Больше историй

21 июня 2017 г. 09:10

4K

Слова в цитатках.

По началу хотела выписывать цитаты во время чтения, чтобы добавлять их на сайт. Но, посмотрев на их общее количество

Цитаты 1984

с глазами по пять рублей отказалась от этой затеи.

И теперь решила посмотреть, можно ли из всех этих цитат составить само произведение.

Так как в последнее время на сайте стали объединять повторяющееся цитаты, и если вы добавите ту, которая уже есть, они воссоединяться в танце блаблабла и станут единым целым. Так вот, предположим, что все цитаты уникальные, повторяющихся нет.

Берём выборку из произвольных 25 цитат с одной страницы, например со страницы 7 (можете потом сами посмотреть и посчитать всё).
Число слов для каждой цитаты выстроилось в такую последовательность: 43, 13, 31, 54, 34, 19, 36, 15, 8, 23, 25, 70, 15, 11, 18, 62, 31, 31, 10, 18, 49, 18, 44, 25, 23.

Таким образом получается, что число слов для каждой цитаты в среднем примерно равно 726/25≈29.04. Вроде немного, да? Но посмотрите сколько всего цитат добавлено на сайт...

Теперь узнаем, сколько же слов использовано было во всех цитатах вместе 1984*29.04≈57615.36 (!) А теперь много? Мне показалось, что да. А если ещё учесть, что word говорит, что всего в произведении "Если бы ты знал..." 49222 слов (без названия и аннотации), то получается, что из цитат можно составить оригинальное произведение и ещё на небольшой рассказ хватит.

Не знаю какой тут вывод, но статистика интересная.

Комментарии


Скорее всего есть повторки в цитатах, потому что не все их пишут одинаково, а система считывает только идентично схожие. То есть допуска малейшую ошибку, система засчитает за оригинальную цитату, отсюда и такое количество :)