Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Перейти вниз

Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Сообщение автор Незнайка на луне в Чт Авг 23, 2018 10:59 pm

Заголовок темы я, признаюсь, прямо заимствовал из названия монографии, указанной в списке источников https://ru.wikipedia.org/wiki/Google_Books_Ngram_Viewer

Кратко изложу суть: группа ученых при спонсорстве небезызвестного Googl оцифровала 15 миллионов (!) печатных источников, выбрала из них треть "серьёзных" (критерии не обсуждаю) и разработала сервис частотности языковых единиц. Есть русский аналог: http://www.ruscorpora.ru/ngram.html

Это очень увлекательное занятие: вбить в поисковое поле несколько слов и посмотреть, как часто ими оперируют печатные тексты, т.е. насколько соответствующие понятия актуальны.

Например, я вбил период (с 1950 г.), слова "опера" и "романс", нажал кнопку "построить" и получил следующие графики:



Те же манипуляции, но с заменой "опера" на "песня", дают не менее интересные графики:



Попробуйте сами!

Незнайка на луне

Сообщения : 1037
Дата регистрации : 2013-07-16

Посмотреть профиль

Вернуться к началу Перейти вниз

Вернуться к началу

- Похожие темы

 
Права доступа к этому форуму:
Вы не можете отвечать на сообщения