Ученые, воспользовавшись поисковыми мощностями Google, смогли провести огромный лингвистический анализ.
Для этого ими было отобрано около 15 миллионов книг, переведенных в электронный вид. Среди них они отобрали те, что написаны на английском, русском, французском, испанском, немецком и китайском языках. Все они были забиты в базу Google Labs, в которой получилось более 500 миллиардов слов. Эту базу слов и механизм её анализа можно найти здесь.
Авторы исследования считают, что такой механизм поможет лингвитам отслеживать тенденции в изменении языков и влияние исторического контекста на эта тенденции.
Комментарии
Подписаться