Найдена константа, общая для всех языков мира
Группа исследователей под руководством системного биолога Марчелло Монтемурро (Marcelo Montemurro) из Манчестерского университета, утверждает, что количество информации, содержащееся в расстановке слов...
Группа исследователей под руководством системного биолога Марчелло Монтемурро (Marcelo Montemurro) из Манчестерского университета, утверждает, что количество информации, содержащееся в расстановке слов, представляет собой величину, одинаковую для всех языков, даже таких, которые между собой никак не связаны.
На первый взгляд, информационное значение расстановки слов для разных языков различается. Так, в финском, а в определенной степени и в русском, слова можно спокойно менять местами без потери смысла, поскольку информационную нагрузку несут на себе окончания. В английском порядок имеет значение. Так, фраза "Полли любит Грегори" имеет совсем другой смысл, чем фраза "Грегори любит Полли". Но на самом деле все немного сложнее. Даже утверждение "Маша любит Сашу" отличается от утверждения "Сашу любит Маша", так как во втором случае подразумевается уточнение – именно Маша любит Сашу, а не какая-нибудь Аня.
Монтемурро понял, что можно подсчитывать количество информации, заложенной в расстановке слов, рассчитав энтропию текста. Используя методы теории информации, его группа провела такие расчеты для тысяч текстов, написанных на восьми различных языках – английском, немецком, французском, финском, шумерском, тагальском (наиболее распространенный из филиппинских языков), древнеегипетском и китайском. Затем они сделали то же самое, предварительно перемешав слова в текстах случайным образом.
Для каждого текста энтропия была своя, так как в ее значениях отражались грамматические и структурные особенности языков. Но странное дело – разница между энтропией оригинального текста и того же текста с перемешанными словами каждый раз оказывалась одной и той же. Эта разница, по словам Монтемурро, нужна была для расчета количества информации, заложенной в порядке расположения слов, поскольку при перемешивании слов эта информация теряется. Ученые подсчитали эту потерю. Она оказалась равной 3,5 битам на слово.
Что это значит, пока неясно. Монтемурро считает, что это или следствие неких когнитивных ограничений, накладываемых на язык человеческим мозгом, или некоторая особенность, связанная с эволюцией языка.
Читайте на CNews
Приехали: мусор закрывает дорогу в космос
HP выпустила новые модели десктопов для СМБ
«Облака» продаются плохо, но «1С» не сдается