Минималистические искусственные языки
Французскому «quatre-vingt-dix-huit», над которым многие смеются, на языке токипона соответствует «mute mute mute mute luka luka luka tu wan»: пять слогов против шестнадцати. Это дает повод для размышления: можно ли создать искусственный язык, который бы был максимально простым во всех своих аспектах — фонетика, словарь, грамматика, синтаксис и т. д.? Можно ли еще упростить язык по одному из выбранных параметров, жертвуя остальными лишь в минимально возможной степени? Скажем, можно ли будет вывести закономерность, когда X дополнительных звуков сокращает словарь языка на Y %? Теоретически ответ, очевидно, утвердительный, если под простотой понимать минимальное число элементов (звуков, корней, правил). Однако если в понятие простоты добавить скорость усвоения языка человеком, удобство использования, безошибочность передачи информации по основным каналам (речь и письмо), то критерии становятся менее очевидными.
В приведенном примере язык токипона¹ явно намного более избыточен, чем естественные языки. «Mute mute mute mute luka luka luka tu wan» (что означает «20+20+20+20+5+5+5+2+1») с помощью введения лишь одного дополнительного правила можно сократить шестнадцать слогов до десяти: «tu tu mute tu wan luka tu wan» (что означает «(2+2)×20+(2+1)×5+2+1». Но сделало бы это язык в целом проще, ведь само новое правило «если меньшее числительное предшествует большему, то меньшее умножается на большее» должно быть изложено на каком-то формальном языке, в котором помимо операции «сложить» появится новая операция «умножить», а также категории «больше» и «меньше»?²
Похоже, что естественные языки дают определенный ориентир, где может проходить реально достижимая граница простоты. В каких-то аспектах такие языки по необходимости избыточны, другие же изменяются вследствие эволюционного давления. Например, русское «девяносто восемь» — это шесть слогов, французское «quatre-vingt-dix-huit» — пять, немецкое «achtundneunzig» — четыре, английское «ninety eight» — три. В других языках наверняка может быть больше, но вряд ли где-то повстречается меньше трех слогов. Сокращение до двух слогов, скажем при переходе к позиционной системе («девять-восемь») чревато невосполнимыми потерями информации при передаче,³ а этого себе естественные языки уже не могут позволить. В двоичной системе потребовалось бы минимум семь слов, которые могли быть односложными. В сторичной бы было достаточно одного слова, не тогда бы само слово стало длиннее. (Односложные бы потребовались для обозначения других, более часто встречающихся в речи понятий, где могли бы принести больше пользы). Интуитивно кажется, что английский язык использует больше односложных и многозначных слов, чем, скажем, русский, но «цена», которую за это платит — сложность фонетики, синтаксиса и довольно непростые правила разрешения многозначности (disambiguation) в некоторых случаях.
Кажется, что из искусственных языков эсперанто — это достаточно хорошее приближение к идеалу простого во всех отношениях языка, хоть он и был создан любителем, опиравшемся на свою языковую интуицию. «Девяносто восемь» на этом языке будет «naŭdek ok» — те же три слога, как в английском, при том, что фонетика эсперанто намного проще английской. Видно, что простота грамматики, связанной с глаголом, как в славянских языках, в сочетании с характерным для романских языков отсутствием склонения у имен (за исключением винительного падежа) не лишили эсперанто универсальных выразительных качеств. С другой стороны, словообразование при помощи суффиксов в этом языке иногда может быть показаться неуклюжим. Скажем, в простейших случаях образование «bovino» (корова) от «bovo» может быть оправданным, тогда как трехсложное слово «patrino» (мать), образованное от «patro» (отец), могло бы иметь свой собственный корень. Вопрос в том, можно ли сделать простой искусственный язык еще проще, чем это получилось у Зименгофа.
Мне неизвестно, ведет ли кто-то исследования в этом направлении, но сама идея создания искусственного интеллекта, который бы был способен генерировать искусственные языки и исследовать их свойства, кажется весьма привлекательной. Конечно, можно было бы обратиться к какому-то из существующих априорных логических языков вроде логлана или ложбана, но при переводе на них текстов с естественных языков возможна потеря значимой информации. Скажем, союзы «и», «или», «если» и отрицательные частицы имеют в языке собственное значение, которое не всегда удается свести к соответствующим им логическим операторам. Сгенерированные искусственным интеллектом языки с эталонной сложностью можно было бы применить, например, для измерения количества информации в естественных информационных системах, где шум и избыточность могут быть следствием использования естественного языка.⁴
¹ Минималистический искусственный язык, созданный, по словам его автора Сони Ланг, в соответствии с принципами дзена. Википедия: Токипона.
² Здесь возникает еще один интересный вопрос: возможно ли описание языка и всех его правил на нем самом? Похоже, что в принципе это возможно, но такое описание само должно основываться на некотором нередуцируемом наборе правил, «внеположенном» самому языку, причем чем меньше этот набор, тем более избыточным получается описание. Чтобы описание было компактным, нужно воспользоваться более богатым, но специализированным «внешним» языком. Программисты знают, к примеру, форму Бэкуса — Наура.
³ Например, при диктовке длинных чисел слушатель может пропустить несколько слов и тогда он легко ошибется на несколько порядков. Если же говорящий будет произносить избыточные слова, такие как «тысяча», «миллион» и т. п., потенциальная ошибка слушателя будет меньше, по крайней мере порядок он определит точнее. Исключение — диктовка номеров телефонов и других подобных цифровых идентификаторов, длина которых фиксирована и ошибка передачи обнаруживается сразу.
⁴ Например, Энтропия и сложность права.
Этот текст существует также в традиционной орфографии: