Mach mit, Mach’s nach, Mach’s besser

Довольно долгое время среди неглупых людей распространено пагубное заблуждение, что классическое образование в современных условиях ненужно. Детям, как они считают, надо давать навыки вместо знаний: учить поиску в интернете вместо запоминания фактов, программированию вместо латыни, работе над проектами вместо отдельных предметов, «критическому мышлению» вместо всего остального. Возражать сторонникам этой идеи непросто. Дело не только в психологических причинах. Разумному диалогу, прежде всего, мешают ценностные установки, из которых следует принципиально отличное отношение к интеллектуальной традиции и культуре.

Последствия уже сказываются. Современные школьники и студенты оказываются беспомощны, оставленные один на один со строкой поиска,¹ причем даже те, чей общий уровень интеллекта достаточно высок.² Чтобы задать осмысленный вопрос, нужно иметь какие-то начальные представления о возможных ответах на него и об устройстве реальности в целом. Тем более, что современные поисковые системы, принадлежащие крупным корпорациям, далеко не нейтральны: они не показывают результаты, которые сами посчитают нерелевантными или вредными. Только предварительное знание о том, что ответ на заданный вопрос существует, помогает продолжать поиски в правильном направлении.

Доступность ChatGPT³ для публичного тестирования и бурное обсуждение тем, связанных с использованием больших языковых моделей на практике, дают повод снова задуматься о преимуществах классического образования. Многие, включая самих создателей из Open AI, отмечают, что осмысленные результаты ее работы неотличимы от правдоподобного бреда. Можно получить весьма точный ответ на заданный вопрос, обзор литературы или отправную точку для последующих вопросов и уточнений. Глубиной «знаний» GPT-3 не поражает, но если говорить об их всеохватности, человек, судя по всему, ее превзойти уже не в силах.⁴ Вместе с тем ответ машины может содержать выдуманные факты со ссылками на несуществующие статьи или книги. Их перепроверка, должно быть, сопоставима по трудоемкости с самостоятельным поиском, извлечением и систематизацией информации на основе первоисточников.

Например, на просьбу назвать самое быстрое из морских млекопитающих “Name the fastest marine mammal”, ChatGPT отвечает, что это птица Falco peregrinus или рыба Istiophorus platypterus. Только базовые знания о классификации животных позволяют понять, что ответ принципиально неверен. Если машину переспросить “But sailfish is not a mammal”, то даже после нескольких попыток все равно нельзя от нее добиться, то ли это короткоплавниковая гринда Globicephala macrorhynchus, то ли косатка Orcinus orca, то ли таких видов несколько и ответ изначально не может быть однозначным. Другой орешек для GPT-3 — вопрос “What is eight hundred and thirty-six billion three hundred and seventy-two million one hundred and thirteen thousand six hundred and seven plus three hundred and ninety-six billion five hundred and eighty-seven million four hundred and sixty thousand seven?” Результат — 1 233 859 580 571 вместо правильного 1 232 959 573 614. Система не может понять, в чем состоит ошибка: она просто не имеет для этого достаточно данных даже в огромной обучающей выборке.⁵

Некоторые комментаторы полагают, что, несмотря на очевидные недостатки, подобный диалоговый способ взаимодействия пользователя с машиной заменит привычный поиск. Возможно, так и произойдет. Но главное, на мой взгляд, уже очевидно: в поиске, сортировке и обобщении текстовой информации (без ее понимания) машины превзошли или скоро превзойдут даже способного человека. Если к этому добавить генерацию псевдооригинального текста, многие пролетарии умственного труда — программисты, копирайтеры, журналисты — окажутся без работы, если не смогут быстро повысить свою квалификацию. Думаю, что теперь крах концепции образования, главными навыками в которой должны были быть поиск информации и программирование, вполне очевиден. В лучшем случае это путевка в ремесленное училище.⁶

Единственная область, в которой человек в обозримом будущем будет способен превосходить искусственный интеллект — это установление связей между фактами реального мира и их описание при помощи естественного или формального языка. Пока машины не научатся приобретать собственный опыт и находить соответствие между потоком сенсорных данных и сложными абстракциями, все их возможности ограничатся лишь комбинированием того, что до этого было создано людьми.⁷ Предыдущие попытки перекинуть мост между реальностью и языком путем формализации многих миллионов элементарных фактов,⁸ несмотря на десятилетия работы и огромные финансовые затраты, привели, как сейчас считается, в тупик. Но и популярные большие языковые модели, принципиально лишенные всякой логики и имитации «разума»,⁹ уже близки к тому, чтобы обучаться на всех доступных текстах, по крайней мере на английском языке. Возможностей для дальнейшего экстенсивного роста остается не так много.

Невозможно проверять каждый факт, каждое утверждение, которое сообщает машина. Получая обратную связь от пользователя, она будет склонна подтверждать имеющуюся у него точку зрения, укреплять т. н. confirmation bias. Получается, что для успешного соревнования с искусственным интеллектом человек сам должен обладать и умом, и знаниями. Одно неотделимо от другого. Чтобы не попасть в ловушку, нужно знать очень много, еще больше, чем раньше, обладать эрудицией не только по своей специальности, но и во самых разнообразных областях. Без знаний невозможно подлинное критическое мышление, без них нельзя отличить стоящее содержание от его правдоподобной имитации. Нужно уметь рассуждать логически, а не только применять технические приемы. Но это как раз то, чем и было классическое образование, даже средневековое. Тривий давал ученику инструментарий правильного мышления, квадривий оттачивал мастерство его применения, а все семь свободных искусств вместе служили необходимым основанием для последующего приобретения специальных знаний.

Надеюсь, скоро хотя бы некоторые поймут, что лучшее, что они могут вложить в своих детей — это древние и современные языки, чтение первоисточников, история, логика, риторика, философия, математика и множество других «бесполезных» общеобразовательных дисциплин, которыми злые учителя мучали прошлые поколения ленивых учеников. Эти знания, может быть, не пригодятся непосредственно на практике, но они нужны, чтобы удержать связь с реальностью в искусственном мире, заполненном сгенерированными симулякрами, копиями, у которых никогда не было и не будет оригинала.

¹ Этот вывод основан на моем собственном опыте работы со студентами-практикантами и начинающими юристами. Он также подтверждается преподавателями юридических факультетов чешских университетов, которые по известным причинам были поставлены перед необходимостью использовать методы дистанционного обучения и контроля студентов. Подробнее: CVRČEK, František a kol. Elektronizace výuky práva. Plzeň: Západočeská univerzita v Plzni, 2020, например, стр. 98 и слл.

² Конкурс на юридические факультеты, как правило, высокий, поэтому для поступления требуются соответствующие результаты в тестах общей эрудиции и интеллекта, которые примерно соответствуют IQ 120 и выше.

³ chat.openai.com.

⁴ Здесь уместно вспомнить о победе суперкомпьютера Watson в знаменитой игре для эрудитов Jeoprady! (аналог в России — «Своя игра»), которая случилась еще в 2011 году.

⁵ Для полноты картины стоит упомянуть, что WolframAlpha способна правильно решить этот пример, но как у более специализированной системы ее возможности ограничены по сравнению с теми, в основе которых лежат большие языковые модели.

⁶ При этом именно традиционное ремесло становится снова востребованным. Возможно, что в скором будущем программисты начнут переучившийся на плотников или сантехников, спрос на работу которых окажется выше.

⁷ Подробнее об этом в статье Э. Бендер и А. Коллера Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data. В ней авторы рассуждают о том, чем отличается понимание от имитации диалога и какое значение имеет коммуникационное намерение собеседников. Примеры, которые приведены в статье, относятся к предыдущей версии GPT-2 и уже несколько устарели; GPT-3 с заданными авторами примерами справляется намного лучше. Для понимания главной идеи статьи, на мой взгляд, стоит обратить внимание на описание мысленного эксперимента со сверхразумным осьминогом.

⁸ Упоминания заслуживает, например, проект Cyc.

⁹ По сути их работа сводится к оптимизации функций с большим количеством параметров. У самых больших моделей их счет идет на сотни миллиардов.

RUS Этот текст существует также в традиционной орфографии: Mach mit, Mach’s nach, Mach’s besser.