Появление больших языковых моделей совершило прорыв в истории искусственного интеллекта, но что будет с ними дальше и удастся ли эту технологию эффективно применить в производстве? А главное, насколько целесообразно внедрять ИИ в каждый новый продукт и оптимизировать имеющиеся? HSE Daily спросило об этом научного сотрудника Международной лаборатории стохастических алгоритмов и анализа многомерных данных НИУ ВШЭ Сергея Самсонова.
Ученые Института статистических исследований и экономики знаний НИУ ВШЭ активно изучают перспективы и направления развития цифровых технологий. В рамках исследовательских проектов они беседуют с участниками рынка — ведущими ИТ-разработчиками. HSE Daily представляет серию таких экспертных интервью.
— В последние годы развитие искусственного интеллекта очень сильно ускорилось, особенно после внедрения больших языковых моделей. Как, на ваш взгляд, будет дальше развиваться история с машинным обучением?
— Я бы не сказал, что именно большие языковые модели сделали революцию с исследовательской точки зрения, с точки зрения математики и инженерии. Поступательное и даже взрывное развитие искусственного интеллекта идет с 2012 года, с тех пор как первая нейронная сеть была обучена на графическом процессоре. Большие языковые модели — это просто очередной шаг, на мой взгляд.
Что касается дальнейшего использования, то, как только сделан новый эволюционный шажок, как только выходит новая технология, сразу появляется возможность применить ее там, где с успехом применялась технология предыдущего уровня, и получить что-то почти наверняка лучше. И с языковыми моделями то же самое — это пойдет вширь, в какие-то связанные дисциплины, смежные области.
Будет, видимо, расширяться обобщающая способность языковых моделей, появится возможность создать архитектуры, которые способны оказывать реальную консультативную помощь человеку в решении конкретных задач.
Но чтобы добиться более серьезного прогресса, нужно привлекать какие-то идеи в смежных областях, создавать некоторый синтез идей.
— А вы разделяете мнение Альтмана из OpenAI, что большие языковые модели — это первый шаг в направлении сильного искусственного интеллекта?
— Я скептичен относительно сильного искусственного интеллекта. В истории человечества были подобные ситуации, и каждый раз казалось, что вот сейчас научатся решать какую-то задачу — и это точно будет сильный искусственный интеллект. Например, если бы вы спросили человека, который занимался искусственным интеллектом лет 40 назад: «А если научить компьютер обыгрывать человека в шахматы — это сильный искусственный интеллект?» — он бы сказал, что, наверное, да. Но это не стало сильным ИИ, как и во многих других случаях.
Превзойти человека в области какой-то конкретной задачи или даже спектра задач — это не настолько сложно. Но за этим не следует никакого сильного преимущества, перехода к мышлению, осознанию происходящего, способности самостоятельно ставить какие-то задачи, заниматься планированием и так далее. По крайней мере в том смысле, который человек в это вкладывает. Поэтому я считаю, что сильный ИИ в том смысле, в котором его боятся, вообще невозможен.
— Это какое-то технологическое ограничение, инженерный предел?
— Мне кажется, что пока все ограничения — в нашем собственном сознании. На данный момент наше познание и те инструменты, которые мы используем в процессе нашего познания, ограничены в первую очередь нашими когнитивными способностями. И мне кажется, что и к текущим моделям искусственного интеллекта это все еще применимо.
В любом случае, какие бы способности к генерализации они ни демонстрировали на данный момент, это все еще остается инструментом, причем вспомогательным инструментом в руках человека. И я не верю, что они смогут перейти на следующий уровень в какой-то разумной перспективе.
— Считается, что одним из недостатков больших языковых моделей является неспособность проводить математические вычисления и, соответственно, неспособность к научным открытиям. Это решаемая проблема?
— Я думаю, что к открытиям они, по-видимому, продолжат быть неспособны. Но в том, что они могут быть способны верифицировать какие-то математические доказательства и вообще какие-то расчеты, имеющие определенную структуру, я абсолютно уверен. И думаю, что уже в течение ближайших лет появится механизм, который позволит проверять сложные структурные расчеты на предмет наличия внутренних противоречий.
Фото: iStock
Например, для унификации регламентов, юридических документов. Может быть, получится наконец-то прогнать через такой инструмент, например, хотя бы Гражданский кодекс и устранить все логические противоречия в нем, а также проверять и обновлять его пункты в режиме реального времени.
— Какие ключевые достижения вы можете отметить в этой области, если исключить большие языковые модели? Какие направления еще были перспективными и ударными?
— Обучение с подкреплением, безусловно, reinforcement learning. Там были очень большие прорывы, которые позволили, например, прекрасно решать игровые задачи на уровне человека и даже превосходить его.
Если говорить про технологии, я бы еще назвал генеративное моделирование. Например, Kandinsky, если говорить про отечественные модели. В области генеративного моделирования достигнут большой прогресс. Мы не просто умеем генерировать по запросу кошечек или собачек, а научились гораздо лучше выполнять задачу сэмплинга, то есть генерировать объекты из заданного распределения вероятностей, что, например, в физике очень часто необходимо для выполнения численных расчетов и симуляций. Современные генеративные модели позволяют справляться с этим гораздо лучше, чем даже пять лет назад, и во многом это достижение класса моделей, которые называются диффузионными.
— Есть ли реально работающие каналы для эффективной смычки науки и производства?
— Безусловно, нужны люди, которые понимают научную составляющую того или иного процесса и видят возможности для его внедрения. Но я не уверен, что ученые должны бросать мел или, в моем случае, маркер и заниматься реализацией своих разработок. В любом случае нужна хорошая экспертиза в той области, в которой будет внедряться результат. Наверное, я далек от мысли, что одни и те же люди должны заниматься и тем и другим.
В Вышке есть такие каналы, но они идут не в производственный сектор, а скорее в какие-то более высокоуровневые приложения: в банки, например, или в сферу услуг — в области персональных рекомендаций или выбора канала коммуникации с пользователем.
— Как обстоят дела с корпоративным искусственным интеллектом? Его называют вертикальными ИИ-моделями, где потребитель не участвует, а стоит задача оптимизации процессов, например сокращение расходов.
— Здесь как раз математический вопрос. Если вы можете решать задачи при помощи новой технологии искусственного интеллекта лучше, чем при помощи каких-то стандартных методов, то получаете преимущество. Важно вычленять такие задачи, в первую очередь математические, которые могут быть более эффективно решены с использованием новых доступных моделей и подходов. И здесь как раз нужны люди, которые про эти подходы знают, например в промышленности.
Сергей Самсонов, фото из личного архива
Не нужно пытаться роботизировать все подряд. Важно уметь вычленить конкретный момент, оптимизация которого в соответствии с текущим уровнем технологического развития, во-первых, возможна, а во-вторых, даст какой-то реальный выигрыш для компании. То есть нет никакого смысла оптимизировать модель, которая зарабатывает вам тысячу рублей в год при цене вложений 10 миллионов.
Вы должны понимать бизнесовую специфику, чувствовать баланс и уметь вовремя отказываться от оптимизации, иметь мужество, чтобы не усложнять модель там, где это не нужно. Если мы говорим о промышленной специфике, мне кажется, что человек, который этим занимается, должен в первую очередь хорошо понимать этот баланс.
— Какие бы вы назвали ключевые центры компетенций в разработке технологий искусственного интеллекта?
— В первую очередь Штаты и Китай, а все остальные — к сожалению, и мы в том числе — сильно отстают.
Я бы еще отметил Арабские Эмираты, они создали два сильных университета и один технологический центр, в который пригласили большое количество исследователей из других стран.
Хороший задел у Индийского центра компетенций, но он пока не тянет на самостоятельный центр, который может конкурировать на высоком уровне.
Если говорить про Россию, то у нас ключевые акторы — это Высшая школа экономики, Физтех, Сколтех. Но специфика России в том, что почти во всех этих местах работают одни и те же люди, происходит горизонтальная миграция. У этого явления есть и положительные моменты, и отрицательные — в первую очередь то, что людей не хватает. В последнее время количество исследователей, занятых около ИИ, растет, но пока недостаточно быстро. На сегодняшний день запросы от корпоративных университетов и компаний перекрывают те возможности, которые сейчас доступны исходя из числа действительно квалифицированных исследователей. Это та проблема, которую в нашей стране еще предстоит решить.
Беседовал Сергей Сычев, ведущий эксперт ИСИЭЗ НИУ ВШЭ