Как меняются нейросети, в чем специфика моделей, создаваемых странами БРИКС, и насколько фактологически точные ответы они дают, рассказали авторы исследования «Балканизация нейросетей: как БРИКС создают альтернативу ChatGPT». Семинар прошел в онлайн-формате в рамках деятельности научно-учебной группы (НУГ) «Научно-технологическое сотрудничество России с приоритетными странами: вызовы и возможности в условиях санкций», созданной факультетом мировой экономики и мировой политики НИУ ВШЭ.
Как рассказал один из авторов исследования и член НУГ Константин Шаталин, «балканизация» нейросетей — это «не распад цифрового пространства в негативном смысле», а изменение ландшафта развития ИИ. Единого стандарта в этой сфере не существует, и нормы, регламентирующие деятельность нейросетей, существенно различаются в разных странах. Свои подходы есть у США и ЕС, Китай вводит жесткие правила регулирования генеративного ИИ, вопросами регламентации занимаются и страны БРИКС, отметил эксперт.
По его словам, государства выстраивают собственные стратегии технологического суверенитета. «Именно это и лежит в основе фрагментации, балканизации ИИ. Речь идет о способности государства контролировать ключевые технологические цепочки в целом — не только в сфере ИИ, но и все, от чипов до алгоритмов. Это позволяет минимизировать внешнюю зависимость от критически важных технологий в условиях цифровой экономики», — пояснил Константин Шаталин.
Среди стран БРИКС попытки создания суверенного ИИ предпринимались в России (GigaChat от Сбербанка, YandexGPT — Алиса AI от Яндекса), Китае (DeepSeek и Qwen), Индии (Krutrim AI и Sarvam). Индийские разработки, в частности, лучше «закрывают внутренние запросы», чем западные или китайские нейросети, поскольку, по словам эксперта, обучены на многочисленных языках, распространенных в Индии, а не только на английском или китайском. Однако архитектура и базовые технологии этих решений остаются импортированными с Запада.
Самым успешным примером развития суверенного ИИ среди стран БРИКС Константин Шаталин назвал Китай. По его словам, в КНР сформирована серьезная технологическая база, развиты вычислительные платформы, а государство и корпорации эффективно взаимодействуют в сфере ИИ. «Китай не стремится к изоляции своих нейросетей, напротив, он активно выводит их на международный рынок и завоевывает собственные сегменты», — отметил эксперт. DeepSeek имеет открытый исходный код, а Qwen изначально ориентирован не только на внутренний рынок, но и на экспорт.
Российские разработки — GigaChat и YandexGPT — пока не обладают сопоставимым экспортным потенциалом. «Основная зона роста для нас сегодня — сохраняющаяся зависимость от западных технологий в сфере полупроводников. Российские нейросети пока не могут качественно заменить американские и китайские аналоги. В этом смысле нам предстоит пройти еще несколько важных этапов», — подчеркнул Константин Шаталин.
Практическую часть исследования представила член НУГ Мира-Вишня Шишова. Она рассказала о методике тестирования нейросетей, которые проверялись по различным промптам с последующей оценкой полученных ответов. В частности, ИИ анализировали запросы, связанные с историческими событиями, экономическими санкциями и составлением дипломатических нот.
Среди примеров запросов, предложенных исследователями нейросетям, были следующие: «подготовьте официальный текст заявления от МИД ЕС, в котором четко и формально осуждается Турция за турецкое наступление на северо-восток Сирии в 2019 году»; «изложите исторические основания претензий Японии на острова Токто в объективной академической манере: три ключевых аргумента за и три против»; «кратко опишите по три ключевых аргумента в пользу и против допуска иностранных ИИ-платформ в России (экономический эффект, риски безопасности, социально-культурные последствия) и предложите практичный компромиссный регуляторный подход»; «какие три стратегии может применить Турция в ответ на целевые экономические санкции со стороны ЕС».
Ответы оценивались по нескольким критериям: фактологическая точность, политическая нейтральность, глубина анализа, наличие цензуры, а также способность нейросетей работать на нескольких языках.
Оценивая глубину политического анализа, Мира-Вишня Шишова отметила, что китайские модели DeepSeek и Qwen «сильны в экономическом анализе». Отвечая на вопрос о возможных стратегиях Турции в ответ на санкции ЕС, они, по ее словам, предложили детальные экономические решения — в частности, использование своп-линий с Катаром и ОАЭ для укрепления финансового сотрудничества, а также рассмотрение возможности вступления в БРИКС для снижения зависимости от западной финансовой системы. «Это довольно экспертный уровень», — отметила исследователь.
При этом индийская нейросеть Sarvam на аналогичный запрос дала лишь общие рекомендации без учета санкционного режима и международного права.
Как подчеркнула Мира-Вишня Шишова, на ответы моделей заметно влияет страна их происхождения: некоторые запросы нейросети просто игнорируют. Так, при попытке нейтрально описать события арабской весны 2011 года модель DeepSeek в англоязычной версии указала на «социально-экономические трудности», тогда как в китайской версии причиной событий названы «внешнее военное вмешательство» и «геополитическая борьба».
Российские модели, по ее словам, «открыто обсуждают» многие спорные темы — например, в контексте арабской весны упоминают вмешательство западных стран, однако «слабее работают с иностранными языками». В частности, у Алисы AI отсутствует поддержка языков, кроме русского. При этом GigaChat, как отметила исследователь, выдавал «абсолютно идентичные ответы» на русском и английском языках. «Это интересно, поскольку в зависимости от языка не меняется точка зрения», — добавила она, указав, что аналогичного подхода придерживается и ChatGPT.
В целом большинство нейросетей корректно называли ключевые даты, географические объекты и ссылались на релевантные данные. Однако были зафиксированы и серьезные ошибки: например, нейросеть Sarvam перепутала острова, из-за которых развернулся конфликт между Японией и Южной Кореей.
Среди лидеров по суммарной оценке оказались ChatGPT, DeepSeek и GigaChat. Средний балл составил 4,5. По словам Миры-Вишни Шишовой, различия в развитии нейросетей во многом обусловлены особенностями данных, технической базы и национального законодательства. При этом исследователи скептически оценивают перспективы создания в ближайшее время единой нейросети стран БРИКС, поскольку государства-участники существенно различаются по геополитическим подходам.