Ученые ИСИЭЗ НИУ ВШЭ активно изучают перспективы и направления развития цифровых технологий. В рамках исследовательских проектов они беседуют с участниками рынка, ведущими ИТ-разработчиками. HSE Daily представляет серию экспертных интервью. Станислав Ашманов, генеральный директор компании «Наносемантика», российского разработчика технологий искусственного интеллекта, рассказал, в чем сильны отечественные создатели ИИ, смогут ли квантовые процессоры совершить революцию и насколько рискованно вживлять чипы в мозг.
— Какие технологии, продукты сейчас в фокусе внимания разработчиков искусственного интеллекта?
— Так как ИИ — сквозная технология, то совершенно разные компании внедряют разный искусственный интеллект. ИИ давно стал инженерной задачей. Например, если мы хотим разработать мобильное приложение, то мы выясняем, какие есть фреймворки для построения визуальной части, для бэкенда, для отладки и так далее. Так же и в искусственном интеллекте. Возникает задача получить продвинутую аналитику данных — мы изучаем существующие архитектуры нейросетей, фреймворки для них и используем нужную подзадачу.
Понятно, что в искусственном интеллекте сейчас почти все задачи решаются нейросетями, и это самый продвинутый алгоритм. Что-либо им на смену пока не придумано.
Кстати, у всех разработчиков возникает проблема, где обучать нейронные сети, — нужны кластеры. Требования к мощностям растут, они сейчас уже содержат миллиарды параметров, даже до триллионов параметров доходит. Самые продвинутые нейросети начинают локализовываться у крупных собственников типа Яндекса и Сбера.
— Как вы выходите из положения?
— Во-первых, мы покупаем мощности, стараемся не экономить на этом. Раз в год, в два года надо пополнять парк оборудования, обновлять, старое выкидывать. Во-вторых, мы сотрудничаем с вузами. У них есть вычислительные кластеры, и они всегда загружены. Различные государственные организации когда-то закупили много оборудования и теперь могут делиться. Им это должно быть выгодно, например, могут быть совместные научные статьи, совместный маркетинг или совместные продукты.
— Есть идеи, которые требуют дополнительных НИОКР.
— У нас в компании «Наносемантика» нет научного отдела. Такое может себе позволить только очень крупная компания типа Facebook, Google, Сбера, VK или Яндекса. Это очень дорогая деятельность, она в чем-то похожа на венчурные инвестиции: инвестируешь в сто коллективов и если хоть у одного что-то получится, уже хорошо.
Если у западных корпораций огромные НИИ из нескольких тысяч разработчиков, тысячи исследователей, то что мы можем противопоставить? У нас в стране разработчиков-исследователей ИИ на два порядка меньше.
— Развитие идет по пути усложнения нейросеток, усложнения архитектуры? Или все-таки в какой-то момент потенциал этого усложнения будет исчерпан и потребуются какие-то другие решения?
— Все идет по пути усложнения нейросеток.
— Это же не бесконечный процесс.
— Мы этого не знаем.
— А если заглянуть за горизонт? Какие вы видите решения, которые, может быть, сейчас кажутся фантастическими, но могут выстрелить, когда метод усложнения перестанет работать?
— В GPT-4 около 100 триллионов параметров — это примерно в 500 раз больше, чем в предыдущей версии. То есть прошло всего три-четыре года, а они выпускают новую сетку, которая имеет в 500 раз больше параметров. Правда, она будет потреблять в 500 раз больше электричества.
Я не футуролог, но мне было всегда интересно, что дадут квантовые процессоры для вычислительных задач. Что дали видеокарты — известно. Что до этого дали векторные процессоры, векторные команды — тоже известно, это значительная параллелизация, возможность выполнять кучу операций.
Фото: iStock
Квантовые процессоры должны тоже дать возможность гораздо быстрее делать вычисления. А это значит, что можно себе позволить даже не 100-триллионные, а гораздо бо́льшие сетки запускать.
Однако нужны миллиардные вливания со стороны государств, чтобы эта тема хоть как-то завелась.
— В развитии квантовых технологий, на ваш взгляд, все страны находятся на одинаковом уровне или у российских исследовательских центров есть технологическое отставание?
— Известно, что Штаты на военный бюджет, например, тратят на порядок больше, чем мы, но при этом у них нет гиперзвукового оружия, а у нас есть. Я помню, про искусственный интеллект тоже метрики смотрели — сколько Китай инвестирует, сколько США. Так вот, мы на искусственный интеллект тратим в 130 раз меньше, чем Китай. Но я не знаю, во сколько раз мы отстаем.
Про квантовые технологии могу только сказать, что у нас хороший фундамент, хорошая база. Думаю, что тема с квантовыми процессорами затронет не только искусственный интеллект. Она затронет очень много всего, и в первую очередь шифрование. Полагаю, что в это стоит инвестировать, создавать институты для работы по этой теме.
— А как вы оцениваете потенциал нейроморфных сетей?
— Единственное, что сейчас реально работает в мире, это не нейроморфные, а обычные тензорные процессоры, которые просто умеют делать быстро нужные для нейросетей операции.
— На ваш взгляд, насколько сейчас уровень технологической зрелости российских разработчиков соответствует западному и в какой именно области?
— У нас есть очень сильные компании. ABBYY, которая делает лучше всех на планете распознавание документов. Яндекс, у которого очень крутой поисковик. Россия — одна из немногих стран, у которых есть собственный поисковик, имеющий лидирующие позиции. И у Яндекса очень крутая система беспилотного вождения «Яндекс Авто». В России есть компании мирового уровня по распознаванию лиц, которые занимают первые строчки во всех тестах. И так далее, таких примеров можно еще много привести. Поэтому у нас, на мой взгляд, с искусственным интеллектом все намного лучше, чем в европейских странах. Конкурировать с нами здесь могут только, на мой взгляд, Штаты и Китай.
— О каком уровне технологической независимости можно говорить, если Россия по патентам занимает ничтожную долю в мировой патентной среде, в отличие от США или Китая?
— Патент — это все-таки тоже маркетинг, и это некое следствие разнообразного венчурного конвейера. Когда у нас есть стартап, ему нужно привлекать инвестиции, для этого он наращивает интеллектуальную собственность, создает видимость путем генерирования патентов, чтобы привлечь в следующий раунд инвестиции. Я знаю компании, у которых ничего, кроме патентов, нет, и они привлекают инвестиции от крупных европейских венчурных фондов.
Сама патентная гонка во многом связана с бутафорской экономикой, когда оценка компании делается не по каким-то реальным активам — количеству платящих клиентов, объему выручки от них, технологиям, — а когда на оценку сильно влияют субъективные факторы. Например, то, что компания потратила сколько-то сотен тысяч долларов, чтобы создать какой-то патент.
В России в ценность патентов мало верят. Может быть, в фармацевтике верят. А на Западе уже цепочка выстроена. Какой-нибудь венчурный фонд дает компании 100 тысяч долларов. Но важно, чтобы 25 тысяч долларов из них было потрачено на маркетинг, еще 25 тысяч — на патенты. Ну а остальное, так уж и быть, потратьте на разработку. А это все нужно, чтобы красиво упаковать компанию к привлечению раунда в 500 тысяч долларов, например.
— Как вы оцениваете конкурентную среду в России в области технологии искусственного интеллекта?
— Она очень насыщенная, плотная. Если лет семь назад было шаром покати, то сейчас очень много компаний, которые делают и заказную разработку, и коробочные решения для распознавания лиц, для распознавания речи. И еще что существенно: раньше не было центров по искусственному интеллекту в крупных корпорациях, а сейчас и ВТБ, и Альфа-Банк, и Сбер вырастили внутри себя центры по анализу данных, по Big Data, по искусственному интеллекту.
Соответственно, корпорация тратит огромные бюджеты. На мой взгляд, это абсолютно неэффективно — годами разрабатывать свое, когда на рынке можно купить недорого.
— Какие вы сейчас знаете в России исследования или продукты, которые вы могли бы назвать state of the art (SOTA)?
— У меня, например, SOTA — проверка правописания. Мы лучше всех умеем это делать. Проверка грамотности, исправление текста на русском языке у нас самые лучшие в мире. Есть распознавание лиц в России — лучшее в мире, такие как NTech, VisionLab, Tevian. Я думаю, что у Яндекса state of the art — это его беспилотники, поисковик Яндекса — тоже state of the art.
— А если говорить про западные компании SOTA, какие направления вы бы выделили?
— Все инновации по генерации текстов — от OpenAI, Facebook, Google. Все инновации по распознаванию и синтезу речи — тоже от этих трех компаний. State of the art по процессорам — у NVIDIA. Никто их обскакать не смог — ни AMD, ни Amazon, ни Google. То есть NVIDIA — номер один и долго будет им оставаться.
— А китайские производители?
— Нет, китайцы в позиции догоняющих.
— Как вы относитесь к истории с вычислением на оконечных устройствах?
— Это тренд. Это точно будет. Сейчас уже какую-то часть распознавания речи Android делает на борту. Apple уже распознавание лиц и текстов делает на борту. Этот тренд обеспечен тем, что тензорные ядра или нейропроцессоры стали стандартными.
— По каким технологиям и продуктам сейчас в России ведется наиболее активная разработка?
— Голосовые помощники у нас российские. Это работающая технология, и это очень конкурентная часть рынка. Есть три очень мощных разработчика: Яндекс, VK и Сбер.
— А по рекомендательным системам?
— Рекомендательную систему каждый пишет для себя. То есть все крупные экосистемы типа МТС, Сбера, Яндекса, VK, банки пишут рекомендательные системы у себя внутри.
— Вы рассматриваете для себя какие-то возможности технологий обработки мультимодальных данных, когда можно работать на стыке обработки образов и речи?
— Да, рассматриваем. У нас есть сейчас один проект. Условно говоря, человек подходит к экрану и видит 3D-аватар, который выглядит как человек. С этим персонажем можно поговорить. Над экраном есть камера, она анализирует лицо, старается определить пол, возраст и эмоции. Затем пробрасывает эту информацию в систему голосового помощника, чат-бота, чтобы он корректировал свое поведение.
Кто-то старается делать мультимодальную биометрию, чтобы мы одновременно и лицо распознавали, и по речи делали идентификацию.
Пока очень плохо работает система определения эмоций — и по видео, и по аудио. Наверное, кто-нибудь сделает это. Человек же справляется с этой задачей, более-менее видит образ. Хотя, мне кажется, человеку тоже сложновато. Например, не все люди способны отличить фейковые эмоции.
— А разработчики ставят задачу считывать интонации, эмоции или это не близкая история?
— Есть такая задача. Call-центры хотели бы, например, отслеживать ситуации, когда оператор вспылил или когда клиент недоволен или возбужден, то есть анализ именно того, как в call-центре идет общение. Кстати, это может быть и с роботом.
— Как вы считаете, интерфейс «мозг — компьютер» — это продолжение истории про искусственный интеллект или отдельный трек?
— Однозначно будет использоваться очень много технологий с искусственным интеллектом. Нам же нужно интерпретировать сигналы, идущие из мозга. Но мне эта тема очень не нравится. Меня прямо коробит от идеи, что в мозг будут встраивать чипы не больным людям, а вообще всем: если я купил Apple Watch, то значит, я купил себе имплантат. Думаю, это очень большой риск для нашей цивилизации.
Фото: iStock
Знаете, вот кардиостимуляторы люди используют по медицинским показаниям — это нормально. Вот я бы чип людям с показаниями к этому тоже предложил внедрять. Это очень большой риск, даже кардиостимуляторы хакеры взламывают. А если чип имеет доступ к мозгу и можно его перепрограммировать так, чтобы он начал в мозг закладывать неправильные мысли или, например, перегревать какие-то области мозга?
— Развитие искусственного интеллекта идет в сторону максимального использования open source? Или проприетарные коды разрабатываются in-house и, в общем, каждый при своем продукте?
— Оpen source сейчас движется вперед не энтузиастами, а корпорациями и университетами. Университеты тратят государственные деньги, чтобы сделать open source. Это у ученых сейчас прямо идея фикс. А корпорации вкладываются именно в open source для маркетинга.
Но компании типа моей и все средние или малые компании, которые занимаются искусственным интеллектом, разумеется, в open source ничего ценного выкладывать не будут. Они будут это держать у себя, это наш актив, интеллектуальная собственность. Нам пользы никакой от open source нет.
— Сейчас искусственный интеллект во многом black box. А есть ли какое-то движение к созданию объяснимого ИИ?
— Есть разные алгоритмы, которые позволяют протестировать результаты работы нейронной сети. Для примера: на что нейронная сеть обратила внимание сама при вынесении своего вердикта. И это вроде бы не очень сложная технология. Но, насколько мне известно, именно пользователям искусственного интеллекта, каким-то крупным корпорациям, в общем-то, все равно, почему нейронная сеть вынесла такое решение. Им не очень важно, почему мы откажем в кредите. От них никто не требует объяснить это. Просто говорим: извините, мы по внутренним процедурам решили вам не выдавать кредит.
И да, тот же «Яндекс» покажет мне рекламу унитазов. Но никто с него не спросит, почему именно мне и именно унитазы. Просто так компьютер решил. Поэтому думаю, что большого запроса со стороны разработчиков точно нет. А значит, по-хорошему, должен быть запрос со стороны государства, что, если мы отказываем человеку в кредите, мы обязаны внятно, достоверно объяснить, почему мы ему отказали. Мне кажется, такая регуляторика была бы очень важна.
— Вопрос о кадровом потенциале отрасли: как вы оцениваете количество выпускников и их качество с точки зрения нанимателя?
— Самое простое — это брать кадры из правильных вузов. То есть если Сколтех, Физтех, Высшая школа экономики, то понятно, что студенты сильные. Мы стараемся брать оттуда, хотя ребята и из МИРЭА у нас тоже работают, есть сильные.
И у нас есть соглашение с вузами, к нам в год примерно человек 20 приходит на стажировку, на практику. Из них примерно четверть оставляем работать. Мы уже в ходе практики подключаем к реальным проектам. И дефицита кадров у нас нет, их нехватку мы восполняем тем, что растим кадры внутри.
— Требуются какие-то меры государственной поддержки компаниям, работающим в области искусственного интеллекта?
— В целом она есть. Институты развития — РФФИ, Фонд содействия инновациям, «Сколково» — активно раздают гранты для разработчиков и для заказчиков. Может быть, было бы здорово, если бы отдельные гранты выделялись только под аренду облачных вычислительных мощностей. Полагаю, что у Яндекса, Сбера, VK много простаивающих мощностей, можно было бы, субсидируя спрос, обеспечить загрузку и им. И компании типа нашей могли бы делать больше экспериментов с нейросетями. Идеально было бы, если бы давали целевые гранты именно под аренду видеокарт.
— И заключительный вопрос: насколько критично для вас и в целом для отрасли то, что западные вендоры ушли с рынка?
— Это же просто прекрасно, это замечательно. Это очень хорошо, что они ушли, потому что компании начинают искать возможности заменить освободившиеся ниши. Например, наш конкурент Amelia ушла из России, соответственно, на рынке появятся новые тендеры на ее замену. А то, что NVIDIA и другие западные поставщики серверов ушли из России не очень ощущается. Все то же самое можно купить у отечественных разработчиков и дистрибьюторов.
Создает проблемы уход Microsoft, скажу вам честно, потому что мы не можем Microsoft Office покупать для компании. А то, что западные вендоры ушли, это очень сильно оздоравливает российский рынок.
— А если отлучат от библиотек, отрежут от публикаций? Вы рассматриваете такой риск?
— Все, что используем мы, всегда было публичным. А есть другие отрасли, которые пользуются платными базами данных, например RELX издательства Elsevier. Они ушли из России, и, соответственно, все институты Академии наук, а также образовательные учреждения потеряли доступ к этой базе. Это сравнимо с тем, как если у программиста отнять Google. Или отнять доступ к GitHub. Поэтому у меня есть проект замены RELX на российскую базу.
Беседовал: Сергей Сычев, ведущий эксперт ИСИЭЗ НИУ ВШЭ