«Бизнес хочет не просто алгоритм из воздуха»: зачем экономисту разбираться в машинном обучении

Требуется ли экономисту осваивать методы машинного обучения и искусственного интеллекта? Как современные компании применяют artificial intelligence? О роли ML в бизнесе, жизни и учебе рассказал руководитель направления искусственного интеллекта Центра экосистемной защиты «Тинькофф», старший преподаватель департамента статистики и анализа данных НИУ ВШЭ, научный сотрудник Научно-учебной лаборатории макроструктурного моделирования экономики России факультета экономических наук Вышки Руслан Искяндяров.

Проектно-учебная лаборатория экономической журналистики НИУ ВШЭ проводит серию интервью, посвященных тому, как технологии машинного обучения и анализа данных применяются в современных экономических исследованиях, развитии науки, финансовых институтов и подготовке специалистов для разных отраслей экономики.

— Как сегодня в экономике применяются методы машинного обучения? Какие задачи решаются с их помощью?

— Современные компании активно используют методы машинного обучения (Machine Learning, ML) для анализа данных и принятия обоснованных решений, что способствует повышению их эффективности.

Масштабное применение машинного обучения и технологий искусственного интеллекта наблюдается в последние годы, хотя научные основы данной области были заложены десятилетия назад. В прошлом развитие технологий машинного обучения замедлялось из-за ограниченных вычислительных возможностей, однако современный прогресс в данной сфере позволил существенно ускорить и улучшить процессы работы с данными, которые являются фундаментом машинного обучения.

Руслан Искяндяров

С точки зрения бизнеса использование машинного обучения позволяет эффективно решать широкий спектр абсолютно разных задач. Первое, что приходит на ум, — прогнозирование и глубокая аналитика, в том числе работа с временными рядами. Машинному обучению отводится важнейшая роль при создании рекомендательных систем и персонализации сервисов: с помощью подобных технологий продукты компании как бы подстраиваются под каждого пользователя, принося ему максимальную пользу. Алгоритмы машинного обучения не только развивают продукты компании, но и защищают их, обеспечивая совершенно новый уровень безопасности. Например, ML-алгоритмы широко применяются для предотвращения мошеннических операций в отношении клиентов, управления различными рисками, превентивного реагирования на нестандартные ситуации.

В долгосрочной перспективе компании, основывающие свои решения на данных, технологиях машинного обучения и искусственного интеллекта, получают значительное преимущество. Однако важно отметить, что мало просто «запускать код», критически важно понимать, как работают эти подходы и что необходимо сделать для максимизации всех преимуществ технологий машинного обучения.

— Применение методов машинного обучения — общемировая тенденция. Какую позицию на исследовательском рынке занимает Россия?

— Безусловно, применение технологий, связанных с машинным обучением и искусственным интеллектом, — общемировой тренд, а основные прорывы совершаются за рубежом. Однако российские компании стараются не отставать от общих тенденций. В России крупнейшие BigTech- и FinTech-компании, а также корпорации с государственным участием стремительно разрабатывают и развивают собственные алгоритмы машинного обучения и генеративные модели. Правда, говорить о том, что Россия находится на острие развития подобных технологий, пока не приходится. Однако важно не останавливать исследования, ведь если отстать сейчас, то велика вероятность того, что наверстать упущенное будет практически невозможно. Мне кажется, мы осознаем важность этих технологий и активно инвестируем в их развитие.

— С этого года курс по машинному обучению на факультете экономических наук ВШЭ сделали обязательным. Зачем современному экономисту знать машинное обучение и уметь анализировать данные?

— Это лишний раз подтверждает мировые тенденции. Если раньше курс по машинному обучению воспринимался как факультатив и порой мог заинтересовать лишь глубоко погруженных в тему студентов, то сейчас это база. При подборе специалистов все меньше вакансий с требованиями к знаниям Excel и все больше — с требованиями к навыкам работы с большими массивами данных, SQL, Python, знанию алгоритмов машинного обучения и умению их применять на практике. Данный набор компетенций дает кандидатам колоссальное преимущество.

Современные компании жаждут найти универсального специалиста, который находится на пересечении трех областей компетенций. Первая область — глубокое понимание бизнеса. В конечном счете за большинством алгоритмов машинного обучения и технологий искусственного интеллекта скрываются процессы и продукты компаний. Глубокое понимание потребностей клиента, тонкостей взаимодействия клиента и компании, умение генерировать гипотезы, строить стратегию развития — важнейшие бизнес-навыки. Вторая область — математический бэкграунд. Специалист должен понимать, как математически обосновать решение, выбрать и проверить гипотезы и переложить поведение клиентов на язык цифр. Третья область — IT. Современный специалист должен ориентироваться в технологиях, понимать, как взаимодействуют сложные системы, как строятся мобильные приложения, что такое микросервисная архитектура, как сервисы «общаются» между собой.

На пересечении данных областей находятся самые ценные специалисты, способные достигать выдающихся результатов.

— Выпускники факультета компьютерных наук (ФКН) лучше разбираются в перечисленных отраслях, в построении алгоритмов точно. Остаются ли вакансии для выпускников факультета экономических наук?

— Да, у выпускников ФКН прекрасная подготовка: они отлично разбираются в сложных алгоритмах и умеют применять их на практике. На них охотятся, их пытаются найти ведущие компании страны. Вместе с тем есть и ограничения. У высококлассных специалистов уровень оплаты труда обычно выше рынка. Однако нужно понимать, что бизнес — это баланс между расходами и получением прибыли. Вы не будете нанимать высокооплачиваемого специалиста, если у вас нет продуктов, которые приносят прибыль, поэтому экономисты, которые создают продукты, при этом еще и разбираются в машинном обучении и могут применять ML-алгоритмы на практике, точно не находятся на заднем плане рынка труда, а порой даже выходят на его передний край.

Кроме этого, порой важно не только уметь разрабатывать модели машинного обучения, но и понимать, где и как их применение покажет максимальную эффективность. Топ-специалисты не только умеют разрабатывать модели, но и могут найти им самое эффективное применение, знают, как они будут работать на «проде» и сколько будет стоить внедрение модели, как она будет связана с другими системами и продуктами компании.

К сожалению, далеко не все выпускники, специализирующиеся исключительно на машинном обучении, понимают особенности бизнеса и IT-архитектуру.

— С бизнесом и корпорациями понятно, а ищут ли таких специалистов, например, государственные компании?

— На мой взгляд, в данной ситуации госкорпорации выступают в роли догоняющих. BigTech- и FinTech-компании традиционно могут предоставить более конкурентные условия труда. Места для маневра у компаний государственного сектора здесь не так много. Однако компании госсектора порой отличают масштаб задач и принятие стратегических решений, которые оказывают влияние на всю страну. Они оказывают огромное влияние на социально-экономическую политику. Именно в рамках государственных структур вы можете получить возможность обосновывать и принимать решения, влияющие на всех. Это могут быть решения в области денежно-кредитной политики, различные социально-экономические программы и проекты.

— Вы руководите направлением искусственного интеллекта Центра экосистемной защиты «Тинькофф». Какие задачи вам приходится решать?

— Я отвечаю за развитие и внедрение алгоритмов машинного обучения и искусственного интеллекта в процессы и продукты антифрода (anti-fraud — букв. «борьба с мошенничеством», система, применяемая финансовыми организациями с целью проверки подозрительных транзакций. — Ред.). Мы стараемся защитить наших клиентов от любых мошеннических действий со стороны третьих лиц, в том числе с использованием подобных технологий. Фактически направление пронизывает все бизнес-линии компании — от традиционных банковских услуг и услуг эквайринга до инновационных FinTech-сервисов, например «Тинькофф Мобайл».

Разнообразие продуктов, бизнес-линий и задач, которые перед нами стоят, привело к тому, что направление фактически включает в себя все области машинного обучения и искусственного интеллекта — от классических ML, NLP (обработка естественного языка. — Ред.) и CV (компьютерное зрение. — Ред.) до генеративных моделей, в том числе языковых. Моя задача — успешное стратегическое развитие данного направления.

— На основе каких данных вы принимаете решения о развитии направления? Как выбираете стратегию?

— В первую очередь мы отталкиваемся от потребностей нашего клиента: стремимся максимизировать его защиту при минимальном уровне беспокойства, предлагать качественные и прорывные AI-ориентированные продукты. Мы также пристально следим за современными тенденциями в области искусственного интеллекта, уделяем внимание научным исследованиям в данной области, для того чтобы всегда быть на острие технологий.

— Можете привести пример рабочей модели?

— В нашем арсенале есть модель, которая предсказывает вероятность того, что клиент в ближайшем будущем будет подвержен мошенничеству со стороны третьих лиц. В ней учитывается большое количество факторов, в том числе социально-экономические. Мы выделяем группы клиентов на основе их профиля, характера совершаемых операций, типичности параметров операций для каждого из клиентов. На основе этой информации мы предсказываем вероятность того, что нашего клиента в ближайшем будущем могут обмануть мошенники, а в случае высокой вероятности превентивно реагируем и дополнительно защищаем.

Фото: iStock

— Помимо работы в «Тинькофф», вы также занимаетесь преподавательской деятельностью в НИУ ВШЭ. Как вам удается совмещать эти сферы?

— Ответ достаточно прост: мне нравится то, чем я занимаюсь. Еще на третьем курсе университета я понял, что хочу развиваться не только в профессиональной сфере, но и в научной. Поступил в аспирантуру, успешно защитил кандидатскую диссертацию и продолжаю делиться знаниями и своим опытом со студентами. При этом научный трек развития способствует эффективному решению рабочих задач, объединению единомышленников и вдохновляет на воплощение в жизнь смелых идей.

— На страничке вашего профиля указано, что вы интересуетесь HFT (высокочастотным трейдингом, high-frequency trading. — Ред.). Как в этой сфере применяется машинное обучение? Мы по поводу HFT знаем, что только умные программисты пишут код на С++.

— HFT — область моих научных интересов. Кандидатскую диссертацию я защищал именно по теме HFT, и она была связана с проблемами выявления недобросовестного поведения и манипулирования финансовыми рынками с помощью высокочастотных торговых алгоритмов. В целом машинное обучение на финансовых рынках применяется повсеместно, поскольку высокочастотные алгоритмы и в целом торговые площадки — это высоконагруженные системы, огромные потоки информации, миллионы участников, миллиарды операций и триллионы оборота. Объемы данных такого масштаба без эффективных подходов проблематично не то что осознать — даже обработать. Человек не способен эффективно переваривать подобные массивы информации, без ML здесь не обойтись. Как и не обойтись без ML-алгоритмов в вопросах выявления недобросовестного поведения участников рынка, оценки их действий и влияния этих действий на остальных участников.

При этом все больше участников применяют HFT-алгоритмы. Скорость — то, что их отличает, и быстрые языки программирования, в том числе C++, здесь как нельзя кстати. Однако написать робота порой недостаточно. Без глубокого понимания экономической сущности механизма финансового рынка он вряд ли будет претендовать на успех. Именно поэтому глубокие знания об особенностях функционирования рынка и тонкостях процессов ценообразования, процессов взаимодействия участников являются крайне важными.

— Что пока не под силу машинному обучению?

— Несколько лет назад многие заявляли, что творчество — это не про машинное обучение и искусственный интеллект. Им отводились задачи анализа данных, предсказаний. Однако относительно недавно выяснилось, что, например, LLM (большие языковые модели. — Ред.) и другие генеративные модели, оказывается, могут прекрасно генерировать сложные стихотворения, создавать невероятные изображения и писать уникальную музыку, которые человек воспринимает как нечто выдающееся. Получилось так, что искусственный интеллект преодолел творческий барьер, поэтому говорить о том, что машинное обучение и искусственный интеллект неспособны решить конкретные задачи, становится все сложнее. Любые обозначенные человечеством барьеры пока просто не преодолены, но это обязательно произойдет в будущем.

Пока мы видим, что алгоритмы искусственного интеллекта теряются в принятии этических, моральных и социальных решений: мы пока не научились перекладывать желания, мысли и переживания человека на язык цифр. У нас не создан нейроинтерфейс для сбора этой информации. Когда это случится, барьер принятия этических решений падет. Посмотрим, что будет в ближайшем будущем.

Факультеты экономических и компьютерных наук ВШЭ реализуют образовательную программу бакалавриата «Экономика и анализ данных» с целью подготовки высококлассных специалистов в области математики, программирования и анализа данных, которые имеют при этом фундаментальные знания в сфере экономики и финансов.

Обучение на программе проходит совместно со студентами двух флагманских бакалаврских программ: «Экономика» факультета экономических наук и «Прикладная математика и информатика» факультета компьютерных наук по модульной системе обучения. Два направления подготовки существенно расширяют спектр возможных направлений профессиональной деятельности, от финансовой аналитики до программирования.