Как нейросети работают и помогают нам учиться

Фото: iStock
Фото: iStock

«Матрица», «Бегущий по лезвию» и другие фантастические фильмы создали в обществе представление об искусственном интеллекте как о сверхразуме. На деле ИИ — просто математический алгоритм, который вычисляет закономерности в поведении человека и старается им подражать. Как передать нейросетям часть рутинных функций и при этом создать себе больше возможностей для творчества и саморазвития, рассказала старший преподаватель факультета компьютерных наук Дарья Касьяненко. Вебинар «Как использовать ИИ, чтобы помочь себе учиться?» был организован Центром непрерывного образования ФКН НИУ ВШЭ.

Стохастические попугаи: как работают нейросети

У современного человека много заблуждений об искусственном интеллекте. Образ ИИ сильно искажен поп-культурой, и в первую очередь фильмами. «Это “Космическая одиссея” Стэнли Кубрика, где был представлен культовый персонаж Элл — искусственный интеллект, который способен пожертвовать человеческими жизнями ради достижения цели космической экспедиции. Или, например, репликанты в фильме “Бегущий по лезвию” Ридли Скотта, которых было не отличить от настоящих людей. “Матрица” Вачовски, конечно же», — перечисляет эксперт Центра непрерывного образования, старший преподаватель факультета компьютерных наук Дарья Касьяненко.

Дарья Касьяненко

Людям порой кажется, что нейросети — это некий сверхмощный разум. Но в действительности у искусственного интеллекта есть ограничения. Например, ChatGPT — наиболее мощный чат-бот с искусственным интеллектом — всего лишь попугай, повторяющий за человеком.

ChatGPT входит в категорию GenAI — генеративного искусственного интеллекта. Это тот тип искусственного интеллекта, который генерирует тексты, изображения, музыку и все что угодно в ответ на запрос от человека.

Нейросети вроде ChatGPT еще называют большими языковыми моделями (БЯМ). БЯМ умеют генерировать тексты. Для этого их обучают на больших наборах текстовых данных. По словам разработчиков, последнюю модель ChatGPT обучали на миллионе гигабайт текстовых данных.

Обучение происходит так: в нейросеть загружают тексты, написанные человеком. Например, произведения писателей или новости из интернета. Модель анализирует эти тексты. Она берет два слова и вычисляет, как часто эти слова встречаются в тексте рядом — в одном предложении, абзаце или тексте. Когда нейросеть изучила связи между словами в языке, она может подбирать предложения, похожие на человеческие. Развитые модели могут набирать целые тексты.

«Такие модели еще называют стохастическими попугаями. Стохастический — от греческого “случайно угаданный”. То есть нейросети хорошо генерируют тексты, но не понимают их значение. В общем-то, как попугаи, которые подражают человеку», — подытожила Касьяненко.

7 нейросетей для науки и учебы

Тем не менее «попугаи» могут быть полезны. В частности, человек может делегировать такой нейросети часть рутинных задач. Дарья Касьяненко выделяет несколько инструментов, которые она рекомендовала бы использовать в учебе или работе.

  • ChatGPT. Важно иметь в виду, что он обучен на данных, собранных до 2021 года. Иначе говоря, ChatGPT не сможет выдать текст о событиях, произошедших в 2022 или 2023 году. Чтобы написать текст с учетом последних новостей, Дарья Касьяненко советует использовать Hugging Chat и Chatsonic. 
  • Chatsonic проводит поиск в Google актуальных событий, позволяет верифицировать данные и выдает текст с источниками. Как и в ChatGPT, в этой нейросети можно писать код. 
  • HuggingChat — open-source чат-бот, созданный компанией HuggingFace, которая уделяла особое внимание этике и прозрачности при разработке и обучении модели. 
  • Wiseone позволяет получить саммари любой страницы в интернете. Это расширение в браузере Google Chrome, которое позволяет делать обобщение больших текстов и получать саммари за считанные секунды. В «Яндекс Браузере» есть встроенная нейросеть YandexGPT с аналогичной функцией. 
  • Deepl поможет перевести текст на английский без ошибок. Это онлайн-переводчик, генерирующий иностранный текст с помощью суперкомпьютера, работающего в Исландии. В приложении есть раздел DeepL Write — там можно написать текст на английском или немецком, и программа проверит грамматические ошибки. 
  • Perplexity — это поисковый чат-бот, который указывает источники и предлагает похожие запросы. Других ссылок на сайты, как в классических поисковиках, у него нет. Пользователи могут посмотреть короткий или детальный ответ, а также работать с источниками — удалять, добавлять новые и переходить по ссылкам. 
  • ChatPDF— работает с pdf-файлами: учебными материалами, статьями, документами. Анализирует весь корпус текстов и использует его как базу для дальнейших запросов.         

Еще есть целая категория нейросетей для учебы под названием EdGPT, то есть EducationGPT. Они нацелены на доработку БЯМ с помощью небольшого количества высококачественных и узкоспециализированных данных. Например, MathGPT — это бесплатный сервис, предназначенный для решения математических задач.

Промпт-инжиниринг: как написать запрос для нейросети

«Кто работал когда-нибудь в ChatGPT, знает: чтобы получить то, что вам нужно, надо достаточно долго помучить сервис, чтобы он вам отдал не просто некий набор каких-то там рандомных фактов или текстов, а именно то, что вам нужно», — говорит Дарья Касьяненко. Чтобы работать эффективно, нужно правильно писать запросы для ИИ.

Запрос, который человек пишет для нейросети, называется промптом. Промпт-инжиниринг — это искусство составления вопросов или инструкций для языковых моделей.

Дарья Касьяненко рекомендует писать запросы по системе S.M.A.R.T. (от англ. specific, measurable, achievable, relevant, time bound — конкретика, измеримость, достижимость, актуальность и ограниченность по времени. — Ред.). Это аббревиатура, обозначающая принципы постановки задач. Систему используют менеджеры, когда объясняют задачи сотрудникам. Например, задача должна быть конкретной — specific, это слово зашифровано буквой S.

Источник: FusionBrain.AI. Картинка, созданная нейросетью Kandinsky по рекомендованному промпту: «Милый котенок в новогодней шапке, пушистый, сказочно. Cтиль: цифровая живопись».

Часть принципов S.M.A.R.T. можно применить и для написания промпта. Промпт должен состоять из максимально конкретных терминов и слов, потому что нейросеть опирается на ключевые слова как на ассоциации. Если использовать ключевые слова со слишком широким смыслом, нейросеть может выдать результат из другой области. По этой же причине важно, чтобы все слова промпта относились к теме запроса. Это тоже один из принципов S.M.A.R.T. — принцип relevant, «относящийся к делу», зашифрованный буквой R.

Еще Дарья Касьяненко рекомендует приводить нейросети примеры, иллюстрирующие желаемый ответ или формат генерируемых дополнений, и объяснять контекст, который важен для генерации релевантных ответов. Работа с нейросетями — итеративная работа, то есть в процессе нужно будет несколько раз уточнять и повторять запрос, экспериментируя с различными вариантами.

Составление промптов похоже на написание запросов в поисковики «Яндекса» или Google, когда они только появились.

Такое «общение» с нейросетью удивляет людей: мы привыкли понимать под искусственным интеллектом некоего робота, похожего на человека. Но нейросети работают совсем не так.

Дата публикации: 15.12.2023

Автор: Артём Самойлов, стажер-исследователь Проектно-учебной лаборатории экономической журналистики НИУ ВШЭ

Будь всегда в курсе !
Подпишись на наши новости: