Академический руководитель программы профессиональной переподготовки «Аналитик данных», аналитик данных в «Яндекс Go» Ксения Байдина рассказала HSE Daily о том, как выглядит ее рабочий день, какие задачи ей приходится решать, какие навыки нужны аналитику данных и чем отличается обучение в университете в России и Германии.
— Кем ты работаешь?
— Я занимаюсь аналитикой водителей-партнеров, сотрудничающих с «Яндекс Такси». Отвечаю за часть про субсидии для водителей, например доплату за определенное количество выполненных заказов. Мы стараемся мотивировать водителей, чтобы они были более лояльны к сервису. И еще в свободное от работы время я участвую в организации Матемаркетинга — крупнейшей аналитической конференции в России. Там я отвечаю за программу.
— Как выглядит твой стандартный рабочий день?
— На работе я совмещаю задачи аналитика с работой менеджера. Например, я общаюсь с разработкой о том, как технически должны быть устроены субсидии, и участвую в обсуждении того, как они должны выглядеть с точки зрения продукта в приложении для водителей. Также я общаюсь с другими людьми в компании (стейкхолдерами), которые хотят использовать субсидии.
Стандартный рабочий день описать сложно. На одной неделе у тебя может быть много релизов, и ты будешь заниматься преимущественно менеджерскими задачами, а на другой — ты уже пишешь код или перед тобой стоит исследовательская задача, ответ на которую нужно найти.
В «Яндекс Такси» у аналитиков широкий спектр задач, мы не пишем целыми днями код в вакууме. Мы часто взаимодействуем с разработкой как прослойка между ею и менеджерами. Если ты не понимаешь, как работает тот или иной элемент, ты идешь к разработке. Поэтому с разработкой достаточно плотно общаемся, и тем более с менеджерами. Поэтому нужно уметь разговаривать на языке смежных отделов.
— Что тебе нравится в твоей работе?
— Переключаемость и разнообразие. Я не тот человек, который будет заниматься все время чем-то одним. Переключаемость — в том, что сегодня я пишу код, а завтра я больше менеджер.
В стартаперской и IT-атмосфере всегда чувствуется недостаток ресурсов. На фоне того, что есть постоянный недостаток аналитиков, есть возможность выбирать разные направления, в которых можно поработать. Список задач условно бесконечен, и в зависимости от того, что принесет наибольший эффект в нужный момент, и от того, что интересно тебе, всегда можно найти что-то, что ты хочешь делать именно в этот момент. Ты всегда ощущаешь свою нужность.
— С какими трудностями ты сталкиваешься на работе?
— С одной стороны, общение с разработкой для меня плюс. С другой стороны, бывают проблемы с коммуникацией: разработка не всегда предупреждает о внедрении новых фичей (feature — дополнительная функция) и изменении логирования. В таких случаях аналитика ломается — нужно разбираться.
Фото: iStock
Во-вторых, время уходит и на поиск багов. Нужно научиться очень аккуратно писать код, и если ты думаешь: «Ладно, я не буду вот это учитывать, потому что такое невозможно», — то обязательно окажется, что такое еще как возможно.
Очень много времени уходит на обработку, подготовку и исследование данных.
— Ты раньше вела блок по прикладной статистике в программе «Аналитик данных». Расскажи, пожалуйста, о чем там идет речь.
— Прикладная статистика — это почти та же самая статистика, которую преподают в университете, но с учетом того, как оно работает в жизни. Там, например, разбирают различные классические статистические методы, но с уклоном не в то, как эта формула абстрактно работает и как она считается руками, а как она работает на реальных данных. Из этого блока можно узнать, как данные могут обмануть, потому что у статистических методов есть какие-то границы применимости. Если не знать этих границ, можно смотреть на результаты статистики и неверно интерпретировать данные.
— Какие базовые навыки нужно иметь, чтобы начать работать аналитиком?
— Набор базовых навыков сильно зависит от типа компании. Я буду говорить про IT-компании, так как в этой сфере я больше всего крутилась. Для IT-компании в России обязательный минимум — знание Python. Почему в России? Я работала в Германии, там все пишут на R, например. Все продакшн-процессы на R — это просто такой стандарт компании.
Как минимум на базовом уровне важно знать алгоритмы.
Еще очень важен SQL, он используется чаще всего. Но освоить его проще, чем Python, поэтому ставлю его на второе место. Многие наши стажеры начали с ним работать уже после трудоустройства.
Из технических навыков, конечно, это статистика. Тебе придется постоянно применять тесты, проверять и запускать их, поэтому тут должно быть очень хорошее понимание.
Машинное обучение полезно знать хотя бы на базовом уровне. Знать, что это такое, разные модели, но я лично на практике их не применяю: продуктовый аналитик может прожить без глубокого понимания ML. Еще, кстати, Excel никто не отменял. Например, когда я работала с отделом продаж, я отдавала им результаты в Excel, потому что им так было проще читать. Из технических навыков — можно уже с этим набором устраиваться.
— А какие нетехнические навыки нужны?
— Для аналитика не менее важны критическое мышление и умение думать. То есть просто нужна голова.
Часто к тебе приходит менеджер, показывает метрику. Метрика сначала идет стабильно, потом резко возрастает и тут же уходит в ноль. И менеджер тебя начинает расспрашивать, почему так вышло. Ответ совершенно не очевиден, и тут тебе не поможет ни Python, ни SQL. Это все вспомогательные инструменты, а нужна тебе тут будет твоя голова, чтобы генерировать гипотезы, уметь декомпозировать эту проблему. Или другой типичный пример: маркетологи закупили трафик, а ты видишь, что конверсии покупок начинают падать. Здесь может быть два виноватых: либо маркетологи привели такой трафик, либо продукт плохой. И ты начинаешь разбираться.
— Ты все время говоришь про продуктовую аналитику, и может возникнуть вопрос: а что, есть какая-то другая?
— Маркетинговая аналитика, аналитика больше с ML, в целом аналитик данных — наверное, два крупных стрима по количеству запросов… Еще есть системные аналитики, бизнес-аналитики — это вообще все совершенно разные люди. Размах еще больше, чем с менеджерами. Поэтому я больше говорю про аналитиков, которые занимаются данными. Я больше, наверное, маркетинговый и продуктовый аналитик.
Фото: iStock
— Ты говорила, что ты была в Германии, расскажи поподробнее.
— Я училась в магистратуре в Германии и параллельно с этим работала в университете исследователем. После окончания проработала там полтора года и еще полгода — в DS в сети строительных супермаркетов OBI. У них очень большое онлайн-направление. Я работала в команде, которая обрабатывала онлайн-поведение пользователей. Пришлось разобраться в том, как люди строят свои дома.
— Есть ли какие-то различия в работе в России и в Германии?
— Как минимум то, что там используют R, а здесь Python. А еще в Германии принято все прорабатывать досконально, а потом уже делать. Как-то раз команда, в которой я работала, полгода делала дашборд с ключевой метрикой для топов. А в России все происходит гораздо быстрее, потому что скорость важнее, и к результату приходят постепенно, шаг за шагом. То есть если ты делаешь хороший результат через полгода, то это уже не очень интересно. А в Германии было все более размеренно, более обдуманно. С одной стороны, иногда это хорошо, потому что мелочи иногда очень сильно влияют на итоговый результат, а с другой стороны, не всегда они так сильно влияют на итоговый результат. Подчеркну, что это мой опыт, я не претендую на репрезентативность. В Германии есть и другие, более приближенные к стартапам компании, в которых действуют по правилу Парето: 20% усилий приносят 80% результата. Приложил усилия — и получил какой-то результат. А остальные 80% усилий, которые дадут еще 20% результата, лучше вложить в другое место.
— Может, ты хочешь что-то добавить?
— Повторюсь: технические навыки — это, безусловно, важно, но самое важное качество аналитика — просто уметь думать, уметь критически на все смотреть, генерировать гипотезы, проверять их, желательно быстро, и допускать различные варианты. Нужно научиться в себе это развивать, рассматривать все возможные варианты, даже которые кажутся совсем невозможными, и, наверное, еще важно воображение — для генерирования гипотез.
Изучить базы данных и язык SQL, язык Python, его применение для сбора, визуализации и анализа данных, статистику и машинное обучение, а также аналитические и продуктовые подходы для работы над реальными задачами можно на программе профессиональной переподготовки «Аналитик данных».