Дата-сайентист

Превращайте сырые данные в решения, которые двигают бизнес вперёд. Дата-сайентисты объединяют статистику, программирование и знание предметной области, чтобы находить закономерности, которые другие упускают.

Медианная зарплата: 180 000 – 280 000 ₽

Сколько зарабатывает дата-саентист?

По данным Хабр Карьера, Glassdoor и Levels.fyi. Реальные офферы зависят от компании, города и переговоров.

Россия

Junior100 000 – 150 000 ₽
Middle180 000 – 280 000 ₽
Senior300 000 – 450 000 ₽

США

Junior$80 000 – $105 000
Middle$110 000 – $145 000
Senior$145 000 – $190 000

Источник: Habr Career, Glassdoor 2025

Как выглядит путь обучения дата-саентиста?

Реалистичный путь за 20 месяцев от нуля до трудоустройства. Скорость зависит от вашего бэкграунда — с опытом программирования или математики вы продвинетесь быстрее.

Месяцы 1-3

Фундамент: Python, статистика и SQL

Освойте основы Python, статистику (распределения, проверка гипотез) и SQL (JOIN, оконные функции). Выполните первый проект — очистите и проанализируйте реальный датасет с помощью pandas.

Месяцы 4-8

Машинное обучение и конструирование признаков

Классический ML: регрессия, деревья, бустинг, кластеризация. Feature engineering и первый пайплайн полного цикла. Практика на Kaggle.

Месяцы 9-14

Глубокое обучение, специализация и эксперименты

Нейронные сети на PyTorch, специализация: NLP или компьютерное зрение. A/B-тестирование и проект полного цикла — от задачи до модели.

Месяцы 15-20+

Портфолио, MLOps и поиск работы

Соберите портфолио из 3-4 проектов на GitHub с документацией. Освойте основы MLOps (MLflow, Docker, CI/CD). Подготовьтесь к собеседованиям: SQL, системный дизайн ML-систем, задачи по вероятности.

Что нужно знать дата-саентисту?

Технические навыки

Python, Pandas, NumPyСтатистика и теория вероятностейSQL и работа с базами данныхМашинное обучение (Scikit-learn)Визуализация данных (Matplotlib, Plotly)Очистка и подготовка данныхГлубокое обучение (PyTorch, TensorFlow)Проектирование признаковA/B-тесты и экспериментыBig Data (Spark, облачные пайплайны)

Гибкие навыки

Критическое мышлениеКоммуникация со стейкхолдерамиПонимание предметной областиЛюбознательность и глубокий анализ

Сколько времени нужно, чтобы стать дата-саентистом?

Срок обучения

9–24 мес.

Срок поиска работы

4–12 мес.

Образование

Бакалавриат по STEM — стандарт. Портфолио и навыки важнее магистратуры

Английский

B2 — для чтения научных статей и работы в международных командах

Тренд спроса

Высокий спрос

Дата-саентист или аналитик данных или ML-инженер — что выбрать?

Аналитик данных

  • Аналитик отвечает на вопрос «что произошло» — дашборды, SQL, отчёты. Сайентист идёт дальше: предсказывает «что произойдёт» с помощью ML-моделей.
  • Инструменты пересекаются: Python, SQL, визуализация. Разница — в глубине статистики и умении строить предиктивные модели. Сайентист решает открытые задачи.

ML-инженер

  • Сайентист — постановка задач, выбор методов, интерпретация результатов. ML-инженер — деплой моделей, инфраструктура, оптимизация и мониторинг.
  • В небольших компаниях роли часто совмещены. В крупных — сайентисты в исследовательских командах, ML-инженеры — в платформенных.

Бэкенд-разработчик

  • Бэкенд — API, базы данных, серверная логика. Сайентист — модели на данных. Пересечение в Python и SQL, но задачи разные.
  • Бэкенд спрашивает: «Как отдать данные?» Сайентист: «Какие в них закономерности?» Переход возможен, но требует изучения статистики и ML.

Какие есть реальные истории перехода в дата-саентиста?

АК

Анна К.

Старший бухгалтер

Старший бухгалтерДата-сайентист в финтех-компании

Анна пять лет работала бухгалтером. Начала изучать Python по вечерам — pandas показался Excel на максималках. Бухгалтерский бэкграунд дал чутьё на аномалии. Два проекта — прогноз оттока и выявление мошенничества — принесли оффер из финтех-стартапа за 18 месяцев.

Срок перехода: 18 месяцев

ДМ

Дмитрий М.

Исследователь-физик

Исследователь-физикСеньор дата-сайентист в e-commerce компании

Дмитрий четыре года занимался физическими исследованиями. Линейная алгебра и статистика были привычны. Сложность — инженерные практики: Git, чистый код. Опыт симуляций помог с рекомендательными системами. Нанят на мидл-позицию через 12 месяцев.

Срок перехода: 12 месяцев

ЕС

Елена С.

Маркетинг-аналитик

Маркетинг-аналитикДата-сайентист в медиа-компании

Елена три года занималась маркетинговой аналитикой. SQL знала, ML — нет. Записалась на курс и применяла методы к рабочим задачам. В портфолио — A/B-тестирование, прогноз LTV, рекомендации. Знание маркетинга сделало её востребованной в медиа.

Срок перехода: 14 месяцев

Какие мифы существуют о дата-саентиста?

Миф

Для работы дата-сайентистом нужна учёная степень.

Реальность

Кандидатская ценится для исследовательских ролей, но большинство позиций ставит практические навыки на первое место. Крепкое портфолио, результаты на Kaggle и способность решать бизнес-задачи откроют больше дверей, чем докторская степень.

Миф

Data Science — это просто продвинутое программирование.

Реальность

Программирование — инструмент, а не суть. Типичный сайентист тратит 60-70% времени на исследование данных и бизнес-контекст. Статистическое мышление и умение задать правильный вопрос важнее написания кода.

Миф

Через пару лет ИИ автоматизирует Data Science.

Реальность

ИИ ускоряет рутину — AutoML подбирает модели, LLM помогают писать код. Но основная работа — понимание бизнес-проблем, дизайн экспериментов, валидация результатов — требует человеческого суждения. Профессия развивается, а не исчезает.

Рынок России

Как выглядит рынок дата-саентиста в России?

Рынок сконцентрирован в Москве, Санкт-Петербурге и Екатеринбурге — эти города дают 75% вакансий. Москва занимает больше половины позиций в крупных IT-компаниях и банках.

Яндекс, VK, Т-Банк и Сбербанк — главные работодатели. Каждая компания содержит ML-команды от десятков до сотен специалистов и активно нанимает на все уровни.

Медали Kaggle и публикации на ML-конференциях имеют значительный вес у работодателей. Они могут компенсировать отсутствие опыта, особенно для кандидатов из академической среды.

NLP для русского языка — серьёзное преимущество. Богатая морфология и меньше предобученных моделей создают спрос на специалистов в медиа, финтехе и e-commerce.

Что чаще всего спрашивают о становлении дата-саентиста?

Готовы начать путь в Дата-саентист?

Получите персональный маршрут с учётом ваших навыков и целей. Бесплатно.