Дата-сайентист
Превращайте сырые данные в решения, которые двигают бизнес вперёд. Дата-сайентисты объединяют статистику, программирование и знание предметной области, чтобы находить закономерности, которые другие упускают.
Сколько зарабатывает дата-саентист?
По данным Хабр Карьера, Glassdoor и Levels.fyi. Реальные офферы зависят от компании, города и переговоров.
Россия
США
Источник: Habr Career, Glassdoor 2025
Как выглядит путь обучения дата-саентиста?
Реалистичный путь за 20 месяцев от нуля до трудоустройства. Скорость зависит от вашего бэкграунда — с опытом программирования или математики вы продвинетесь быстрее.
Месяцы 1-3
Фундамент: Python, статистика и SQL
Освойте основы Python, статистику (распределения, проверка гипотез) и SQL (JOIN, оконные функции). Выполните первый проект — очистите и проанализируйте реальный датасет с помощью pandas.
Месяцы 1-3
Фундамент: Python, статистика и SQL
Освойте основы Python, статистику (распределения, проверка гипотез) и SQL (JOIN, оконные функции). Выполните первый проект — очистите и проанализируйте реальный датасет с помощью pandas.
Месяцы 4-8
Машинное обучение и конструирование признаков
Классический ML: регрессия, деревья, бустинг, кластеризация. Feature engineering и первый пайплайн полного цикла. Практика на Kaggle.
Месяцы 4-8
Машинное обучение и конструирование признаков
Классический ML: регрессия, деревья, бустинг, кластеризация. Feature engineering и первый пайплайн полного цикла. Практика на Kaggle.
Месяцы 9-14
Глубокое обучение, специализация и эксперименты
Нейронные сети на PyTorch, специализация: NLP или компьютерное зрение. A/B-тестирование и проект полного цикла — от задачи до модели.
Месяцы 9-14
Глубокое обучение, специализация и эксперименты
Нейронные сети на PyTorch, специализация: NLP или компьютерное зрение. A/B-тестирование и проект полного цикла — от задачи до модели.
Месяцы 15-20+
Портфолио, MLOps и поиск работы
Соберите портфолио из 3-4 проектов на GitHub с документацией. Освойте основы MLOps (MLflow, Docker, CI/CD). Подготовьтесь к собеседованиям: SQL, системный дизайн ML-систем, задачи по вероятности.
Месяцы 15-20+
Портфолио, MLOps и поиск работы
Соберите портфолио из 3-4 проектов на GitHub с документацией. Освойте основы MLOps (MLflow, Docker, CI/CD). Подготовьтесь к собеседованиям: SQL, системный дизайн ML-систем, задачи по вероятности.
Что нужно знать дата-саентисту?
Технические навыки
Гибкие навыки
Сколько времени нужно, чтобы стать дата-саентистом?
Срок обучения
9–24 мес.
Срок поиска работы
4–12 мес.
Образование
Бакалавриат по STEM — стандарт. Портфолио и навыки важнее магистратуры
Английский
B2 — для чтения научных статей и работы в международных командах
Тренд спроса
Высокий спрос
Дата-саентист или аналитик данных или ML-инженер — что выбрать?
Аналитик данных
- Аналитик отвечает на вопрос «что произошло» — дашборды, SQL, отчёты. Сайентист идёт дальше: предсказывает «что произойдёт» с помощью ML-моделей.
- Инструменты пересекаются: Python, SQL, визуализация. Разница — в глубине статистики и умении строить предиктивные модели. Сайентист решает открытые задачи.
ML-инженер
- Сайентист — постановка задач, выбор методов, интерпретация результатов. ML-инженер — деплой моделей, инфраструктура, оптимизация и мониторинг.
- В небольших компаниях роли часто совмещены. В крупных — сайентисты в исследовательских командах, ML-инженеры — в платформенных.
Бэкенд-разработчик
- Бэкенд — API, базы данных, серверная логика. Сайентист — модели на данных. Пересечение в Python и SQL, но задачи разные.
- Бэкенд спрашивает: «Как отдать данные?» Сайентист: «Какие в них закономерности?» Переход возможен, но требует изучения статистики и ML.
Какие есть реальные истории перехода в дата-саентиста?
Анна К.
Старший бухгалтер
Анна пять лет работала бухгалтером. Начала изучать Python по вечерам — pandas показался Excel на максималках. Бухгалтерский бэкграунд дал чутьё на аномалии. Два проекта — прогноз оттока и выявление мошенничества — принесли оффер из финтех-стартапа за 18 месяцев.
Срок перехода: 18 месяцев
Дмитрий М.
Исследователь-физик
Дмитрий четыре года занимался физическими исследованиями. Линейная алгебра и статистика были привычны. Сложность — инженерные практики: Git, чистый код. Опыт симуляций помог с рекомендательными системами. Нанят на мидл-позицию через 12 месяцев.
Срок перехода: 12 месяцев
Елена С.
Маркетинг-аналитик
Елена три года занималась маркетинговой аналитикой. SQL знала, ML — нет. Записалась на курс и применяла методы к рабочим задачам. В портфолио — A/B-тестирование, прогноз LTV, рекомендации. Знание маркетинга сделало её востребованной в медиа.
Срок перехода: 14 месяцев
Какие мифы существуют о дата-саентиста?
Миф
Для работы дата-сайентистом нужна учёная степень.
Реальность
Кандидатская ценится для исследовательских ролей, но большинство позиций ставит практические навыки на первое место. Крепкое портфолио, результаты на Kaggle и способность решать бизнес-задачи откроют больше дверей, чем докторская степень.
Миф
Data Science — это просто продвинутое программирование.
Реальность
Программирование — инструмент, а не суть. Типичный сайентист тратит 60-70% времени на исследование данных и бизнес-контекст. Статистическое мышление и умение задать правильный вопрос важнее написания кода.
Миф
Через пару лет ИИ автоматизирует Data Science.
Реальность
ИИ ускоряет рутину — AutoML подбирает модели, LLM помогают писать код. Но основная работа — понимание бизнес-проблем, дизайн экспериментов, валидация результатов — требует человеческого суждения. Профессия развивается, а не исчезает.
Как выглядит рынок дата-саентиста в России?
Рынок сконцентрирован в Москве, Санкт-Петербурге и Екатеринбурге — эти города дают 75% вакансий. Москва занимает больше половины позиций в крупных IT-компаниях и банках.
Яндекс, VK, Т-Банк и Сбербанк — главные работодатели. Каждая компания содержит ML-команды от десятков до сотен специалистов и активно нанимает на все уровни.
Медали Kaggle и публикации на ML-конференциях имеют значительный вес у работодателей. Они могут компенсировать отсутствие опыта, особенно для кандидатов из академической среды.
NLP для русского языка — серьёзное преимущество. Богатая морфология и меньше предобученных моделей создают спрос на специалистов в медиа, финтехе и e-commerce.
Что чаще всего спрашивают о становлении дата-саентиста?
Готовы начать путь в Дата-саентист?
Получите персональный маршрут с учётом ваших навыков и целей. Бесплатно.