Антон М. Data Scientist, Senior
ID 26551
АМ
Антон М.
Мужчина, 30 лет
Россия, Москва, UTC+3
Ставка
3 896,1 Р/час
НДС не облагается
Специалист доступен с 4 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Владею инструментами для работы с данными на всех этапах:
- сбор данных из внешних источников (парсинг) или работа с внутренними базами данных
- анализ данных в jupyter notebook
- моделирование
- вывод моделей в продакшн: airflow, docker
- проведение A/B тестов и оценка их результатов: умею работать с ratio метриками
Умею писать понятный код на python, с логированием и автотестами. Владею инструментами bigdata: умею писать map reduce задачи, а также владею pyspark, имею опыт с Cassandra. Люблю NLP во всех его проявлениях.
Обладаю навыками необходимыми для менторинга младших коллег, умею давать развивающую обратную связь.
Понимаю каким образом должна выглядеть инфраструктура данных для продуктивного моделирования. Имею опыт создания витрин признаков, написания регламентов по работе с данными, формализации пайплайнов моделирования.
Проекты
(5 лет 1 месяц)
Модель NPD, Система оценки А/В тестов
Роль
Ведущий Data Scientist
Обязанности
Проект моделей маркетинговых оптимизаций. Разработка моделей для оптимизации маркетинговых стратегий с целью повышения эффективности рекламных кампаний и увеличения возврата на инвестиции (ROI). Проект включает в себя анализ данных о клиентах, их поведении, а также оценку эффективности различных каналов маркетинга.
-Разработка моделей в рамках маркетинговых оптимизаций: модели NPD, элементы рекомендательной системы, векторное представление клиентов на основе чеков. -Разработка витрины с более чем 200+ различными признаками и 4 различными модальностями, разработка дорожной карты развития ML решений.
-Разработка автоматизированной системы оценки А/В тестов с ratio/non-ratio метриками.
-Менторинг младших коллег.
-Планирование спринта, оценка нагрузки на команду, помощь в разработки критериев отбора кандидатов.
-Работа в клиентских стримах ВИП, трафик, отток
-Работа с ПРОМО Товарами (рекомендательные сервисы механик upsell, cross-sell. Реализация базовых моделей в магните под моим руководством)
-Разработка алгоритмов рекомендаций в рамках работы с промо товарами и увеличения покупательской активности
-Прогнозирование оптимальной скидки
Достижения
Модель NPD: используется для запусков маркетинговых кампаний для определения склонности к посещению в период следующих 7 дней.
Витрина признаков: снижение временных затрат на сбор данных для команды ML разработчиков.
Система оценки А/В тестов: снижение временных затрат на анализ рекламных кампаний, появилась возможность декомпозиции бизнес метрик + появилось более детальное понимание влияния на поведение клиента.
Векторное представление: позволило оптимизировать этап деления клиентских выборок для запуска А/В теста, дополнительные признаки для любых моделей отклика.
Стек специалиста на проекте
SQL, Python, PyTorch, CatBoost, statmodels, deeppavlov
Отрасль проекта
Cloud Services
Период работы
Январь 2024 - По настоящее время
(1 год 7 месяцев)
Банковский проект
Роль
Data scientist
Обязанности
Массовая персонализация В2С (B2C) в Сбер направлен на создание индивидуализированных предложений и услуг для клиентов на основе их поведения, предпочтений и потребностей. Цель проекта — повысить уровень удовлетворенности клиентов, увеличить лояльность и, как следствие, повысить доходность компании.
Сбор и подготовка данных:
Сбор данных о клиентах из различных источников (CRM-системы, транзакционные данные, данные о взаимодействии с продуктами и услугами).
Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток).
Анализ данных:
Проведение разведывательного анализа данных (EDA) для выявления ключевых факторов, влияющих на поведение клиентов.
Использование визуализаций для представления результатов анализа и выявления сегментов клиентов.
Сегментация клиентов:
Применение методов кластеризации (например, K-means или DBSCAN) для группировки клиентов по схожим характеристикам и поведению.
Определение целевых сегментов для дальнейшей персонализации предложений.
Разработка моделей рекомендаций:
Создание систем рекомендаций на основе коллаборативной фильтрации или контентной фильтрации для предложения продуктов и услуг.
Использование алгоритмов машинного обучения (например, градиентный бустинг или нейронные сети) для предсказания вероятности покупки.
Анализ эффективности персонализации:
Проведение A/B-тестирования для оценки влияния персонализированных предложений на конверсию и другие ключевые показатели эффективности (KPI).
Мониторинг результатов тестов и корректировка моделей на основе полученных данных.
Внедрение решений:
Подготовка отчетов с выводами и рекомендациями по внедрению персонализированных предложений в маркетинговые стратегии.
Сотрудничество с командами разработки и маркетинга для интеграции моделей в существующие системы.
Мониторинг и оптимизация:
Установка KPI для оценки успешности внедренных решений.
Регулярный анализ результатов работы моделей и их корректировка на основе новых данных.
Обучение команды:
Проведение семинаров или тренингов для команды по использованию разработанных моделей и инструментов аналитики.
Разработка модуля обработки текстовой информации в рекомендательной системе участия в торговых процедурах
Достижения
Текущая модель наилучшего времени коммуникации в канале телефон + робот получила 11% прироста CR.
Прогноз трат на школьника: модель являлась составляющей масштабного проекта “Ромашка” по предсказанию жизненных ситуаций клиента, наличие данной модели позволило приблизить проект к завершению еще на один шаг.
Стек специалиста на проекте
SQL, PyTorch, CatBoost, PySpark, shap
Отрасль проекта
FinTech & Banking
Период работы
Апрель 2023 - Январь 2024
(10 месяцев)
Банковский проект
Роль
Data Scientist
Обязанности
Построение моделей для банковских продуктов. Построение моделей для банковских продуктов в Газпромбанке направлен на разработку и внедрение аналитических решений, которые помогут оптимизировать предложения банковских услуг, повысить эффективность кредитования, улучшить управление рисками и увеличить клиентскую лояльность. Проект включает в себя использование методов машинного обучения и анализа данных для создания предсказательных моделей.
Сбор и подготовка данных:
Сбор данных из различных источников, включая CRM-системы, транзакционные данные, данные о клиентах и их взаимодействии с продуктами банка.
Очистка и предобработка данных: обработка пропусков, нормализация признаков, создание новых переменных (например, на основе временных меток).
Анализ данных:
Проведение разведывательного анализа данных (EDA) для выявления закономерностей в поведении клиентов и факторов, влияющих на принятие решений.
Использование визуализаций для представления результатов анализа и выявления ключевых сегментов клиентов.
Разработка моделей кредитного скоринга:
Создание моделей для оценки кредитоспособности клиентов с использованием методов машинного обучения (например, логистическая регрессия, деревья решений, градиентный бустинг).
Оценка вероятности дефолта по кредитам на основе исторических данных о клиентах.
Персонализация предложений:
Разработка систем рекомендаций для предложения продуктов и услуг на основе анализа клиентского поведения.
Использование алгоритмов коллаборативной фильтрации или контентной фильтрации для создания персонализированных предложений.
Выявление мошенничества:
Построение моделей для обнаружения аномалий в транзакциях с целью выявления потенциальных мошеннических действий.
Применение методов машинного обучения (например, кластеризация или методы классификации) для автоматизации процесса мониторинга.
Анализ эффективности моделей:
Проведение A/B-тестирования для оценки влияния внедренных моделей на бизнес-показатели (например, уровень одобрения кредитов или конверсия по предложениям).
Мониторинг результатов тестов и корректировка моделей на основе полученных данных.
Внедрение решений:
Подготовка отчетов с выводами и рекомендациями по внедрению разработанных моделей в бизнес-процессы банка.
Сотрудничество с командами разработки и маркетинга для интеграции аналитических решений в существующие системы.
Обучение команды:
Проведение семинаров или тренингов по использованию разработанных моделей и инструментов аналитики для сотрудников банка.
Достижения
Модели отклика: сокращение финансовых затрат на маркетинговые кампании в заведомо дорогом канале связи СМС.
Система мониторинга: сокращение трудовых затрат сотрудников на отслеживание качества моделей находящихся в проде
Стек специалиста на проекте
SQL, Matplotlib, Sklearn, CatBoost, PySpark, shap
Отрасль проекта
FinTech & Banking
Период работы
Август 2020 - Июнь 2021
(11 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Национальный исследовательский университет "Высшая школа экономики", Москва
Специальность
Департамент прикладной математики, Математические методы моделирования и компьютерные технологии
Завершение учебы
2021 г.
Высшее
Учебное заведение
Национальный исследовательский университет "Высшая школа экономики", Москва
Специальность
Департамент прикладной математики, Прикладная математика
Завершение учебы
2018 г.