ИМ
Илья М.
Мужчина, 28 лет
Россия, Москва, UTC+3
Ставка
4 545,45 Р/час
НДС не облагается
Специалист доступен с 4 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Главное о специалисте
5+ лет опыта в ML и анализе данных, включая продакшн-разработку моделей.
Коммерческий опыт с рекомендательными системами (Implicit, LightFM, SVD, DL-based), включая:
Collaborative Filtering (ALS, LightFM, SVD);
Matrix Factorization (SVD, ALS);
Two-Tower Model (Deep Learning) — моделирование с использованием контентных признаков (тексты, эмбеддинги видео/аудио/изображений);
Hybrid Model (CF + Content-Based) — интеграция поведенческих и контентных фич для рекомендаций;
Transformer-based модели (YouTube DNN, SASRec) — учет последовательностей взаимодействий пользователей.
Глубокое понимание алгоритмов RecSys и бустинга (LightGBM, CatBoost, XGBoost).
Разработка и деплой моделей (классификация, регрессия, ранжирование) с использованием:
PyTorch, TensorFlow;
Triton Inference Server, TorchServe, TF Serving
Feature engineering для RecSys и других задач;
Проведение A/B-тестирования рекомендательных моделей и новых фич;
Построение end-to-end ML пайплайнов, автоматизация CI/CD;
Опыт с высоконагруженными и распределёнными системами (Spark, Dask, Ray);
Разработка REST API (Flask, FastAPI), опыт работы с облаками (AWS, GCP, Yandex Cloud);
Использование LLM (в т.ч. RAG) для бизнес-задач и интеграции с рекомендательными системами;
Уверенное владение Python, Docker, Kubernetes;
Анализ и визуализация данных (NumPy, SciPy, Pandas, Plotly).
Проекты
(4 года 9 месяцев)
MARS Inc.
Роль
Data Scientist
Обязанности
Построение моделей прогнозирования спроса и каннибализации.
Работа с RecSys алгоритмами
Детектирование аномалий во временных рядах.
Семантический поиск и создание чат-ботов для HR и внутренней документации.
Применение моделей бустинга.
Опыт работы с промо товарами в рекомендательных системах
Опыт работы с предсказаниями спроса с помощью промо
Достижения
Реализовал NLP-пайплайн на базе моделей E5-Large и OpenAI API.
Разработал языковых ассистентов для работы с внутренними данными компании.
Оптимизировал скорость инференса моделей с использованием VLLM.
Стек специалиста на проекте
langchain, modelio, AWS, llm, ClickHouse, Spark, FastAPI, Scikit-learn, PyTorch, sagemaker, PySpark, Python, RecSys, Flask, LightFM, dl, Yandex Cloud, svd, milvus
Отрасль проекта
HRTech
Период работы
Март 2023 - Май 2025
(2 года 3 месяца)
ИВНД РАН (Институт высшей нервной деятельности РАН)
Роль
Data Scientist
Обязанности
Обработка ЭЭГ, МЭГ, фМРТ-данных.
Классификация временных рядов с помощью PCA, ICA, CSP, Riemann geometry.
Построение моделей на основе линейной регрессии, LightGBM, LSTM.
Проведение научных исследований и подготовка публикаций на английском языке.
Достижения
Построены модели прогнозирования спроса для основных продуктов компании
Построен пайплайн аналитики продуктов
Стек специалиста на проекте
Python, ClickHouse, NLTK, Lightgbm, PySpark, HuggingFace, deeppavlov
Отрасль проекта
Government & Public Sector
Период работы
Сентябрь 2020 - Май 2025
(4 года 9 месяцев)
Разработка рекомендательной системы для рекламных placement’ов и креативов
Роль
Data Scientist
Обязанности
Реализация продакшн-ориентированной рекомендательной системы для подбора рекламных placement’ов и креативов с учетом поведения пользователей, тематики приложений и контентных признаков. Система интегрирована в маркетинговую платформу с высоким трафиком, поддерживает A/B тестирование и масштабируется через распределенную инфраструктуру.
Ключевые задачи:
Разработка гибридной рекомендательной модели:
Поведенческий компонент: Collaborative Filtering (ALS, Implicit, LightFM) и Matrix Factorization.
Контентный компонент: эмбеддинги BERT/ruBERT/fastText + item similarity через FAISS, Milvus
Финальное объединение — Tower Model
Обработка текстовых данных (названия/описания приложений):
NER, topic modeling, классификация (TF-IDF, LDA, BERT);
Построение контентных эмбеддингов через Sentence-BERT и ruBERT.
Разработка пайплайнов A/B тестирования и автоматизация анализа uplift/CTR.
Feature engineering.
Детектирование аномалий (в показах, кликах, метриках вовлеченности) через модели и правила.
Визуализация сегментов и результатов тестов.
Достижения
Реализована гибридная рекомендательная система, учитывающая тематику, поведение и метаданные;
Построена система кластеризации placement’ов (контент + поведение), улучшившая cold start;
Повышение CTR на ~15% в тестовых группах (по сравнению с ручной подборкой);
Разработан масштабируемый пайплайн A/B тестов с авторасчётом uplift и доверительных интервалов;
Внедрена система поиска похожих placement’ов через Milvus на продакшене.
Стек специалиста на проекте
transformers, Bert, mlp, kuber, ClickHouse, Spark, Numpy, Elasticsearch, Pandas, SciPy, Redis, FastAPI, Scikit-learn, NLTK, PyTorch, Deep Learning, XGBoost, bower, HuggingFace, CatBoost, NLP, FastText, Lightgbm, PySpark, Dask, Plotly, Docker, Python, LightFM, dl, Apache AirFlow, Machine learning, mlib, deeppavlov, youtube, Framework, ALS, FAISS, Yandex Cloud, Triton Inference Server, Kubernetes, A/B testing, implicit, milvus, dnn
Отрасль проекта
E-commerce & Retail
Период работы
Ноябрь 2021 - Февраль 2023
(1 год 4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
НИУ «Высшая школа экономики»
Специальность
Когнитивные науки
Завершение учебы
2024 г.
Высшее
Учебное заведение
НИУ «Высшая школа экономики»
Специальность
Когнитивные науки
Завершение учебы
2021 г.
Высшее
Учебное заведение
Московский инженерно-физический институт
Специальность
Медицинская физика
Завершение учебы
2018 г.