Василий Х. Data Scientist, Senior
ID 32888
ВХ
Василий Х.
Мужчина, 29 лет
Россия, Москва, UTC+3
Ставка
7 597,4 Р/час
НДС не облагается
Специалист доступен с 29 октября 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Василий — специалист в области Data Science с грейдом Senior. Имеет высшее образование по направлениям «Экономика», «Прикладная математика и информатика», «Искусственный интеллект и машинное обучение». Владеет английским языком на уровне B2.
Области специализации: E-commerce & Retail, Manufacturing, FinTech & Banking, Logistics & Transport.
Ключевые навыки: Apache AirFlow, AWS, Bitbucket, CatBoost, Docker, DVC, FastAPI, Git, GitLab, Hadoop, Hive, langchain, LightGBM, Machine learning, Matplotlib, MLflow, openAI, OpenCV, Optuna, Oracle, Pandas, pgvector, PostgreSQL, Python, PyTorch, S3, Scikit-learn, Seaborn, Spark, Stable Diffusion, transformers, анализ данных, инфраструктура.
Опыт работы на проектах:
- THE LIST (E-commerce & Retail): проектирование архитектуры матчинга товаров и её разработка с нуля, автоматизация системы матчинга, проведение экспериментов с моделями CLIP/ResNet для векторизации изображений, обучение, валидация и деплой реранкера (CatBoost) в сервис.
- Redmadrobot (Manufacturing): разработка предиктивных моделей, проверка гипотез на основе LLM, улучшение существующей AI-based базы знаний, тюнинг диффузионных моделей для генерации изображений.
- Альфа-Банк (FinTech & Banking): разработка скоринга склонности к продукту, построение ранжирования продуктов для приложения банка, работа с пайплайнами обработки данных.
- Сбербанк (FinTech & Banking): анализ и обработка текстовых данных, формирование и версионирование датасетов для обучения, формирование задач для краудсорсинга, сопровождение и поддержка разметки текстов.
- КРОК (Logistics & Transport): разработка автоматизированной системы прогнозирования объёмов перевозок, разработка системы по построению графа маршрутов для сотрудников транспортной компании, работа с пресейлами.
Проекты
(6 лет 11 месяцев)
THE LIST – приложение по покупке одежды, аксессуаров.
Роль
Senior ML Engineer
Обязанности
Проектирование архитектуры матчинга товаров и ее разработка с нуля
Автоматизация системы матчинга: построение пайплайнов (Airflow), добавление хранилищ (S3, Postgres), подключение векторной БД (pgvector)
Проведение экспериментов с моделями CLIP/ResNet для векторизацией изображений (PyTorch): выбор архитектуры, тюнинг (metric-learning), деплой моделей
Обучение, валидация и деплой реранкера (CatBoost) в сервис
Анализ данных, поиск инсайтов, построение отчетов (pandas, matplotlib, seaborn)
Стек специалиста на проекте
PostgreSQL, Docker, Python, GitLab, AWS, Pandas, Numpy, Matplotlib, Scikit-learn, Seaborn, PyTorch, Apache AirFlow, CatBoost, S3, OpenCV, Lightgbm, Optuna, transformers, openAI, Validation, metrics, pgvector, CLIP
Отрасль проекта
E-commerce & Retail
Период работы
Июнь 2024 - По настоящее время
(1 год 5 месяцев)
Redmadrobot – разработка ПО и внедрение цифровых продуктов.
Роль
Data Scientist
Обязанности
Разработка предиктивных моделей для индустриального сектора (LightGBM, CatBoost)
Проверка гипотез на основе LLM (OpenAI, transformers, LangChain, LlamaIndex)
Улучшение существующей AI-based базы знаний: добавление реранкера в RAG (кросс-энкодеры), деплой фичей в сервис (FastAPI)
Тюнинг диффузионных моделей для генерации изображений (OpenCV, stable-diffusion)
Стек специалиста на проекте
Docker, Python, GitLab, Pandas, Numpy, FastAPI, Matplotlib, Scikit-learn, Seaborn, PyTorch, CatBoost, OpenCV, Lightgbm, Optuna, transformers, Stable Diffusion, langchain, openAI, llamaindex, vllm
Отрасль проекта
Manufacturing
Период работы
Июнь 2023 - Июнь 2024
(1 год 1 месяц)
Альфа-Банк – коммерческий банк.
Роль
ML Engineer
Обязанности
Разработка скоринга склонности к продукту: формирование таргета с нуля (Hadoop, Oracle), эксперименты с моделями (LightGBM, CatBoost), деплой решения (Airflow, MLflow)
Построение ранжирования продуктов для приложения банка: сбор данных (Hadoop, Oracle), обучение моделей (LightGBM, CatBoost) и анализ результатов
Работа с пайплайнами обработки данных: формирование новых признаков для feature store (Hadoop, Spark), добавление и поддержка существующих DAG с моделями (Airflow, MLFlow)
Стек специалиста на проекте
Python, Oracle, Bitbucket, Hive, Spark, Hadoop, Pandas, Numpy, Matplotlib, Scikit-learn, Seaborn, Apache AirFlow, CatBoost, MLflow, Lightgbm, shap, Разработка, Анализ результатов, hue, feature, dag, Обучение моделей
Отрасль проекта
FinTech & Banking
Период работы
Март 2021 - Июнь 2023
(2 года 4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Да
Образование
Высшее
Учебное заведение
ТюмГУ
Специальность
Экономика
Завершение учебы
2018 г.
Высшее
Учебное заведение
МГУ имени М. В. Ломоносова
Специальность
Прикладная математика и информатика
Завершение учебы
2022 г.
Высшее
Учебное заведение
ФИЦ ИУ РАН
Специальность
Искусственный интеллект и машинное обучение
Завершение учебы
2027 г.