БТ
Богдан Т.
Мужчина, 29 лет
Россия, Тольятти, UTC+4
Ставка
4 046,1 Р/час
вкл. НДС 5% (150 Р)
Специалист доступен с 4 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B1
Главное о специалисте
Богдан — ML-разработчик уровня Senior из Тольятти, Россия. Специализируется на машинном обучении и обработке данных. Имеет высшее образование по специальности «Информационные системы и технологии» в Skolkovo Institute of Science and Technology.
Обладает опытом работы с широким спектром технологий и инструментов, включая Apache AirFlow, Apache Kafka, BigQuery, ClickHouse, Docker, Kubernetes, PyTorch, SQL и другие.
Принимал участие в проектах в отраслях E-commerce & Retail и Urban technology. Среди проектов:
- Разработка и дообучение Transformer‑энкодера для текстовых описаний товаров в проекте Magnit Tech.
- Поиск визуального сходства в проекте Optimax Dev.
- Прогнозирование спроса и рекомендации товаров в e-commerce компании по производству и ритейлу очков.
- Повышение разрешения томограмм в исследовательском проекте в области разведки нефтяных месторождений.
- Исследования в области спектроскопии белков-маркеров заболеваний.
Общая продолжительность работы на проектах составляет 8 лет.
Проекты
(8 лет 10 месяцев)
Magnit Tech: Матчинг товаров конкурентов
Роль
ML разработчик, Data Scientist
Обязанности
Разработка и дообучение Transformer‑энкодера (contrastive learning) для текстовых описаний товаров.
Создание пайплайна расчёта эмбеддингов и NN‑поиска.
Проектирование Airflow DAG, выгрузка результатов в S3 / Greenplum.
Поддержка ETL из ClickHouse и интеграция данных в pricing‑dashboard.
Настройка мониторинга качества (Hit‑Rate, MRR) и алертов.
Разработка и внедрение ML-моделей (регрессия, классификация, кластеризация) с использованием sklearn, CatBoost
Понижение размерности данных и визуализация результатов с помощью Plotly (2D/3D графики)
Реализация рекомендательных систем (RecSys) на основе SVD и Deep Learning
Создание и вывод в продакшен микросервисов на Flask и FastAPI
Использование deepseek и qwen для автоматической валидации матчинга строк
Работа с моделями бустинга: CatBoostRegressor, CatBoostClassifier
Достижения
Достигнуты метрики: MRR 0.71, Hit‑Rate@10 0.92 на 18 k SKU.
Время ежедневного обновления маппинга сокращено до 12 мин (×4 быстрее старта).
Снижена доля ручного матчинга до <30 % через confident‑threshold и semi‑auto review.
Настроена CI‑автосинхронизация DAG → zero‑downtime релизы.
Пайплайн масштабирован под рост до 500 k SKU без изменения SLA.
Стек специалиста на проекте
Validation, dashboards, metrics, tracking, transformers, Gitlab CI, Визуализация, Кластеризация, Классификация, ClickHouse, DVC, Data, Pandas, FastAPI, PyTorch, Sklearn, Regex, Deep Learning, CatBoost, S3, MLflow, Plotly, Docker, Python, RecSys, GreenPlum, Flask, Apache AirFlow, Machine learning, Yandex Cloud, Microservices, deepseek, svd
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2025 - По настоящее время
(7 месяцев)
Optimax Dev
Роль
Data Science
Обязанности
Поиск визуального сходства — сбор набора данных, обучение модели, извлечение вложений, реализация поиска, разработка и развертывание микросервисов, регистрация и мониторинг;
Visual similarity search — поиск визуально похожих очков среди ассортимента компании, ResNet (дообученный) кодирование изображений присланных пользователем и поиск максимально похожих очков в каталоге
Сокращение PII — подпроцесс для удаления защищенных данных HIPA в дополнение к основному конвейеру OCR;
Оценка отзывов — регулярный конвейер CI для ранжирования обзоров продуктов;
Reviews ranking — ранжирование отзывов пользователей на основе сентимента и информативности ревью
Наставничество и техническое руководство в небольшой команде специалистов по данным:
Quiz-based hybrid RS — рекомендации очков на основе ответов пользователя на опросник (Quiz) CatBoost
Рекомендации визуально похожих очков
Достижения
Достигнут HitRate@1 в районе 60% для визуального поиска
Рекомендации визуально похожих товаров увеличили конверсию на 3%
Стек специалиста на проекте
Python, Kubernetes, BigQuery, Pandas, PyTorch, Sklearn, Apache AirFlow, Yandex Cloud, DVC, GCP, Gitlab CI, OpenCV, mediapipe
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2024 - Декабрь 2024
(1 год)
E-commerce компания по производству и ритейлу очков
Роль
data scientist
Обязанности
Экспорт данных из BigQuery(SQL)4
Подготовка датасетов (feature engineering, feature selection, imputing);
Обучение моделей, hyperparameter tuning (optima, grid-search);
Деплой моделей в продакшн.
Основные проекты:
Предсказание купит ли пользователь премиальный или обычный продукт
Прогнозирование спроса на очки
Рекомендация очков по фото лица
Facial-&-behaviour hybrid RS - рекомендации очков на основе фотографии лица пользователя
Ранжирование отзывов на основе сентимента и информативности
Достижения
В задаче предсказания премиума ROC-AUC > 95%
Прогнозирование спроса MAPE 27 -> 17 %
В задаче рекомендаций CTR +4%, CR +2%
Стек специалиста на проекте
OpenCV, Test NG, Engineering, analysis, DVC, BigQuery, Numpy, Pandas, Systemd, PyTorch, CatBoost, MLflow, Optuna, SQL, Docker, Python, Lerna, Features, datax, visualization, Classification, gilab, Forecasting
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2022 - Декабрь 2024
(3 года)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Skolkovo Institute of Science and Technology Advanced Manufacturing Technologies
Специальность
Information Systems and Technologies
Завершение учебы
2015 г.