ТС
Тимур С.
Мужчина
Россия, Москва, UTC+3
Ставка
4 285,71 Р/час
НДС не облагается
Специалист доступен с 4 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — C1
Главное о специалисте
У меня более трёх лет опыта в разработке и внедрении решений в области машинного обучения, и я владею знаниями как классических (KNN, RandomForest, Boosting), так и нейросетевых моделей, основанных на dense, rnn, трансформерах. Мой вклад помогал компаниям сократить ресурсные затраты и улучшить стабильность и производительность процессов.
ОСНОВНЫЕ НАВЫКИ
• Python (NumPy, Pandas, Scikit-learn, PyTorch, OpenCV, Matplotlib, PySpark)
• Machine Learning (классические, нейросетевые модели)
• Инфраструктура хранения и обработки данных и проектов: SQL, VM (Selectel, Yandex Cloud),
Apache Superset, Apache Airflow, Git, Docker
• Иное: SAP, Linux
Проекты
(4 года 1 месяц)
Metro
Роль
Data Scientist
Обязанности
Занимался разработкой и поддержанием моделей, направленных на решение логистических задач в области спроса и поставок.
Модель распределения спроса по торговым центрам:
• Модель отвечала на необходимость поддержания определённого стока по всем ТЦ для всех типов клиентов для улучшения общего процесса закупок и планирования в рознице и оптовой торговле. Характеристики: >400 тыс. объектов, ~27 основных фичей, Random Forrest как базовая модель;
• Я в рамках создания и поддержания модели занимался парсингом и препроцессингом данных, оценкой параметров, фича-инжинирингом; тестированием ML-гипотез; анализом метрик;
• Мне удалось добиться 6-9% роста прибыли в ряде точек и 12,5% повышения общего уровня клиентской удовлетворённости;
Модель прогнозирования объёмов поставок:
• Целью модели было получение реалистичного объёма поставок на горизонте для корректного выстраивания взаимодействия ЦО с точками и клиентами. Характеристики: до 0.5 млн объектов, до 45 фичей рассмотрено, модель LightGBM;
• Я работал на основных этапах создания модели; занимался разработкой фичей, сбором данных, первичным тестированием и выбором модели;
• Я смог создать baseline-модель, готовую для последующего совершенствования;
Также работал с задачами от отделов Маркетинга (рекомендательная система), Продаж (A/B тесты в области персонализации предложений), Закупок (кластеризацией поставщиков и предобработкой и анализом данных от поставщиков).
• Работал с BLEU, RNN, LSTM, transformers
Стек специалиста на проекте
Работа с базами данных, Прогнозирование, transformers, lstm, Базы данных, Spark, Анализ данных, Bash, Git, Linux, Apache, Математическая статистика, PyTorch, Sklearn, NLP, Data Science, Моделирование, SQL, Docker, Python, Статистический анализ, Автоматизация процессов, Сбор и анализ информации, Machine learning, Анализ рисков, RNN
Отрасль проекта
E-commerce & Retail
Период работы
Август 2023 - По настоящее время
(2 года)
Nestle
Роль
Специалист Data Science в департаменте цепей поставок
Обязанности
Работал над улучшением модели оптимизации распределения товарных запасов, участвовал в ML-проектах, связанных с планированием спроса и поставок и смежными направлениями.
Модель оптимизации распределяемых запасов:
• Модель выдавала предсказания оптимальных объёмов поставок с национального склада на региональные при условии ограничений на логистической цепочке. Характеристики: ~1.2 млн объектов в выборке, воутинг по бустингу – LighGBM, CatBoost, XGBoost;
• Я инициировал и проводил эксперименты по изменению архитектуры и тренировки моделей; работал с фичами; интегрировал результаты в систему.
• Мне удалось достичь сокращения затрат на обратную логистику и возвраты со складов – до 14,6% в расчёте на паллету;
Приложение CV-контроля за стеллажами и паллетами:
• Проект предполагал детекцию по фотографиям требуемых к незамедлительному перемещению в зону отгрузки склада паллет с необходимой продукцией; модель работала на основе YOLO;
• Отбирал изначальные скриншоты, предоставляемые складом; размечал их; обучал; предоставлял результаты для дальнейшей обработки складской системой;
• В результате применения этой модели удалось достигнуть 37%-го сокращения недогрузов по топ-10 продуктам в ограничениях по сравнению с предыдущим периодом;
Также занимался моделью умного поиска по регуляторным документам (в т.ч. DeepPavlov, иные модели BERT), чат-ботом для внутреннего пользования сотрудниками в регионах (генерационные модели, в т.ч. LLaMA), классификацией повреждений разных форм паллет, A/B тестированием гипотез и разработкой модели оптимизации объёмов допустимых буферных отгрузок.
Стек специалиста на проекте
Работа с базами данных, Прогнозирование, Bert, Базы данных, llama, Spark, Анализ данных, Bash, Git, Linux, Apache, Математическая статистика, PyTorch, Sklearn, XGBoost, CatBoost, NLP, Data Science, Моделирование, YOLO, SQL, Docker, Python, Статистический анализ, Автоматизация процессов, Сбор и анализ информации, Machine learning, Анализ рисков
Отрасль проекта
E-commerce & Retail
Период работы
Июль 2021 - Август 2023
(2 года 2 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Российский экономический университет имени Г.В. Плеханова, Москва
Специальность
Институт математики, информационных систем и цифровой экономики, Статистика
Завершение учебы
2021 г.
Высшее
Учебное заведение
Московский государственный институт международных отношений (университет) Министерства иностранных дел Российской Федерации, Москва
Специальность
Факультет международных экономических отношений
Завершение учебы
2020 г.