АС
Алексей С.
Мужчина, 23 года
Беларусь, Минск, UTC+3
Ставка
3 896,1 Р/час
НДС не облагается
Специалист доступен с 10 июня 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Middle Data Scientist по работе с данными с опытом работы 3 года.
Специалист по обработке данных, специализирующийся на разработке эффективных проектов, ориентированных на данные, и уделяющий особое внимание использованию передовых методов прогнозного моделирования, аналитики и рекомендательных систем. Я обладаю проверенным опытом в выявлении и решении бизнес-проблем с помощью стратегического применения Data Science. Кроме того, у меня есть практический опыт, охватывающий весь жизненный цикл работы с данными - от понимания проблем и разработки функциональных возможностей до внедрения моделей машинного обучения в производство. Для этого я использую различные инструменты, такие как Python, Pandas, пакеты визуализации данных, Scikit-learn, XGBoost, SHAP, Boruta для обработки данных, моделирования и оценки; FastAPI для серверной разработки, Docker и k8s для задач DevOps, облачные сервисы AWS и Azure.
Проекты
(3 года 10 месяцев)
СИСТЕМА РЕКОМЕНДАЦИЙ
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
СИСТЕМА РЕКОМЕНДАЦИЙ
Оптимизирован персонализированный медиа-контент для SMM и график отправки электронных писем, а также медиа-контент для приложения, подобного Netflix.
Обязанности и достижения
Сотрудничал со специалистами SMM в разработке и проверке гипотез;
Проводил исследовательский анализ данных для выявления и устранения проблем качества данных, влияющих на работу машинного обучения;
Готовил и представлял интерактивные дашборды для заинтересованных сторон;
Разработал собственную систему ранжирования для сбалансированного распределения медиаресурсов;
Тестировал методы матричной факторизации и глубокого обучения для рекомендательных систем;
Тестировал различные подходы создания рекомендательных систем, такие как SVD, ALS, NCF;
Обучал отдельную модель для задачи ранжирования контента на основе LightGBM;
Создавал математические модели для решения различных бизнес-задач;
Реализовал кастомный парсер для сбора данных из социальных сетей;
Применил разработанные модели для планирования публикации промо-контента, сократив время работы прежнего алгоритма с дней/недель до менее 15 минут в 99% случаев;
Использовал модели для планирования контента с учетом ротации, зрительских предпочтений, праздников и условий контрактов. A/B-тесты показали рост рейтингов в 2 раза с точностью прогноза 94%;
Исследовал методы сегментации аудитории и поиска похожих пользователей, разработал методологию и алгоритм обработки больших данных;
Автоматизировал и внедрил сервисы для рекомендаций и аналитики на базе математических моделей и программных решений с использованием Python, Docker и AWS;
Проводил код-ревью.
Рабочее окружение
Python, FastAPI, Pydantic, SciPy, Matplotlib, Apache Spark, PySpark, AWS(S3, Sagemaker, CloudWatch, etc), NLTK, Scikit-Learn, Seaborn, CatBoost, LightGBM, Implicit, SHAP, Hyperopt, MariaDB, Redis, PyTorch, XGBoost, Numpy, Pandas, Plotly, MLFlow, Docker, Docker Compose, Git, GitLab, GitLab CI.
Стек специалиста на проекте
MariaDB, Gitlab CI, AWS, GitLab, Numpy, Git, Pandas, SciPy, Redis, shap, FastAPI, Scikit-learn, Seaborn, NLTK, PyTorch, XGBoost, Apache Spark, sagemaker, CatBoost, S3, Pydantic, MLflow, Docker Compose, Lightgbm, PySpark, Plotly, Docker, Python, etc, Matplotlib, CloudWatch, implicit
Отрасль проекта
Media
Период работы
Февраль 2024 - По настоящее время
(1 год 5 месяцев)
МЕХАНИЗМ ПРОГНОЗИРОВАНИЯ ПРОДАЖ
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
МЕХАНИЗМ ПРОГНОЗИРОВАНИЯ ПРОДАЖ
Аналитический механизм для прогнозирования объема продаж - это инструмент, который использует исторические данные о продажах и другую соответствующую информацию для прогнозирования будущих объемов продаж определенного продукта или группы продуктов. Механизм обычно использует передовые статистические методы и алгоритмы машинного обучения для анализа данных и составления точных прогнозов.
Обязанности и достижения
Взаимодействовал с клиентами и командой разработки, уточнял и детализировал бизнес-требования;
Проводил углубленный разведочный анализ данных для формирования первоначальных гипотез и выявления ключевых проблем;
Извлекал ценные признаки из JSON-данных;
Разрабатывал временные признаки, включая лаговые переменные, для выявления временных паттернов в транзакционных данных;
Предложил и внедрил небольшую систему рекомендаций с использованием LightGBM ранжирования, которая предоставляла бизнесу релевантные предложения и оптимизировала закупки по категориям;
Обучал и тестировал различные методы временных рядов: модели семейства ARIMA, Facebook Prophet, градиентный бустинг (XGBoost, LightGBM);
Интегрировал аналитический слой на Apache Spark в архитектуру движка с акцентом на масштабируемость для обработки пиковых нагрузок и динамических изменений бизнес-потребностей;
Создал статистический слой для детекции аномалий;
Разработал и реализовал систему обнаружения аномалий;
Внедрил слой интерпретируемости моделей;
Использовал алгоритм Boruta в пайплайне feature engineering;
Организовал непрерывный мониторинг качества моделей;
Настроил Apache Airflow для оркестрации end-to-end процессов в проекте прогнозирования объема продаж;
Готовил и предоставлял клиентам полезные аналитические отчеты.
Рабочее окружение
Python, FastAPI, Pydantic, Seaborn, XGBoost, Scikit-learn, Prophet, Boruta, Pandas, Pyspark, Apache Spark, LightGBM, Numpy, Neptune, Apache Airflow, AWS(Lambda, SageMaker, S3, ECR, EKS, etc.), Docker, Docker Compose, PostgreSQL, Git, Github, Github Actions, Kubernetes(k8s).
Стек специалиста на проекте
ecr, AWS, Numpy, Git, Pandas, GitHub, FastAPI, Scikit-learn, Seaborn, XGBoost, Apache Spark, sagemaker, S3, Pydantic, Docker Compose, EKS, Lightgbm, PySpark, Docker, Python, GitHub Actions, etc, Lambda, Apache AirFlow, prophet, PostgreSQL, Kubernetes
Отрасль проекта
E-commerce & Retail
Период работы
Декабрь 2022 - Январь 2024
(1 год 2 месяца)
КРЕДИТНАЯ ПЛАТФОРМА ДЛЯ АНАЛИЗА И ПРИНЯТИЯ РЕШЕНИЙ
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
КРЕДИТНАЯ ПЛАТФОРМА ДЛЯ АНАЛИЗА И ПРИНЯТИЯ РЕШЕНИЙ
Платформа для управления финансами и кредитования поставщиков и клиентов в строительной отрасли.
Обязанности и достижения
Экспериментировал с различными статистическими и ML-подходами для задач прогнозирования;
Разрабатывал модели кластеризации на основе исторических данных клиентов;
Решал задачи оптимизации, включая оптимизацию маркетинговых активностей;
Настроил MLflow для трекинга экспериментов, сравнения метрик и регистрации артефактов;
Разработал аналитический слой поверх сервиса Azure Synapse;
Перенес ресурсоемкую аналитическую логику из продакшен-базы данных в DWH;
Создал подключения к внешним источникам данных для DWH;
Инициировал внедрение практик работы с данными и ML на проекте. Развернул DWH для сбора данных из множества внешних источников;
Разрабатывал дашборды в PowerBI для анализа и презентации результатов стейкхолдерам;
Настроил сервисы для инференса моделей.
Рабочее окружение
Python, Numpy, Pandas, SciPy, Plotly, Matplotlib, XGBoost, SHAP, Prophet, Tensorflow, Keras, Azure(Blob Storage, VMs, ML, Pipelines, Synapse, Data Factory) MongoDB, PostgreSQL, SQL Server, PowerBI, MLflow, Docker, Git, Azure DevOps.
Стек специалиста на проекте
Synapse, blob, Tensorflow, Numpy, Data Factory, Git, Pandas, SciPy, Power BI, MongoDB, shap, XGBoost, Keras, vms, Storage, MLflow, Plotly, SQL, Docker, Python, Matplotlib, Azure DevOps, Pipelines, Azure, Identity Server, prophet, Machine learning, PostgreSQL
Отрасль проекта
FinTech & Banking
Период работы
Сентябрь 2021 - Ноябрь 2022
(1 год 3 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Белорусский государственный университет (БГУ)
Специальность
ФПМИ - Информатика
Завершение учебы
2023 г.