Алексей С. Data Scientist, Middle+

ID 26481
АС
Алексей С.
Мужчина, 23 года
Беларусь, Минск, UTC+3
Ставка
3 896,1 Р/час
НДС не облагается
Специалист доступен с 10 июня 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle+
Навыки
Apache AirFlow
Apache Spark
app
AWS
Azure
Backend
blob
CatBoost
CloudWatch
Data
Data Factory
DevOps
Docker
Docker Compose
ecr
EKS
Engineering
etc
FastAPI
Git
GitHub
GitHub Actions
GitLab
Gitlab CI
Identity Server
implicit
inner
Keras
Kubernetes
Lambda
Lightgbm
Machine learning
MariaDB
Matplotlib
MLflow
MLops
MongoDB
NLTK
Numpy
Pandas
Pipelines
Plotly
PostgreSQL
Power BI
prophet
Pydantic
PySpark
Python
PyTorch
Redis
S3
sagemaker
Scikit-learn
SciPy
Seaborn
shap
SQL
Storage
Synapse
Tensorflow
transformers
vms
XGBoost
Отрасли
E-commerce & Retail
FinTech & Banking
Media
Знание языков
Английский — B2
Главное о специалисте
Middle Data Scientist по работе с данными с опытом работы 3 года. Специалист по обработке данных, специализирующийся на разработке эффективных проектов, ориентированных на данные, и уделяющий особое внимание использованию передовых методов прогнозного моделирования, аналитики и рекомендательных систем. Я обладаю проверенным опытом в выявлении и решении бизнес-проблем с помощью стратегического применения Data Science. Кроме того, у меня есть практический опыт, охватывающий весь жизненный цикл работы с данными - от понимания проблем и разработки функциональных возможностей до внедрения моделей машинного обучения в производство. Для этого я использую различные инструменты, такие как Python, Pandas, пакеты визуализации данных, Scikit-learn, XGBoost, SHAP, Boruta для обработки данных, моделирования и оценки; FastAPI для серверной разработки, Docker и k8s для задач DevOps, облачные сервисы AWS и Azure.
Проекты   (3 года 10 месяцев)
СИСТЕМА РЕКОМЕНДАЦИЙ
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
СИСТЕМА РЕКОМЕНДАЦИЙ Оптимизирован персонализированный медиа-контент для SMM и график отправки электронных писем, а также медиа-контент для приложения, подобного Netflix. Обязанности и достижения Сотрудничал со специалистами SMM в разработке и проверке гипотез; Проводил исследовательский анализ данных для выявления и устранения проблем качества данных, влияющих на работу машинного обучения; Готовил и представлял интерактивные дашборды для заинтересованных сторон; Разработал собственную систему ранжирования для сбалансированного распределения медиаресурсов; Тестировал методы матричной факторизации и глубокого обучения для рекомендательных систем; Тестировал различные подходы создания рекомендательных систем, такие как SVD, ALS, NCF; Обучал отдельную модель для задачи ранжирования контента на основе LightGBM; Создавал математические модели для решения различных бизнес-задач; Реализовал кастомный парсер для сбора данных из социальных сетей; Применил разработанные модели для планирования публикации промо-контента, сократив время работы прежнего алгоритма с дней/недель до менее 15 минут в 99% случаев; Использовал модели для планирования контента с учетом ротации, зрительских предпочтений, праздников и условий контрактов. A/B-тесты показали рост рейтингов в 2 раза с точностью прогноза 94%; Исследовал методы сегментации аудитории и поиска похожих пользователей, разработал методологию и алгоритм обработки больших данных; Автоматизировал и внедрил сервисы для рекомендаций и аналитики на базе математических моделей и программных решений с использованием Python, Docker и AWS; Проводил код-ревью. Рабочее окружение Python, FastAPI, Pydantic, SciPy, Matplotlib, Apache Spark, PySpark, AWS(S3, Sagemaker, CloudWatch, etc), NLTK, Scikit-Learn, Seaborn, CatBoost, LightGBM, Implicit, SHAP, Hyperopt, MariaDB, Redis, PyTorch, XGBoost, Numpy, Pandas, Plotly, MLFlow, Docker, Docker Compose, Git, GitLab, GitLab CI.
Стек специалиста на проекте
MariaDB, Gitlab CI, AWS, GitLab, Numpy, Git, Pandas, SciPy, Redis, shap, FastAPI, Scikit-learn, Seaborn, NLTK, PyTorch, XGBoost, Apache Spark, sagemaker, CatBoost, S3, Pydantic, MLflow, Docker Compose, Lightgbm, PySpark, Plotly, Docker, Python, etc, Matplotlib, CloudWatch, implicit
Отрасль проекта
Media
Период работы
Февраль 2024 - По настоящее время  (1 год 5 месяцев)
МЕХАНИЗМ ПРОГНОЗИРОВАНИЯ ПРОДАЖ
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
МЕХАНИЗМ ПРОГНОЗИРОВАНИЯ ПРОДАЖ Аналитический механизм для прогнозирования объема продаж - это инструмент, который использует исторические данные о продажах и другую соответствующую информацию для прогнозирования будущих объемов продаж определенного продукта или группы продуктов. Механизм обычно использует передовые статистические методы и алгоритмы машинного обучения для анализа данных и составления точных прогнозов. Обязанности и достижения Взаимодействовал с клиентами и командой разработки, уточнял и детализировал бизнес-требования; Проводил углубленный разведочный анализ данных для формирования первоначальных гипотез и выявления ключевых проблем; Извлекал ценные признаки из JSON-данных; Разрабатывал временные признаки, включая лаговые переменные, для выявления временных паттернов в транзакционных данных; Предложил и внедрил небольшую систему рекомендаций с использованием LightGBM ранжирования, которая предоставляла бизнесу релевантные предложения и оптимизировала закупки по категориям; Обучал и тестировал различные методы временных рядов: модели семейства ARIMA, Facebook Prophet, градиентный бустинг (XGBoost, LightGBM); Интегрировал аналитический слой на Apache Spark в архитектуру движка с акцентом на масштабируемость для обработки пиковых нагрузок и динамических изменений бизнес-потребностей; Создал статистический слой для детекции аномалий; Разработал и реализовал систему обнаружения аномалий; Внедрил слой интерпретируемости моделей; Использовал алгоритм Boruta в пайплайне feature engineering; Организовал непрерывный мониторинг качества моделей; Настроил Apache Airflow для оркестрации end-to-end процессов в проекте прогнозирования объема продаж; Готовил и предоставлял клиентам полезные аналитические отчеты. Рабочее окружение Python, FastAPI, Pydantic, Seaborn, XGBoost, Scikit-learn, Prophet, Boruta, Pandas, Pyspark, Apache Spark, LightGBM, Numpy, Neptune, Apache Airflow, AWS(Lambda, SageMaker, S3, ECR, EKS, etc.), Docker, Docker Compose, PostgreSQL, Git, Github, Github Actions, Kubernetes(k8s).
Стек специалиста на проекте
ecr, AWS, Numpy, Git, Pandas, GitHub, FastAPI, Scikit-learn, Seaborn, XGBoost, Apache Spark, sagemaker, S3, Pydantic, Docker Compose, EKS, Lightgbm, PySpark, Docker, Python, GitHub Actions, etc, Lambda, Apache AirFlow, prophet, PostgreSQL, Kubernetes
Отрасль проекта
E-commerce & Retail
Период работы
Декабрь 2022 - Январь 2024  (1 год 2 месяца)
КРЕДИТНАЯ ПЛАТФОРМА ДЛЯ АНАЛИЗА И ПРИНЯТИЯ РЕШЕНИЙ
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
КРЕДИТНАЯ ПЛАТФОРМА ДЛЯ АНАЛИЗА И ПРИНЯТИЯ РЕШЕНИЙ Платформа для управления финансами и кредитования поставщиков и клиентов в строительной отрасли. Обязанности и достижения Экспериментировал с различными статистическими и ML-подходами для задач прогнозирования; Разрабатывал модели кластеризации на основе исторических данных клиентов; Решал задачи оптимизации, включая оптимизацию маркетинговых активностей; Настроил MLflow для трекинга экспериментов, сравнения метрик и регистрации артефактов; Разработал аналитический слой поверх сервиса Azure Synapse; Перенес ресурсоемкую аналитическую логику из продакшен-базы данных в DWH; Создал подключения к внешним источникам данных для DWH; Инициировал внедрение практик работы с данными и ML на проекте. Развернул DWH для сбора данных из множества внешних источников; Разрабатывал дашборды в PowerBI для анализа и презентации результатов стейкхолдерам; Настроил сервисы для инференса моделей. Рабочее окружение Python, Numpy, Pandas, SciPy, Plotly, Matplotlib, XGBoost, SHAP, Prophet, Tensorflow, Keras, Azure(Blob Storage, VMs, ML, Pipelines, Synapse, Data Factory) MongoDB, PostgreSQL, SQL Server, PowerBI, MLflow, Docker, Git, Azure DevOps.
Стек специалиста на проекте
Synapse, blob, Tensorflow, Numpy, Data Factory, Git, Pandas, SciPy, Power BI, MongoDB, shap, XGBoost, Keras, vms, Storage, MLflow, Plotly, SQL, Docker, Python, Matplotlib, Azure DevOps, Pipelines, Azure, Identity Server, prophet, Machine learning, PostgreSQL
Отрасль проекта
FinTech & Banking
Период работы
Сентябрь 2021 - Ноябрь 2022  (1 год 3 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Белорусский государственный университет (БГУ)
Специальность
ФПМИ - Информатика
Завершение учебы
2023 г.

Похожие специалисты

AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее
E-commerce & Retail • Travel, Hospitality & Restaurant business
МГ
Максим Г.
Минск
Data Scientist
Middle+
4 415,58 Р/час
AllenNLP
Apache AirFlow
Apache Spark
AWS
Azure
BLoC
CloudWatch
Data Factory
Databricks
Docker
+56

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее
EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
generator
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
+123

▪ Data Scientist с опытом работы c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов, оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов.

Подробнее
FinTech & Banking • IoT • Manufacturing
АЛ
Артем Л.
Минск
Data Scientist
Senior
6 493,5 Р/час
A/B testing
Agile
Anaconda
API
Bash
Bitbucket
CatBoost
CI/CD
Circle CI
Docker
+74

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • FinTech & Banking • Media
АС
Алексей С.
Минск
Data Scientist
Middle+
3 896,1 Р/час
MariaDB
transformers
Gitlab CI
ecr
Synapse
AWS
GitLab
inner
blob
Engineering
+63

Middle Data Scientist по работе с данными с опытом работы 3 года. Специалист по обработке данных, специализирующийся на разработке эффективных проектов, ориентированных на данные, и уделяющий особое внимание использованию передовых методов прогнозного моделирования, аналитики и рекомендательных систем. Я обладаю проверенным опытом в выявлении и решении бизнес-проблем с помощью стратегического применения Data Science. Кроме того, у меня есть практический опыт, охватывающий весь жизненный цикл работы с данными - от понимания проблем и разработки функциональных возможностей до внедрения моделей машинного обучения в производство. Для этого я использую различные инструменты, такие как Python, Pandas, пакеты визуализации данных, Scikit-learn, XGBoost, SHAP, Boruta для обработки данных, моделирования и оценки; FastAPI для серверной разработки, Docker и k8s для задач DevOps, облачные сервисы AWS и Azure.

Подробнее
Отрасли не указаны
ЮШ
Юлия Ш.
Москва
Копирайтер
1 857,14 Р/час
Английский язык
Постановка задач
копирайтинг
редактирование текстов
корректура текстов
Написание продающих текстов
Написание текстов для email-рассылок
SEO-копирайтинг
Генерация текстов
Редакторский навык
+11

Пишущий редактор и копирайтер в маркетинге с опытом более трёх лет. Работала с тематиками: IT, маркетинг, строительство, путешествия, спорт, публичные выступления. Пишу и редактирую в разных форматах: лонгриды, экспертные статьи, подборки, кейсы, интервью, сценарии для видео, посты, рассылки, SEO-статьи и любые другие форматы текстов. Помимо работы с текстом имею опыт ведения проектов, постановки ТЗ, приема и согласования работ. Занималась организацией авторских туров, а также вела проекты по созданию видео для YouTube-канала крупной российской IT-компании.

Подробнее
Cloud Services
ОТ
Ольга Т.
Москва
QA ручной
Senior
2 857,14 Р/час
*nix
Регрессионное тестирование
UI
Redmine
IOS
Postman
HTTP
XML
Java
Scrum
+31

Основные компетенции: - ручное тестирование; - функциональное тестирование; - анализ и проверка API (в том числе REST и формат JSON); - смоук- и регрессионное тестирование; - модульное тестирование; - проверка взаимодействия между системами (интеграционное тестирование); - оценка качества UI. Технологический стек и инструменты: - работа с базами данных (PostgreSQL, MS SQL), уверенное использование SQL; - инструменты для тестирования API: Postman, Swagger; - системы контроля версий: Git; - средства управления задачами и документацией: Jira, Confluence; - планирование и отслеживание тестов: Zephyr; - инструменты для работы с логами и взаимодействием сервисов: Kafka; - анализ фронтенда: DevTools; - работа с визуальными макетами в Figma; - DBeaver — для взаимодействия с БД. Подходы и методологии: - применение гибких методологий разработки: Agile, Scrum; Личностные качества и дополнительные навыки: - способность к аналитическому мышлению; - эффективная командная работа; - опыт адаптации и сопровождения новых сотрудников. QA Engineer с опытом тестирование web приложений. В настоящее время изучаю Java, объектно-ориентированное программирование (ООП), а также инструменты для автоматизации тестирования: Selenium, Selenide и REST Assured, CI/CD в GitHub, Docker. Планирую активно развиваться в направлении автоматизации QA.

Подробнее
BioTech, Pharma, Health care & Sports • FinTech & Banking • HRTech • Information Security • LifeStyle
ЮК
Юлия К.
Казань
UX/UI дизайнер
Middle+
2 337,66 Р/час
Построение гипотез
AI
Дорожная карта продукта
Пользовательские интерфейсы
Редизайн
UX прототипы
Web Design
Behave
Поддержка пользователей
мобильных приложений
+58

Специалист — опытный продуктовый дизайнер с более чем трехлетним стажем в проектировании веб и мобильных приложений. Имеет глубокие знания UX/UI, уверенно владеет Figma, Adobe Photoshop и Illustrator, умеет создавать интерактивные прототипы, проводить UX-исследования и внедрять улучшения на основе анализа пользовательских данных. Работала с разнообразными проектами в сферах финтех, электронной коммерции, медицины и мобильной разработки, включая разработку дизайн-систем и анимаций для улучшения пользовательского опыта. Подробное портфолио и примеры проектов доступны по ссылке: https://drive.google.com/file/d/1KyQGuJJa_FZoOu5Z8SrIt3ZFUyP2fxAO/view?usp=drive_link

Подробнее