Александр К. Data Scientist, Middle

ID 26477
АК
Александр К.
Мужчина, 23 года
Беларусь, Минск, UTC+3
Ставка
3 896,1 Р/час
НДС не облагается
Специалист доступен с 13 сентября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle
Навыки
Apache AirFlow
Apache Spark
app
AWS
Azure
Backend
blob
CatBoost
CloudWatch
Data
Data Factory
DevOps
Docker
Docker Compose
ecr
EKS
Engineering
etc
FastAPI
Git
GitHub
GitHub Actions
GitLab
Gitlab CI
Identity Server
implicit
inner
Keras
Kubernetes
Lambda
Lightgbm
Machine learning
MariaDB
Matplotlib
MLflow
MLops
MongoDB
NLTK
Numpy
Pandas
Pipelines
Plotly
PostgreSQL
Power BI
prophet
Pydantic
PySpark
Python
PyTorch
Redis
S3
sagemaker
Scikit-learn
SciPy
Seaborn
shap
SQL
Storage
Synapse
Tensorflow
transformers
vms
XGBoost
Отрасли
E-commerce & Retail
Realty & Constructoring
Знание языков
Английский — B2
Главное о специалисте
Middle Data Scientist с опытом работы 3 года. Специалист в области анализа данных с глубокими знаниями математики и уверенными навыками программирования. Специализируюсь на предиктивном моделировании, аналитике и рекомендательных системах в различных бизнес-доменах. Имею практический опыт на всех этапах цикла Data Science — от постановки задачи и исследования данных до внедрения моделей машинного обучения в продакшн.
Проекты   (3 года 5 месяцев)
РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА ДЛЯ ИНТЕРНЕТ-МАГАЗИНА
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
РЕКОМЕНДАТЕЛЬНАЯ СИСТЕМА ДЛЯ ИНТЕРНЕТ-МАГАЗИНА Система, предлагающая релевантные товары онлайн-покупателям на основе их истории просмотров и покупок. Используются методы интеллектуального анализа данных для анализа поведения пользователей и генерации персонализированных рекомендаций, что делает процесс покупок более приятным и эффективным. Обязанности и достижения Коммуникация с клиентом, предоставление выявленных инсайтов, влияющих на процесс принятия решений; Разработка системы ранжирования товаров с учетом различных временных факторов (сезонность, текущие тренды) и персонализации под предпочтения пользователей c использованием различных подходов(LightFM, XGBoost, SVD++, нейросетевые методы и тд); Кластеризация пользователей по их предпочтениям для более точных рекомендаций; Оптимизация ML-инфраструктуры, версионирование признаков и данных; Совместная работа с командой Data Engineering над схемой A/B-тестирования и определением оптимальной логики стриминга данных под потребности проекта; Создание статистического слоя для выявления выбросов, который улучшил общую производительность ML-моделей и обеспечил дополнительные инсайты; Оптимизация скорости инференса моделей и ETL-пайплайнов на 20% за счет правильного индексирования и асинхронных процессов; Существенное улучшение бизнес-метрики — увеличение CTR (Click-Through Rate) на 35%; Разработка микросервисов для ML-моделей с использованием FastAPI; Развертывание моделей машинного обучения в AWS. Рабочее окружение Python, Plotly, XGBoost, LightFM, Hyperopt, Matplotlib, Scikit-learn, PyTorch, Pandas, Numpy, FastAPI, Pydantic, AWS(Lambda, S3, EC2, Glue, Redshift, RDS, ECR, EKS, Sagemaker, etc.), Docker, Docker Compose, MariaDB, Redis, Feast, PostgreSQL, Github, Github Actions, Kubernetes(k8s).
Стек специалиста на проекте
glue, MariaDB, ecr, AWS, Redshift, Numpy, Pandas, Redis, GitHub, FastAPI, Scikit-learn, PyTorch, XGBoost, sagemaker, S3, Jeast, Pydantic, Docker Compose, EKS, EC2, Plotly, Docker, Python, GitHub Actions, etc, Lambda, Matplotlib, LightFM, RDS, Kubernetes, PostgreSQL
Отрасль проекта
E-commerce & Retail
Период работы
Октябрь 2023 - По настоящее время  (2 года)
АНАЛИЗ ДАННЫХ ДЛЯ ОТЕЛЬНОГО БИЗНЕСА
Роль
Инженер по данным / Инженер по машинному обучению
Обязанности
АНАЛИЗ ДАННЫХ ДЛЯ ОТЕЛЬНОГО БИЗНЕСА Основной целью этого проекта было прогнозирование, мониторинг и контроль трафика отелей. Это включало в себя рассылку информационных бюллетеней и прогнозирование прибыли от новых контрактов. Обязанности и достижения Анализ и преобразование исторических данных; Извлечение отзывов об отелях с различных сайтов для использования в качестве дополнительной информации; Автоматизация создания ограниченного количества рекламных рассылок для привлечения трафика, путем кластеризации пользователей и отелей по различным признакам; Участие в совершенствовании платформы для бронирования туров и создание новых инструментов для увеличения прибыли этой платформы за счет использования передовых инструментов и методологий анализа данных; Построение регрессионной модели для прогнозирования прибыли отеля по новому контракту на основе характеристик отеля, поведения конкурентов и данных из контракта; Оптимизация RMSE и MAE в качестве ключевых показателей регрессионной модели; Проведение анализа сегментации для классификации клиентов на основе их предпочтений, поведения и демографических данных, что позволило адаптировать маркетинговые услуги для лучшего удовлетворения потребностей и предпочтений клиентов; Проверка качества сегментации с помощью оценки силуэтов; Представление результатов сегментации и регрессии заинтересованным сторонам бизнеса с помощью PowerBI, используя не только динамические графики, но и геопозиционные данные отелей и потенциальных клиентов; Создание слоя интерпретируемости, позволяющего понимать предсказания модели. Рабочее окружение Python, Numpy, SciPy, Matplotlib, Pandas, Seaborn, PowerBI, kmodes, MLflow, UMAP, Scikit-learn, XGBoost, pymc, SHAP, Hyperopt, NLTK, MySQL, Redis, Docker, FastAPI, Docker Compose, Kubernetes(k8s), Github, Github Actions, Azure (VMs, Blob Storage, ML, Databricks, Data Factory).
Стек специалиста на проекте
MySQL, Docker, Python, Power BI, GitHub Actions, Kubernetes, GitHub, Machine learning, Pandas, SciPy, Numpy, Data Factory, FastAPI, Matplotlib, Scikit-learn, Seaborn, NLTK, XGBoost, Azure, Storage, Docker Compose, Redis, vms, MLflow, Databricks, shap, blob, pymc
Отрасль проекта
Realty & Constructoring
Период работы
Май 2022 - Октябрь 2023  (1 год 6 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Белорусский Государственный Университет
Специальность
Информатика (факультет ФПМИ)
Завершение учебы
2023 г.

Похожие специалисты

E-commerce & Retail • FinTech & Banking • Media
АС
Алексей С.
Минск
Data Scientist
Middle+
3 896,1 Р/час
Apache AirFlow
Apache Spark
app
AWS
Azure
Backend
blob
CatBoost
CloudWatch
Data
+63

Middle Data Scientist по работе с данными с опытом работы 3 года. Специалист по обработке данных, специализирующийся на разработке эффективных проектов, ориентированных на данные, и уделяющий особое внимание использованию передовых методов прогнозного моделирования, аналитики и рекомендательных систем. Я обладаю проверенным опытом в выявлении и решении бизнес-проблем с помощью стратегического применения Data Science. Кроме того, у меня есть практический опыт, охватывающий весь жизненный цикл работы с данными - от понимания проблем и разработки функциональных возможностей до внедрения моделей машинного обучения в производство. Для этого я использую различные инструменты, такие как Python, Pandas, пакеты визуализации данных, Scikit-learn, XGBoost, SHAP, Boruta для обработки данных, моделирования и оценки; FastAPI для серверной разработки, Docker и k8s для задач DevOps, облачные сервисы AWS и Azure.

Подробнее
AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее
EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
Optimizely
+135

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Подробнее
E-commerce & Retail • Travel, Hospitality & Restaurant business
МГ
Максим Г.
Минск
Data Scientist
Middle+
4 415,58 Р/час
AllenNLP
Apache AirFlow
Apache Spark
AWS
Azure
BLoC
CloudWatch
Data Factory
Databricks
Docker
+56

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее
FinTech & Banking • IoT • Manufacturing
АЛ
Артем Л.
Минск
Data Scientist
Senior
6 493,5 Р/час
A/B testing
Agile
Anaconda
API
Bash
Bitbucket
CatBoost
CI/CD
Circle CI
Docker
+74

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее

Недавно просмотренные специалисты

EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
Optimizely
+135

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Подробнее