Максим Г. Data Scientist, Middle+

ID 12084
МГ
Максим Г.
Мужчина
Беларусь, Минск, UTC+3
Ставка
4 415,58 Р/час
НДС не облагается
Специалист доступен с 4 июля 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle+
Навыки
AllenNLP
Apache AirFlow
Apache Spark
AWS
Azure
BLoC
CloudWatch
Data Factory
Databricks
Docker
Docker Compose
EC2
ecr
EKS
Faker
gamemaker
Gensim
Git
GitHub
Kubernetes
Lambda
Machine learning
MLflow
MySQL
NLTK
PostgreSQL
PySpark
Redis
S3
Storage
vms
Hyper-V
IMAP
JVM
Matplotlib
Microsoft
Numpy
Pandas
Python
QT
RenPy
Scikit-learn
Seaborn
Smoke testing
XGBoost
Lightgbm
Posuta
TLS
ER
HuggingFace
NFC
NVidia
Plotly
PyTorch
Tesseract
Power BI
Отрасли
E-commerce & Retail
Travel, Hospitality & Restaurant business
Знание языков
Английский — B2
Главное о специалисте
Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.
Проекты   (4 года 8 месяцев)
АНАЛИЗ ДАННЫХ ДЛЯ ОТЕЛЬНОГО БИЗНЕСА
Роль
Специалист по данным/инженер по машинному обучению
Обязанности
Основной целью этого проекта было прогнозирование, мониторинг и контроль трафика отелей. Это включало в себя рассылку информационных бюллетеней и прогнозирование прибыли от новых контрактов.Обязанности и достижения Общение с заказчиком для обсуждения бизнес-требований; Анализ и преобразование исторических данных; Извлечение отзывов об отелях с различных сайтов для использования в качестве дополнительной информации; Автоматизация создания ограниченного количества рекламных рассылок для привлечения трафика, путем кластеризации пользователей и отелей по различным признакам; Участие в совершенствовании платформы для бронирования туров и создание новых инструментов для увеличения прибыли этой платформы за счет использования передовых инструментов и методологий анализа данных; Построение регрессионной модели для прогнозирования прибыли отеля по новому контракту на основе характеристик отеля, поведения конкурентов и данных из контракта; Оптимизация RMSE и MAE в качестве ключевых показателей регрессионной модели; Проведение анализа сегментации для классификации клиентов на основе их предпочтений, поведения и демографических данных, что позволило адаптировать маркетинговые услуги для лучшего удовлетворения потребностей и предпочтений клиентов; Проверка качества сегментации с помощью оценки силуэтов; Представление результатов сегментации и регрессии заинтересованным сторонам бизнеса с помощью PowerBI, используя не только динамические графики, но и геопозиционные данные отелей и потенциальных клиентов; Автоматизация конвейеров ETL для эффективной интеграции данных из различных источников в хранилище данных и аналитическую платформу с помощью Apache Spark и Azure Databricks; Создание слоя интерпретируемости для понимания предсказаний моделей заинтересованными сторонами. Код ревью. Окружение Python, PowerBI, Pandas, Numpy, Seaborn, Matplotlib, GeoPy, kmodes, Scikit-learn, XGBoost, UMAP, Hyperopt, NLTK, Apache Spark, PySpark, Azure(VM, ML, Databricks, Blob Storage, DataFactory), Redis, Docker , Docker Compose, Kubernetes(k8s), MySQL, Git, Github.
Стек специалиста на проекте
Databricks, Numpy, Data Factory, Git, Pandas, Power BI, Redis, GitHub, JVM, QT, Scikit-learn, Seaborn, NLTK, XGBoost, Apache Spark, BLoC, IMAP, Storage, RenPy, Docker Compose, Hyper-V, PySpark, Docker, Python, Matplotlib, Azure, Microsoft, MySQL, Smoke testing, Machine learning, Kubernetes
Отрасль проекта
Travel, Hospitality & Restaurant business
Период работы
Апрель 2023 - По настоящее время  (2 года 4 месяца)
ПРОГНОЗИРОВАНИЕ ПРОДАЖ
Роль
Специалист по данным / инженер по машинному обучению
Обязанности
Аналитическая система для прогнозирования объема продаж — это инструмент, который использует исторические данные о продажах и другую соответствующую информацию для прогнозирования объемов продаж для определенного продукта или группы продуктов в будущем. В системе используются статистические методы и алгоритмы машинного обучения для анализа данных и составления точных прогнозов. Обязанности и достижения Проводил глубокий исследовательский анализ данных с целью выработки первоначальной гипотезы и основных проблем, которые было необходимо решить в дальнейшем; Разработка временных характеристик, включая запаздывающие переменные, для выявления временных закономерностей в транзакционных данных; Интеграция аналитического слоя с использованием Apache Spark в архитектуру системы с упором на масштабируемость для эффективного управления скачками объемов данных и динамическими изменениями в потребностях бизнеса; Создал слой обнаружения статистических выбросов, который повысил общую производительность ML-модели и позволил получить дополнительную информацию из данных; Предложил и интегрировал систему рекомендаций, которая давала соответствующие советы конечным предприятиям и оптимизировала их покупки; Разработал и внедрил систему обнаружения аномалий, использующую методы машинного обучения для выявления и фиксации нарушений в данных о продажах; Обучение и тестирование нескольких подходов для анализа временных рядов, таких как семейство моделей ARIMA, Facebook Prophet, алгоритмы GBDT; Внедрение слоев интерпретируемости для повышения прозрачности и объяснимости прогнозов моделей; Внедрение механизма Boruta в пайплайн извлечения признаков из данных для улучшения интерпретируемости моделей и оптимизации процесса прогнозирующего моделирования. Развертывание моделей на AWS SageMaker; Осуществление непрерывного мониторинга производительности моделей, выявление и устранение дрейфа данных или снижения точности прогнозирования с течением времени; Внедрение Apache Airflow для оркестрации сквозных рабочих процессов; Предоставление аналитических отчетов конечному заказчику. Окружение Python, Seaborn, XGBoost, Scikit-learn, Prophet, Boruta, Pandas, LightGBM, Numpy, Neptune, Apache Airflow, Apache Spark, PySpark, AWS(Lambda, SageMaker, S3, EC2, ECR, EKS и т. д.), Docker, Docker Compose, PostgreSQL, Git, Github, Kubernetes(k8s).
Стек специалиста на проекте
ecr, TLS, AWS, gamemaker, Numpy, Git, Pandas, GitHub, Scikit-learn, Seaborn, XGBoost, Apache Spark, S3, Docker Compose, EKS, EC2, Lightgbm, PySpark, Docker, Python, Lambda, Posuta, Apache AirFlow, PostgreSQL, Kubernetes
Отрасль проекта
E-commerce & Retail
Период работы
Июнь 2022 - Апрель 2023  (11 месяцев)
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ЮРИДИЧЕСКИХ КОМПАНИЙ
Роль
Специалист по данным / инженер по машинному обучению
Обязанности
Приложение для сотрудников крупных юридических компаний для ускорения составления типовых юридических договоров. Мы использовали искусственный интеллект для анализа существующих документов компании и разработали алгоритм предложения структуры документов на основе выявленных документов золотого стандарта. Обязанности и достижения Определение типа текста для настройки предложений пользователю с использованием различных подходов к классификации текстов (tf-idf + классические классификаторы, признаки word2vec + svm/lstm/cnn); Выявление несоответствующих частей документа для уведомления пользователя о том, что часть текста или абзац являются неподходящими для определенной текстовой области; Настройка NVIDIA AMI на сервисе AWS EC2 для последующего обучения OCR-моделей из каталога NVIDIA NGC для извлечения текста из отсканированных документов; Предложение исправлений на основе баз данных документов; Реализован механизм перефразирования пользовательского текста для лучшего соответствия специфике домена. Для краткосрочного (следующие фразы/предложения) автодополнения использовали модели GPT-2, GPT-3; Использование семантического сходства векторных представлений, полученных с помощью таких моделей как BERT, для предложения нескольких шаблонов абзацев из базы знаний; Распознавание и отслеживание терминологии и других сущностей (задача NER), чтобы предложить их определения, или уведомить пользователя, если некоторые сущности были определены, но не были использованы в тексте, или были использованы в необычном для данной сущности контексте ; Проведение A/B-тестирования; Окружение Python, PyTorch, NLTK, Tesseract, Hugging Face, Gensim, AllenNLP, MLflow, Pandas, Plotly, Numpy, Scikit-learn, Matplotlib, NVIDIA NGC, AWS (SageMaker, S3, Lambda, EKS, EC2, CloudWatch, Sagemaker), Redis , Docker, Docker Compose, PostgreSQL, Git, Github.
Стек специалиста на проекте
NVidia, AWS, gamemaker, Numpy, Git, Pandas, ER, NFC, Redis, GitHub, Scikit-learn, NLTK, PyTorch, Gensim, HuggingFace, Tesseract, S3, MLflow, Docker Compose, EKS, EC2, Plotly, Docker, Python, Lambda, Matplotlib, AllenNLP, CloudWatch, PostgreSQL
Отрасль проекта
E-commerce & Retail
Период работы
Декабрь 2020 - Июнь 2022  (1 год 7 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
-
Специальность
Информатика и программная инженерия
Завершение учебы
2011 г.

Похожие специалисты

AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее
E-commerce & Retail • FinTech & Banking • Media
АС
Алексей С.
Минск
Data Scientist
Middle+
3 896,1 Р/час
Apache AirFlow
Apache Spark
app
AWS
Azure
Backend
blob
CatBoost
CloudWatch
Data
+63

Middle Data Scientist по работе с данными с опытом работы 3 года. Специалист по обработке данных, специализирующийся на разработке эффективных проектов, ориентированных на данные, и уделяющий особое внимание использованию передовых методов прогнозного моделирования, аналитики и рекомендательных систем. Я обладаю проверенным опытом в выявлении и решении бизнес-проблем с помощью стратегического применения Data Science. Кроме того, у меня есть практический опыт, охватывающий весь жизненный цикл работы с данными - от понимания проблем и разработки функциональных возможностей до внедрения моделей машинного обучения в производство. Для этого я использую различные инструменты, такие как Python, Pandas, пакеты визуализации данных, Scikit-learn, XGBoost, SHAP, Boruta для обработки данных, моделирования и оценки; FastAPI для серверной разработки, Docker и k8s для задач DevOps, облачные сервисы AWS и Azure.

Подробнее
EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
generator
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
+128

▪ Data Scientist с опытом работы c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов, оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • Travel, Hospitality & Restaurant business
МГ
Максим Г.
Минск
Data Scientist
Middle+
4 415,58 Р/час
NVidia
ecr
TLS
AWS
gamemaker
Databricks
Numpy
Data Factory
Git
Pandas
+56

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее
HRTech • Social Networking • Travel, Hospitality & Restaurant business • VR/AR
АМ
Антон М.
Таганрог
Frontend разработчик
Senior
3 246,75 Р/час
MobX
HTML5
TypeORM
Sass
React Hook Form
Redux Toolkit
lint
Socket.io
Redux
Styled-Components
+86

• Разработка адаптивных, кроссбраузерных интерфейсов с использованием React и Styled Components; • Разработка с применением методологии Agile, SCRUM, и использованием Jira, Confluence. • Разработка внешнего вида приложения в соответствии с дизайном, предоставленным в Figma. • Верстка страниц и стилизация с использованием HTML, CSS/SCSS/SASS/LESS, CSS Modules, Styled Components • Создание SPA и SSR приложений на React с использованием Next.js и TypeScript; • Опыт написания unit-тестов с использованием Jest и React Testing Library; • Управление состоянием через Redux Toolkit, опыт работы с MobX и Effector; • Настройка и оптимизация Webpack, внедрение микрофронтенд-архитектуры с использованием Module Federation (Webpack 5); • Реализация мультиязычности с помощью i18next и next-intl. Создание Progressive Web Apps (PWA) и Service Workers; • Использование UI-библиотек: Styled Components, Ant Design (AntD), Chakra UI • Анализ и обработка трафика с помощью Google Analytics, Clarity и Mixpanel; • Основы разработки на WebGL, Three.js и PlayCanvas; • Разработка кастомных систем авторизации (OAuth2, JWT, Firebase Auth и другие); • Интеграция платёжных систем с использованием Stripe; • Интеграция RESTful микросервисов, написанных на Node.js; • Работа с рядом паттернов микросервисной архитектуры; • Разработка бекенда на Node.js с использованием Express и NestJS; • работа с базами данных PostgreSQL и Prisma; • Создание чатов с использованием Socket.io; • Разработка стриминговых видеосервисов с применением WebRTC, PeerJS.

Подробнее