Григорий Р. Data Scientist, Middle+

ID 28521
ГР
Григорий Р.
Мужчина, 25 лет
Россия, Москва, UTC+3
Ставка
2 774,47 Р/час
вкл. НДС 5% (102.86 Р)
Специалист доступен с 31 августа 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle+
Навыки
API
automl
bases
CatBoost
CI/CD
compliance
ETL
Forecasting
gigachat
Git
HuggingFace
JupyterNoteBook
kuber
Linux
Machine learning
metal
NLP
NLTK
Numpy
optimization
Pandas
PostgreSQL
Power BI
PySpark
Python
PyTorch
Scikit-learn
SciPy
Seaborn
SpaCy
SQL
XGBoost
Аналитика
Отрасли
E-commerce & Retail
FinTech & Banking
Знание языков
Английский — B1
Главное о специалисте
Григорий — специалист уровня Middle+ в области Data Science, работает в Москве. Имеет высшее образование по специальности «Экономист» в области международного энергетического бизнеса. Владеет английским языком на уровне B1. Обладает опытом работы на проектах в сферах FinTech & Banking и E-commerce & Retail. Участвовал в следующих проектах: 1. ФинТех проект (роль — Data Scientist, руководитель направления валидации): анализ и оценка модельных рисков, верификация процесса сбора данных и разработки моделей, формирование отчётов и рекомендаций для разработчиков. 2. Анализ кадровых данных (роль — Data Scientist): снижение текучести кадров через предиктивную аналитику и NLP, построение ETL-пайплайна обработки текстов, автоматизирование разметки данных через GigaChat API. 3. Система прогнозирования спроса (роль — Data Scientist): разработка ML-моделей прогнозирования спроса, автоматизирование ETL-процессов, внедрение алгоритма A/B-тестирования ценовых стратегий. Ключевые навыки: Analytics, API, AutoML, ETL, Forecasting, Git, Machine learning, NLP, Pandas, PostgreSQL, Power BI, Python, PySpark, Scikit-learn, SQL, XGBoost и другие.
Проекты   (4 года 6 месяцев)
ФинТех проект
Роль
Data Scientist (руководитель направления Валидации)
Обязанности
● Анализ и оценка модельных рисков: ценообразование, прогноз вероятности банкротства, расчет резервов, расчет экономического капитала ● Верификация процесса сбора данных, разработки моделей ● Формирование отчетов/презентаций/докладов по итогам анализа, выработка рекомендаций для разработчиков ● Разработка плана необходимых мероприятий по устранению недостатков моделей совместно с их владельцами и разработчиками
Достижения
Спроектировал архитектуру тестирования 15+ моделей (PD/LGD, скоринг, эконометрика) с поддержкой Python-фреймворка для автоматизации (80% coverage) ● Внедрил stress-testing и backtesting по стандартам Базель III, выявив системные ошибки в 2 ключевых моделях (снижение рисков на 20%+) ● Разработал 120+ рекомендаций по улучшению архитектуры моделей и данных для команды разработки ● Провалидировал следующие модели: 1. Оценки уровня потерь при дефолте розничных кредитных требований для ипотеки 2. Оценки вероятности дефолта крупных корпоративных клиентов 3. Предсказания пространства Макроэкономических показателей 4. Модель справедливой оценки стоимости опционов (процентных, валютных) 5. Провел сценарный анализ качества моделей количественной оценки параметров кредитного риска для ипотечных кредитных требований розничного портфеля 6. Интегральная скоринговая модель по ипотеке 7. Модель учета прогноза макроэкономики при оценке ОСУ по портфелю ипотечных финансовых инструментов в соответствии с МСФО 9 «Финансовые инструменты» (Модель Мертона-Васичека) 8. Модель прогнозирования временных рядов графиков финансирования строительно-монтажных работ объектов проектного финансирования (Ансамбль из градиентных бустингов)
Стек специалиста на проекте
SQL, Python, Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, compliance, bases, automl
Отрасль проекта
FinTech & Banking
Период работы
Декабрь 2023 - Июнь 2025  (1 год 7 месяцев)
Анализ кадровых данных NLP-направление для анализа кадровых данных 2000+ организаций
Роль
Data Scientist
Обязанности
● Снижение текучести кадров через предиктивную аналитику и NLP, минимизируя ручной труд в обработке текстов ● Построение ETL-пайплайн обработки текстов: от сырых данных до предиктов (SpaCy, NLTK, HuggingFace) ● Автоматизирование разметки данных через GigaChat API, сократив затраты на labeling
Достижения
● Запустил и масштабировал NLP-направление с нуля: от исследований до внедрения, включая координацию с HR-отделами клиентов ● Разработал end-to-end решение для прогнозирования оттока сотрудников на основе текстовых данных, интеграции с HR-системами и автоматизации разметки ● Разработал и внедрил production-ready модель на RuBERT (GINI 92% для прогноза оттока), интегрированную в HR-процессы ● Создал интерактивный дашборд (Power BI) с метриками модели, используемый руководством для кадровых решений
Стек специалиста на проекте
API, Power BI, Pandas, NLTK, PyTorch, NLP, HuggingFace, SpaCy, kuber, gigachat
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2023 - Декабрь 2023  (9 месяцев)
Система прогнозирования спроса
Роль
Data Scientist
Обязанности
Система прогнозирования спроса На основе которой принималось решение о старте продаж товаров в различных категориях. Комплексное решение включало ML-модели, автоматизированные ETL-процессы и инструменты для принятия коммерческих решений. ● Повышение точности планирования запасов и маржинальности через data-driven подход ● Разработка ML-моделей прогнозирования спроса на основе ансамбля XGBoost + CatBoost с точностью 87% (MAPE) ● Автоматизирование ETL-процессов, заменив Excel на Python + PostgreSQL, что сократило время подготовки данных с 4 часов до 5 минут/день
Достижения
● Внедрил алгоритм A/B-тестирования ценовых стратегий, увеличив маржинальность на 5-7% в ключевых категориях ● Создал интерактивные дашборды (Power BI) для мониторинга продаж, остатков и эффективности моделей
Стек специалиста на проекте
PostgreSQL, Python, Power BI, Pandas, ETL, XGBoost, PyTorch, Аналитика, CatBoost, optimization, metal, Forecasting
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2021 - Апрель 2023  (2 года 4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Российский государственный университет нефти и газа им. И.М. Губкина, Москва
Специальность
Факультет Международного энергетического бизнеса, Экономист
Завершение учебы
2022 г.
Высшее
Учебное заведение
Российский государственный университет нефти и газа им. И.М. Губкина, Москва
Специальность
Факультет Международного энергетического бизнеса, Экономист Магистратура
Завершение учебы
2024 г.

Похожие специалисты

EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
Optimizely
+135

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Подробнее
FinTech & Banking • IoT • Manufacturing
АЛ
Артем Л.
Минск
Data Scientist
Senior
6 493,5 Р/час
A/B testing
Agile
Anaconda
API
Bash
Bitbucket
CatBoost
CI/CD
Circle CI
Docker
+74

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее
AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • FinTech & Banking • Manufacturing
МН
Марк Н.
Москва
Бизнес/системный аналитик
Middle+
3 596,53 Р/час
интервьюирование
методологии
1С: Управление предприятием
ЧТЗ
business studio
RUP
UML
Kanban
Функциональные требования
+89

Марк — опытный IT-специалист, обладающий широким спектром навыков и компетенций в области бизнес-аналитики и системного анализа. За плечами у Марка более 4 лет опыта работы на различных проектах, где он проявил себя как разносторонний специалист, способный решать задачи любой сложности. В своей работе Марк использует современные инструменты и методологии, такие как BPMN, UML, EPC, IDEF, REST, SOAP, JSON, XML, Visio, а также системы управления проектами Jira и Confluence. Он обладает глубокими знаниями в области разработки и проектирования систем, а также навыками работы с базами данных и API. Марк обладает отличными коммуникативными навыками и способен эффективно работать в команде. Он готов к новым вызовам и всегда стремится к профессиональному росту.

Подробнее