Кирилл С. Data Scientist, Senior
ID 26307
КС
Кирилл С.
Мужчина, 24 года
Беларусь, Минск, UTC+3
Ставка
3 896,62 Р/час
вкл. НДС 20% (520 Р)
Специалист доступен с 13 сентября 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Русский — C1
Английский — B2
Главное о специалисте
▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах.
▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям.
▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8
▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов.
▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins).
▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов.
▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей
▪ Проведение code review
Проекты
(4 года 10 месяцев)
Комплексная система персонализации и прогнозирования для медицинского портала
Роль
Data Scientist
Обязанности
Проект по развитию комплексной системы персонализации и прогнозирования для медицинского портала. Проект направлен на создание инновационной платформы, которая объединяет передовые методы машинного обучения и анализа данных для повышения качества медицинских услуг. Система разработана с учетом специфики здравоохранения и требований к защите персональных данных пациентов. Основная цель проекта – внедрение персонализированного подхода к взаимодействию с пациентами через использование современных технологий предиктивной аналитики. Проект обеспечивает автоматизацию процессов принятия решений в здравоохранении и повышение эффективности работы медицинских специалистов. Особое внимание уделялось созданию масштабируемой архитектуры, способной обрабатывать большие объемы медицинских данных в реальном времени, сохраняя высокую точность прогнозов:
▪ Разработка гибридной рекомендательной системы для предложений медицинских услуг с использованием Transformer-based моделей и интеграцией с Kafka Streams для реального времени обновления рекомендаций
▪ Создание системы раннего выявления рисков для пациентов с хроническими заболеваниями с применением ансамблевых моделей на основе XGBoost, LightGBM и CatBoost, автоматической системой переобучения и мониторингом метрик через Prometheus и Grafana
▪ Разработал систему распознавания документов на основе компьютерного зрения с использованием OCR (оптического распознавания символов) для автоматизации извлечения и оцифровки медицинских записей и форм, что повысило эффективность ввода данных и сократило количество ошибок при ручной обработке.
▪ Исследование и реализация подходов к преобразованию текстовых описаний в структурированные шаблоны с использованием Seq2Seq и Transformer-based моделей, что открывает возможность применения методов задач Text2BIM.
▪ Внедрение системы интерпретации результатов моделей для врачей с LIME и SHAP, интеграция с системой электронных медицинских карт через REST API и создание отчетов с Tableau
▪ Оптимизация процессов обработки больших объемов медицинских данных с помощью Hadoop ecosystem, Dask и Spark для параллельной обработки
▪ Разработка системы управления качеством данных с Great Expectations и внедрение механизма автоматической проверки корректности моделей
▪ Реализация системы A/B тестирования для экспериментов с различными подходами к персонализации с использованием Optimizely
▪ Интеграция ML-моделей с существующей IT-инфраструктурой клиники через микросервисную архитектуру на базе Kubernetes
▪ Разработка системы документации ML-процессов с использованием Confluence и Jira
▪ Настройка CI/CD pipeline с GitLab CI/CD для автоматизации развертывания изменений
Стек специалиста на проекте
OpenCV, AI, Grafana, Optimizely, extract, AWS, pytesseract, reat, Tensorflow, Spark, Hive, Google Cloud, Hadoop, Scikit-learn, PyTorch, XGBoost, CatBoost, Tableau, Tesseract, HDFS, MLflow, Kafka Streams, ELK Stack, Lightgbm, Dask, Docker, Python, Confluence, Apache AirFlow, Jira, Xpectations, ocr, Prometheus, Kubernetes
Отрасль проекта
Travel, Hospitality & Restaurant business
Период работы
Февраль 2023 - По настоящее время
(2 года 8 месяцев)
Комплексное решение для персонализированного обучения
Роль
Data Scientist
Обязанности
Проект по разработке комплексного решения для персонализированного обучения. Создана инновационная AI-платформа, объединяющая передовые методы машинного обучения для повышения эффективности образовательных программ. Проект реализует адаптивный подход к обучению с использованием современных технологий предиктивной аналитики и генеративных моделей. Особое внимание уделялось созданию масштабируемой архитектуры для обработки больших объемов данных в реальном времени и предоставления точных рекомендаций.
● AI-платформы для адаптивного обучения, включающей модуль системы автоматического контроля качества образовательного контента, модель прогнозирования спроса на курсы и технологии RAG (Retrieval-Augmented Generation) для улучшения поиска и генерации учебных материалов
● Создание системы персонализации обучения с рекомендательной системой для подбора индивидуальных траекторий, прогнозированием успеха студентов и корректировкой программ в реальном времени
● Интеграция технологии RAG для улучшения взаимодействия с образовательным контентом с использованием Large Language Models для генерации ответов на вопросы студентов и оптимизации поисковой системы с помощью векторных баз данных
● Разработка моделей прогнозирования спроса на образовательные продукты с точностью более 90% и прогнозирование результатов обучения студентов для своевременной коррекции программы
● Добавление компонентов компьютерного зрения для анализа визуального контента (включая real-time видео конференции):
○ Автоматическая классификация и анализ образовательных видео и изображений для повышения качества контента
○ Использование моделей детекции и сегментации для создания интерактивных элементов обучения (например, выделение ключевых объектов в научных экспериментах)
● Проведение детального анализа эффективности системы с разработкой метрик оценки качества работы всех компонентов платформы, включая NLP-метрики (BLEU, ROUGE), анализ конверсии пользователей, изучение поведения пользователей через событийную аналитику, выявление точек оттока и регулярная оценка ROI внедренных решений.
● Развертывание аналитической инфраструктуры: Построение ETL-пайплайнов (Apache AirFlow) для консолидации данных образовательной платформы, внешних API (LMS, контент-провайдеры) и результатов работы ML-моделей. Создание аналитических витрин в ClickHouse (обработка событий обучения) и PostgreSQL (хранение метаданных курсов и пользователей)
● Визуализация и отчетность: Разработка управленческих дашбордов в Яндекс DataLens с динамическими фильтрами: трекинг успеваемости, востребованность контента, ROI образовательных программ. Интеграция API платформы для автоматизации отчетов по метрикам NLP (BLEU/ROUGE) и поведенческой аналитики
● Настройка CI/CD pipeline для автоматизации процессов развертывания и тестирования изменений
● Настройка и интеграция MLflow для отслеживания параметров, метрик и артефактов моделей на всех этапах разработки; автоматизация логгирования результатов экспериментов и сравнения производительности различных моделей машинного обучения и глубокого обучения.
Стек специалиста на проекте
Docker, Python, Kubernetes, Pandas, Numpy, FastAPI, Scikit-learn, XGBoost, PyTorch, Apache AirFlow, ONNX, YANDEX DATALENS, MLflow, OpenCV, GitLab CI/CD, Lightgbm, cloud, DataLens, langchain, weaviate, lightning, Alure, Hugging face transformers, pinecone
Отрасль проекта
EdTech
Период работы
Декабрь 2021 - Январь 2023
(1 год 2 месяца)
Система управления кредитным портфелем для цифрового банка
Роль
Data Scientist
Обязанности
Разработка и внедрение системы управления кредитным портфелем для цифрового банка, включая прогнозирование рисков и оптимизацию финансовых продуктов.
● Разработка систем оценки кредитного риска: создание моделей оценки платежеспособности клиентов на основе транзакционных данных, демографической информации и альтернативных источников данных.
● Прогнозирование поведения клиентов: анализ исторических данных для предсказания вероятности просрочки, оттока клиентов и потребностей в финансовых продуктах с использованием ETS и ARIMA для моделирования динамики показателей и построения долгосрочных прогнозов.
● Оптимизация портфеля финансовых продуктов: разработка алгоритмов для подбора оптимальных условий кредитования с учетом рыночной конъюнктуры и рисков.
● Создание системы мониторинга показателей: внедрение дашбордов для оперативного анализа ключевых метрик кредитного портфеля и принятия решений.
● Автоматизация процессов принятия решений: интеграция ML-моделей в production-среду для автоматического одобрения/отклонения заявок на кредиты.
Стек специалиста на проекте
PostgreSQL, Docker, SQL, Python, Kubernetes, GitLab, Pandas, Numpy, FastAPI, Matplotlib, Scikit-learn, Seaborn, XGBoost, PyTorch, JupyterLab, Azure, Flask, Apache AirFlow, MLflow, Plotly, Lightgbm, cloud, sber
Отрасль проекта
FinTech & Banking
Период работы
Декабрь 2020 - Ноябрь 2021
(1 год)
Формат работы
Тип занятости
Фулл-тайм, Парт-тайм (4 ч/день)
Формат работы
Удаленно, Офис
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
БГУИР (Белорусский Государственный университет информатики и радиоэлектроники)
Специальность
ФИТиУ(Факультет информационных технологий и управления) АСОИ(Автоматизированные системы обработки информации)
Завершение учебы
2022 г.