Егор Т. ML разработчик, Senior
ID 32207
ЕТ
Егор Т.
Мужчина, 30 лет
Беларусь, Гомель, UTC+3
Ставка
4 480,52 Р/час
НДС не облагается
Специалист доступен с 13 октября 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
ML разработчик
Грейд
Навыки
Отрасли
Знание языков
Английский — C1
Проекты
(5 лет 9 месяцев)
ИНТЕЛЛЕКТУАЛЬНОЕ УПРАВЛЕНИЕ ОБЪЕКТАМИ
Роль
ML-разработчик
Обязанности
Тесное взаимодействие со стейкхолдерами для определения бизнес-требований;
Наставничество младших разработчиков;
Проектирование и реализация инфраструктуры проекта на базе AWS;
Проведение разведывательного анализа данных (EDA) для лучшего понимания проблем клиентов и последующее создание отчетов;
Сотрудничество с экспертами для выявления специфических признаков и характеристик, связанных со строительными проблемами;
Разработка сегментационного слоя для клиентских данных на различных уровнях агрегации;
Улучшение и оптимизация каждого слоя ML-пайплайна;
Разработка слоя для преобразования неструктурированных данных в полезные предиктивные факторы;
Реализация слоя для восстановления пропущенных данных путем обработки описаний проблем;
Извлечение именованных сущностей (NER) из описаний проблем с использованием LLM (Qwen, LLama, OpenAI API, Mistral);
Эксперименты с prompting-подходами (chain-of-thoughts, few-shot и др.) для повышения качества моделей;
Реализация Retrieval-Augmented Generation (RAG)-подхода для обогащения LLM внешними источниками знаний (QA/Cx протоколы, строительная документация) для повышения точности классификации проблем и извлечения сущностей;
Проектирование и реализация модели классификации (критичные и некритичные проблемы) на основе строительной информации с применением кластеризации и методов принятия решений;
Создание системы контроля версий данных и воспроизводимости для дополнительных слоев;
Квантование LLM-моделей для снижения задержек и уменьшения использования памяти;
Использование LLM для классификации проблем по описаниям и извлечения сущностей (NER);
Документирование проекта;
Развертывание моделей машинного обучения и мониторинг метрик с использованием AWS;
Выявление и обработка дрейфа данных и концептуального дрейфа;
Код-ревью.
Стек специалиста на проекте
Git, Docker, Python, AWS, GitHub, Lambda, Pandas, SciPy, SQLAlchemy, Numpy, Matplotlib, Scikit-learn, Seaborn, XGBoost, PyTorch, Alembic, Flask, Docker Compose, Apache AirFlow, EC2, Redis, Babel.js, DVC, S3, EKS, Plotly, shap, HuggingFace, langchain, studio, OpenAI API, sagemaker
Отрасль проекта
Realty & Constructoring
Период работы
Июль 2024 - По настоящее время
(1 год 4 месяца)
АНАЛИТИКА ТЕЛЕКОММУНИКАЦИОННЫХ АБОНЕНТОВ
Роль
ML-разработчик
Обязанности
Настройка окружения для мониторинга метрик модели и отслеживания артефактов во время экспериментов с обучением;
Создание пайплайнов для предварительной обработки данных;
Интеграция анализа тональности отзывов клиентов в аналитический слой с использованием трансформеров;
Разработка сегментационного слоя для абонентов и последующий анализ сегментов по различным критериям;
Создание ансамблей моделей для прогнозирования оттока по различным сегментам абонентов с учетом их характеристик и поведения;
Эксперименты с oversampling, undersampling и продвинутыми алгоритмами, такими как SMOTE, для решения проблемы несбалансированных данных;
Добавление слоя интерпретируемости для лучшего понимания факторов оттока и обоснованного принятия решений;
Проведение углубленного разведывательного анализа данных (EDA) для изучения распределения и особенностей данных абонентов;
Выявление и обработка дрейфа данных и концептуального дрейфа;
Создание и представление полезных отчётов стейкхолдерам;
Проведение A/B тестирования для сравнения различных стратегий удержания;
Развертывание моделей с использованием AWS Sagemaker;
Автоматизация непрерывного обновления моделей и инференса по принципу CI/CD.
Стек специалиста на проекте
Git, Docker, Python, Oracle, Jenkins, GitLab, AWS, etc, Redshift, Pandas, SciPy, Scikit-learn, Seaborn, Statsmodels, NLTK, XGBoost, PyTorch, Apache Spark, Docker Compose, EC2, CatBoost, S3, CloudWatch, Plotly, Lightgbm, shap, HuggingFace, glue, sagemaker
Отрасль проекта
Telecom
Период работы
Август 2023 - Июль 2024
(1 год)
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ЮРИДИЧЕСКИХ КОМПАНИЙ
Роль
ML-разработчик
Обязанности
Проектирование новых пользовательских кейсов;
Определение типа текста для персонализации рекомендаций пользователю с использованием различных подходов к классификации (tf-idf + классические классификаторы, признаки word2vec + svm/lstm/cnn);
Выявление несогласованных частей документа с целью уведомления пользователя о том, что абзац или фрагмент не соответствует заданной тематике текста;
Применение Tesseract OCR для распознавания символов в обнаруженном тексте;
Предложение исправлений на основе баз данных документов;
Переформулирование пользовательского текста с учётом специфики домена. Для автодополнения на короткий срок (следующие фразы/предложения) использовались генеративные трансформеры (GPT);
Использование семантического сходства на основе трансформеров, таких как BERT, для предложения шаблонов абзацев из нашей базы знаний;
Предложение улучшенной структуры текста на основе распознанного подтипа текста;
Распознавание и отслеживание терминологии и других сущностей (NER-задача) с целью предложения определений для повышения ясности текста пользователя или уведомления пользователя, если некоторые сущности были определены, но не использовались в тексте, либо использовались в нетипичном контексте;
Проведение A/B тестирования;
Реализация новых сервисов на FastAPI;
Настройка CI/CD пайплайнов;
Код-ревью.
Стек специалиста на проекте
PostgreSQL, Git, Docker, Python, AWS, GitHub, etc, Lambda, Pandas, SQLAlchemy, Numpy, FastAPI, Matplotlib, Scikit-learn, NLTK, PyTorch, Gensim, Alembic, Docker Compose, Redis, Tesseract, AllenNLP, S3, CloudWatch, MLflow, EKS, Plotly, HuggingFace, sagemaker
Отрасль проекта
Government & Public Sector
Период работы
Июнь 2022 - Август 2023
(1 год 3 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
ГГУ им. Ф. Скорины
Специальность
Программное обеспечение информационных технологий
Завершение учебы
2019 г.