АГ
Анастасия Г.
Женщина, 32 года
Россия, Москва, UTC+3
Ставка
3 272,72 Р/час
НДС не облагается
Специалист доступен с 12 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Scala разработчик
Грейд
Навыки
Отрасли
Знание языков
Английский — C1
Главное о специалисте
Machine Learning Engineer и разработчик Scala с более чем 6 годами опыта в разработке и внедрении моделей машинного обучения, включая классическое ML, NLP и RAG. Специализируется на Scala, Spark и интеграции с GigaChat API. Руководила направлением ML в мобильной разработке, успешно внедряла модели бустинга (Gini ~80) и RAG (точность до 80%). Имеет опыт работы с Hadoop, Kafka, Docker, Kubernetes и REST API. Участвовала в создании пайплайнов для обработки больших данных, дообучения LLM и контейнеризации моделей. Ориентирована на автоматизацию процессов, оптимизацию производительности и сотрудничество со смежными командами.
Технические компетенции:
- Языки программирования: Scala, Java, Go, SQL, Bash, Python
- ML/DS инструменты: Spark, Hadoop, RoBERTa, E5, GigaChat, LORA
- Инструменты: Git, Docker, Kubernetes, Kafka, S3
- Технологии и протоколы: REST API, Akka Stream, Akka HTTP
- Базы данных: Не указаны явно, но опыт работы с большими данными (Hadoop, S3)
- Методологии: Agile
Проекты
(6 лет 1 месяц)
Разработка пайплайна обучения и применения моделей классического ML для обработки больших данных с использованием Scala, Spark и S3.
Роль
Главный разработчик
Обязанности
- Проектирование и разработка ML-пайплайнов на Scala с использованием Spark.
- Настройка интеграции с S3 для хранения и обработки больших данных.
- Разработка RESTful API сервисов для взаимодействия с моделями.
- Реализация приложений с использованием Akka Stream и Akka HTTP.
- Контейнеризация приложений с использованием Docker.
- Настройка и развертывание приложений в Kubernetes.
- Оптимизация производительности ML-пайплайнов.
- Проведение код-ревью и обеспечение качества кода.
- Написание скриптов на Bash для автоматизации задач.
- Документирование архитектуры и API.
Достижения
- Успешно реализованы масштабируемые ML-пайплайны для обработки больших данных.
- Сокращено время обработки данных на 20% за счет оптимизации Spark.
- Обеспечена стабильная работа сервисов в Kubernetes.
Стек специалиста на проекте
Git, Docker, Bash, Scala, Kubernetes, Streams, HTTP, Spark, S3, Akka
Отрасль проекта
LifeStyle
Период работы
Сентябрь 2024 - Июль 2025
(11 месяцев)
Руководство направлением машинного обучения в мобильной разработке, включая разработку моделей бустинга, RAG и дообучение LLM для улучшения рекомендаций и обработки клиентских данных.
Роль
Head of ML Department (ML / Software Engineer)
Обязанности
- Руководство командой ML-инженеров, координация со смежными командами.
- Разработка и внедрение 6 моделей бустинга с Gini ~80 для рекомендаций переводов.
- Проектирование и автоматизация ML-пайплайнов с использованием Spark и Hadoop.
- Разработка RAG-моделей (на базе E5) с точностью до 80% для поиска по базе знаний.
- Интеграция с API GigaChat для суммаризации и классификации отзывов клиентов.
- Дообучение LLM (GigaChat) с использованием LORA-адаптеров.
- Оптимизация производительности моделей и сокращение времени инференса.
- Проведение код-ревью и менторство младших инженеров.
- Настройка CI/CD для автоматизации развертывания моделей.
- Документирование процессов и результатов в Confluence.
Достижения
- Улучшены рекомендации переводов, увеличив конверсию на 15%.
- Достигнута точность RAG до 80%, ускорив поиск по базе знаний на 30%.
- Автоматизированы ML-пайплайны, сократив время внедрения моделей на 25%.
Стек специалиста на проекте
Git, SQL, Python, Scala, Spark, Hadoop, gigachat
Отрасль проекта
FinTech & Banking
Период работы
Сентябрь 2020 - Сентябрь 2024
(4 года 1 месяц)
Разработка голосового чат-бота с использованием NLP-моделей, включая сбор данных, обучение и контейнеризацию.
Роль
Data Scientist NLP (голосовой чат-бот)
Обязанности
- Создание пайплайна для сбора и предобработки датасетов.
- Обучение NLP-моделей, включая дообучение RoBERTa.
- Разработка REST API для взаимодействия с моделью.
- Контейнеризация модели с использованием Docker.
- Интеграция с Kafka для обработки сообщений в реальном времени.
- Проведение тестирования моделей и API.
- Оптимизация производительности NLP-моделей.
- Написание SQL-запросов для анализа данных.
- Документирование пайплайнов и API.
- Участие в код-ревью и улучшение качества кода.
Достижения
- Запущен голосовой чат-бот с точностью распознавания 85%.
- Сокращено время обработки запросов на 20% за счет оптимизации API.
- Обеспечена стабильная работа модели в продакшене через Docker и Kafka.
Стек специалиста на проекте
Git, Docker, SQL, Python, Kafka, roberta
Отрасль проекта
FinTech & Banking
Период работы
Сентябрь 2019 - Сентябрь 2020
(1 год 1 месяц)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Дипломы и сертификаты
NVIDIA, Apache Spark for Data Engineering, 2022 г.
Yandex, Hadoop 2021 г.
Технопарк МГТУ им. Н.Э. Баумана, Hadoop: Система для обработки больших объемов данных, 2019 г.
Образование
Высшее
Учебное заведение
Московский государственный технический университет им. Н.Э. Баумана
Специальность
Информатика и системы управления
Завершение учебы
2019 г.
Высшее
Учебное заведение
Московский государственный технический университет им. Н.Э. Баумана
Специальность
Инноватина
Завершение учебы
2015 г.