ИЛ
Илья Л.
Мужчина, 28 лет
Россия, Москва, UTC+3
Ставка
3 917,65 Р/час
вкл. НДС 5% (145.24 Р)
Специалист доступен с 1 августа 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
ML разработчик
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Илья — ML-разработчик уровня Middle+ из Москвы. Специализируется на машинном обучении, имеет опыт работы в сферах Media, BioTech, Pharma, Health care & Sports. Владеет английским языком на уровне B2.
Имеет высшее образование по специальности «Специалист по защите информации» Орловского университета.
Участвовал в двух проектах:
- Langswap (Media, декабрь 2023 — июль 2025). Роль: ML developer. Задачи включали исследования в области речевых технологий, участие в Emotion Recognition Challenge 2024, руководство командой по сбору датасета для TTS, развёртывание моделей на serverless платформе runpod, оптимизация инференса моделей.
- NDA Здравоохранение (BioTech, Pharma, Health care & Sports, июнь 2021 — декабрь 2023). Роль: ML developer + Data Scientist. Задачи включали реализацию задач в области computer vision, разработку моделей в области NLP для анализа текста, представление результатов в виде demo на gradio, fine-tuning YandexGPT на суммаризацию текста.
Общая продолжительность работы на проектах — 4 года 1 месяц.
Проекты
(4 года 2 месяца)
Langswap
Роль
ML developer
Обязанности
● Исследования в области речевых технологий (TTS, ASR, voice classification, speech +gpt)
● Участие в Emotion Recognition Challenge 2024
● Руководство командой по сбору датасета для TTS (аренда студии, подбор актёров, генерация текстов). В результате, модели синтеза речи стали звучать естественнее
● Развертывание моделей на serverless платформе runpod
● Ускорение инференса моделей (triton + потоковая реализация) - в результате,
● экономия gpu часов 30%
● Обучение моделей синтеза речи
● Разработка пайплайна по переводу видео
Достижения
● Собрал и подготовил уникальный датасет (аренда студии, подбор актёров, генерация текстов), что повысило естественность звучания моделей на 25%.
● Оптимизировал пайплайн предобработки аудио, сократив время подготовки данных на 40%.
● Внедрил Triton Inference Server + потоковую обработку, что снизило затраты GPU на 30%.
● Добился уменьшения задержки инференса в 2 раза для ASR (автоматического распознавания речи).
● Разработал модель классификации эмоций в речи (точность 85% на валидационном наборе).
● Применил мультимодальный подход (аудио + текст), улучшив качество распознавания на 15%.
● Настроил serverless-инфраструктуру на RunPod, что позволило масштабировать TTS/ASR-сервисы без лишних затрат.
● Автоматизировал деплой моделей, сократив время выкатки обновлений с 2 часов до 15 минут.
● Создал сквозной пайплайн: ASR → машинный перевод → TTS с сохранением эмоциональной окраски.
● Интегрировал GPT-4 для пост-обработки текста, улучшив качество перевода на 20%.
Стек специалиста на проекте
Docker, Python, Bash, Grafana, Kubernetes, Prometheus, PyTorch, Apache AirFlow, ONNX, TensorRT, Whisper, Bert, roberta, Классификация, Исследования, kuber, Librosa, Trino, runtime, TTS
Отрасль проекта
Media
Период работы
Декабрь 2023 - Июль 2025
(1 год 8 месяцев)
NDA Здравоохранение
Роль
ML developer + Data Scientist
Обязанности
● Реализации задач в области computer vision (classfication, detection, OCR, segmentation) от постановки задачи, сбора/разметки начального датасета, разработки PoC моделей, достижение целевых метрик моделей и вывода в прод.
● Разработка моделей в области NLP для анализа текста(finetune bert-like моделей).
● Представление результатов в виде demo на gradio.
● Fintune YandexGPT на суммаризацию текста.
● Разработка модели по описанию изображений (CNN + transformer).
Достижения
● Полностью разработал (от сбора данных до упаковки в контейнер) модели для детекции элементов на печатных платах и распознаванию с них текста
● Классификацию кожных заболеваний (меланома, bcc, и т.д.) по снимкам с дерматоскопические изображений распознавания номеров с машин.
Стек специалиста на проекте
Docker, FastAPI, PyTorch, NLP, MLflow, OpenCV, EasyOCR, YOLO, UNET, Bert, Trino, YandexGPT, Hugging face transformers
Отрасль проекта
BioTech, Pharma, Health care & Sports
Период работы
Июнь 2021 - Декабрь 2023
(2 года 7 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Орловский университет
Специальность
Специалист по защите информации
Завершение учебы
2020 г.