ДН
Дмитрий Н.
Мужчина, 24 года
Россия, Санкт-Петербург, UTC+3
Ставка
3 896,1 Р/час
НДС не облагается
Специалист доступен с 31 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
ML разработчик
Грейд
Навыки
Отрасли
Знание языков
Английский — B1
Главное о специалисте
Опыт разработки и проектирования сложного программного обеспечения в том числе с интеграцией данных.
Эксперт в области нейронных сетей.
Знание основных алгоритмов и структур данных.
Хорошее знание шаблонов проектирования, дизайна объектно-ориентированного программирования, юнит-тестирования
Опыт применения современных инженерных практик, чистый код, рефакторинг.
Опыт разработки и построения веб-сервисов
Опыт работы с ML и CV – 3 года (полный цикл сбор и подготовка данных, feature selection & engineering, тренировка/валидация/тестирование ML моделей, выбор лучшей модели, демонстрация результатов)
Опыт работы с данными - 2 года
Опыт разработки на Python - 3 года
Опыт разработки на C++ - 1 лет
Опыт разработки и построения веб-сервисов
Опыт работы с асинхронными библиотеками
Опыт разработки MLOps инструментов/платформ
Опыт разработки NLP/NLU платформ
Проекты
(2 года 7 месяцев)
Разработка беспилотного гоночного болида
Роль
Руководитель группы автопилота
Обязанности
Проект посвящен разработке системы для детекции и оценки расстояния до конусов в рамках
участия в соревнованиях Formula Student. Модуль использует YOLOv8n для детекции объектов
(конусов), обеспечивая высокую точность (AP50=0.98). Также система оценивает глубину с
помощью модели monodepth2 для анализа расстояния до объектов.
Задачи
Детекция конусов:
Использование модели YOLOv8n для детекции и классификации конусов на
изображениях с высокой точностью (AP50=0.98).
Интеграция модели с алгоритмами автопилота для реального времени.
Оценка глубины (моноглубина):
Применение модели monodepth2 для оценки расстояний до конусов на основе
моновизии.
Тестирование и проверка гипотез с использованием базовой модели для определения
точности глубины.
Оптимизация производительности:
Перевод модели YOLOv8n в формат ONNX для ускорения инференса.
Планирование перехода на TensorRT для дальнейшей оптимизации времени отклика.
Стек специалиста на проекте
Docker, C++, Python, Numpy, ONNX, YOLO, TensorRT, Промпт-инжиниринг, Engineering, monodepth2, ros2
Отрасль проекта
Manufacturing
Период работы
Сентябрь 2024 - По настоящее время
(11 месяцев)
Система машинного перевода с языка зетан (a.k.a зашумленный турецкий) на английский
Роль
ML-разработчик, обучение нейронной сети, подготовка разметка данных
Обязанности
Проект направлен на создание системы машинного перевода с языка зетан на английский. Эта
система необходима для эффективного общения с внеземной цивилизацией и будет
использоваться для перевода текстов, предоставленных зетанами. В задачи проекта входит
разработка модели перевода, обучение модели на предоставленных данных, а также оценка
качества перевода с использованием метрик, таких как BLEU score. Модель будет обучаться на
текстах, содержащих оригинальные произведения зетан и их переводы на английский.
Задачи
Предобработка данных:
Загрузка и подготовка текстов из предоставленных данных (переводы с языка зетан на английский).
Токенизация и преобразование данных в формат, пригодный для подачи в модель.
Обучение модели:
Использование предобученной модели MarianMT для машинного перевода и дообучение модели на специфичных данных языка зетан.
Обучение модели для эффективного перевода с учетом особенностей языка зетан.
Оценка качества перевода:
Применение метрики BLEU score для оценки качества перевода.
Тестирование модели на закрытой тестовой выборке и сравнение результатов с референсными переводами.
Форматирование и создание итогового файла:
Формирование выходных данных в формате json-lines, где каждая строка включает исходный текст на языке зетан и его перевод на английский.
Анализ и выводы:
Оценка результатов перевода и выводы по качеству работы модели на основе метрики BLEU.
Стек специалиста на проекте
Python, Numpy, NLTK, transformers
Отрасль проекта
Social Networking
Период работы
Ноябрь 2024 - Декабрь 2024
(2 месяца)
Система классификации текстов с использованием модели BERT
Роль
ML-разработчик, обучение нейронной сети, подготовка разметка данных
Обязанности
Проект направлен на реализацию системы классификации текстов с использованием модели BERT. Основной целью является обработка текстов для решения задач классификации, таких как определение тематической принадлежности, эмоциональной окраски или выделение ключевых
элементов текста. Это может быть полезно в различных областях, таких как анализ отзывов, классификация новостных статей, категоризация контента на основе его содержания.
Задачи
Предобработка данных:
Сбор и очистка текстовых данных для использования в модели.
Токенизация текста с использованием моделей BERT.
Преобразование текста в формат, подходящий для подачи в модель (для токенизации).
Обучение модели:
Настройка модели BERT для задачи классификации.
Разделение данных на обучающую и тестовую выборки.
Обучение модели на подготовленных данных.
Оценка и тестирование модели:
Применение модели для предсказания классов на тестовых данных.
Оценка точности классификации с использованием метрик, таких как accuracy, F1-score, precision, recall.
Оптимизация модели:
Применение техник fine-tuning для улучшения метрик модели.
Стек специалиста на проекте
Python, Numpy, HuggingFace, transformers
Отрасль проекта
Manufacturing
Период работы
Ноябрь 2024 - Декабрь 2024
(2 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Университет ИТМО
Специальность
Робототехника и ИИ
Завершение учебы
2025 г.