Ермухамет М. ML разработчик, Senior
ID 21509
ЕМ
Ермухамет М.
Мужчина, 27 лет
Казахстан, Алматы, UTC+5
Ставка
3 082,74 Р/час
вкл. НДС 5% (114.29 Р)
Специалист доступен с 3 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
ML разработчик
Грейд
Навыки
Отрасли
Главное о специалисте
Machine Learning Engineer с более чем 5-летним опытом коммерческой разработки. Эксперт в области построения и оптимизации ML-моделей, обработки изображений и NLP. Обладаю глубокими знаниями в Python, TensorFlow, PyTorch, MLFlow, ONNX. Имею опыт работы с LLM, RAG, RuBERT, Whisper, Vosk, а также в развертывании ML-сервисов в Kubernetes. Активно использую инструменты Docker, Git, AWS, Azure, GCP.
Проекты
(7 лет)
Kolesa Group, Алматы, Казахстан
Роль
Инженер по машинному обучению
Обязанности
Разработка чат-бота на основе Retrieval-Augmented Generation (RAG)
● Создал чат-бота, использующего RAG и большие языковые модели (LLM), что позволило значительно улучшить качество ответов на пользовательские запросы.
● Интегрировал Qdrant в качестве векторной базы данных для эффективного поиска и генерации релевантных ответов.
● Оптимизировал обработку данных, улучшив скорость и точность поиска информации.
Разработка RAG-приложения с использованием Streamlit
● Разработал веб-приложение на основе Streamlit, включающее:
○ GPT-4 и Claude для обработки естественного языка.
○ Визуальные модели Haiku, Sonnet, Gemini для анализа изображений и извлечения информации.
○ Оптимизированные методы разбиения данных (data chunking) для улучшения поиска и обработки запросов.
Оптимизация процесса модерации и сканирования фото
● Внедрил YOLOv7 для автоматической детекции людей и детей на загруженных пользователями изображениях.
● Использовал EfficientNet и Vision Transformer (ViT) для детекции и классификации водяных знаков.
● Разработал алгоритмы для автоматического кадрирования и классификации скриншотов и коллажей, что улучшило качество загружаемого контента.
Обучение модели анализа тональности текста
● Провел обучение модели анализа тональности с использованием BERT и различных механизмов внимания (attention mechanisms), что позволило улучшить понимание эмоций и настроений пользователей.
● Применил RuBERT для анализа русскоязычных текстов, что позволило значительно повысить точность определения тональности и категоризации сообщений пользователей.
Файн-тюнинг LLM с использованием Retrieval-Augmented Generation (RAG)
● Разработал и протестировал методы дообучения больших языковых моделей на специализированных данных, улучшив их способность работать в узкоспециализированных задачах.
Работа с распознаванием речи (Voice-to-Text)
● Интегрировал голосовые модели Whisper и Vosk для преобразования речи в текст.
● Реализовал обработку аудиофайлов с последующей семантической интерпретацией на основе LLM.
Развертывание ML-сервисов в Kubernetes
● Настроил и развернул ML-модели в Kubernetes, используя Helm и Docker.
● Автоматизировал масштабирование и обновление моделей, обеспечив высокую отказоустойчивость системы.
Достижения
● Внедрил векторную базу Qdrant, повысив скорость поиска информации.
● Использовал YOLOv7 для детекции людей и EfficientNet, ViT для водяных знаков.
● Автоматизировал масштабирование моделей через Helm, Docker, Kubernetes.
Стек специалиста на проекте
langchain, Whisper, transformers, Bert, Streamlit, gemini, kuber, claude, core, llm, WebSockets, Tensorflow, Data, ONNX, Prometheus, Helm, PyTorch, Qdrant, MLflow, Web, Vision, Confluence, Docker, Agile, Python, REST API, yolov5, Jira, rag, Kubernetes
Отрасль проекта
Information Security
Период работы
Июнь 2022 - По настоящее время
(3 года 2 месяца)
DataArt
Роль
Инженер по машинному обучению & Data Scientist
Обязанности
Разработка системы реального времени для детекции людей и сегментации изображений
● Работал в команде, разрабатывая алгоритмы обнаружения людей в реальном времени.
● Оптимизировал модель для работы на ограниченных вычислительных ресурсах.
Разработка модели детекции автомобилей для сети автомоек
● Создал модель машинного обучения для автоматического распознавания автомобилей, что упростило процесс обслуживания клиентов.
Кластеризация пользовательских данных с помощью глубокого обучения
● Разработал модель кластеризации изображений, анализируя скриншоты ноутбуков пользователей.
● Использовал методы feature extraction и машинного обучения для классификации данных и расчета ключевых показателей эффективности (KPI).
Разработка Layout-LM для задач Named Entity Recognition (NER)
● Работал над реализацией модели Layout-LM для извлечения именованных сущностей из документов.
● Оптимизировал модель и интегрировал её в облачные сервисы Azure, а также перевел в формат ONNX для ускорения работы.
Разработка модели детекции опухолей на медицинских изображениях
● Участвовал в создании алгоритмов глубокого обучения для автоматического распознавания опухолей на медицинских снимках.
Оптическое распознавание символов (OCR) и анализ текста
● Применял OCR для извлечения текстовой информации из изображений, анализировал текст и создавал эмбеддинги для последующей классификации.
Достижения
● Оптимизировал Layout-LM, адаптировав под облачные сервисы Azure.
● Внедрил OCR для анализа текстов и их классификации.
Стек специалиста на проекте
langchain, Whisper, transformers, Bert, AWS, kuber, llm, Tensorflow, Numpy, Git, ONNX, Hadoop, Helm, PyTorch, MLflow, GCP, Vision, PySpark, SQL, Docker, Python, Matplotlib, Azure, yolov5, rag, Kubernetes
Отрасль проекта
Urban technology
Период работы
Сентябрь 2020 - Май 2022
(1 год 9 месяцев)
Forte Bank (Топ-3 банков Казахстана), Астана, Казахстан
Роль
Data Scientist
Обязанности
Разработка предсказательных моделей для финансового сектора
● Разработал и внедрил модели предсказания оттока клиентов, прогнозирования доходов и кредитного скоринга, что повысило эффективность бизнес-решений банка.
Оптимизация конверсии транзакций
● Проанализировал и улучшил систему транзакций, повысив показатели конверсии денежных переводов.
Разработка и улучшение антифрод-модели
● Оптимизировал антифрод-модель, повысив метрику F1-score с 79% до 86%, что позволило снизить уровень мошеннических операций.
Оптимизация работы базы данных
● Решил ряд проблем с хранением и обработкой данных в базе банка, обеспечив стабильность работы систем.
Достижения
Достижения: Доработал модель, увеличив F1-score с 79% до 86%.
Стек специалиста на проекте
SQL, Python, AWS, Tensorflow, Hadoop, Pandas, Numpy, Matplotlib, Scikit-learn, XGBoost, PyTorch, Azure, CatBoost, GCP, MLflow, Lightgbm, PySpark
Отрасль проекта
FinTech & Banking
Период работы
Август 2018 - Август 2020
(2 года 1 месяц)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Дополнительное
Учебное заведение
University of Michigan
Специальность
Understanding and Visualizing Data with Python
Завершение учебы
2020 г.
Дополнительное
Учебное заведение
Яндекс
Специальность
Time Series Bootcamp, Supervised/Unsupervised Learning, Deep Learning mlcourse.ai
Завершение учебы
2021 г.
Дополнительное
Учебное заведение
Deep Learning AI
Специальность
- Improving Deep Neural Networks: Hyperparameter Tuning, Regularization, and Optimization - Neural Networks and Deep Learning
Завершение учебы
2019 г.
Дополнительное
Учебное заведение
Karpov Courses
Специальность
HardML
Завершение учебы
2022 г.
Дополнительное
Учебное заведение
DataCamp
Специальность
Introduction to Python
Завершение учебы
2019 г.
Высшее
Учебное заведение
San Diego University
Специальность
Supervised Learning Yessenov Data Lab 2019
Завершение учебы
2019 г.