Мария Я. Data Scientist, Middle+
ID 5115
МЯ
Мария Я.
Женщина, 23 года
Россия, Челябинск, UTC+5
Ставка
4 935,06 Р/час
НДС не облагается
Специалист доступен с 3 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B1
Главное о специалисте
Разрабатываю модели, способные решать задачи классификации и регрессии. Моя основная цель - помочь решить проблемы в области прогнозирования, компьютерного зрения и анализа текстовой информации. Владею классическими и глубокими методами машинного обучения. Занимаюсь анализом данных и визуализацией результатов с помощью библиотек Pandas, Numpy, Matplotlib, Seaborn, Plotly. Строю модели глубокого обучения с помощью фреймворков Keras и PyTorch. Уверенно разрабатываю на Python. Есть опыт работы с Flask, SQLAlchemy, а также опыт написания юнит-тестов с помощью библиотек PyTest и UnitTest. Совершенствую свои навыки, читая профессиональную литературу и публикуя научные статьи и статьи на Хабре.
Проекты
(3 года 1 месяц)
Разработка корпоративного LLM-помощника для работы с документацией компании
Роль
ML-инженер / Team Lead
Обязанности
Разработка поисковой системы по документации компании на основе архитектуры Retrieval-Augmented Generation (RAG)
Результат работы:
- Cбор и анализ требований.
- Провела исследование наилучших практик, применяющихся в разработке RAG-систем.
- Построила базовый пайплайн RAG-системы с помощью фреймворков Langchain, Ollama и LLM серии Qwen3.
- Реализовала API-сервис для работы с базовым RAG-пайплайном с помощью фреймворка FastAPI.
- Изучила и реализовала деление на чанки и векторизацию как этапы препроцессинга данных в RAG-системе.
- Изучила и реализовала сохранение векторных данных в базу, поиск по базе и извлечение наиболее подходящих результатов поиска с помощью векторной базы данных Qdrant.
- Развернула в изолированном локальном контуре систему, включающую API-сервис, Ollama и базу данных Qdrant.
- Организация работы команды.
- Проводила код-ревью коллег.
Стек специалиста на проекте
langchain, transformers, Lens, Postman, llm, GitHub, FastAPI, Jupyter, Qdrant, SmartGit, Workflow, Poetry, Docker Compose, Dev, Docker, Python, Clang, containerD, Framework, ruff, Kubernetes, deepseek, ollama, qwen3
Отрасль проекта
HRTech
Период работы
Май 2025 - По настоящее время
(3 месяца)
R&D по системам автоматического распознавания речи (ASR)
Роль
ML-инженер / Team Lead
Обязанности
Исследования в рамках разработки системы перевода речи в текст для автоматического обнаружения ошибок автоматического обнаружения ошибок и определения уровня соответствия переговоров внутреннему регламенту.
Результаты работы:
- Провела сравнение различных подходов к автоматическому распознаванию речи.
- Проанализировала существующие способы оценки качества ASR и на их основе разработала концепцию смешанной метрики.
- Исследовала существующие модели ASR.
- Изучала методы распознавания именованных сущностей и их применение в задачах ASR.
- Разработала пайплайн распознавания шаблонов в тексте в соответствии с заданными протоколами.
- Провела сравнительный анализ различных способов улучшения качества звука, включая работу с частотами, алгоритмические подходы и модели глубокого обучения.
- Проводила дообучение модели Whisper c помощью адаптера LoRA с целью повышения качества работы модели на данных, специфичных предметной области: на существующих аудиоданных с применением ресемплирования, а также на искусственно сгенерированном датасете с помощью моделей перевода текста в речь.
- Организация работы команды.
- Проводила код-ревью коллег.
Стек специалиста на проекте
Python, GitHub, Numpy, PyTorch, Jupyter, Fork, Python2, Whisper, transformers, Нейронные сети, SpaCy, vosk, сверточные, рекурентные
Отрасль проекта
Logistics & Transport
Период работы
Февраль 2025 - Май 2025
(4 месяца)
Авто
Роль
Data scientist
Обязанности
Бизнес-аналитика процессов в компании, занимающейся покупкой и продажей автомобилей. Добавление алгоритмов, совершенствующих бизнес-процесс.
Обязанности:
- Работа с базами данных, анализ данных и построение отчетов,
отвечающих на бизнес-запросы.
- Реализация алгоритма классификации ТС по габаритным параметрам.
- Реализация алгоритма по определению цены ТС по его характеристикам
и комплектациям.
Стек специалиста на проекте
Git, Docker, Python, Cypress, Pandas, Numpy, Matplotlib, Seaborn, Sklearn, JupyterLab
Отрасль проекта
E-commerce & Retail
Период работы
Декабрь 2023 - Октябрь 2024
(11 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Готов
Релокация
Не готов
Готов работать на зарубежных проектах
Да
Дипломы и сертификаты
Samsung Нейронные сети и компьютерное зрение 2019 г.
Samsung Нейронные сети и обработка текста 2019 г.
HTML Academy. HTML и CSS. Профессиональная вёрстка сайтов 2023 г.
Образование
Высшее
Учебное заведение
Южно-Уральский государственный университет
Специальность
Программная инженерия, бакалавр
Завершение учебы
2022 г.
Высшее
Учебное заведение
Южно-Уральский государственный университет
Специальность
Программная инженерия (искусственный интеллект и инженерия данных), магистр
Завершение учебы
2024 г.