ИР
Игорь Р.
Мужчина, 23 года
Россия, Москва, UTC+3
Ставка
3 339,64 Р/час
вкл. НДС 5% (123.81 Р)
Специалист доступен с 13 января 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Уверенный Data Scientist, Ml Engineer (Опыт в CV, NLP)
Фуллстек разработка (Java Spring\Python Flask, React, MySQL)
Навыки использования HuggingFace и PapersWithCode
Проекты
(2 года 1 месяц)
Data scientist
Роль
Data scientist
Обязанности
- Сбор и подготовка данных
- Исследование и определение подходов решения задачи (Алгоритм, ML-модель или NN-модель)
- Реализация и валидация моделей
- Сравнение качеств моделей
- Контейнеризация и настройка пайплайнов
- Построение ad-hoc отчётов
- Аналитика данных
- Полностью автоматизированный процесс извлечения интересующей информации из рекламы используя CV и NLP
(достоверная информация о 88% хранящейся рекламы)
- Уменьшение использования занимаемого места в хранилище данных путём устранения дубликатов изображений используя
CV-модель (сокращение объёма хранения до 76%)
Стек специалиста на проекте
Avro, GitLab, Tensorflow, Clickhouse, Numpy, Pandas, Seaborn, PyTorch, Sklearn, CatBoost, Plotly, Docker, SQL, Matplotlib, GreenPlum
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2023 - По настоящее время
(1 год 10 месяцев)
Data scientist NLP
Роль
Стажер
Обязанности
- Кластеризация запросов пользователей: Разработка и внедрение алгоритма для кластеризации пользовательских запросов в
чат-бота, используя TF-IDF и NLP для улучшения качества и скорости обслуживания. Результат: Автоматизация ответов на
вопросы пользователей, снижение нагрузки службы поддержки на 40% и сокращение среднего времени пользовательского
ожидания ответа в 3 раза.
- Multi-label классификация для организации документов: Разработка системы для автоматического тегирования и
классификации внутренних документов, применяя комбинацию TF-IDF, ансамблевых методов и трансформеров в PyTorch.
Результат: Улучшение поиска документов по тегам, что обеспечило быстрый и удобный доступ к необходимой информации
для сотрудников.
Опыт работы с данными:
- Использование инструментов Hadoop и Pyspark для обработки больших объемов данных, включая оптимизацию запросов и
повышение производительности системы.
- Разработка асинхронных функций и мультипоточности (multiprocessing) для оптимизации предобработки данных, что
сократило время обработки данных до 70%.
- Создание кастомных классов, методов и функций для повышения эффективности обработки данных и обучения моделей,
включая разработку уникальных алгоритмов для непрерывного обучения, что увеличило скорость обучения и тестирования
моделей до 60%.
Стек специалиста на проекте
OpenCV, Обучение, Tensorflow, MVC, Математическая статистика, PyTorch, Sklearn, Big Data, HuggingFace, CatBoost, NLP, Data Science, Docker Compose, Docker, SQL, Python, Английский язык, Matplotlib, MySQL, Нереляционные БД (NoSQL), REST API, Machine learning, PostgreSQL, ООП
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2023 - Апрель 2023
(4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
МИРЭА
Специальность
Программная инженерия
Завершение учебы
2022 г.