Оставьте заявку, мы подберем для вас подходящего специалиста за 48 часов!
Премия рунета

Игорь Р. Data Scientist, Middle

ID 10020
ИР
Игорь Р.
Мужчина, 22 года
Россия, Москва, UTC+3
Ставка
3,250 Р/час
НДС не облагается
Специалист доступен с 27 февраля 2024 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle
Навыки
Python
Clickhouse
SQL
Docker
Matplotlib
Seaborn
Plotly
Pandas
Numpy
Sklearn
CatBoost
PyTorch
Tensorflow
Machine learning
Avro
GitLab
GreenPlum
Big Data
Data Science
docker-compose
HuggingFace
MVC
MySQL
NLP
NoSQL
OpenCV
PostgreSQL
rest api
Английский язык
Математическая статистика
Обучение
ООП
Отрасли
E-commerce & Retail
Знание языков
Английский — B2
Главное о специалисте
Уверенный Data Scientist, Ml Engineer (Опыт в CV, NLP) Фуллстек разработка (Java Spring\Python Flask, React, MySQL) Навыки использования HuggingFace и PapersWithCode
Проекты   (1 год 2 месяца)
Data scientist
Роль
Data scientist
Обязанности
- Сбор и подготовка данных - Исследование и определение подходов решения задачи (Алгоритм, ML-модель или NN-модель) - Реализация и валидация моделей - Сравнение качеств моделей - Контейнеризация и настройка пайплайнов - Построение ad-hoc отчётов - Аналитика данных - Полностью автоматизированный процесс извлечения интересующей информации из рекламы используя CV и NLP (достоверная информация о 88% хранящейся рекламы) - Уменьшение использования занимаемого места в хранилище данных путём устранения дубликатов изображений используя CV-модель (сокращение объёма хранения до 76%)
Стек специалиста на проекте
Avro, Tensorflow, Clickhouse, Numpy, Pandas, GitLab, Seaborn, PyTorch, Sklearn, CatBoost, Plotly, Docker, SQL, Matplotlib, GreenPlum
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2023 - По настоящее время  (11 месяцев)
Data scientist NLP
Роль
Стажер
Обязанности
- Кластеризация запросов пользователей: Разработка и внедрение алгоритма для кластеризации пользовательских запросов в чат-бота, используя TF-IDF и NLP для улучшения качества и скорости обслуживания. Результат: Автоматизация ответов на вопросы пользователей, снижение нагрузки службы поддержки на 40% и сокращение среднего времени пользовательского ожидания ответа в 3 раза. - Multi-label классификация для организации документов: Разработка системы для автоматического тегирования и классификации внутренних документов, применяя комбинацию TF-IDF, ансамблевых методов и трансформеров в PyTorch. Результат: Улучшение поиска документов по тегам, что обеспечило быстрый и удобный доступ к необходимой информации для сотрудников. Опыт работы с данными: - Использование инструментов Hadoop и Pyspark для обработки больших объемов данных, включая оптимизацию запросов и повышение производительности системы. - Разработка асинхронных функций и мультипоточности (multiprocessing) для оптимизации предобработки данных, что сократило время обработки данных до 70%. - Создание кастомных классов, методов и функций для повышения эффективности обработки данных и обучения моделей, включая разработку уникальных алгоритмов для непрерывного обучения, что увеличило скорость обучения и тестирования моделей до 60%.
Стек специалиста на проекте
docker-compose, OpenCV, rest api, Обучение, Tensorflow, ООП, MVC, Machine learning, Математическая статистика, PyTorch, Sklearn, Big Data, HuggingFace, CatBoost, NLP, Data Science, Docker, SQL, Python, Английский язык, Matplotlib, MySQL, NoSQL, PostgreSQL
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2023 - Апрель 2023  (4 месяца)
Формат работы
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
МИРЭА
Специальность
Программная инженерия
Завершение учебы
2022 г.

Похожие специалисты

Недавно просмотренные специалисты