Оставьте заявку, мы подберем для вас подходящего специалиста за 48 часов!
Премия рунета

Игорь Р. Data Scientist, Middle

ID 10020
ИР
Игорь Р.
Мужчина, 22 года
Россия, Москва, UTC+3
Ставка
3 250 Р/час
НДС не облагается
Специалист доступен с 27 июля 2024 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle
Навыки
Python
Clickhouse
SQL
Docker
Matplotlib
Seaborn
Plotly
Pandas
Numpy
Sklearn
CatBoost
PyTorch
Tensorflow
Machine learning
Avro
GitLab
GreenPlum
Big Data
Data Science
Docker Compose
HuggingFace
MVC
MySQL
NLP
NoSQL
OpenCV
PostgreSQL
Английский язык
Математическая статистика
Обучение
ООП
REST API
Отрасли
E-commerce & Retail
Знание языков
Английский — B2
Главное о специалисте
Уверенный Data Scientist, Ml Engineer (Опыт в CV, NLP) Фуллстек разработка (Java Spring\Python Flask, React, MySQL) Навыки использования HuggingFace и PapersWithCode
Проекты   (1 год 7 месяцев)
Data scientist
Роль
Data scientist
Обязанности
- Сбор и подготовка данных - Исследование и определение подходов решения задачи (Алгоритм, ML-модель или NN-модель) - Реализация и валидация моделей - Сравнение качеств моделей - Контейнеризация и настройка пайплайнов - Построение ad-hoc отчётов - Аналитика данных - Полностью автоматизированный процесс извлечения интересующей информации из рекламы используя CV и NLP (достоверная информация о 88% хранящейся рекламы) - Уменьшение использования занимаемого места в хранилище данных путём устранения дубликатов изображений используя CV-модель (сокращение объёма хранения до 76%)
Стек специалиста на проекте
Docker, SQL, GitLab, Tensorflow, Avro, Clickhouse, Pandas, Numpy, Matplotlib, GreenPlum, Seaborn, PyTorch, Sklearn, CatBoost, Plotly
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2023 - По настоящее время  (1 год 4 месяца)
Data scientist NLP
Роль
Стажер
Обязанности
- Кластеризация запросов пользователей: Разработка и внедрение алгоритма для кластеризации пользовательских запросов в чат-бота, используя TF-IDF и NLP для улучшения качества и скорости обслуживания. Результат: Автоматизация ответов на вопросы пользователей, снижение нагрузки службы поддержки на 40% и сокращение среднего времени пользовательского ожидания ответа в 3 раза. - Multi-label классификация для организации документов: Разработка системы для автоматического тегирования и классификации внутренних документов, применяя комбинацию TF-IDF, ансамблевых методов и трансформеров в PyTorch. Результат: Улучшение поиска документов по тегам, что обеспечило быстрый и удобный доступ к необходимой информации для сотрудников. Опыт работы с данными: - Использование инструментов Hadoop и Pyspark для обработки больших объемов данных, включая оптимизацию запросов и повышение производительности системы. - Разработка асинхронных функций и мультипоточности (multiprocessing) для оптимизации предобработки данных, что сократило время обработки данных до 70%. - Создание кастомных классов, методов и функций для повышения эффективности обработки данных и обучения моделей, включая разработку уникальных алгоритмов для непрерывного обучения, что увеличило скорость обучения и тестирования моделей до 60%.
Стек специалиста на проекте
PostgreSQL, MySQL, Docker, SQL, Python, Английский язык, REST API, MVC, Machine learning, NoSQL, Tensorflow, Matplotlib, PyTorch, Sklearn, Математическая статистика, Big Data, NLP, Data Science, Docker Compose, ООП, CatBoost, OpenCV, Обучение, HuggingFace
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2023 - Апрель 2023  (4 месяца)
Формат работы
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
МИРЭА
Специальность
Программная инженерия
Завершение учебы
2022 г.

Похожие специалисты

AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 250 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+66

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее
FinTech & Banking • IoT • Manufacturing
АЛ
Артем Л.
Минск
Data Scientist
Senior
6 250 Р/час
A/B testing
Agile
Anaconda
API
Bash
Bitbucket
CatBoost
CI/CD
Circle CI
Docker
+77

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее

Недавно просмотренные специалисты