Игорь Р. Data Scientist, Middle

ID 10020
ИР
Игорь Р.
Мужчина, 23 года
Россия, Москва, UTC+3
Ставка
3 339,64 Р/час
вкл. НДС 5% (123.81 Р)
Специалист доступен с 13 января 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle
Навыки
Python
Clickhouse
SQL
Docker
Matplotlib
Seaborn
Plotly
Pandas
Numpy
Sklearn
CatBoost
PyTorch
Tensorflow
Machine learning
Avro
GitLab
GreenPlum
Big Data
Data Science
Docker Compose
HuggingFace
MVC
MySQL
NLP
OpenCV
PostgreSQL
Английский язык
Математическая статистика
Обучение
ООП
REST API
Нереляционные БД (NoSQL)
Отрасли
E-commerce & Retail
Знание языков
Английский — B2
Главное о специалисте
Уверенный Data Scientist, Ml Engineer (Опыт в CV, NLP) Фуллстек разработка (Java Spring\Python Flask, React, MySQL) Навыки использования HuggingFace и PapersWithCode
Проекты   (2 года 1 месяц)
Data scientist
Роль
Data scientist
Обязанности
- Сбор и подготовка данных - Исследование и определение подходов решения задачи (Алгоритм, ML-модель или NN-модель) - Реализация и валидация моделей - Сравнение качеств моделей - Контейнеризация и настройка пайплайнов - Построение ad-hoc отчётов - Аналитика данных - Полностью автоматизированный процесс извлечения интересующей информации из рекламы используя CV и NLP (достоверная информация о 88% хранящейся рекламы) - Уменьшение использования занимаемого места в хранилище данных путём устранения дубликатов изображений используя CV-модель (сокращение объёма хранения до 76%)
Стек специалиста на проекте
Avro, GitLab, Tensorflow, Clickhouse, Numpy, Pandas, Seaborn, PyTorch, Sklearn, CatBoost, Plotly, Docker, SQL, Matplotlib, GreenPlum
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2023 - По настоящее время  (1 год 10 месяцев)
Data scientist NLP
Роль
Стажер
Обязанности
- Кластеризация запросов пользователей: Разработка и внедрение алгоритма для кластеризации пользовательских запросов в чат-бота, используя TF-IDF и NLP для улучшения качества и скорости обслуживания. Результат: Автоматизация ответов на вопросы пользователей, снижение нагрузки службы поддержки на 40% и сокращение среднего времени пользовательского ожидания ответа в 3 раза. - Multi-label классификация для организации документов: Разработка системы для автоматического тегирования и классификации внутренних документов, применяя комбинацию TF-IDF, ансамблевых методов и трансформеров в PyTorch. Результат: Улучшение поиска документов по тегам, что обеспечило быстрый и удобный доступ к необходимой информации для сотрудников. Опыт работы с данными: - Использование инструментов Hadoop и Pyspark для обработки больших объемов данных, включая оптимизацию запросов и повышение производительности системы. - Разработка асинхронных функций и мультипоточности (multiprocessing) для оптимизации предобработки данных, что сократило время обработки данных до 70%. - Создание кастомных классов, методов и функций для повышения эффективности обработки данных и обучения моделей, включая разработку уникальных алгоритмов для непрерывного обучения, что увеличило скорость обучения и тестирования моделей до 60%.
Стек специалиста на проекте
OpenCV, Обучение, Tensorflow, MVC, Математическая статистика, PyTorch, Sklearn, Big Data, HuggingFace, CatBoost, NLP, Data Science, Docker Compose, Docker, SQL, Python, Английский язык, Matplotlib, MySQL, Нереляционные БД (NoSQL), REST API, Machine learning, PostgreSQL, ООП
Отрасль проекта
E-commerce & Retail
Период работы
Январь 2023 - Апрель 2023  (4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
МИРЭА
Специальность
Программная инженерия
Завершение учебы
2022 г.

Похожие специалисты

E-commerce & Retail • FinTech & Banking • LifeStyle • Urban technology
КК
Кирилл К.
Екатеринбург
Data Scientist
Middle+
5 620,13 Р/час
Docker
Flow.js
Linux
Machine learning
MLops
Numpy
NVidia
OpenCV
Pandas
Python
+38

Кирилл — опытный специалист в области Data Science с грейдом Middle+. Он обладает широким спектром навыков, включая работу с Docker, Flow.js, Linux, ML, MLOps, Numpy, NVidia, OpenCV, Pandas, Python, PyTorch, Scikit-learn, Spark, SQL, Tensor, Tensorflow и другими инструментами. Кирилл имеет опыт работы на проектах в различных отраслях, таких как лайфстайл, электронная коммерция и ритейл, финтех и банкинг, а также городские технологии. Он принимал участие в разработке проектов для прогнозирования продаж товаров на маркетплейсах, создания приложения ассортимента компании, распознавания документов и других задач. На последнем месте работы Кирилл курировал реализацию крупных инвестиционных проектов по автоматизации энергетических объектов.

Подробнее
AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее

Недавно просмотренные специалисты

FinTech & Banking • GameDev • Government & Public Sector • Manufacturing • Realty & Constructoring
ЕК
Евгений К.
Минск
Бизнес аналитик
Senior
3 896,1 Р/час
C#
Управление командой
Tuskr
кд
Обучение сотрудников
UI
lsa
t4
store /
C4
+142

Евгений — опытный бизнес-аналитик с 5-летним опытом работы в различных проектах. Он обладает навыками создания структуры, работы с требованиями, анализа и управления ими, а также разработки технических решений. Евгений умеет работать с инструментами UML, BPMN, SQL, PostgreSQL, Miro, Visio, Jira, Confluence и другими. В портфолио Евгения — проекты в сферах недвижимости, финансовых услуг, игр, производства, государственного сектора. Он работал над проектами NFT-недвижимости, перевыпуска платёжных карт, мобильного приложения для юридических лиц, крупного продукта в сфере азартных игр и беттинга, EDI-провайдера, MES-системы, аппаратно-программных средств для систем управления войсками и оружием. Евгений успешно выполнял задачи по выявлению и описанию требований, созданию структуры технической документации, описанию пользовательских историй, логики работы REST API, тестированию API, описанию логики работы на backend/frontend, управлению командой разработки, формированию бэклога по продукту, доработке приоритетных функций от бизнеса, описанию процессов команды разработки. О себе от первого лица: • Успешное проектирование/внедрение пилотного проекта по проектированию электрических схем (срок 3 недели), договор подряда (30+ элементов на схеме+ настройка согласно требованиям заказчика). • Успешный менторинг 2yx junior бизнес-аналитиков, совместная проработка заданий, подготовка к собеседованиям, индивидуальный план развития (ВА). • Посещение/активное участие в online/offline (Минск) конференциях (5-6 в год): IT Entrance 2022, Start IT 2022, DesignIN 2022, Barrs 2021 др. • Просмотр/анализ/активное участие IT-вибинаров (10-15 в год) • Чтение/анализ 7-8 книг в год по профессии, в том числе "От монолита к микросервисам" Сэм Ньюман, "Шаблоны интеграции корп. приложений" Хоп/Вульф, "Ошибки и компромиссы (software)" Лелек/Скит. • Уже больше года изучаю английский 2 раза в неделю на занятиях и 2-3 в неделю в свободное время.

Подробнее
Cloud Services • FinTech & Banking • FoodTech • Logistics & Transport
ЯГ
Яков Г.
Ростов-на-Дону
Инженер БД
Middle+
3 376,62 Р/час
Apache Superset
1С 8
ssas
qlick view
DAX
REST
API
JSON
Git
+30

T-SQL: запросы, транзакции, аналитический SQL(CUBE, ROLLUP), представления, функции, хранимые процедуры, курсор, общее табличные выражения, рекурсия, индексы, секционирование, Jobs, Linked Servers. Способность быстро разбираться в чужом коде,создавать адекватный документированный T-SQL код. Есть опыт работы с большим объёмом данных( чуть более 1 миллиарда записей). Есть опыт работы в команде и использования средств коллективной работы (Microsoft Visual SourceSafe) XML: XPath Reporting Services(SSRS): простые отчеты, отчеты с параметрами, связанные отчеты, настройка автоматической рассылки отчетов, настройка безопасности. Integration Services(SSIS): Data Flow Task, Execute SQL Task, File System Task, Script Task. Analytics services(SSAS): разработка кубов, MDX. Microsoft Visual Studio 2005/2008/2012: Создание Report Server Project, Integration Services Project, Analysis Services Project. Знания и навыки по парсингу метаданных 1С для дальнейшего построения хранилища и моделей данных Apache Airflow: настройка ETL между msSql и Portgres Apache Superse: настройка источников, чартов, дашбордов и безопасности. Есть опыт написания кода на: с, javascript, 1C, PowerShell Microsoft Excel 2007/2010/2013: фильтры, сводные таблицы, впр, макросы(vba) Microsoft Visio 2010 Знание методологии описания бизнес-процессов IDEF0 PowerBI: DAX QlikView 11: QVD-файлы, проектировка и создание модели данных приложения, скрипты загрузки, синтетические ключи, Set-анализ, функции, лицензирование, разграничение прав. SAS RTDM: Создание кампаний(диаграмм), определение синхронного/ псевдо - синхронного режима вызова диаграмм. SAS base: Шаг Date, Шаг Proc, операторы, Libraries, program data vector (PDV), создание переменных/ подмножеств наблюдений, объединение/ слияние наборов данных, форматы/ ярлыки, внешний вывод, FREQ, MEANS, TABULATE. SAS Data Integration Studio: использование инструмента для написания Jobs. Знание принципов методологии ITIL

Подробнее