ВБ
Владимир Б.
Мужчина, 30 лет
Россия, Саратов, UTC+4
Ставка
4 025,97 Р/час
НДС не облагается
Специалист доступен с 12 июля 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Senior
Навыки
AI
C#
Framework
JavaScript
Keras
Matplotlib
Numpy
ONNX
OpenVINO
paddleocr
Pandas
Python
PyTorch
Selenium
Sklearn
Tensorflow
TensorRT
YOLO
библиотеки
Отрасли
E-commerce & Retail
EdTech
FinTech & Banking
IoT
LifeStyle
Manufacturing
Social Networking
Главное о специалисте
Опытный специалист по машинному обучению (ML) с углубленной специализацией в области компьютерного зрения (CV) и обработки естественного языка (NLP), а также многолетним опытом работы в качестве Full Stack разработчика. Умение создавать прототипы, управлять проектами и командами. Активное участие в сообществе Data Science и постоянно исследую новые подходы.
Проекты   (8 лет 2 месяца)
Fringe
Роль
Senior Data Scientist / ML Architect
Обязанности
Разработка продуктов с использованием OCR и scrapping с моим участием в качества архитектора/главы отдела разработки: Банк из топ 2 Росcии: - Разработка и обучение модели OCR для задачи извлечения ключевых данных в невыделяемых PDF презентациях на основе multi-modal LLM. Достигнута точность 98% по метрике f1 по извлеченным показателям (числовые данные). - Реализован ETL пайплайн для скраппинга 20+ сайтов платформ, включающий извлечение ключевых данных из HTML на основе LLM и извлечение парамеров из неструктурированных данных на основе OCR. Построение DWH для хранения результатов. 24AI: Разработка инфографики и использованием OCR для создания шаблонов на основе изображения инфографики. Использовались модели text-detection в связки с multi-modal LLM для извлечения текста с изображением, его размера, шрифта и местоположения. Юридическое агенство из топ3: Оцифровка сканов документов и нередактируемых PDF с последующим NER и vector search по текстам документов и описаниям изображений. Достигнута целевая метрика AP@5 в 95% на более чем 700 тысяч документов. LightShelf: Разработка модели OCR для классификации товаров на полках магазинов. Реализована модель OCR для извлечения текста на товаре по bbox модели детекции. Добавление извлеченной текстовой информации в строковом и векторном виде позволила увеличить точность модели классификации товаров на 27% относительно модели без OCR на 8тысяч классов. Moduse: Разработка пайплайна парсинга для сбора данных с 30 маркетплейсов одежды (более 2млн страниц товаров). Разработка CV модели аттрибуции товаров на 20+ классов на основе обученной contrastive-learning-based модели. Построенный пайплайн включает в себя набор микросервисов для scrapping с использованием proxy, data lake для хранения HTML, ETL процесс процессинга HTML и инференса DL модели на изображениях и текстах для классификации и векторизации. Обязанности: • Выявление бизнес проблемы и декомпозиция требований; • Разработка описания архитектуры разрабатываемой системы; • Контроль и организации работы команды, реализация функционала, который не могут сделать другие • Определение технического стека и оценка задач. Состав команды: 6 data scientist, 1 devops, 1 backend, 1 qa, teamlead, project manager, business assistant
Стек специалиста на проекте
C++, Python, Kubernetes, AWS, Pandas, DWH, Apache AirFlow, MLflow, PySpark, Dagster, DBT, ray, ocr
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2022 - По настоящее время  (3 года 4 месяца)
Aliexpress
Роль
Senior Data Scientist
Обязанности
Задача заключалась в самостоятельной разработке системы атрибуции продуктов, включая выявление атрибутов с наименьшим охватом корректных значений и создание масштабируемой системы, позволяющей использовать zero-shot и few-shot обучение для всех атрибутов. Обязанности: ● Анализ исходных данных для формирования и приоритизации задач ● Проведение экспериментов с различными моделями, оценка их применимости и выбор оптимальной ● Обучение и валидация моделей ● Интеграция в производственные конвейеры
Достижения
● Достигнуто увеличение охвата целевых атрибутов на 60% (включая цвет) ● Реализована модель, позволяющая повышать охват для низкоприоритетных атрибутов без дополнительного обучения ● Созданная модель интегрирована в конвейер и показала эффективность в A/B-тестах
Стек специалиста на проекте
Hive, PyTorch, Apache AirFlow, MLflow, PySpark, Trino
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2022 - Июнь 2023  (1 год 3 месяца)
ESN
Роль
Senior Data Scientist
Обязанности
Основные продукты, разрабатываемые ESN — социальные сети «chipz» и «punch», основанные на пользовательском контенте, с большим количеством фильтров и генеративных сетей, при этом модели должны работать непосредственно на мобильных устройствах. Моя задача заключалась в оптимизации моделей, созданных другими командами, для обеспечения их работы в реальном времени на телефоне. Обязанности: ● Выбор технологического стека для оптимизации моделей ● Построение конвейера для квантования, дистилляции и конвертации моделей в форматы CoreML и TFlite ● Создание тестов и адаптация конвейера для новых моделей
Достижения
● Реализовал конвейеры на базе mediapipe для запуска моделей на iOS и Android ● Конвертировал модели, которые, по публичной информации, ещё «невозможно» было конвертировать ● Все разработанные модели достигли скорости 30-60 fps на устройстве в реальном времени
Стек специалиста на проекте
C++, Python, ONNX, ray, mediapipe, mnn, Trino
Отрасль проекта
Social Networking
Период работы
Февраль 2022 - Февраль 2023  (1 год 1 месяц)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Саратовский государственный университет
Специальность
Обработка изображений и сигналов
Завершение учебы
2023 г.
Высшее
Учебное заведение
Саратовский государственный университет
Специальность
Прикладная математика и информатика
Завершение учебы
2018 г.
Высшее
Учебное заведение
Саратовский государственный университет
Специальность
Математика и информатика
Завершение учебы
2016 г.

Похожие специалисты

AI & Robotics • HRTech
ЕЛ
Егор Л.
Нижний Новгород
Data Scientist
Middle+
4 545,45 Р/час
API
Bubble
Deep Learning
Flask
gpt
Keras
LowCode
OpenCV
Python
PyTorch
+124

Я специалист в области науки о данных, с аналитическим складом ума и глубокими знаниями математике статистике. Имею опыт работы смежных сферах IT, что обеспечивает мне широкую перспективу понимание технологических процессов компании. Знаком компьютерным зрением обработкой естественного языка на теоретическом уровне, имею реализации академических проектов этих областях. В своём профессиональном пути, начав с автоматизации процессов помощью RPA, я постепенно приближался к науке о данных, увлекаясь её мощным потенциалом в преобразовании данных ценные знания и решения. Этот интерес ведёт меня желанию глубже изучить развиться этой области. Убеждён, что наука открывает новые горизонты для инноваций эффективности любой сфере, стремлюсь стать частью этого процесса, внося свой вклад создание передовых решений. Я готов приложить все усилия достижения профессионального мастерства, сопровождаемого постоянным обучением совершенствованием

Подробнее
AI & Robotics • BioTech, Pharma, Health care & Sports • Information Security • Telecom • VR/AR
ВК
Владимир К.
Москва
Data Scientist
Senior
4 624,11 Р/час
C
C#
C++
Java
Julia
Microsoft
Python
SQL
Zerolog
+72

Языки программирования Python, C, C++, Java, JS, Julia, SQL, C#, Prolog Фреймворки, библиотеки TensorFlow 1/2, PyTorch, Pandas, Numpy, Sklearn, Spacy, Matplotlib/Seaborn, MATLAB, NLTK, RASA, OpenCV, CUDA, boto3, данные ГИС ML-экспертиза Обработка естественного языка: - NER, QA, Chatbots, Intents Matching, Text Classification, Sentiment Analysis, Emotion Detection, Text Abstraction, Text Generation, Clustering, Language Translation - Трансформаторы, BERT, RoBERTa, all-mpnet-base-v2, GPT-3, HDBSCAN, UMAP, RNNs, LSTMs, GRUs, LDA, Gaussians, LSH, K-means Компьютерное зрение - Классификация изображений, обнаружение объектов, сегментация изображений, распознавание таблиц, распознавание структуры таблиц, OCR, распознавание лиц, 3D реконструкция лиц, создание подписей к изображениям - Визуальные трансформаторы, DETR, TableFormer, ConvNets, YOLO3/4, YOLOX, Mask R-CNNs, Fast R-CNNs, Faster R-CNNs, ResNets, VGG, GANs Классические и другие ОД: - Анализ временных рядов, скоринговые модели, регрессии, предикторы, линейная регрессия, логистическая регрессия, SVM, деревья решений, градиентный бустинг (XGBoost, CatBoost), ансамбли, байесовцы, уменьшение размерности, PCA, PCE, t-SNE Контролируемое, полу контролируемое, неконтролируемое обучение и обучение с подкреплением Базы данных Postgres, DynamoDB, NEO4J, JanusGraph, SQLAlchemy Облачные сервисы AWS (SQS, SNS, SageMaker, Lambdas, EC2, S3, Textract, VPC, CloudTrail и т.д.), GСloud Разработка программного обеспечения Git, Docker, Podman, Linux, Bash, Ansible, Sentry, GitLab CI/CD, Conda, Jupyter, VS Code, Pycharm Другие инструменты/навыки Отлично

Подробнее
AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • FinTech & Banking • Urban technology
ЕЛ
Евгений Л.
Брест
IOS разработчик
Middle
4 110,32 Р/час
build
multithreading
sandbox
provisioning portal
itunes
CoreData
UI
continuous
coreanimation
AppleMaps
+103

Опытный iOS-разработчик с более чем 4 годами коммерческой разработки мобильных приложений для банковской сферы, картографии и бизнес-решений. Специализируется на создании адаптивных и интуитивно понятных интерфейсов, используя современные технологии, такие как Swift, UIKit, SwiftUI, RxSwift и Combine. Имеет глубокие знания в архитектурах MVC, MVVM, VIPER и Clean Swift, а также опыт работы с базами данных (Realm, CoreData) и сетевыми запросами (REST, JSON). Успешно реализовал сложные модули, включая платежные системы, онбординг, интеграцию ApplePay и работу с push-уведомлениями. Постоянно совершенствует навыки, уделяя внимание качеству кода, тестированию (Unit, UI, Snapshot) и оптимизации производительности приложений.

Подробнее
E-commerce & Retail • EdTech
ДМ
Дмитрий М.
Киров
QA ручной
Senior
1 457,14 Р/час
Регрессионное тестирование
Zephyr Scale
Grafana
hasura
GraphQL
Postman
DevTools
Git
API
Swagger
+26

QA-инженер с 3+ годами опыта в EdTech, B2B и e-commerce. Обеспечиваю качество на всех этапах SDLC, внедряю процессы, ускоряю релизы. Двигаюсь в сторону автоматизации. • Выстроил процессы обеспечения качества с нуля в 3 проектах • Внедрил подходы для обнаружения багов на более ранних этапах и ускорения работы • Создал регрессионные модели + базы знаний • Менторил участников команды, замещал Scrum Master Инструменты: DB: SQL, GraphQL(Hasura), DataGrip API и отладка: Postman, Swagger, Charles, DevTools CI/CD: GitLab, Docker, Jenkins, BitBucket Test Management: Jira, TestIT, ZephyrScale, Qase Логирование: Sentry, Grafana, Bugsnag Data Representation Formats: JSON, XML UI/UX и совместимость: BrowserStack, Strotybook, Figma, a11y-инструменты Интеграция и масштабируемость: Apache Kafka AI-инструменты для автоматизации задач Linux

Подробнее