ВБ
Владимир Б.
Мужчина, 31 год
Россия, Саратов, UTC+4
Ставка
4 025,97 Р/час
НДС не облагается
Специалист доступен с 12 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Senior
Навыки
AI
C#
Framework
JavaScript
Keras
Matplotlib
Numpy
ONNX
OpenVINO
paddleocr
Pandas
Python
PyTorch
Selenium
Sklearn
Tensorflow
TensorRT
YOLO
библиотеки
Отрасли
E-commerce & Retail
EdTech
FinTech & Banking
IoT
LifeStyle
Manufacturing
Social Networking
Главное о специалисте
Опытный специалист по машинному обучению (ML) с углубленной специализацией в области компьютерного зрения (CV) и обработки естественного языка (NLP), а также многолетним опытом работы в качестве Full Stack разработчика. Умение создавать прототипы, управлять проектами и командами. Активное участие в сообществе Data Science и постоянно исследую новые подходы.
Проекты   (8 лет 5 месяцев)
Fringe
Роль
Senior Data Scientist / ML Architect
Обязанности
Разработка продуктов с использованием OCR и scrapping с моим участием в качества архитектора/главы отдела разработки: Банк из топ 2 Росcии: - Разработка и обучение модели OCR для задачи извлечения ключевых данных в невыделяемых PDF презентациях на основе multi-modal LLM. Достигнута точность 98% по метрике f1 по извлеченным показателям (числовые данные). - Реализован ETL пайплайн для скраппинга 20+ сайтов платформ, включающий извлечение ключевых данных из HTML на основе LLM и извлечение парамеров из неструктурированных данных на основе OCR. Построение DWH для хранения результатов. 24AI: Разработка инфографики и использованием OCR для создания шаблонов на основе изображения инфографики. Использовались модели text-detection в связки с multi-modal LLM для извлечения текста с изображением, его размера, шрифта и местоположения. Юридическое агенство из топ3: Оцифровка сканов документов и нередактируемых PDF с последующим NER и vector search по текстам документов и описаниям изображений. Достигнута целевая метрика AP@5 в 95% на более чем 700 тысяч документов. LightShelf: Разработка модели OCR для классификации товаров на полках магазинов. Реализована модель OCR для извлечения текста на товаре по bbox модели детекции. Добавление извлеченной текстовой информации в строковом и векторном виде позволила увеличить точность модели классификации товаров на 27% относительно модели без OCR на 8тысяч классов. Moduse: Разработка пайплайна парсинга для сбора данных с 30 маркетплейсов одежды (более 2млн страниц товаров). Разработка CV модели аттрибуции товаров на 20+ классов на основе обученной contrastive-learning-based модели. Построенный пайплайн включает в себя набор микросервисов для scrapping с использованием proxy, data lake для хранения HTML, ETL процесс процессинга HTML и инференса DL модели на изображениях и текстах для классификации и векторизации. Обязанности: • Выявление бизнес проблемы и декомпозиция требований; • Разработка описания архитектуры разрабатываемой системы; • Контроль и организации работы команды, реализация функционала, который не могут сделать другие • Определение технического стека и оценка задач. Состав команды: 6 data scientist, 1 devops, 1 backend, 1 qa, teamlead, project manager, business assistant
Стек специалиста на проекте
C++, Python, Kubernetes, AWS, Pandas, DWH, Apache AirFlow, MLflow, PySpark, Dagster, DBT, ray, ocr
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2022 - По настоящее время  (3 года 7 месяцев)
Aliexpress
Роль
Senior Data Scientist
Обязанности
Задача заключалась в самостоятельной разработке системы атрибуции продуктов, включая выявление атрибутов с наименьшим охватом корректных значений и создание масштабируемой системы, позволяющей использовать zero-shot и few-shot обучение для всех атрибутов. Обязанности: ● Анализ исходных данных для формирования и приоритизации задач ● Проведение экспериментов с различными моделями, оценка их применимости и выбор оптимальной ● Обучение и валидация моделей ● Интеграция в производственные конвейеры
Достижения
● Достигнуто увеличение охвата целевых атрибутов на 60% (включая цвет) ● Реализована модель, позволяющая повышать охват для низкоприоритетных атрибутов без дополнительного обучения ● Созданная модель интегрирована в конвейер и показала эффективность в A/B-тестах
Стек специалиста на проекте
Hive, PyTorch, Apache AirFlow, MLflow, PySpark, Trino
Отрасль проекта
E-commerce & Retail
Период работы
Апрель 2022 - Июнь 2023  (1 год 3 месяца)
ESN
Роль
Senior Data Scientist
Обязанности
Основные продукты, разрабатываемые ESN — социальные сети «chipz» и «punch», основанные на пользовательском контенте, с большим количеством фильтров и генеративных сетей, при этом модели должны работать непосредственно на мобильных устройствах. Моя задача заключалась в оптимизации моделей, созданных другими командами, для обеспечения их работы в реальном времени на телефоне. Обязанности: ● Выбор технологического стека для оптимизации моделей ● Построение конвейера для квантования, дистилляции и конвертации моделей в форматы CoreML и TFlite ● Создание тестов и адаптация конвейера для новых моделей
Достижения
● Реализовал конвейеры на базе mediapipe для запуска моделей на iOS и Android ● Конвертировал модели, которые, по публичной информации, ещё «невозможно» было конвертировать ● Все разработанные модели достигли скорости 30-60 fps на устройстве в реальном времени
Стек специалиста на проекте
C++, Python, ONNX, ray, mediapipe, mnn, Trino
Отрасль проекта
Social Networking
Период работы
Февраль 2022 - Февраль 2023  (1 год 1 месяц)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Саратовский государственный университет
Специальность
Обработка изображений и сигналов
Завершение учебы
2023 г.
Высшее
Учебное заведение
Саратовский государственный университет
Специальность
Прикладная математика и информатика
Завершение учебы
2018 г.
Высшее
Учебное заведение
Саратовский государственный университет
Специальность
Математика и информатика
Завершение учебы
2016 г.

Похожие специалисты

AI & Robotics • HRTech
ЕЛ
Егор Л.
Нижний Новгород
Data Scientist
Middle+
4 545,45 Р/час
API
Bubble
Deep Learning
Flask
gpt
Keras
OpenCV
Python
PyTorch
R Framework
+124

Я специалист в области науки о данных, с аналитическим складом ума и глубокими знаниями математике статистике. Имею опыт работы смежных сферах IT, что обеспечивает мне широкую перспективу понимание технологических процессов компании. Знаком компьютерным зрением обработкой естественного языка на теоретическом уровне, имею реализации академических проектов этих областях. В своём профессиональном пути, начав с автоматизации процессов помощью RPA, я постепенно приближался к науке о данных, увлекаясь её мощным потенциалом в преобразовании данных ценные знания и решения. Этот интерес ведёт меня желанию глубже изучить развиться этой области. Убеждён, что наука открывает новые горизонты для инноваций эффективности любой сфере, стремлюсь стать частью этого процесса, внося свой вклад создание передовых решений. Я готов приложить все усилия достижения профессионального мастерства, сопровождаемого постоянным обучением совершенствованием

Подробнее
AI & Robotics • BioTech, Pharma, Health care & Sports • Information Security • Telecom • VR/AR
ВК
Владимир К.
Москва
Data Scientist
Senior
4 624,11 Р/час
C
C#
C++
Java
Julia
Microsoft
Python
SQL
Zerolog
+72

Языки программирования Python, C, C++, Java, JS, Julia, SQL, C#, Prolog Фреймворки, библиотеки TensorFlow 1/2, PyTorch, Pandas, Numpy, Sklearn, Spacy, Matplotlib/Seaborn, MATLAB, NLTK, RASA, OpenCV, CUDA, boto3, данные ГИС ML-экспертиза Обработка естественного языка: - NER, QA, Chatbots, Intents Matching, Text Classification, Sentiment Analysis, Emotion Detection, Text Abstraction, Text Generation, Clustering, Language Translation - Трансформаторы, BERT, RoBERTa, all-mpnet-base-v2, GPT-3, HDBSCAN, UMAP, RNNs, LSTMs, GRUs, LDA, Gaussians, LSH, K-means Компьютерное зрение - Классификация изображений, обнаружение объектов, сегментация изображений, распознавание таблиц, распознавание структуры таблиц, OCR, распознавание лиц, 3D реконструкция лиц, создание подписей к изображениям - Визуальные трансформаторы, DETR, TableFormer, ConvNets, YOLO3/4, YOLOX, Mask R-CNNs, Fast R-CNNs, Faster R-CNNs, ResNets, VGG, GANs Классические и другие ОД: - Анализ временных рядов, скоринговые модели, регрессии, предикторы, линейная регрессия, логистическая регрессия, SVM, деревья решений, градиентный бустинг (XGBoost, CatBoost), ансамбли, байесовцы, уменьшение размерности, PCA, PCE, t-SNE Контролируемое, полу контролируемое, неконтролируемое обучение и обучение с подкреплением Базы данных Postgres, DynamoDB, NEO4J, JanusGraph, SQLAlchemy Облачные сервисы AWS (SQS, SNS, SageMaker, Lambdas, EC2, S3, Textract, VPC, CloudTrail и т.д.), GСloud Разработка программного обеспечения Git, Docker, Podman, Linux, Bash, Ansible, Sentry, GitLab CI/CD, Conda, Jupyter, VS Code, Pycharm Другие инструменты/навыки Отлично

Подробнее
AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4 415,58 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+65

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее

Недавно просмотренные специалисты

Cloud Services • E-commerce & Retail • RnD • Social Networking
АЛ
Артем Л.
Брест
React разработчик
Senior
3 831,17 Р/час
meecs
Rebase
Sass
ES
React Query
hasura
Socket.io
Redux Thunk
Redux
+56

Артём — опытный IT-специалист, сеньор-разработчик. Обладает навыками работы с широким спектром технологий и инструментов, включая React, Node.js, TypeScript, Docker, AWS и другие. Артём имеет опыт работы на нескольких проектах в различных отраслях, таких как RnD, облачные сервисы, электронная коммерция и социальные сети. Он участвовал в разработке веб-приложений, сервисов и платформ, а также интеграции с различными сервисами и системами. На каждом проекте Артём выполнял широкий спектр задач, включая разработку новых страниц и пользовательских интерфейсов, разработку и обновление кастомных компонент, фиксинг багов, подготовку релизов, проведение ревью, участие в созвонах и дейликах с командой, разработку нового функционала приложения, интеграции с разными сервисами приложения, настройки конфигов сервисов и виджетов, добавление событий в Amplitude, рефакторинг. Опыт работы Артёма на проектах составляет 4 года и 6 месяцев.

Подробнее
Government & Public Sector
КХ
Кирилл Х.
Курск
DevOps
Middle+
2 568,95 Р/час
ELK
Grafana
GitLab-Runner
MS Windows
DNS
NFS
Zabbix
Flyway
SonarQube
Bash
+40

- опыт работы с Kubernetes, включая настройку и управление кластерами, деплой приложений с использованием манифестов, Helm-чартов и kustomize; конфигурацию сервисов, ingress-контроллеров, секретов и configMap; масштабирование, rollouts и мониторинг через встроенные механизмы и сторонние инструменты (Prometheus, Grafana и др.). - написание скриптов автоматизации рутинных задач на Bash. - умение работать с объектными хранилищами, организация хранения чувствительных данных в HashiCorp Vault, Kubernetes Secrets (включая интеграцию с CI/CD и базами данных). - опыт сборки и настройки пайплайнов для сборки, тестирования, релиза и деплоя (SpringBoot Framework, Java). - организация версионирования с использованием систем хранения Nexus и Artifactory. - навыки в развертывании инфраструктуры согласно подходу Ifrastructure as Code используя Terraform, а также управлении конфигурациями с помощью Ansible. - опыт работы с Helm-чартами для автоматизации развертывания приложений. - опыт развертывания микросервисных приложений в кластерах Kubernetes, обеспечение надежности, доступности приложений. - умение настраивать Ingress контролеры, NetworkPolicy и CNI (Calico, Flannel, Cilium). - опыт администрирования систем на базе Linux. - развертывание системы мониторинга прод среды (Grafana, VictoriaMetrics/Prometeus, vmagent, node-exporter) в кластере K8s, а также на выделенных серверах и ВМ. - настройка дашбордов в Grafana для мониторинга микросервисов в Kubernetes-кластере. - навыки работы с Docker, уверенное владение контейнеризацией, включая настройку многослойной сборки образов (multi-stage build), оптимизацию Dockerfile, использование Docker Compose для управления многоконтейнерной инфраструктурой, а также автоматизацию сборки и развёртывания контейнеров.

Подробнее
BioTech, Pharma, Health care & Sports • FinTech & Banking
АС
Андрей С.
Москва
Системный аналитик
Senior
3 376,62 Р/час
PostgreSQL
REST
API
JSON
Jira
Confluence
BPMN
Agile
UML
Postman
+19

Седов Андрей - опытный Системный аналитик, специализирующийся на анализе и проектировании систем. На последнем проекте Андрей продемонстрировал высокие навыки в проведении интервью с заказчиками, анализе требований и составлении технических заданий. Его опыт включает в себя проектирование API, создание графических прототипов и поддержку актуальности документации, что позволило автоматизировать ключевые функциональные процессы. Андрей также принимал участие в проекте по разработке системы логирования и мониторинга ПО для самого крупного банка РФ. В этой роли он успешно проводил интервью с заказчиками, анализировал требования и создавал BPMN схемы, что значительно сократило время, затрачиваемое командой на объяснение процессов. Его достижения включают написание технического задания на доработку сервиса валидации прав, что обеспечило автоматизацию интеграций и улучшение взаимодействия между командами. Андрей владеет методологиями разработки Agile и Waterfall, а также активно использует инструменты для моделирования и управления проектами, такие как Jira и Confluence. Его знания в области интеграции, работы с базами данных и архитектуры систем делают его ценной частью любой команды.

Подробнее