Даниил К. Data Scientist, Middle+

ID 12041
ДК
Даниил К.
Мужчина
Беларусь, Минск, UTC+3
Ставка
4 415,58 Р/час
НДС не облагается
Специалист доступен с 18 августа 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle+
Навыки
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
Docker Compose
DynamoDB
EC2
EKS
ER
etc
gamemaker
Gensim
Git
GitHub
Gradio
HuggingFace
JVM
Keras
Kubernetes
langchain
Machine learning
MLflow
MongoDB
NFC
NLTK
Numpy
NVidia
Open AI
OpenCV
OpenVINO
Pandas
PDF
Plotly
PostgreSQL
PySpark
Python
PyTorch
QT
Redis
S3
Scikit-learn
Seaborn
Services
SpaCy
Spock
SQL
Storage
Synapse
Tensorboard
Tensorflow
TensorRT
Torchvision
Virtual Machines
XGBoost
TLS
ecr
CatBoost
Matplotlib
Tableau
Отрасли
AI & Robotics
Manufacturing
Знание языков
Английский — B2
Главное о специалисте
Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.
Проекты   (4 года 6 месяцев)
РОЛЕВОЙ КОММУНИКАЦИОННЫЙ БОТ
Роль
Специалист по данным / инженер по машинному обучению
Обязанности
Чат-бот для ролевого общения с разными персонажами. Чат-бот — отличный инструмент для людей всех возрастов, позволяющий общаться со своими любимыми героями фильмов. Решение исключает любые деликатные и неуместные темы, поэтому пользователи могут чувствовать себя в безопасности, а модераторы могут сосредоточиться на создании контента, мониторинге системы и привлечении потенциальных клиентов. Обязанности и достижения Общение с клиентом и командой для уточнения бизнес требований, презентации результатов и бизнес закономерностей; Экспериментировал с различными предобученными большими языковыми моделями, чтобы определить лучшую основу для дообучения. Использованные модели включали LLaMA, WizardLM, Pygmalion; Выполнял промпт инжиниринг (Few Shot, Chain of Thoughts, Self-Ask и т.д.) чтобы улучшить качество ответов для всех запросов с использованием OpenAI API; Построил пайплайн предварительной обработки больших текстовых данных с использованием Apache Spark и AWS SageMaker; Сделал механизм запоминания контекста с использованием Langchain и настраиваемой модели обобщения T5; Разработал инфраструктуру AWS для предсказания, обучения и экспериментов с мониторингом и отслеживанием артефактов; Использовал фильтрацию запрещенных тем с помощью OpenAI API; Настроил процесс аннотации данных; Реализация файн-тюнинга с использованием PEFT для модели LLaMA; Проводил обучение и тестирование больших языковых моделей на основе инструкций; обучение моделей масками; Настроил векторное хранилище для модели, чтобы сохранять векторизованные подсказки; Использовал сжатые представления BERT и KNN в качестве базовой модели для создания предварительных аннотаций данных для задачи классификации намерений; Реализовал ​​цензуру для модели на основе инструкций Разработал и интегрировал дополнительные новые инструменты для чат-бот агента; Настроил демо окружение с помощью Gradio, чтобы предоставить заказчику способ экспериментировать с текущей системой; Развернул модели на EKS; Код ревью. Окружение Python, Numpy, Pandas, Plotly, Scikit-learn, Tensorflow, Keras, NLTK, Spacy, Gensim, BERTopic, OpenAI API, Langchain, Hugging Face, gradio, BitsAndBytes, PEFT, Apache Spark, PySpark, AWS(Sagemaker, S3, EKS , EC2, Bedrock, Cloudwatch и т. д.), MongoDB, Docker, Docker Compose, Kubernetes (k8s), Git Github.
Стек специалиста на проекте
Gradio, langchain, TLS, AWS, Open AI, SpaCy, gamemaker, Tensorflow, Numpy, Git, API, Pandas, MongoDB, ER, GitHub, QT, Scikit-learn, NLTK, Gensim, Apache Spark, Keras, HuggingFace, S3, Docker Compose, EKS, EC2, PDF, PySpark, Plotly, Docker, CloudWatch, Kubernetes
Отрасль проекта
AI & Robotics
Период работы
Август 2023 - По настоящее время  (2 года 1 месяц)
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ РОБОТОВ
Роль
Специалист по данным / инженер по машинному обучению
Обязанности
Исследование и разработка программного обеспечения с поддержкой искусственного интеллекта для сельскохозяйственных роботов как на этапе подготовки к сбору урожая (обнаружение сельскохозяйственных культур и сорняков, выявление болезней, распознавание состояния поля с помощью изображений RGB и NIR), так и на этапе сбора урожая (оценка количества плодов и уровня их зрелости с использованием данных ультразвуковых). Обязанности и достижения Реализовал пайплайн обработки данных; Исследовал наиболее эффективные подходы к оптимизации для различных типов архитектур, таких как ViT и ResNet; Использовал контейнеры NVIDIA NGC для обучения моделей компьютерного зрения на AWS SageMaker; Экспериментировал с различными предобученными базовыми моделями и их применением для последовательных задач в пайплайне; Исследовал и обучал различные модели для сегментации, обнаружения и классификации; Изучил интеграцию мультисенсорных данных, объединение информации с камер, LiDAR и других датчиков для повышения точности обнаружения в сложных сельскохозяйственных условиях; Экспериментировали с методами объединения данных, используя такие модели, как Multimodal YOLO и FusionNet; Оптимизировал пайплайны обучения моделей для работы на спотовых виртуальных машинах; Разрабол модули для работы моделей для периферийных устройств с использованием TensorRT; Окружение Python, Pandas, NumPy, Seaborn, TensorFlow, PyTorch, TensorBoard, Keras, OpenVINO, TensorRT, OpenCV, TorchVision, NVIDIA NGC, AWS (Sagemaker, S3, CloudWatch, ECR, DynamoDB), PostgreSQL, Redis, Docker, Docker Compose, Git Github
Стек специалиста на проекте
PostgreSQL, Git, Docker, Python, AWS, GitHub, Tensorflow, DynamoDB, Pandas, Numpy, Seaborn, PyTorch, Keras, Docker Compose, Redis, NFC, OpenVINO, Torchvision, S3, CloudWatch, OpenCV, Tensorboard, TensorRT, NVidia, ecr, gamemaker
Отрасль проекта
AI & Robotics
Период работы
Май 2022 - Август 2023  (1 год 4 месяца)
ИНСТРУМЕНТ АВТОМАТИЗАЦИИ БИЗНЕСА
Роль
Специалист по данным/инженер по машинному обучению
Обязанности
Автоматизация бизнес-процессов с использованием возможностей RPA и машинного обучения при закупке и обработке материалов. Обязанности и достижения Создание отдельного слоя, который кластеризует все доступные данные и группирует их в схожие по бизнес-процессам когорты и отдельно обучает на них модели; Создал уровень объяснения предсказаний, чтобы конечный пользователь мог проверить поведение модели и лучше понять оценку; Проводил периодические ревью производительности для оценки эффективности системы мониторинга моделей и определения областей для постоянного улучшения; Применял автоматизированное машинное обучение для повышения скорости создания моделей; Внедрил технику повторной выборки, которая уменьшает эффект дрейфа данных; Создал ETL пайплайн для подготовки необработанных данных; Реализовал среду экспериментирования для удобного отслеживания результатов моделирования; Реализовал многоэтапный пайплайн интеграции данных с использованием PySpark; Создавал бизнес-отчеты и информационные панели с использованием Tableau и представлял их клиенту; Окружение Python, PyTorch, XGBoost, Tableau, OpenCV, Numpy, Pandas, Scikit-Learn, Matplotlib, Seaborn, CatBoost, MLFlow, Apache Spark, PySpark, Azure(Virtual Machines, Spot VM, SQL, Machine Learning, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps), Redis, Docker, Docker Compose, Git Github.
Стек специалиста на проекте
OpenCV, Synapse, Spock, Numpy, Data Factory, Git, Pandas, DevOps, Redis, GitHub, JVM, Scikit-learn, Seaborn, PyTorch, XGBoost, Apache Spark, BLoC, CatBoost, Storage, Tableau, Virtual Machines, MLflow, Docker Compose, Services, PySpark, SQL, Docker, Python, Matplotlib, Azure, Machine learning
Отрасль проекта
Manufacturing
Период работы
Март 2021 - Май 2022  (1 год 3 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
-
Специальность
Информатика и программирование
Завершение учебы
2020 г.

Похожие специалисты

E-commerce & Retail • Travel, Hospitality & Restaurant business
МГ
Максим Г.
Минск
Data Scientist
Middle+
4 415,58 Р/час
AllenNLP
Apache AirFlow
Apache Spark
AWS
Azure
BLoC
CloudWatch
Data Factory
Databricks
Docker
+56

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее
E-commerce & Retail • FinTech & Banking • Media
АС
Алексей С.
Минск
Data Scientist
Middle+
3 896,1 Р/час
Apache AirFlow
Apache Spark
app
AWS
Azure
Backend
blob
CatBoost
CloudWatch
Data
+63

Middle Data Scientist по работе с данными с опытом работы 3 года. Специалист по обработке данных, специализирующийся на разработке эффективных проектов, ориентированных на данные, и уделяющий особое внимание использованию передовых методов прогнозного моделирования, аналитики и рекомендательных систем. Я обладаю проверенным опытом в выявлении и решении бизнес-проблем с помощью стратегического применения Data Science. Кроме того, у меня есть практический опыт, охватывающий весь жизненный цикл работы с данными - от понимания проблем и разработки функциональных возможностей до внедрения моделей машинного обучения в производство. Для этого я использую различные инструменты, такие как Python, Pandas, пакеты визуализации данных, Scikit-learn, XGBoost, SHAP, Boruta для обработки данных, моделирования и оценки; FastAPI для серверной разработки, Docker и k8s для задач DevOps, облачные сервисы AWS и Azure.

Подробнее
EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
Optimizely
+135

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Подробнее
FinTech & Banking • IoT • Manufacturing
АЛ
Артем Л.
Минск
Data Scientist
Senior
6 493,5 Р/час
A/B testing
Agile
Anaconda
API
Bash
Bitbucket
CatBoost
CI/CD
Circle CI
Docker
+74

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее

Недавно просмотренные специалисты

BioTech, Pharma, Health care & Sports • Government & Public Sector • IoT • Telecom
АЕ
Алексей Е.
Самара
Angular разработчик
Middle+
4 496,1 Р/час
Git
HTML
CSS
JavaScript
Jira
SQL
Linux
GitLab
БЭМ
RxJS
+21

Алексей — Angular разработчик. Специализируется на фронтенд-разработке, обладает опытом работы с Angular, Atlassian, CSS, CSS3, DNS, Git, GitLab, Handlebars, HTML, HTML5, JavaScript, Jira, Linux, Npm, RxJS, SCSS, SourceTree, SQL, TypeScript. Участвовал в проектах для отраслей Government & Public Sector, BioTech, Pharma, Health care & Sports, IoT, Telecom. Работал над сервисом цифрового решения для автоматизации закупок в Government & Public Sector (11 месяцев), медицинским веб-приложением для сопровождения пациентов в BioTech, Pharma, Health care & Sports (2 года 9 месяцев), IoT платформой для Интернета Вещей (2 месяца). Также занимал должность специалиста технической поддержки по хостингу (2-я линия) в Telecom (1 год 4 месяца). Имеет среднее образование по специальности «Компьютерные системы и комплексы» (Самарский Авиационный Техникум) и высшее образование по специальности «Информационные системы и технологии» (Поволжский государственный университет телекоммуникаций и информатики).

Подробнее
E-commerce & Retail
НП
Никита П.
Минск
Java разработчик
Senior
3 519,46 Р/час
Java EE/SE
Grafana
assertj
Redux
AWS
GitLab
Postman
core
Spring Data
HTTP
+71

Никита — Java-разработчик уровня Senior из Минска, Беларусь. Специализируется на разработке приложений с использованием Java и сопутствующих технологий. Имеет высшее образование по специальности «Программное обеспечение информационных технологий, базы данных и программное обеспечение информационных систем» от ВГУ имени Петра Мироновича Машерова. Владеет английским языком на уровне B1. Имеет опыт работы на трёх проектах в отрасли E-commerce & Retail: - Платформа для оптимизации и автоматизации работы такси-сервиса (10 месяцев). Разработка микросервиса для расчёта скидок и промокодов, использование шаблонов проектирования и кеширования для повышения производительности, разработка витрины данных с использованием Spring Batch и Kafka. - Веб-приложение для компьютерной диагностики заболеваний головного мозга (2 года 2 месяца). Подготовка датасета для обучения нейросети, реализация веб-приложения на Spring Boot, REST приложения с интеграцией с фронт частью и сервисом с нейросетью. - Платформа для автоматизации процессов в автосервисе (2 года 2 месяца). Разработка REST API, взаимодействие со сторонними сервисами, реализация микросервиса для сбора и хранения данных об использовании услуг.

Подробнее
Telecom
ММ
Мария М.
Рыбинск
Java разработчик
Senior
3 246,75 Р/час
PosrgteSQL
options
Spring framework (Web, Boot)
Разработка
Программное обеспечение
ДО
Реляционные БД
Базы данных
Lombok
SOLID
+55

Мария — опытный Java-разработчик уровня Senior. Обладает навыками работы с Java, Spring framework, Git, SQL, PostgreSQL, Hibernate ORM, Docker, REST, Oracle, Spring Boot, Backend, Redis, JPA, Swagger, JavaScript, Kubernetes, Microservices, Lombok, Maven. Имеет опыт разработки микросервисной архитектуры на основе Spring framework и СУБД Oracle. Принимала участие в создании и сопровождении MES-систем, а также в миграции существующих систем на новую архитектуру. Занималась развёртыванием новых сервисов. Мария работала над full-stack разработкой web-приложений для госучреждений. Имеет опыт работы с СУБД PostgreSQL и backend на Java EE, frontend на JavaScript. Ранее занималась разработкой и поддержкой модулей desktop-приложения на Delphi. Работала с СУБД Oracle и Interbase. Также имеет опыт тестирования и сопровождения ПО для бюджетных организаций. Создавала и дорабатывала пользовательские макросы и печатные формы. Писала и ревьюила пользовательские инструкции и документацию.

Подробнее