Даниил К. Data Scientist, Middle+

ID 12041

ДК

Даниил К.

Мужчина

Беларусь, Минск, UTC+3

Ставка

4 250 Р/час

НДС не облагается

Специалист доступен с 26 июля 2024 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data Scientist

Грейд

Middle+

Навыки

Apache Spark

API

AWS

Azure

Bash scripting

BLoC

CloudWatch

Data Factory

DevOps

Docker

Docker Compose

DynamoDB

EC2

EKS

etc

gamemaker

Gensim

Git

GitHub

Gradio

HuggingFace

JVM

Keras

Kubernetes

langchain

MLflow

MongoDB

NFC

NLTK

Numpy

NVidia

Open AI

OpenCV

OpenVINO

Pandas

PDF

Plotly

PostgreSQL

PySpark

Python

PyTorch

Redis

Scikit-learn

Seaborn

Services

SpaCy

Spock

SQL

Storage

Synapse

Tensorboard

Tensorflow

TensorRT

Torchvision

Virtual Machines

XGBoost

TLS

ecr

CatBoost

Machine learning

Matplotlib

Tableau

Отрасли

AI & Robotics

Manufacturing

Знание языков

Английский — B2

Главное о специалисте

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Проекты (3 года 5 месяцев)

РОЛЕВОЙ КОММУНИКАЦИОННЫЙ БОТ

Роль

Специалист по данным / инженер по машинному обучению

Обязанности

Чат-бот для ролевого общения с разными персонажами. Чат-бот — отличный инструмент для людей всех возрастов, позволяющий общаться со своими любимыми героями фильмов. Решение исключает любые деликатные и неуместные темы, поэтому пользователи могут чувствовать себя в безопасности, а модераторы могут сосредоточиться на создании контента, мониторинге системы и привлечении потенциальных клиентов. Обязанности и достижения Общение с клиентом и командой для уточнения бизнес требований, презентации результатов и бизнес закономерностей; Экспериментировал с различными предобученными большими языковыми моделями, чтобы определить лучшую основу для дообучения. Использованные модели включали LLaMA, WizardLM, Pygmalion; Выполнял промпт инжиниринг (Few Shot, Chain of Thoughts, Self-Ask и т.д.) чтобы улучшить качество ответов для всех запросов с использованием OpenAI API; Построил пайплайн предварительной обработки больших текстовых данных с использованием Apache Spark и AWS SageMaker; Сделал механизм запоминания контекста с использованием Langchain и настраиваемой модели обобщения T5; Разработал инфраструктуру AWS для предсказания, обучения и экспериментов с мониторингом и отслеживанием артефактов; Использовал фильтрацию запрещенных тем с помощью OpenAI API; Настроил процесс аннотации данных; Реализация файн-тюнинга с использованием PEFT для модели LLaMA; Проводил обучение и тестирование больших языковых моделей на основе инструкций; обучение моделей масками; Настроил векторное хранилище для модели, чтобы сохранять векторизованные подсказки; Использовал сжатые представления BERT и KNN в качестве базовой модели для создания предварительных аннотаций данных для задачи классификации намерений; Реализовал цензуру для модели на основе инструкций Разработал и интегрировал дополнительные новые инструменты для чат-бот агента; Настроил демо окружение с помощью Gradio, чтобы предоставить заказчику способ экспериментировать с текущей системой; Развернул модели на EKS; Код ревью. Окружение Python, Numpy, Pandas, Plotly, Scikit-learn, Tensorflow, Keras, NLTK, Spacy, Gensim, BERTopic, OpenAI API, Langchain, Hugging Face, gradio, BitsAndBytes, PEFT, Apache Spark, PySpark, AWS(Sagemaker, S3, EKS , EC2, Bedrock, Cloudwatch и т. д.), MongoDB, Docker, Docker Compose, Kubernetes (k8s), Git Github.

Стек специалиста на проекте

Gradio, langchain, Open AI, TLS, AWS, Kubernetes, SpaCy, gamemaker, Tensorflow, Numpy, API, Git, Pandas, MongoDB, ER, GitHub, QT, Scikit-learn, NLTK, Gensim, Apache Spark, Keras, HuggingFace, S3, Docker Compose, EKS, EC2, PDF, PySpark, Plotly, Docker, CloudWatch

Отрасль проекта

AI & Robotics

Период работы

Август 2023 - По настоящее время (1 год)

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ РОБОТОВ

Роль

Специалист по данным / инженер по машинному обучению

Обязанности

Исследование и разработка программного обеспечения с поддержкой искусственного интеллекта для сельскохозяйственных роботов как на этапе подготовки к сбору урожая (обнаружение сельскохозяйственных культур и сорняков, выявление болезней, распознавание состояния поля с помощью изображений RGB и NIR), так и на этапе сбора урожая (оценка количества плодов и уровня их зрелости с использованием данных ультразвуковых). Обязанности и достижения Реализовал пайплайн обработки данных; Исследовал наиболее эффективные подходы к оптимизации для различных типов архитектур, таких как ViT и ResNet; Использовал контейнеры NVIDIA NGC для обучения моделей компьютерного зрения на AWS SageMaker; Экспериментировал с различными предобученными базовыми моделями и их применением для последовательных задач в пайплайне; Исследовал и обучал различные модели для сегментации, обнаружения и классификации; Изучил интеграцию мультисенсорных данных, объединение информации с камер, LiDAR и других датчиков для повышения точности обнаружения в сложных сельскохозяйственных условиях; Экспериментировали с методами объединения данных, используя такие модели, как Multimodal YOLO и FusionNet; Оптимизировал пайплайны обучения моделей для работы на спотовых виртуальных машинах; Разрабол модули для работы моделей для периферийных устройств с использованием TensorRT; Окружение Python, Pandas, NumPy, Seaborn, TensorFlow, PyTorch, TensorBoard, Keras, OpenVINO, TensorRT, OpenCV, TorchVision, NVIDIA NGC, AWS (Sagemaker, S3, CloudWatch, ECR, DynamoDB), PostgreSQL, Redis, Docker, Docker Compose, Git Github

Стек специалиста на проекте

PostgreSQL, Git, Docker, Python, AWS, GitHub, Tensorflow, DynamoDB, Pandas, Numpy, Seaborn, PyTorch, Keras, Docker Compose, Redis, NFC, OpenVINO, Torchvision, S3, CloudWatch, OpenCV, Tensorboard, TensorRT, NVidia, ecr, gamemaker

Отрасль проекта

AI & Robotics

Период работы

Май 2022 - Август 2023 (1 год 4 месяца)

ИНСТРУМЕНТ АВТОМАТИЗАЦИИ БИЗНЕСА

Роль

Специалист по данным/инженер по машинному обучению

Обязанности

Автоматизация бизнес-процессов с использованием возможностей RPA и машинного обучения при закупке и обработке материалов. Обязанности и достижения Создание отдельного слоя, который кластеризует все доступные данные и группирует их в схожие по бизнес-процессам когорты и отдельно обучает на них модели; Создал уровень объяснения предсказаний, чтобы конечный пользователь мог проверить поведение модели и лучше понять оценку; Проводил периодические ревью производительности для оценки эффективности системы мониторинга моделей и определения областей для постоянного улучшения; Применял автоматизированное машинное обучение для повышения скорости создания моделей; Внедрил технику повторной выборки, которая уменьшает эффект дрейфа данных; Создал ETL пайплайн для подготовки необработанных данных; Реализовал среду экспериментирования для удобного отслеживания результатов моделирования; Реализовал многоэтапный пайплайн интеграции данных с использованием PySpark; Создавал бизнес-отчеты и информационные панели с использованием Tableau и представлял их клиенту; Окружение Python, PyTorch, XGBoost, Tableau, OpenCV, Numpy, Pandas, Scikit-Learn, Matplotlib, Seaborn, CatBoost, MLFlow, Apache Spark, PySpark, Azure(Virtual Machines, Spot VM, SQL, Machine Learning, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps), Redis, Docker, Docker Compose, Git Github.

Стек специалиста на проекте

OpenCV, Synapse, Spock, Numpy, Data Factory, Git, Pandas, DevOps, Redis, GitHub, Machine learning, JVM, Scikit-learn, Seaborn, PyTorch, XGBoost, Apache Spark, BLoC, CatBoost, Storage, Tableau, Virtual Machines, MLflow, Docker Compose, Services, PySpark, Docker, SQL, Python, Matplotlib, Azure

Отрасль проекта

Manufacturing

Период работы

Март 2021 - Май 2022 (1 год 3 месяца)

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Образование

Высшее

Учебное заведение

Специальность

Информатика и программирование

Завершение учебы

2020 г.

Похожие специалисты

E-commerce & Retail • Travel, Hospitality & Restaurant business

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее

AI & Robotics • BioTech, Pharma, Health care & Sports • Information Security • Telecom • VR/AR

Языки программирования Python, C, C++, Java, JS, Julia, SQL, C#, Prolog Фреймворки, библиотеки TensorFlow 1/2, PyTorch, Pandas, Numpy, Sklearn, Spacy, Matplotlib/Seaborn, MATLAB, NLTK, RASA, OpenCV, CUDA, boto3, данные ГИС ML-экспертиза Обработка естественного языка: - NER, QA, Chatbots, Intents Matching, Text Classification, Sentiment Analysis, Emotion Detection, Text Abstraction, Text Generation, Clustering, Language Translation - Трансформаторы, BERT, RoBERTa, all-mpnet-base-v2, GPT-3, HDBSCAN, UMAP, RNNs, LSTMs, GRUs, LDA, Gaussians, LSH, K-means Компьютерное зрение - Классификация изображений, обнаружение объектов, сегментация изображений, распознавание таблиц, распознавание структуры таблиц, OCR, распознавание лиц, 3D реконструкция лиц, создание подписей к изображениям - Визуальные трансформаторы, DETR, TableFormer, ConvNets, YOLO3/4, YOLOX, Mask R-CNNs, Fast R-CNNs, Faster R-CNNs, ResNets, VGG, GANs Классические и другие ОД: - Анализ временных рядов, скоринговые модели, регрессии, предикторы, линейная регрессия, логистическая регрессия, SVM, деревья решений, градиентный бустинг (XGBoost, CatBoost), ансамбли, байесовцы, уменьшение размерности, PCA, PCE, t-SNE Контролируемое, полу контролируемое, неконтролируемое обучение и обучение с подкреплением Базы данных Postgres, DynamoDB, NEO4J, JanusGraph, SQLAlchemy Облачные сервисы AWS (SQS, SNS, SageMaker, Lambdas, EC2, S3, Textract, VPC, CloudTrail и т.д.), GСloud Разработка программного обеспечения Git, Docker, Podman, Linux, Bash, Ansible, Sentry, GitLab CI/CD, Conda, Jupyter, VS Code, Pycharm Другие инструменты/навыки Отлично

Подробнее

FinTech & Banking • IoT • Manufacturing

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее

E-commerce & Retail • Hardware

Григорий — опытный Data Scientist с навыками в области машинного обучения и анализа данных. Он обладает глубоким пониманием Apache AirFlow, Azure, C++, Docker, FastAPI и других технологий. Григорий успешно работал над проектами в сфере Hardware и E-commerce & Retail. В рамках одного из проектов он разработал систему автоматического выявления дефектов на производственной линии, используя архитектуру YOLO V5. Это позволило повысить точность обнаружения дефектов до 89%. В другом проекте Григорий создал модель прогнозирования продаж для ритейл-сети, используя комбинацию алгоритмов Prophet и XGBoost. Это помогло снизить MAPE с 15% до 8%. Также Григорий разработал автоматизированный классификатор товаров для e-commerce платформы, что позволило сократить затраты человекочасов на категоризацию на 30%.

Подробнее

FinTech & Banking • IoT • Manufacturing

Python Data Analysis Big Data Machine Learning Linux Git Docker SQL Deep Learning NLP Машинное обучение DevOps Bash Английский язык ML Data Scientist OpenCV PyTorch FastAPI NLTK TensorRT XGBoost Flask pandas numpy matplotlib keras transformers uvicorn dvc

Подробнее

Недавно просмотренные специалисты

Опыт работы в разработке UX/UI интерфейсов более 9 лет. Стараюсь соответствовать тенденциям и инновациям в своей профессиональной сфере, использовать современные методы создания успешных дизайнов. Индивидуальный подход к каждому проекту и проработка деталей до мелочей. В то же время, всегда внимательна к таким этапам, как каркасное моделирование и прототипирование. Прекрасно знаю специфику реализации веб- и мобильных приложений. Знакома с различными гайдлайнами (material, flat, iOS, Android и т.д.) и могу применять их по мере необходимости. Также изучала Cinema 4d. Портфолио - https://drive.google.com/file/d/1pPe03iZEQnH7Xgz8QPYRhJNKM6LP-Ic1/

Подробнее

AI & Robotics • Manufacturing

Marketing, Advertising & Design

Работал в продуктовых компаниях, дизайн-студиях и медиа, разрабатывал системы управления контентом, финансовые и туристические веб-сервисы, онлайн-медиа и мобильные приложения.

Бизнес/системный анализ – общение со стейкхолдерами, выявление потребностей, построение моделей, согласование, проектирование БД, микросервисов, описанме методов, маппинги, написание документации по ГОСТ 34

Подробнее

FinTech & Banking • FoodTech • Information Security

Техническая поддержка

+13

Опыт проектирования и реализации ЛВС. Базовые навыки программирования на языке 1С. Установка и настройка серверов 1С на основе базы данных PostgreSQL, администрирование сервера 1С, оптимизация базы данных. Опыт обслуживания парка техники принтеров (Kyocera, HP, Brother, Canon, Zebra). Опыт обслуживания серверов ОС Windows, Active Directory. Большой опыт диагностики и ремонта ПК (выявление неполадок, подбор и замена комплектующих, восстановление). Большой опыт удалённой поддержки пользователей. Знание принципов работы сетей (коммутации, маршрутизации). Установка, настройка и обслуживание прикладного ПО. Базовые знания JavaScript. Базовые знания C# (ООП). Настройка и обслуживание систем видеонаблюдения (HiWatch, Hikvision, Polyvision). Настройка и обслуживание торгового оборудование (ATOL, CAS, Massa-K). Нравится заниматься музыкой, играю на электрогитаре, немного играл в группе, записывался на домашней студии.

Подробнее