Кирилл У. Data Scientist, Middle

ID 21878

КУ

Кирилл У.

Мужчина, 25 лет

Россия, Смоленск, UTC+3

Ставка

3 376,62 Р/час

НДС не облагается

Специалист доступен с 10 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data Scientist

Грейд

Middle

Навыки

Alembic

Asyncio

Bash

Celery

CSS

dash

Django

Docker

Flask

HTML

JavaScript

JSON

Keras

MLops

Numpy

Pandas

PySpark

Python

Redis

SQLAlchemy

Tensorflow

MySQL

PostgreSQL

SQLite

Anaconda

GitLab

Jira

JupyterNoteBook

Vim

VS Code

Отрасли

AgroTech

E-commerce & Retail

EdTech

FinTech & Banking

HRTech

Manufacturing

Главное о специалисте

Более 5 лет опыта работы в области Data Science и python разработки. Большой интерес к Data Mining и анализу, AI технологиям, машинному обучению. Хорошие аналитические навыки и умение решать проблемы. Ориентирован на результат, способен быстро вникать в новые технологии. Есть опыт самостоятельной работы на проекте и в составе команды разработчиков. Является senior data engineer, но при этом активно развивает свои навыки и участвует в проектах в области data science.

Проекты (5 лет 1 месяц)

Система проксирования запросов LLM

Роль

Data Scientist

Обязанности

Разработка и внедрение моделей LLM для обработки запросов; Настройка и оптимизация API для взаимодействия с LLM; Обучение моделей и их настройка под специфические запросы; Интеграция модели LLM с существующими системами; Мониторинг и анализ работы моделей; Оптимизация работы моделей для улучшения производительности; Обработка ошибок и улучшение модели на основе обратной связи; Внедрение и поддержка методов безопасности при работе с данными; Работа с командой разработчиков для улучшения взаимодействия систем; Обновление и поддержка модели LLM в рабочей среде; Файнтюнинг LLM моделей под кастомные запросы и специфические датасеты; Работа с текстовыми метриками: BLEU, NIST, ROUGE, METEOR.

Стек специалиста на проекте

PostgreSQL, Docker, Python, REST API, Grafana, OAuth, Kubernetes, Nginx, AWS, Celery, Prometheus, JWT, HAProxy, PyTorch, Azure, HTTPS, Flask, Django, Redis, GCP, llm, OpenAI API, Hugging face transformers

Отрасль проекта

EdTech

Период работы

Август 2024 - Февраль 2025 (7 месяцев)

Дообучение LLM моделей по RAG архитектуре

Роль

Data Scientist

Обязанности

Сбор и предобработка данных: Использование Python (Pandas, Numpy, re) для загрузки, очистки и токенизации текстовых документов; Построение корпуса знаний: Формирование базы данных текстов с использованием SQL/NoSQL решений (например, PostgreSQL или MongoDB) для хранения и управления документами; Генерация эмбеддингов: Применение моделей Sentence Transformers для преобразования текстов в векторные представления на Python; Индексация векторов: Создание и оптимизация векторного индекса с использованием библиотеки FAISS для быстрого поиска ближайших соседей; Разработка модуля поиска: Реализация API на Python для извлечения релевантных документов из индекса FAISS; Формирование промптов: Создание шаблонов на Python для объединения исходного запроса и извлечённого контекста в единый промпт для Llama3; Дообучение Llama3: Настройка и тренировка модели с использованием Hugging Face Transformers и PyTorch для генерации ответов на основе расширенного промпта; Настройка пайплайна обучения: Интеграция всех компонентов (retriever, генератор, обработка данных) с использованием Docker и orchestration-инструментов (например, Airflow); Оптимизация seq2seq моделей для задачи генерации ответов; Занимался fine-tuning и alignment: Применение методов обратной связи от пользователей для улучшения качества генерации ответов, включая использование методов активного обучения и регуляризации, а также оптимизацию гиперпараметров через MLflow и автоматизированные тесты с Pytest.

Стек специалиста на проекте

Docker, Python, Pytest, GitLab, GitHub, Pandas, Numpy, PyTorch, FastText, CI, Apache AirFlow, MLflow, word2vec, transformers, tfidf, sense, re, MangoDB, FAISS, Hugging face transformers

Отрасль проекта

Manufacturing

Период работы

Апрель 2024 - Август 2024 (5 месяцев)

Анализ документов для автоматизированной обработки данных

Роль

Data Scientist

Обязанности

Автоматизированная обработка документов (OCR, классификация, извлечение данных); Разработка NLP-модели для анализа и понимания документов; Оптимизация алгоритмов для извлечения ключевой информации; Разработка пайплайна для интеграции моделей в рабочую среду; Применение LLM-моделей для анализа юридических и финансовых документов; Разработка кастомных токенизаторов и алгоритмов нормализации текста; Оценка качества распознавания с применением BLEU, ROUGE, METEOR.

Стек специалиста на проекте

PostgreSQL, Docker, Python, MongoDB, Tensorflow, Meteor, NLTK, PyTorch, Tesseract, OpenCV, word2vec, tfidf, SpaCy, ocr

Отрасль проекта

FinTech & Banking

Период работы

Апрель 2024 - Июнь 2024 (3 месяца)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Образование

Высшее

Учебное заведение

Белорусский государственный университет

Специальность

Компьютерная безопасность (математические методы и программные системы)

Завершение учебы

2021 г.

Похожие специалисты

FinTech & Banking • IoT • Manufacturing

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее

AI & Robotics • E-commerce & Retail • FoodTech • HRTech • IoT • Logistics & Transport • Media • VR/AR

Разрабатываю модели, способные решать задачи классификации и регрессии. Моя основная цель - помочь решить проблемы в области прогнозирования, компьютерного зрения и анализа текстовой информации. Владею классическими и глубокими методами машинного обучения. Занимаюсь анализом данных и визуализацией результатов с помощью библиотек Pandas, Numpy, Matplotlib, Seaborn, Plotly. Строю модели глубокого обучения с помощью фреймворков Keras и PyTorch. Уверенно разрабатываю на Python. Есть опыт работы с Flask, SQLAlchemy, а также опыт написания юнит-тестов с помощью библиотек PyTest и UnitTest. Совершенствую свои навыки, читая профессиональную литературу и публикуя научные статьи и статьи на Хабре. Статьи: 1. Прикладная математика и вопросы управления, 2023, Пермь: Метод определения уровня схожести изображений по цветовой составляющей на основе корреляционного анализа и квантования цветового пространства https://elibrary.ru/item.asp?id=54951039 2. Вестник Южно-Уральского государственного университета, 2023, Челябинск:Разработка системы определения перемещения рабочих на производстве на основе OpenCV и алгоритма одностадийного детектора https://elibrary.ru/item.asp?id=51254937 3. USBEREIT, 2023, Yekaterinbug: Application of Ensembles of Neural Networks for Deepfake Recognition 4. Хабр, 2023: Почему Data Science не для вас? https://habr.com/ru/users/TourmalineCore/articles/ 5. Applied Human Factors and Ergonomics, 2024, Nice: Development of Neural Networks for Deepfake Recognition https://clok.uclan.ac.uk/id/eprint/52098/1/978-1-958651-98-8_14.pdf 7. Хабр, 2025: To Docker or not to Docker? Вот в чём JupyterLab https://habr.com/ru/articles/911298/ Монография: 1. Южно-Уральский государственный университет, 2024: Управление промышленными предприятиями как фактор эффективного развития региона https://elibrary.ru/item.asp?id=79614873

Подробнее

AI & Robotics • HRTech

Я специалист в области науки о данных, с аналитическим складом ума и глубокими знаниями математике статистике. Имею опыт работы смежных сферах IT, что обеспечивает мне широкую перспективу понимание технологических процессов компании. Знаком компьютерным зрением обработкой естественного языка на теоретическом уровне, имею реализации академических проектов этих областях. В своём профессиональном пути, начав с автоматизации процессов помощью RPA, я постепенно приближался к науке о данных, увлекаясь её мощным потенциалом в преобразовании данных ценные знания и решения. Этот интерес ведёт меня желанию глубже изучить развиться этой области. Убеждён, что наука открывает новые горизонты для инноваций эффективности любой сфере, стремлюсь стать частью этого процесса, внося свой вклад создание передовых решений. Я готов приложить все усилия достижения профессионального мастерства, сопровождаемого постоянным обучением совершенствованием

Подробнее

Cloud Services • FinTech & Banking • Logistics & Transport • RnD

● Опыт разработки более 6 лет ● Участие в проектировании архитектуры продукта ● Код-ревью, рефакторинг ● Уверенное знание фреймворка Streamlit ● Опыт использования GIT и Docker ● Аналитические и организационные навыки ● Опыт менторства начинающих специалистов

Подробнее

EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • FinTech & Banking • FoodTech • GameDev • Government & Public Sector • HRTech • Logistics & Transport • Marketing, Advertising & Design • Realty & Constructoring • Telecom • Travel, Hospitality & Restaurant business

Специализируется на Backend разработке на PHP фреймворках. Опыт работы в сфере программирования 8+ лет. Отличные познания в проектировании структуры проекта.

Подробнее

Hardware • Information Security • IoT • Media • Social Networking

Работа с интеграциями

Андрей — опытный Python-разработчик уровня Middle+. Обладает навыками работы с различными технологиями и инструментами, такими как Ansible, Apache Kafka, DevOps, Django, Docker, DRF, Elasticsearch, FastAPI, Flask, Microsoft, MongoDB, MQ, MySQL, NoSQL, Oracle, PostgreSQL, RabbitMQ, SQL, SQLAlchemy и другие. Андрей имеет опыт разработки систем в различных отраслях, включая информационную безопасность, аппаратное обеспечение, социальные сети и IoT. Он работал над проектами, связанными с реализацией требований информационной безопасности, разработкой системы гарантированного доведения команд БПЛА, созданием модулей для корпоративного портала и разработкой IoT-платформы управления инженерными системами здания. Также участвовал в разработке информационно-аналитической системы. На проектах Андрей выполнял роли Python-разработчика, разработчика ПО и back-end разработчика. Его опыт работы на проектах составляет 12 лет.

Подробнее

E-commerce & Retail • Marketing, Advertising & Design • Social Networking

Регрессионное тестирование

Ориентированный на качество и результат, высокомотивированный, энергичный, самостоятельный командный игрок, быстро обучаемый, обладающий сильными навыками внимательности, ищет позицию специалиста по тестированию ПО. Обладаю сильными аналитическими способностями и навыками решения проблем. Стремлюсь получить должность, которая позволит мне развивать мои навыки и расти как специалист. ● Ручное и автоматизированное тестирование (Ul, функциональное, Smoke и регрессионное тестирование): ○ для веб-приложений: Selenium WebDriver, Cucumber, TestNG ○ для мобильных (Android) приложений: Android Studio, Appium ● Создание/редактирование технической документации (тест план, тест кейсы, чек листы) и составление подробных баг репортов ● Создание простых запросов с использованием SQL ● Понимание Lean подхода и различных методологий SDLC - Agile, Scrum, Kanban, Waterfall

языки программирования

Коммуникативные навыки

Ведущий Data Engineer с опытом работы в проектировании ETL-процессов, построении хранилищ данных и реализации CDC-решений. Основные достижения: автоматизация отчетности (ускорение в 6 раз), декомпозиция Hadoop-стека для НЛМК, внедрение real-time загрузки данных и оптимизация рабочих процессов (повышение эффективности в 5 раз). Владеет полным циклом работы с данными: от разработки DAG'ов и витрин до настройки мониторинга. Имеет опыт интеграции с 1С и промышленными системами.

Скульптор и Дизайнер персонажей Портфолио: https://www.artstation.com/elijaharts НАВЫКИ: КОНЦЕПТУАЛЬНАЯ СКУЛЬПТУРА - ДИЗАЙН ПЕРСОНАЖЕЙ/СУЩЕСТВ - ОРГАНИЧЕСКАЯ СКУЛЬПТУРА - ДИНАМИЧЕСКАЯ АНАТОМИЯ - РЕНДЕРИНГ (ОСВЕЩЕНИЕ) - ЗНАНИЕ ОСНОВ 2D __________________________________________________________________________ О себе: Я художник-фрилансер из России. Начиная с 2020 года я работал с различными индивидуальными клиентами в Интернете, в основном над 3D-печатью персонажей и миниатюр, а также продавал модели на таких торговых площадках, как CGtraider. Я также пробовал себя в создании 3D-моделей для игр с несколькими небольшими инди-студиями. В настоящее время работаю с HardWitch- Games: https://www.myminifactory.com/users/HardWitch-Games больше года. Я начал работать с ними в конце 2023 года. Также работал с Bestiarum Games, E.S. Monster, и имел возможность работать над единичным проектом для Mundfish. На данный момент мой набор инструментов состоит из: Zbrush, Blender, Scrivener и Procreate. (Я также знаком со всем остальным программным обеспечением, используемым в процессе создания 3D-персонажей)

Подробнее

Кирилл У. Data Scientist, Middle

Похожие специалисты

Недавно просмотренные специалисты

Подпишитесь на нашу рассылку