Илья К. Data Scientist, Middle+

ID 18618
ИК
Илья К.
Мужчина, 22 года
Россия, Москва, UTC+3
Ставка
1 948,05 Р/час
НДС не облагается
Специалист доступен с 21 августа 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Middle+
Навыки
Python
SQL
Pandas
PyTorch
Numpy
PostgreSQL
Tensorflow
Lightgbm
Scikit-learn
Plotly
Seaborn
CatBoost
Docker
FastAPI
langchain
Network
openAI
Psycopg2
Qdrant
Sklearn
Streamlit
XGBoost
Yandex Cloud
Agile
Git
Beautiful soup
Отрасли
LifeStyle
RnD
Знание языков
Английский — B2
Главное о специалисте
Илья — опытный Data Scientist с навыками работы в сфере машинного обучения и анализа данных. Он обладает глубоким пониманием алгоритмов и инструментов, таких как Python, SQL, Pandas, PyTorch, Numpy, PostgreSQL, Tensorflow, Lightgbm, Scikit-learn, Plotly, Seaborn, beautifulsoup, CatBoost, Docker, FastAPI, langchain, Network, openAI, Psycopg2, Qdrant, Sklearn, Streamlit, XGBoost, Yandex Cloud. Илья участвовал в разработке и улучшении модели Catboost для прогнозирования числа гостей и чеков, а также в создании веб-приложения для машинного обучения. В рамках проектов он решал задачи классификации изображений товаров, разработки чат-ботов, создания RAG системы для поиска жилья на Бали, оптимизации обработки запросов пользователей к LLM. Опыт работы Ильи на проектах составляет 3 года.
Проекты   (3 года 1 месяц)
Разработка и улучшение модели Catboost для прогнозирования числа гостей и чеков
Роль
Data Scientist
Обязанности
Команда: 8 человек - Teamlead, product manager, backend-developer и 5 специалистов data science Основные обязанности: • Разработка и улучшение модели Catboost для прогнозирования числа гостей и чеков на основании погодных условий, праздников и предыдущих данных • Классификация изображений товаров с помощью дообучения моделей ViT и MobileNet-V2. • Разработка алгоритма для определения класса товара на основе близости эмбеддингов изображений и текстовых описаний с использованием моделей MAWS и CLIP • Создание Telegram чат-бота с ассистентами на основе LLM агентов для автоматизации взаимодействия с сервисами (Notion, Google Календарь), оптимизация структуры промптов для лучшей работы LLM агентов. • Разработка RAG системы для поиска жилья на Бали на основе мультиагентной системы (один из агентов - retriever, который делает запрос в векторную базу данных с объявлениями) • Разработка системы рекомендаций товаров на основе графовых эмбеддингов для изображений и текстовых атрибутов с помощью EfficientNet и Node2vec
Достижения
За счёт добавления новых признаков и улучшения модели удалось уменьшить среднюю ошибку модели предсказания количества гостей и чеков с помощью Catboost до 10% • Для задачи классификации изображений удалось достичь точности на модели VIT - 96%. • Разработал более эффективную структуру промптов для LLM агентов, оптимизирующую количество вызовов API GPT и более релевантные ответы
Стек специалиста на проекте
langchain, Streamlit, llm, openAI, Tensorflow, Numpy, Google, Pandas, Notion, FastAPI, Beautiful soup, Scikit-learn, Seaborn, PyTorch, Sklearn, XGBoost, Qdrant, CatBoost, Network, Lightgbm, Plotly, SQL, Docker, Python, Matplotlib, Psycopg2, Telegram, данных, rag, langgraph, node2vec
Отрасль проекта
RnD
Период работы
Февраль 2023 - Сентябрь 2024  (1 год 8 месяцев)
веб-приложение для машинного обучения
Роль
8 человек - Teamlead, product manager, backend-developer и 5 специалистов data science
Обязанности
Команда: 6 человек - product manager, backend-developer и 4 специалистов data science Основные обязанности: • Разработка backend для веб-приложения машинного обучения, предоставляющего пользователям возможность легко обучать модели на своих данных и получать оценки качества моделей по различным метрикам. • Интеграция с хранилищами данных (Clickhouse, Yandex Cloud) и создание визуального интерфейса для выбора и загрузки файлов. • Разработка архитектуры для MVP платформы для совместной работы с LLM (GPT-3.5, YandexGPT), предназначенную для генерации и редактирования контента • Разработка интерфейсов чатов с функцией сохранения и загрузки истории из базы данных. • Реализация системы регистрации пользователей, отправки уведомлений и управления сессиями через cookies • Реализация RAG системы для взаимодействия LLM с пользовательскими документами
Достижения
Оптимизировал обработку запросов пользователей к LLM путем добавления мультиагентной системы, где каждый из агентов выполняет специализированные задачи: извлечение данных, компиляция промптов и генерация текста с помощью LLM
Стек специалиста на проекте
MVP, ClickHouse, Data Science, Yandex Cloud, Работа с интеграциями, cookies, developer, llm, rag
Отрасль проекта
LifeStyle
Период работы
Сентябрь 2021 - Февраль 2023  (1 год 6 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Дипломы и сертификаты
Теория и практика глубокого обучения и нейронных сетей 2022 г.
Машинное обучение с использованием Python 2021 г.
Аналитик данных 2021 г.
Образование
Высшее
Учебное заведение
Финансовый университет при Правительстве Российской Федерации, Москва
Специальность
Факультет информационных технологий и анализа больших данных, Прикладная математика и информатика
Завершение учебы
2023 г.

Похожие специалисты

FinTech & Banking • IoT • Manufacturing
АЛ
Артем Л.
Минск
Data Scientist
Senior
6 493,5 Р/час
A/B testing
Agile
Anaconda
API
Bash
Bitbucket
CatBoost
CI/CD
Circle CI
Docker
+74

Артём — опытный специалист в области Data Science с опытом работы более двух лет. Он обладает глубокими знаниями и навыками в машинном обучении, анализе данных и разработке программного обеспечения. Артём работал над проектами в нефтегазовой отрасли и сфере финансовых технологий, где разрабатывал модели машинного обучения для прогнозирования компонентного состава жидкостей и создания системы рекомендаций на основе искусственного интеллекта. Он также участвовал в проекте по разработке алгоритмов машинного обучения и их интеграции в облачные сервисы. Артём хорошо разбирается в инструментах и технологиях, таких как Python, TensorFlow, PyTorch, PostgreSQL, Docker и GitHub. Его опыт и навыки делают его ценным специалистом для компаний, работающих в сфере Data Science и машинного обучения.

Подробнее
EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business
КС
Кирилл С.
Минск
Data Scientist
Senior
3 896,62 Р/час
OpenCV
AI
Data Visualization
langchain
deployment
credit
Grafana
language
modelio
Optimizely
+135

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Подробнее

Недавно просмотренные специалисты

BioTech, Pharma, Health care & Sports • FinTech & Banking • Realty & Constructoring
ОВ
Олег В.
Гродно
Data инженер
Senior
4 196,36 Р/час
PostgreSQL
MySQL
Jira
Python
Oracle
Linux
IntelliJ IDEA
MariaDB
Informatica
Java 8-11
+26

Разработчик с 20+ лет опыта работы в разработке программного обеспечения. Большой опыт работы с базами данных, в том числе с настройкой производительности SQL. Опыт работы на всех этапах жизненного цикла разработки программного обеспечения: создание идеи и развитие, разработка, тестирование, внедрение в производство и поддержка; 21-летний опыт разработки Oracle (9i, 10g, 11g), включающий в себя: - логический и физический дизайн базы данных, распределение памяти, разбиение, сегменты таблиц и индексов, роли и привилегии; - настройка производительности SQL, индексация, распараллеливание, объяснение планов, подсказки, статистика; - глубокие знания в логическому и физическом моделировании данных с использованием методов нормализации; - программирование ETL-процессов с использованием PL/SQL, Informatica; - программирование PL/SQL, хранимые процедуры, функции, пакеты, триггеры, типы; - программирование с использованием динамического SQL и PL/SQL; - работа с Oracle: разработка приложений с использованием Oracle Forms; разработка отчетов и визуализация данных с использованием Oracle Reports, Oracle Graphics и Oracle BI Publisher; - разработка приложений с использованием HTML/XML/CSS/XSLT; Манипулирование, очистка и обработка данных с использованием SQL. Анализ необработанных данных, подведение итогов и выработка рекомендаций. Проектирование, разработка и внедрение новой функциональности. Разработка приложений с использованием Java Core, Java Spring Boot, ORM Hibernate. Дополнительная информация: - Сильные аналитические способности, самомотивация, способность адаптироваться к новой среде.

Подробнее