Андрей К. Data Scientist, Senior
ID 14230
АК
Андрей К.
Мужчина, 32 года
Россия, Москва, UTC+3
Ставка
5 800 Р/час
вкл. НДС 20% (800 Р)
Специалист доступен с 19 сентября 2024 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — B1
Главное о специалисте
Андрей — опытный Data Scientist с более чем шестилетним опытом работы в различных отраслях, таких как e-commerce & retail, marketing, advertising & design, media и fintech & banking.
Он обладает глубокими знаниями и навыками в области машинного обучения, обработки данных и разработки программного обеспечения. На своих проектах Андрей разрабатывал модели эластичности спроса для прогнозирования продаж, системы автоматической модерации комментариев, а также занимался кластеризацией рекламодателей и прогнозированием рекламного трафика.
Андрей участвовал в разработке дополнения для клавиатуры Сбера — предсказании следующего написанного слова. Также он разработал модель, которая позволяет автоматически обрабатывать 40% комментариев на сайте ria.ru.
Его опыт и навыки делают его ценным специалистом в области Data Science.
Проекты
(6 лет 7 месяцев)
Автоматизированное формирование цен.
Роль
Senior Data Scientist
Обязанности
Разработал модель эластичности спроса для прогнозирования продаж и расчета эластичности с использованием графиков частичной зависимости. Это позволило разработать оптимальные стратегии ценообразования;
-Была разработана и внедрена автоматизированная система для выявления и сравнения аналогичных продуктов конкурентов, что улучшило ценовую стратегию "М.Видео";
Ключевые достижения включают создание надежных систем синтаксического анализа, тщательную очистку данных и обучение прогностических моделей, что способствовало повышению ценовой конкурентоспособности на 10%;
Разработал микросервисы для производственного развертывания и удобный графический интерфейс пользователя.
Стек специалиста на проекте
Spark, Pandas, SciPy, GitHub, PyTorch, Sklearn, MSSQL, Docker, SQL, Python, Apache AirFlow, Microservices, MySQL, PostgreSQL
Отрасль проекта
E-commerce & Retail
Период работы
Июль 2021 - Июль 2024
(3 года 1 месяц)
Прогнозирование показателей рекламы для финансового планирования и планирования продаж; Кластеризация рекламодателей.
Роль
Data Scientist
Обязанности
Кластеризация рекламодателей: нашел интерпретируемые кластеры со значительными различиями в ключевых показателях (доход, недавность и т.д.). Кластеры использовались для стратификации в A/B тестах и в качестве характеристик в других моделях;
Прогноз доходов от рекламы: использовалось распределенное обучение fb prophet (с внутренним движком MapReduce от Яндекса). Модель используется для финансового планирования;
Оценка зависимости между содержанием видеорекламы и ее видимостью. Мы попытались найти информацию для рекламодателей о том, как сделать видео более доступным для просмотра. Были проанализировали влияние текста и людей на видео, измеренное с помощью значений формы модели cat boots.
Прогноз рекламного трафика на главной странице Яндекса и в видеосети. Модель используется при планировании продаж.
Стек специалиста на проекте
Numpy, Pandas, SciPy, Sklearn, Python, Matplotlib, Jira
Отрасль проекта
Marketing, Advertising & Design
Период работы
Октябрь 2019 - Июль 2021
(1 год 10 месяцев)
Задачи НЛП (классификация, кластеризация, NER); Автоматическая модерация комментариев.
Роль
Data Scientist
Обязанности
Автоматическая модерация комментариев по адресу ria.ru: классификатор + модель, основанная на правилах для нецензурных слов. Модель позволяет автоматически обрабатывать 40% комментариев, а постмодерацию можно вводить вместо премодерации;
Режим подобия новостной статьи (на ЛДА основе): используется в системе ria.ru;
Тегирование новостных статей: модели NER (основанные на правилах + BiLSTM-CRF) и классификатор тем. Модель предлагает редакторам наиболее релевантные теги;
Разработана система рекомендаций для новостных статей (раздел «читать дальше...») с использованием нейронной сети DSSM. Повышен показатель кликабельности на 10%;
Стек специалиста на проекте
Clickhouse, Pandas, GitHub, PyTorch, Sklearn, Docker, SQL, Python, PostgreSQL
Отрасль проекта
Media
Период работы
Май 2018 - Сентябрь 2019
(1 год 5 месяцев)
Формат работы
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Национальный исследовательский университет «Высшая школа экономики»
Специальность
Факультет компьютерных наук
Завершение учебы
2019 г.
Высшее
Учебное заведение
МГТУ им. Н.Э. Баумана, Москва
Специальность
Робототехника и комлексная автоматизация, Прикладная механика
Завершение учебы
2019 г.