Дмитрий С. Data аналитик, Middle+

ID 10665
ДС
Дмитрий С.
Мужчина, 28 лет
Россия, Санкт-Петербург, UTC+3
Ставка
3 082,74 Р/час
вкл. НДС 5% (114.29 Р)
Специалист доступен с 4 июля 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data аналитик
Грейд
Middle+
Навыки
GreenPlum
Hive
PostgreSQL
Python
AntD
Apache AirFlow
Confluence
Data Analysis
DataGrip
DBeaver
Git
Jira
JupyterNoteBook
Machine learning
Matplotlib
metabase
Microsoft
Notion
Numpy
Pandas
PyCharm
Redash
Scikit-learn
Seaborn
vscode
Power BI
Отрасли
EdTech
FinTech & Banking
Главное о специалисте
работал в связке Python + PostgreSQL для написания самообновляющихся в Apache Airflow скриптов для дашбордов MS PowerBI, Redash, Metabase, поддерживал их состояние, исправлял ошибки в случае их возникновения; построение отчетов в вышеуказанных пакетах визуализации согласно ТЗ; участвовал в дизайне и проверке результатов простых A/B-тестов (сравнение конверсий, изменений средних значений), обсуждал их результаты с внутренними заказчиками; выполнял ad-hoc запросов внутренних заказчиков в формате .csv/.xlsx/.pkl по мере необходимости; поиск инсайтов и точек роста на проектах совместно с командой (brainstorm); оценивал качество моделей машинного обучения - самостоятельно построенных или предобученных; участвовал в code review коллег по команде; участвовал в обучении / менторстве коллег; опыт работы с библиотеками машинного обучения; тесное взаимодействие с QA / backend-разработчиками
Проекты   (3 года 2 месяца)
Платформа для исследования удовлетворенности ЮЛ продуктами экосистемы банка
Роль
Data Analyst
Обязанности
Описание проекта: Платформа представляет собой систему, собирающую данные об удовлетворенности клиентов-юридических лиц продуктами экосистемы банка (CSI). Данные на платформу поступают следующим образом: клиент обращается в техническую поддержку с определенной проблемой, после решения которой у клиента просят оценить работу по нескольким критериям по шкале 1-5. Весь текст разговора и оценки поступают в общее хранилище, из которого можно формировать инфографику. Платформа предназначена, в первую очередь, для детекции плохих оценок (alert) и поиска набора признаков, которые имеют наибольший вес при ее выставлении (долгое время ожидания, грубый оператор и т.д.) для обеспечения приемлемой предсказательной способности. Состав команды: 1 PO, 1 BA, 2 Frontend-разработчика, 2 DS, 1 DA Технологии на проекте: Jupyter Notebook, Jira, Confluence, Data Analysis and Machine Learning Libraries (Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn) Задачи/реализованный функционал: Проверка статистических гипотез - влияние признака или группы признаков на оценки пользователей (корреляция Пирсона, ANOVA и т.д.). Дообучение действующей на проекте модели машинного обучения на новых признаках, имеющих статистическую значимость (градиентный бустинг) или построение новых моделей с нуля (например, TF-IDF + LightGBM + nltk / spacy для классификации речи операторов). Оценка возможности использования предобученных моделей машинного обучения на проекте (например, насколько хорошо модель, обученная у коллег из другого проекта на тексте подойдет для анализа речи клиента и/или оператора на нашем). Улучшение детекции неприемлемого контента (например, нецензурной лексики) без методов машинного обучения (доработка уже готовых регулярных выражений или же создание своих с нуля).
Стек специалиста на проекте
Jira, Confluence, Machine learning, Pandas, Numpy, Data Analysis, Matplotlib, Scikit-learn, Seaborn, JupyterNoteBook, AntD
Отрасль проекта
FinTech & Banking
Период работы
Февраль 2023 - Февраль 2024  (1 год 1 месяц)
Платформа для подбора экспертов для оказания образовательных услуг
Роль
Data Analyst
Обязанности
Описание проекта: Платформа для подбора подходящего эксперта, оказывающего образовательную услугу заказчику. Чаще всего это - курсовые, контрольные и т.д. работы, выполнение которых требуется студентам учреждений среднего специального или высшего образования к определенному дедлайну. Система подбора работает следующим образом: заказчик вводит все необходимые сведения (тип, предмет работы, сумма денег, которую он готов заплатить, дедлайн и т.д.) на сайт, после чего он выдает список рекомендованных экспертов, которых можно выбрать. Любое взаимодействие происходит строго на платформе путем внутреннего чата на самой платформе, там же оговариваются все легальные способы оплаты, а также изменения изначального задания: корректировки, отмены, дополнительные услуги и т.д. Состав команды: 1 Team-Lead, 1 DS, 1 DE, 2 DA, 1 PM Технологии на проекте: Jupyter Notebook, Apache Airflow, VSCode / PyCharm, DataGrip / DBeaver, MS PowerBI, Redash, Metabase, Git, Jira, Confluence, Data Analysis and Machine Learning Libraries (Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn, etc.), Notion Задачи/реализованный функционал: Рефакторинг legacy-кода на проекте (удаление лишних и дублирующихся строк кода в репозитории, формирование и/или оптимизация функций для ускорения отработки скриптов в Apache Airflow). Построение новых DAG или тасок для Apache Airflow в зависимости от ТЗ с целью разработки автоматически обновляющихся дашбордов, мониторинг состояния отработки тасок и корректности метрик в построенных дашбордах. За время работы на проекте количество дашбордов в разных системах визуализации выросло почти вдвое. Участие в дизайне и проверке результатов A/B-тестов (сравнение p_value и уровня значимости, иногда bootstrap), обсуждение наличия статистической значимости с коллегами по команде и внутренними заказчиками. Каждый успешный A/B-тест приносил в среднем ~3-5% от выручки. Оценка возможности использования предобученных моделей машинного обучения (Hugging Face + sklearn + PyTorch) на наших проектах - получение метрик и сравнение их с эталонным значением. Совместно с DE разработали non-ML-алгоритм ранжирования желаемых вознаграждений экспертов, который впоследствии был протестирован QA и внедрен в production, что привело к росту выручки на ~7-10%.
Стек специалиста на проекте
Numpy, AntD, Git, Pandas, Power BI, Notion, DBeaver, PyCharm, Scikit-learn, Redash, Seaborn, vscode, Confluence, Data Analysis, Matplotlib, metabase, Apache AirFlow, DataGrip, JupyterNoteBook, Microsoft, Machine learning, Jira
Отрасль проекта
EdTech
Период работы
Январь 2021 - Февраль 2023  (2 года 2 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет

Похожие специалисты

BioTech, Pharma, Health care & Sports • FinTech & Banking • HRTech
АВ
Александр В.
Воронеж
Data аналитик
Middle+
4 051,94 Р/час
A/B testing
Apache AirFlow
BI инструменты
CTE
Data Analysis
ETL
Excel
FineBI
Git
GitHub
+37

Александр — data-аналитик уровня middle+. Специализируется на A/B тестировании, машинном обучении и анализе данных. Работал с различными BI инструментами, включая FineBI и Power BI, а также с ETL процессами, Hadoop и Hive. Опыт работы на проектах: - Анализ и борьба с мошенничеством на платформе HeadHunter. Расследовал мошеннические инциденты, внедрял превентивные алгоритмы для борьбы с фродом, работал с большими объёмами данных, строил дашборды в FineBI и Zeppelin. Снизил долю пользователей, сталкивающихся с капчей, на 40%. - Продуктовая аналитика и анализ рисков. Оценивал экономическую эффективность новых фич и продуктов, работал с MS SQL, PostgreSQL, оптимизировал запросы, создавал дашборды. Снизил долю мошенников по определённым каналам на 7–9%. - Разработка скоринговой модели для кредитного портфеля. Разработал более эффективную скоринговую модель (на 23% лучше сторонних сервисов). Внедрял ETL процессы, анализировал большие объёмы данных клиентов, проводил антифрод- и риск-аналитику. - Внедрение аналитики в стоматологической клинике. Внедрил реляционную базу данных, построил ML модели для прогнозирования оттока клиентов. Увеличил прибыль клиники на 11% и снизил затраты на 13%.

Подробнее
E-commerce & Retail • FinTech & Banking
ДХ
Дарья Х.
Минск
Data аналитик
Senior
3 746,75 Р/час
Time series
Time Series Analysis
Time Series Forecasting
Forecasting
forecast
Predictive Analytics
Analytics
Classical ML
Classical ML models
MLflow
+136

▪ Data Scientist / Data Analyst c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов, оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов.

Подробнее

Недавно просмотренные специалисты

EdTech • FinTech & Banking
ДС
Дмитрий С.
Санкт-Петербург
Data аналитик
Middle+
3 082,74 Р/час
Numpy
AntD
Hive
Git
Pandas
Power BI
Notion
DBeaver
PyCharm
Scikit-learn
+26

работал в связке Python + PostgreSQL для написания самообновляющихся в Apache Airflow скриптов для дашбордов MS PowerBI, Redash, Metabase, поддерживал их состояние, исправлял ошибки в случае их возникновения; построение отчетов в вышеуказанных пакетах визуализации согласно ТЗ; участвовал в дизайне и проверке результатов простых A/B-тестов (сравнение конверсий, изменений средних значений), обсуждал их результаты с внутренними заказчиками; выполнял ad-hoc запросов внутренних заказчиков в формате .csv/.xlsx/.pkl по мере необходимости; поиск инсайтов и точек роста на проектах совместно с командой (brainstorm); оценивал качество моделей машинного обучения - самостоятельно построенных или предобученных; участвовал в code review коллег по команде; участвовал в обучении / менторстве коллег; опыт работы с библиотеками машинного обучения; тесное взаимодействие с QA / backend-разработчиками

Подробнее