Дмитрий С. Data аналитик, Middle+

ID 10665

ДС

Дмитрий С.

Мужчина, 27 лет

Россия, Санкт-Петербург, UTC+3

Ставка

3,000 Р/час

НДС не облагается

Специалист доступен с 1 июня 2024 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data аналитик

Грейд

Middle+

Навыки

GreenPlum

Hive

PostgreSQL

Python

AntD

Apache AirFlow

Confluence

Data Analysis

DataGrip

DBeaver

Git

Jira

JupyterNoteBook

Machine learning

Matplotlib

metabase

Microsoft

Notion

Numpy

Pandas

PowerBI

PyCharm

Redash

Scikit-learn

Seaborn

vscode

Отрасли

EdTech

FinTech & Banking

Главное о специалисте

работал в связке Python + PostgreSQL для написания самообновляющихся в Apache Airflow скриптов для дашбордов MS PowerBI, Redash, Metabase, поддерживал их состояние, исправлял ошибки в случае их возникновения; построение отчетов в вышеуказанных пакетах визуализации согласно ТЗ; участвовал в дизайне и проверке результатов простых A/B-тестов (сравнение конверсий, изменений средних значений), обсуждал их результаты с внутренними заказчиками; выполнял ad-hoc запросов внутренних заказчиков в формате .csv/.xlsx/.pkl по мере необходимости; поиск инсайтов и точек роста на проектах совместно с командой (brainstorm); оценивал качество моделей машинного обучения - самостоятельно построенных или предобученных; участвовал в code review коллег по команде; участвовал в обучении / менторстве коллег; опыт работы с библиотеками машинного обучения; тесное взаимодействие с QA / backend-разработчиками

Проекты (3 года 2 месяца)

Платформа для исследования удовлетворенности ЮЛ продуктами экосистемы банка

Роль

Data Analyst

Обязанности

Описание проекта: Платформа представляет собой систему, собирающую данные об удовлетворенности клиентов-юридических лиц продуктами экосистемы банка (CSI). Данные на платформу поступают следующим образом: клиент обращается в техническую поддержку с определенной проблемой, после решения которой у клиента просят оценить работу по нескольким критериям по шкале 1-5. Весь текст разговора и оценки поступают в общее хранилище, из которого можно формировать инфографику. Платформа предназначена, в первую очередь, для детекции плохих оценок (alert) и поиска набора признаков, которые имеют наибольший вес при ее выставлении (долгое время ожидания, грубый оператор и т.д.) для обеспечения приемлемой предсказательной способности. Состав команды: 1 PO, 1 BA, 2 Frontend-разработчика, 2 DS, 1 DA Технологии на проекте: Jupyter Notebook, Jira, Confluence, Data Analysis and Machine Learning Libraries (Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn) Задачи/реализованный функционал: Проверка статистических гипотез - влияние признака или группы признаков на оценки пользователей (корреляция Пирсона, ANOVA и т.д.). Дообучение действующей на проекте модели машинного обучения на новых признаках, имеющих статистическую значимость (градиентный бустинг) или построение новых моделей с нуля (например, TF-IDF + LightGBM + nltk / spacy для классификации речи операторов). Оценка возможности использования предобученных моделей машинного обучения на проекте (например, насколько хорошо модель, обученная у коллег из другого проекта на тексте подойдет для анализа речи клиента и/или оператора на нашем). Улучшение детекции неприемлемого контента (например, нецензурной лексики) без методов машинного обучения (доработка уже готовых регулярных выражений или же создание своих с нуля).

Стек специалиста на проекте

Jira, Confluence, Machine learning, Pandas, Numpy, Data Analysis, Matplotlib, Scikit-learn, Seaborn, JupyterNoteBook, AntD

Отрасль проекта

FinTech & Banking

Период работы

Февраль 2023 - Февраль 2024 (1 год 1 месяц)

Платформа для подбора экспертов для оказания образовательных услуг

Роль

Data Analyst

Обязанности

Описание проекта: Платформа для подбора подходящего эксперта, оказывающего образовательную услугу заказчику. Чаще всего это - курсовые, контрольные и т.д. работы, выполнение которых требуется студентам учреждений среднего специального или высшего образования к определенному дедлайну. Система подбора работает следующим образом: заказчик вводит все необходимые сведения (тип, предмет работы, сумма денег, которую он готов заплатить, дедлайн и т.д.) на сайт, после чего он выдает список рекомендованных экспертов, которых можно выбрать. Любое взаимодействие происходит строго на платформе путем внутреннего чата на самой платформе, там же оговариваются все легальные способы оплаты, а также изменения изначального задания: корректировки, отмены, дополнительные услуги и т.д. Состав команды: 1 Team-Lead, 1 DS, 1 DE, 2 DA, 1 PM Технологии на проекте: Jupyter Notebook, Apache Airflow, VSCode / PyCharm, DataGrip / DBeaver, MS PowerBI, Redash, Metabase, Git, Jira, Confluence, Data Analysis and Machine Learning Libraries (Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn, etc.), Notion Задачи/реализованный функционал: Рефакторинг legacy-кода на проекте (удаление лишних и дублирующихся строк кода в репозитории, формирование и/или оптимизация функций для ускорения отработки скриптов в Apache Airflow). Построение новых DAG или тасок для Apache Airflow в зависимости от ТЗ с целью разработки автоматически обновляющихся дашбордов, мониторинг состояния отработки тасок и корректности метрик в построенных дашбордах. За время работы на проекте количество дашбордов в разных системах визуализации выросло почти вдвое. Участие в дизайне и проверке результатов A/B-тестов (сравнение p_value и уровня значимости, иногда bootstrap), обсуждение наличия статистической значимости с коллегами по команде и внутренними заказчиками. Каждый успешный A/B-тест приносил в среднем ~3-5% от выручки. Оценка возможности использования предобученных моделей машинного обучения (Hugging Face + sklearn + PyTorch) на наших проектах - получение метрик и сравнение их с эталонным значением. Совместно с DE разработали non-ML-алгоритм ранжирования желаемых вознаграждений экспертов, который впоследствии был протестирован QA и внедрен в production, что привело к росту выручки на ~7-10%.

Стек специалиста на проекте

Git, Jira, Confluence, Notion, DBeaver, PyCharm, Machine learning, Pandas, Numpy, Data Analysis, Matplotlib, Scikit-learn, Redash, Seaborn, JupyterNoteBook, Microsoft, Apache AirFlow, AntD, DataGrip, PowerBI, metabase, vscode

Отрасль проекта

EdTech

Период работы

Январь 2021 - Февраль 2023 (2 года 2 месяца)

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Похожие специалисты

EdTech • FinTech & Banking • Marketing, Advertising & Design

Аналитический склад ума, внимательна к деталям, ответственна, люблю учится и совершенствовать свои навыки, общительна, жизнерадостна, всегда открыта новому. Люблю и хочу продолжать развиваться в сфере анализа данных. Сейчас прохожу курс "Визуализация данных в BI-инструментах

Подробнее

FinTech & Banking • FoodTech

Описание пока отсутствует

Подробнее

AgroTech • E-commerce & Retail • Logistics & Transport

Аналитик данных с опытом работы более 5 лет. Люблю аналитическую работу, умею эффективно интерпретировать, анализировать и прогнозировать данные с помощью современных инструментов. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель - достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, Apache Spark, PySpark, Apache Airflow. Облачные технологии AWS(Redshift, EC2, Lambda, Glue, S3, RDS, DynamoDB, EMR, Athena, etc.). Базы данных PostgreSQL, MySQL, Greenplum, MongoDB, Redis. Машинное обучение и Data Science Pandas, NumPy, Scikit-learn. BI и визуализация данных Power BI, Seaborn, Matplotlib. Моделирование данных Размерное моделирование (схема «звезда», схема «снежинка»), моделирование сущностей-связей, нормализация / денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Bash Scripting. Системы контроля версий Git, Bitbucket, GitHub. Достижения Улучшение предсказания спроса Разработал модель прогнозирования спроса на автомобили в разных районах города, что позволило оптимизировать распределение автомобилей и снизить время ожидания клиентов на 15%. Успешное проведение A/B тестирования Разработал и провел серию А/Б тестов, что позволило оптимизировать пользовательский интерфейс и улучшить конверсию на 7%, принеся дополнительный доход в размере $30,000 в месяц. Анализ эффективности каналов продвижения Провел анализ данных о рекламных каналах и их влиянии на продажи, что позволило оптимизировать бюджет маркетинга и увеличить эффективность кампаний на 15%.

Подробнее

FinTech & Banking • Media

Свободно владею английским; ответственный и трудолюбивый специалист с глубокими знаниями в области математического моделирования, статистики и эконометрики, что подтверждается соответствующей степенью магистра в области Прикладной математики и информатики; обладаю знаниями в области микро- и макроэкономики. Разработка базы данных Логический и физический дизайн базы данных; Мониторинг производительности БД, Root Cause Analysis; Программирование на PL / SQL, T-SQL, хранимые процедуры, функции; Программирование ETL-процессов с использованием PL / SQL; Data Science: Исследовательский анализ данных с использованием Pandas, Numpy, SciPy; Визуализация данных с использованием Matplotlib, seaborn; Разработка веб-приложений с использованием Flask and Docker; Обучение и тестирование моделей машинного обучения с использованием opencv, scikit-learn, keras, tensorflow, Jupyter Notebook; Data Mining: Предобработка данных: выбросы и пропуски в данных; Построение и оценка регрессионных моделей с применением Логистической регрессии и Дерева принятия решений для задачи банковского скоринга; Text Mining с применением Метода опорных векторов и Наивного Баессовоского классификатора для задачи SMS спам фильтра; Анализ потребительской корзины (Аффинитивный анализ) наа базе сети продовольственных товаров с применением алгоритма Априори на языке R; Разработка интерактивных дашбордов с использованием Tableau, Grafana и Excel Power Query. Дополнительные навыки: Сильные аналитические способности, внимание к деталям, способность быстро учиться.

Подробнее

Manufacturing • Telecom

О себе: Постоянно учусь и стремлюсь к знаниям. Высокий уровень самоорганизации и любовь к делу помогают каждый день узнавать что-то новое. Воспринимаю сложные задачи и трудности как очередную ступень на пути вверх. Стек компетенций: • Python (Matplotlib, Numpy, Pandas, Google.colab, Tensorflow, Keras, Torch и др.); • SQL/NoSQL (MySQL, PostgreSQL, MongoDB, SQLite); • BI платформы (Tableau, Qlik Sense, Power BI); • Сбор данных (Scrapy, Selenium, BeautifulSoup, Xpath); • Методы аналитики маркетинговойактивности, системы web-аналитики; • GIt; • Bash Первую программу для управления заказами и складом для компании занимающийся доставкой воды и кулеров, написал в 2005 году. Работает до сих пор. Писал роботов для биржевой торговли на mql4. Заинтересовался ИИ и пошел учиться в Университет ИИ. Хобби - искусство, графический дизайн, фотография.

Подробнее

Недавно просмотренные специалисты

EdTech • FinTech & Banking

Описание пока отсутствует

Подробнее

LifeStyle • Logistics & Transport • Realty & Constructoring • RnD • Travel, Hospitality & Restaurant business

React testing library

Ответственный веб-разработчик, командный игрок и проактивный сотрудник с 4+ годами в коммерческой разработке. Работал над проектами как «с нуля», так и с существующими продуктами. Участвовал в полном цикле разработки проекта - от MVP до продуктов «в продакшене». Имеет опыт работы в малых и средних распределенных командах с использованием agile-методологий и инструментов управления проектами (Trello, Jira и т. д.). Сейчас фокус на JS технологическом стеке - React.

Подробнее

FinTech & Banking • Media

Описание пока отсутствует

Подробнее

AI & Robotics • E-commerce & Retail • Logistics & Transport • RnD

Инженер баз данных с более чем 3 годами опыта в ИТ-сфере. Отличное знание баз данных PostgreSQL, MySQL, а также языков SQL и Python. Умение писать логику и скрипты для разных целей. Практические навыки визуализации и оптимизации данных. Сильные аналитические способности, а также хорошие коммуникативные навыки. Готов получать новые знания и навыки для работы над различными проектами. PostgreSQL, MySQL Percona-Toolkit Python, VBA, SQL, pl/pgSQL PowerBI Docker/Docker Compose Ansible ProxySQL Windows, Linux Git

Подробнее