Оставьте заявку, мы подберем для вас подходящего специалиста за 48 часов!
Премия рунета

Дмитрий С. Data аналитик, Middle+

ID 10665
ДС
Дмитрий С.
Мужчина, 27 лет
Россия, Санкт-Петербург, UTC+3
Ставка
3,000 Р/час
НДС не облагается
Специалист доступен с 1 июня 2024 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data аналитик
Грейд
Middle+
Навыки
GreenPlum
Hive
PostgreSQL
Python
AntD
Apache AirFlow
Confluence
Data Analysis
DataGrip
DBeaver
Git
Jira
JupyterNoteBook
Machine learning
Matplotlib
metabase
Microsoft
Notion
Numpy
Pandas
PowerBI
PyCharm
Redash
Scikit-learn
Seaborn
vscode
Отрасли
EdTech
FinTech & Banking
Главное о специалисте
работал в связке Python + PostgreSQL для написания самообновляющихся в Apache Airflow скриптов для дашбордов MS PowerBI, Redash, Metabase, поддерживал их состояние, исправлял ошибки в случае их возникновения; построение отчетов в вышеуказанных пакетах визуализации согласно ТЗ; участвовал в дизайне и проверке результатов простых A/B-тестов (сравнение конверсий, изменений средних значений), обсуждал их результаты с внутренними заказчиками; выполнял ad-hoc запросов внутренних заказчиков в формате .csv/.xlsx/.pkl по мере необходимости; поиск инсайтов и точек роста на проектах совместно с командой (brainstorm); оценивал качество моделей машинного обучения - самостоятельно построенных или предобученных; участвовал в code review коллег по команде; участвовал в обучении / менторстве коллег; опыт работы с библиотеками машинного обучения; тесное взаимодействие с QA / backend-разработчиками
Проекты   (3 года 2 месяца)
Платформа для исследования удовлетворенности ЮЛ продуктами экосистемы банка
Роль
Data Analyst
Обязанности
Описание проекта: Платформа представляет собой систему, собирающую данные об удовлетворенности клиентов-юридических лиц продуктами экосистемы банка (CSI). Данные на платформу поступают следующим образом: клиент обращается в техническую поддержку с определенной проблемой, после решения которой у клиента просят оценить работу по нескольким критериям по шкале 1-5. Весь текст разговора и оценки поступают в общее хранилище, из которого можно формировать инфографику. Платформа предназначена, в первую очередь, для детекции плохих оценок (alert) и поиска набора признаков, которые имеют наибольший вес при ее выставлении (долгое время ожидания, грубый оператор и т.д.) для обеспечения приемлемой предсказательной способности. Состав команды: 1 PO, 1 BA, 2 Frontend-разработчика, 2 DS, 1 DA Технологии на проекте: Jupyter Notebook, Jira, Confluence, Data Analysis and Machine Learning Libraries (Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn) Задачи/реализованный функционал: Проверка статистических гипотез - влияние признака или группы признаков на оценки пользователей (корреляция Пирсона, ANOVA и т.д.). Дообучение действующей на проекте модели машинного обучения на новых признаках, имеющих статистическую значимость (градиентный бустинг) или построение новых моделей с нуля (например, TF-IDF + LightGBM + nltk / spacy для классификации речи операторов). Оценка возможности использования предобученных моделей машинного обучения на проекте (например, насколько хорошо модель, обученная у коллег из другого проекта на тексте подойдет для анализа речи клиента и/или оператора на нашем). Улучшение детекции неприемлемого контента (например, нецензурной лексики) без методов машинного обучения (доработка уже готовых регулярных выражений или же создание своих с нуля).
Стек специалиста на проекте
Jira, Confluence, Machine learning, Pandas, Numpy, Data Analysis, Matplotlib, Scikit-learn, Seaborn, JupyterNoteBook, AntD
Отрасль проекта
FinTech & Banking
Период работы
Февраль 2023 - Февраль 2024  (1 год 1 месяц)
Платформа для подбора экспертов для оказания образовательных услуг
Роль
Data Analyst
Обязанности
Описание проекта: Платформа для подбора подходящего эксперта, оказывающего образовательную услугу заказчику. Чаще всего это - курсовые, контрольные и т.д. работы, выполнение которых требуется студентам учреждений среднего специального или высшего образования к определенному дедлайну. Система подбора работает следующим образом: заказчик вводит все необходимые сведения (тип, предмет работы, сумма денег, которую он готов заплатить, дедлайн и т.д.) на сайт, после чего он выдает список рекомендованных экспертов, которых можно выбрать. Любое взаимодействие происходит строго на платформе путем внутреннего чата на самой платформе, там же оговариваются все легальные способы оплаты, а также изменения изначального задания: корректировки, отмены, дополнительные услуги и т.д. Состав команды: 1 Team-Lead, 1 DS, 1 DE, 2 DA, 1 PM Технологии на проекте: Jupyter Notebook, Apache Airflow, VSCode / PyCharm, DataGrip / DBeaver, MS PowerBI, Redash, Metabase, Git, Jira, Confluence, Data Analysis and Machine Learning Libraries (Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn, etc.), Notion Задачи/реализованный функционал: Рефакторинг legacy-кода на проекте (удаление лишних и дублирующихся строк кода в репозитории, формирование и/или оптимизация функций для ускорения отработки скриптов в Apache Airflow). Построение новых DAG или тасок для Apache Airflow в зависимости от ТЗ с целью разработки автоматически обновляющихся дашбордов, мониторинг состояния отработки тасок и корректности метрик в построенных дашбордах. За время работы на проекте количество дашбордов в разных системах визуализации выросло почти вдвое. Участие в дизайне и проверке результатов A/B-тестов (сравнение p_value и уровня значимости, иногда bootstrap), обсуждение наличия статистической значимости с коллегами по команде и внутренними заказчиками. Каждый успешный A/B-тест приносил в среднем ~3-5% от выручки. Оценка возможности использования предобученных моделей машинного обучения (Hugging Face + sklearn + PyTorch) на наших проектах - получение метрик и сравнение их с эталонным значением. Совместно с DE разработали non-ML-алгоритм ранжирования желаемых вознаграждений экспертов, который впоследствии был протестирован QA и внедрен в production, что привело к росту выручки на ~7-10%.
Стек специалиста на проекте
Git, Jira, Confluence, Notion, DBeaver, PyCharm, Machine learning, Pandas, Numpy, Data Analysis, Matplotlib, Scikit-learn, Redash, Seaborn, JupyterNoteBook, Microsoft, Apache AirFlow, AntD, DataGrip, PowerBI, metabase, vscode
Отрасль проекта
EdTech
Период работы
Январь 2021 - Февраль 2023  (2 года 2 месяца)
Формат работы
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет

Похожие специалисты

AgroTech • E-commerce & Retail • Logistics & Transport
АП
Антон П.
Минск
Data аналитик
Senior
4,250 Р/час
glue
AWS
Redshift
Numpy
adyen
Git
Power BI
Pandas
Bitbucket
MongoDB
+38

Аналитик данных с опытом работы более 5 лет. Люблю аналитическую работу, умею эффективно интерпретировать, анализировать и прогнозировать данные с помощью современных инструментов. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель - достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, Apache Spark, PySpark, Apache Airflow. Облачные технологии AWS(Redshift, EC2, Lambda, Glue, S3, RDS, DynamoDB, EMR, Athena, etc.). Базы данных PostgreSQL, MySQL, Greenplum, MongoDB, Redis. Машинное обучение и Data Science Pandas, NumPy, Scikit-learn. BI и визуализация данных Power BI, Seaborn, Matplotlib. Моделирование данных Размерное моделирование (схема «звезда», схема «снежинка»), моделирование сущностей-связей, нормализация / денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Bash Scripting. Системы контроля версий Git, Bitbucket, GitHub. Достижения Улучшение предсказания спроса Разработал модель прогнозирования спроса на автомобили в разных районах города, что позволило оптимизировать распределение автомобилей и снизить время ожидания клиентов на 15%. Успешное проведение A/B тестирования Разработал и провел серию А/Б тестов, что позволило оптимизировать пользовательский интерфейс и улучшить конверсию на 7%, принеся дополнительный доход в размере $30,000 в месяц. Анализ эффективности каналов продвижения Провел анализ данных о рекламных каналах и их влиянии на продажи, что позволило оптимизировать бюджет маркетинга и увеличить эффективность кампаний на 15%.

Подробнее
FinTech & Banking • Media
МЗ
Мария З.
Гродно
Data аналитик
Middle+
3,480 Р/час
Anaconda
DBeaver
Flask
IBM DB2
Jupiter Notebook
Keras
Linux
Mathcad
Matplotlib
MS Visual Studio
+46

Свободно владею английским; ответственный и трудолюбивый специалист с глубокими знаниями в области математического моделирования, статистики и эконометрики, что подтверждается соответствующей степенью магистра в области Прикладной математики и информатики; обладаю знаниями в области микро- и макроэкономики. Разработка базы данных Логический и физический дизайн базы данных; Мониторинг производительности БД, Root Cause Analysis; Программирование на PL / SQL, T-SQL, хранимые процедуры, функции; Программирование ETL-процессов с использованием PL / SQL; Data Science: Исследовательский анализ данных с использованием Pandas, Numpy, SciPy; Визуализация данных с использованием Matplotlib, seaborn; Разработка веб-приложений с использованием Flask and Docker; Обучение и тестирование моделей машинного обучения с использованием opencv, scikit-learn, keras, tensorflow, Jupyter Notebook; Data Mining: Предобработка данных: выбросы и пропуски в данных; Построение и оценка регрессионных моделей с применением Логистической регрессии и Дерева принятия решений для задачи банковского скоринга; Text Mining с применением Метода опорных векторов и Наивного Баессовоского классификатора для задачи SMS спам фильтра; Анализ потребительской корзины (Аффинитивный анализ) наа базе сети продовольственных товаров с применением алгоритма Априори на языке R; Разработка интерактивных дашбордов с использованием Tableau, Grafana и Excel Power Query. Дополнительные навыки: Сильные аналитические способности, внимание к деталям, способность быстро учиться.

Подробнее
Manufacturing • Telecom
АЗ
Алексей З.
Москва
Data аналитик
Senior
3,875 Р/час
Apache AirFlow
Apache Spark
Bash
BeautifulSoap
Bootstrap
CSS
Deep Learning
Docker
Flask
Git
+46

О себе: Постоянно учусь и стремлюсь к знаниям. Высокий уровень самоорганизации и любовь к делу помогают каждый день узнавать что-то новое. Воспринимаю сложные задачи и трудности как очередную ступень на пути вверх. Стек компетенций: • Python (Matplotlib, Numpy, Pandas, Google.colab, Tensorflow, Keras, Torch и др.); • SQL/NoSQL (MySQL, PostgreSQL, MongoDB, SQLite); • BI платформы (Tableau, Qlik Sense, Power BI); • Сбор данных (Scrapy, Selenium, BeautifulSoup, Xpath); • Методы аналитики маркетинговойактивности, системы web-аналитики; • GIt; • Bash Первую программу для управления заказами и складом для компании занимающийся доставкой воды и кулеров, написал в 2005 году. Работает до сих пор. Писал роботов для биржевой торговли на mql4. Заинтересовался ИИ и пошел учиться в Университет ИИ. Хобби - искусство, графический дизайн, фотография.

Подробнее

Недавно просмотренные специалисты

EdTech • FinTech & Banking
ДС
Дмитрий С.
Санкт-Петербург
Data аналитик
Middle+
3,000 Р/час
PostgreSQL
Git
Jira
Confluence
Python
Notion
DBeaver
PyCharm
Machine learning
Hive
+26

работал в связке Python + PostgreSQL для написания самообновляющихся в Apache Airflow скриптов для дашбордов MS PowerBI, Redash, Metabase, поддерживал их состояние, исправлял ошибки в случае их возникновения; построение отчетов в вышеуказанных пакетах визуализации согласно ТЗ; участвовал в дизайне и проверке результатов простых A/B-тестов (сравнение конверсий, изменений средних значений), обсуждал их результаты с внутренними заказчиками; выполнял ad-hoc запросов внутренних заказчиков в формате .csv/.xlsx/.pkl по мере необходимости; поиск инсайтов и точек роста на проектах совместно с командой (brainstorm); оценивал качество моделей машинного обучения - самостоятельно построенных или предобученных; участвовал в code review коллег по команде; участвовал в обучении / менторстве коллег; опыт работы с библиотеками машинного обучения; тесное взаимодействие с QA / backend-разработчиками

Подробнее