Павел К. Data инженер, Middle+

ID 19802

ПК

Павел К.

Мужчина

Россия, Санкт-Петербург, UTC+3

Ставка

3 246,75 Р/час

НДС не облагается

Специалист доступен с 31 августа 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data инженер

Грейд

Middle+

Навыки

Apache AirFlow

Big Data

ClickHouse

DataLens

elt

ETL

Hadoop

HDFS

Microsoft

MS PowerPoint

PostgreSQL

Power BI

Python

SQL

Tableau

Анализ данных

Анализ рынка

Аналитические исследования

Аналитическое мышление

Базы данных

Деловая коммуникация

Подготовка и проведение презентаций

Прогнозирование

Работа с базами данных

Работа с большим объемом информации

Статистический анализ

анализ больших данных

СУБД

Отрасли

FinTech & Banking

Insurance

Проекты (3 года 4 месяца)

Проект: Aston

Роль

Data Аналитик

Обязанности

Достижения: • Разработал модель прогнозирования спроса на облигации, что позволило повысить эффективность таргетированных предложений и увеличить конверсию за счет более точной персонализации • Оптимизировал процессы обработки данных, что позволило повысить производительность и сократить время анализа данных на 30% Описание проекта: Брокер-консультант, с помощью которого реализуются таргетированные предложения для клиентов о покупке ценных бумаг. На основании сырых данных, загруженных в Data Warehouse, подготавливаются профилированные аналитические таблицы, включающие в себя данные о клиентах, их аккаунтах, ценных бумагах и операциях вне портфеля. Состав Команды: инженеры, аналитики, архитектор Задачи: • Анализ и интерпретация данных с использованием инструментов визуализации, таких как Power BI и MS Excel, для представления результатов в понятной и наглядной форме • Разработка и оптимизация SQL-запросов для извлечения данных из баз данных PostgreSQL, ClickHouse, GreenPlum • Создание и поддержка схем данных в DrawSQL для структурирования и визуализации потоков данных • Работа с большими данными и выполнение ETL- процессов с использованием Apache Hadoop и Apache Spark • Разработка и выполнение скриптов на Python с использованием библиотек Pandas и NumPy для обработки и анализа данных • Применение PySpark для обработки и анализа больших объемов данных в распределенных системах • Управление контейнерами Docker для настройки и развертывания среды анализа данных • Систематизация и автоматизация процессов анализа данных с использованием Jupyter Notebook • Написание и поддержка скриптов на языке Linux для автоматизации задач • Участие в проектах в рамках Agile-методологий(Scrum, Kanban) с использованием инструментов Jira и Confuence для управления задачами и документирования • Проведение анализа результатов и предоставление рекомендаций на основе данных для поддержки принятия бизнес-решений Стек: PostgreSQL, ClickHouse, GreenPlum

Стек специалиста на проекте

PostgreSQL, Docker, Jira, Confluence, Python, Scrum, Power BI, Linux, Kanban, ClickHouse, Pandas, Numpy, GreenPlum, Apache Hadoop, Apache Spark, MS Excel, JupyterNoteBook, Microsoft, PySpark, SQL запросы, Data Warehouse, DrawSQL, agale

Отрасль проекта

FinTech & Banking

Период работы

Июнь 2024 - Декабрь 2024 (7 месяцев)

Проект: Тензор

Роль

Data-аналитик

Обязанности

Описание проекта: Инструмент веб-панели, который объединяет внешний источник данных, агрегирует и уточняет их, извлекает информацию и отображает ее в удобном современном интерфейсе для лиц, принимающих решения. Задачи: • Создание документов с анализом данных, включая отчеты, дашборды и рекомендации, а также документы картирования данных и технические спецификации для процессов ETL/ELT • Разработка сложных SQL-запросов для извлечения и анализа данных из PostgreSQL, Greenplum и ClickHouse • Разработка DMD/ERD для понимания структуры данных и отношений с использованием DrawSQL • Разработка сценариев очистки и трансформации данных, включающих способы устранения пропущенных значений, аномалий и дубликатов • Анализ данных в Hadoop-экосистеме, использование Apache (Hadoop, Hive, Hue) для аналитики больших объемов данных, хранящихся в HDFS • Понимание основных архитектурных принципов КХД; • Моделирование dds слоя; • Разработка Spark-скриптов для обработки и анализа данных в реальном времени и пакетной обработки • Создание интерактивных дашбордов и отчетов для визуализации результатов анализа, используя BI-инструменты и библиотеки Python для визуализации (Matplotlib, Seaborn) • Отслеживание и анализ качества данных, работа с инженерами данных для оптимизации процессов сбора и обработки данных • Анализ производительности SQL-запросов и Spark-задач, оптимизация для улучшения скорости и эффективности обработки данных • Оптимизация производительности ETL-процессов на больших объемах данных с PySpark • Сотрудничество с инженерами данных, разработчиками, бизнес-аналитиками и заинтересованными сторонами для обеспечения соответствия аналитических решений бизнес-целям • Разработка и представление презентаций и отчетов по результатам анализа для поддержки принятия решений на основе данных Достижения: • На основании глубокого анализа данных предложил и реализовал решение, которое помогло компании сократить операционные расходы на 15% за счет оптимизации цепочки поставок или улучшения планирования ресурсов • Провел анализ данных по поведению клиентов и сегментация целевой аудитории, что позволило увеличить конверсию в рамках маркетинговой кампании на 10% Стек: PySpark Python

Стек специалиста на проекте

PostgreSQL, Python, Apache, Hive, ClickHouse, Hadoop, Анализ данных, Matplotlib, GreenPlum, Seaborn, Specifications, HDFS, PySpark, SQL запросы, DrawSQL, BI инструменты, hue, ETL ELT

Отрасль проекта

Insurance

Период работы

Сентябрь 2021 - Июнь 2024 (2 года 10 месяцев)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Похожие специалисты

FinTech & Banking • IoT • Manufacturing

Data Engineer с более чем 7 годами опыта в разработке ETL-процессов, аналитических витрин и интеграций данных. Специализируется на автоматизации пайплайнов данных с использованием Apache Airflow, Apache NiFi, dbt и других инструментов. Имеет опыт работы с MPP-базами (Greenplum, Snowflake, Teradata), большими данными (Hadoop, Kafka) и BI-инструментами (Datalens, Power BI, Looker). Разрабатывал решения для классификации контента с использованием ML-моделей (CatBoost) и LLM, а также интеграции с 1С, Salesforce и Zendesk. Руководил командами, оптимизировал процессы миграции данных и обеспечивал контроль качества данных. Обладает навыками построения дашбордов, оптимизации производительности баз данных и разработки методологий валидации данных. Технические компетенции Разработка и миграция ETL-процессов (Airflow, NiFi, dbt, Informatica Power Center). Построение аналитических витрин для BI-решений (Datalens, Power BI, Looker, Superset). Интеграция данных из внешних источников (API, веб-сайты, облачные хранилища, 1С). Оптимизация производительности MPP-баз (Greenplum, Snowflake, Teradata). Разработка и обучение ML-моделей для классификации контента (CatBoost, LLM). Настройка мониторинга и контроля качества данных. Автоматизация миграции данных и очистка данных. Работа с большими данными (Hadoop, Kafka, Ytsaurus). Разработка дашбордов и визуализация данных. Руководство командами и постановка задач разработчикам.

Data Engineering: Проектирование и разработка высоконагруженных ETL/ELT-процессов, оркестрация (Airflow), оптимизация производительности. Базы данных: Глубокие знания SQL, оптимизация сложных запросов. Опыт с MPP-системами (GreenPlum, Teradata), традиционными СУБД (Oracle, PostgreSQL, MS SQL Server) и Hadoop-экосистемой (HDFS, Hive, Impala). Программирование: Python (разработка ETL), Java (интеграционные шины, Spring Boot), опыт с Scala-окружением (Apache Spark, Kafka). Инструменты: Airflow, dbt, Apache Kafka, Trino, Apache Spark, Debezium, Pentaho, Talend DI. Инфраструктура: Kubernetes, Docker, Yandex Cloud (YC), S3, опыт развертывания и миграции на container-based инфраструктуру Сертификаты обучения: Informatica, SAS DIS, Oracle, Golden Gate

Подробнее

E-commerce & Retail • FinTech & Banking

Data Engineer с опытом работы на проектах в сфере E-commerce & Retail и FinTech & Banking. На проектах занимался разработкой аналитических платформ, DWH и систем аналитики. Обязанности: - разработка ETL-пайплайнов в Apache Airflow и Apache NiFi; - обработка больших объёмов данных с использованием PySpark, Pandas, NumPy; - оптимизация интеграции Hadoop (HDFS); - агрегация данных в ClickHouse для BI-отчётов; - визуализация данных в Power BI и Superset; - мониторинг и оптимизация производительности запросов в Snowflake; - интеграция PostgreSQL и MS SQL; - использование Docker и Kubernetes для контейнеризации ETL-компонентов; - создание детальных технических проектных документов; - сотрудничество с командой аналитиков; - проведение тестирования системы; - настройка CI/CD-конвейеров с помощью GitLab CI/CD.

Подробнее

E-commerce & Retail • FinTech & Banking

Владлена — data-инженер уровня middle+ из Минска (Беларусь). Обладает опытом работы с различными инструментами и технологиями, включая Alembic, Apache AirFlow, AWS, Docker, ETL, FastAPI, GitHub Actions, GitLab CI/CD, Python, SQLAlchemy и другие. Владлена участвовала в нескольких проектах в сферах FinTech & Banking и E-commerce & Retail: - Обрабатывала и трансформировала большие данные из разных источников в хранилище. - Разрабатывала и оптимизировала ETL-пайплайны на Apache Airflow, Python и SQL. - Интегрировала данные из различных источников в централизованное хранилище. - Оптимизировала SQL-запросы в Snowflake, PostgreSQL и других базах данных. - Настраивала механизмы ретраев, SLA и уведомлений в Airflow. - Автоматизировала процессы очистки, нормализации, дедупликации и агрегации данных.

Подробнее

FinTech & Banking • HRTech

● Опыт работы на коммерческих проектах более 3,5 лет ● Обладает обширными знаниями в области проектирования и оптимизации ETL/ELT-процессов, разработки и поддержки DWH, а также работы с большими данными ● Специализируется на использовании современных технологий для обработки, хранения и анализа данных. ● Занимается проектированием и реализацией ELT, ETL-пайплайнов, работает с DWH для аналитики и отчетности. ● Имеет опыт написания и оптимизации SQL- запросов к БД (Oracle) ● Умеет настраивать и поддерживать кластеры ClickHouse; организовывать ETL-процессы для витрин данных. ● Занимается оптимизацией витрин данных на Hadoop и Greenplum; автоматизацией составления S2T для аналитиков ● Имеет опыт разработки на Python и Golang

Подробнее

Недавно просмотренные специалисты

Government & Public Sector • HRTech

React testing library

Постоянно совершенствую навыки программирования через решение алгоритмических задач (1700+ решенных задач на LeetCode), что помогает мне эффективно решать сложные технические проблемы в реальных проектах. Ссылка на профиль: https://leetcode.com/u/Vladislav-sys/

Подробнее

Government & Public Sector

Командная разработка, работа с GIT. Навыки чтения, написания и отладки SQL-запросов. Разработка и доработка функционала, unit-тестирование и устранение багов.

Описание пока отсутствует

Подробнее

E-commerce & Retail • EdTech • FinTech & Banking • GameDev • LifeStyle • Media • Realty & Constructoring • Urban technology • VR/AR

Инициативный веб-дизайнер ищу работу с интересными проектами, которая позволит совершенствоваться и реализовать свой опыт в области аналитической деятельности, знаний, навыков в UX/UI Навыки WEB аналитики UX/UI дизайна Дизайн интерфейсов Usability Граф, дизайна (композиция, цветоведение, типографика) Организационные работы в команде: -Менеджмента -Эмоционального интеллекта -Рефлексии опыта

Подробнее

Cloud Services • E-commerce & Retail

Java инженер-программист с хорошим опытом в разработке веб-приложений, большую часть карьеры работала как участник бэкенд команд. Умею расставлять приоритеты для достижения ближайших и долгосрочных целей. Я фокусируюсь на успехе и ценности для бизнеса. Также я быстро учусь и способна погружаться в новые технологии, могу работать в незнакомых областях.

Подробнее

Павел К. Data инженер, Middle+

Похожие специалисты

Недавно просмотренные специалисты

Подпишитесь на нашу рассылку