Павел З. Data инженер, Middle+

ID 30374
ПЗ
Павел З.
Мужчина, 25 лет
Россия, Москва, UTC+3
Ставка
3 468,09 Р/час
вкл. НДС 5% (128.57 Р)
Специалист доступен с 14 сентября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data инженер
Грейд
Middle+
Навыки
aiohttp
Apache AirFlow
Apache Kafka
Apache Spark
Apache Superset
Bash
CI/CD
ClickHouse
DataLens
DBT
Docker
Git
GreenPlum
Hive
MongoDB
Numpy
Pandas
PostgreSQL
Python
Requests
Scala
Selenium
sftp
SQL
Trino
Отрасли
FinTech & Banking
Manufacturing
Telecom
Знание языков
Английский — B1
Главное о специалисте
Data Engineer с более чем 3 годами практики в проектировании, внедрении и оптимизации ETL-процессов и аналитических хранилищ. Специализируется на построении масштабируемых систем обработки данных, автоматизации пайплайнов, обеспечении качества данных, наставничестве и взаимодействии с бизнес-подразделениями для достижения высоких результатов.
Проекты   (3 года 5 месяцев)
Разработка и сопровождение аналитических хранилищ и ETL-пайплайнов на проекте банка ТОП-10
Роль
Data Engineer
Обязанности
● Разработка архитектуры аналитических хранилищ с учетом требований масштабируемости и стабильности ● Проектирование и сопровождение ETL-процессов для обработки больших объемов данных ● Автоматизация и управление пайплайнами с помощью Docker и CI/CD для обеспечения надежного развертывания ● Внедрение и поддержание процессов контроля качества данных на уровне разработки и эксплуатации ● Оптимизация рабочих нагрузок на Spark и улучшение производительности SQL-запросов для эффективной обработки больших данных ● Поиск, визуализация и интерпретация полезных сигналов и аномалий в данных с целью выявления проблем качества (Data Quality), мошенничества, ошибок интеграции или бизнес-возможностей ● Организация эффективного взаимодействия с аналитиками и бизнес-заказчиками для сбора и уточнения требований ● Наставничество и обучение младших специалистов, проведение код-ревью и помощь в решении технических проблем ● Участие в планировании задач и управлении Agile-спринтами в команде
Достижения
● Руководил внедрением системы контроля качества данных, снизив количество ошибок загрузки на 20%, что повысило доверие к аналитическим отчетам ● Оптимизировал ETL-процессы, сократив время обработки данных на 30%, ускорив выпуск аналитических витрин ● Внедрил стандартизацию и контейнеризацию пайплайнов, повысив отказоустойчивость и повторяемость процессов, сократив время восстановления после инцидентов на 40% ● Организовал обмен знаниями в команде, повысив уровень технической экспертизы и качество кода
Стек специалиста на проекте
Docker, SQL, Scala, Apache Spark, CI/CD, DBT
Отрасль проекта
FinTech & Banking
Период работы
Ноябрь 2024 - Август 2025  (10 месяцев)
Проектирование и развитие BI-витрин на платформе МТС Диджитал
Роль
Data Engineer
Обязанности
● Разработка и поддержка витрин данных для BI с применением DWH технологий ● Анализ больших объемов структурированных и неструктурированных данных с целью выявления скрытых закономерностей и трендов, поиск, визуализация и интерпретация полезных сигналов и аномалий в данных ● Администрирование и оптимизация структур хранения данных в Greenplum, включая индексацию и партиционирование ● Оркестрация ETL процессов с помощью Apache Airflow и контроль хранимых процедур ● Интеграция внешних систем и ресурсов для полноты данных с использованием Kafka, PostgreSQL и SFTP ● Рефакторинг и оптимизация SQL-запросов и Spark заданий для ускорения вычислительных процессов ● Обеспечение мониторинга и оповещений для поддержания стабильности пайплайнов ● Организация рабочих встреч с аналитиками и бизнес-подразделениями для анализа требований ● Обучение и наставничество новичков в команде
Достижения
● Оптимизировал структуру хранения данных в DWH, уменьшив занимаемый объем на 32%, что снизило инфраструктурные затраты ● Сократил время вычисления сложных аналитических витрин на 37%, повысив скорость принятия решений бизнесом ● Настроил стабильную работу пайплайнов интеграции с внешними сервисами, сократив время доставки данных на 15% ● Внедрил практики мониторинга и автоматического оповещения, повысив стабильность дата процессов на 25% и снизив количество простоев
Стек специалиста на проекте
PostgreSQL, SQL, Hive, Spark, ClickHouse, GreenPlum, Kafka, Apache AirFlow, sftp
Отрасль проекта
Telecom
Период работы
Апрель 2024 - Ноябрь 2024  (8 месяцев)
Автоматизация сбора и визуализации данных рекламных кампаний и разработка DWH
Роль
ETL-разработчик
Обязанности
● Автоматизация сбора, парсинга и агрегации данных из различных источников с использованием Python и библиотек ● Загрузка и поддержка актуальности данных в NoSQL и реляционных хранилищах, включая MongoDB и PostgreSQL ● Разработка и сопровождение ETL-процессов для формирования аналитических витрин и отчетности ● Создание визуализаций и дашбордов для бизнес-заказчиков с использованием Apache Superset и Datalens ● Оркестрация и автоматизация пайплайнов с Apache Airflow для регулярных процессов ● Выполнение ad-hoc аналитики и автоматизация отчетности в Excel ● Взаимодействие с заказчиками для уточнения требований и адаптации аналитических решений ● Участие в планировании развития архитектуры DWH и оценке задач
Достижения
● Спроектировал и внедрил автоматизированный процесс оценки эффективности рекламных кампаний, сократив ручной труд на 50% и повысив точность аналитики ● Разработал систему автоматической оценки эффективности работы государственных пабликов, повысив качество мониторинга и отчетности ● Автоматизировал формирование отчетности для высших органов власти, сэкономив более 360 часов рабочего времени ежемесячно ● Создал масштабируемую архитектуру DWH подразделения, обеспечив возможность расширения аналитических витрин и поддержки новых требований
Стек специалиста на проекте
PostgreSQL, Python, Selenium, MongoDB, aiohttp, Requests, CSV, MS Excel, Microsoft, Apache AirFlow, DataLens, Apache Superset
Отрасль проекта
Manufacturing
Период работы
Апрель 2022 - Апрель 2024  (2 года 1 месяц)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Московский педагогический государственный университет, Москва
Специальность
Институт истории и политики, Проектная и экспертно-аналитическая деятельность в социогуманитарной сфере (Магистр)
Завершение учебы
2023 г.
Высшее
Учебное заведение
Московский педагогический государственный университет, Москва
Специальность
Институт истории и политики, Политология (Бакалавр)
Завершение учебы
2021 г.

Похожие специалисты

IoT • Manufacturing • Telecom
ПЗ
Павел З.
Москва
Data инженер
Senior
3 896,1 Р/час
Agile
aiohttp
Apache AirFlow
Apache Spark
Apache Superset
arenadata
Bash
CI/CD
ClickHouse
DataLens
+47

Data-инженер с опытом работы более 3 лет в разработке ETL-процессов и аналитических хранилищ данных. Специализируется на создании и оптимизации ETL-пайплайнов, разработке аналитической отчетности и интеграции данных с использованием Python, Spark, Airflow, Greenplum, PostgreSQL и других инструментов. Имеет опыт миграции хранилищ, настройки CI/CD и работы с большими объемами данных. Обладает навыками автоматизации процессов, аналитическим мышлением и стремлением к созданию эффективных решений. Коммуникабелен, ответственен и ориентирован на результат. Технические компетенции: Разработка и оптимизация ETL-пайплайнов с использованием Python, PySpark, Airflow, Dbt. Создание и поддержка аналитических хранилищ данных (Greenplum, PostgreSQL, Arenadata DB). Интеграция данных с использованием REST API, Kafka, ClickHouse, SFTP. Парсинг данных из открытых источников (requests, selenium, aiohttp). Визуализация данных в Apache Superset и Datalens. Настройка CI/CD процессов для автоматизации развертывания. Разработка хранимых процедур (PL/pgSQL) и скриптов на Bash. Оптимизация производительности хранилищ и ETL-процессов. Формирование архитектурных решений для миграции данных. Оптимизация произвожительности MPP (Greenplum, Snowflake, Teradata) Работа с большими объемами данных и их обработка (pandas, NumPy, SQL).

Подробнее
E-commerce & Retail • FinTech & Banking
КЯ
Кирилл Я.
Минск
Data инженер
Middle+
3 545,15 Р/час
aks
Apache AirFlow
Apache Kafka
Apache NiFi
Apache Spark
Apache Superset
AWS
Azure
Azure SQL
Bitbucket
+50

Data Engineer с опытом работы на проектах в сфере E-commerce & Retail и FinTech & Banking. На проектах занимался разработкой аналитических платформ, DWH и систем аналитики. Обязанности: - разработка ETL-пайплайнов в Apache Airflow и Apache NiFi; - обработка больших объёмов данных с использованием PySpark, Pandas, NumPy; - оптимизация интеграции Hadoop (HDFS); - агрегация данных в ClickHouse для BI-отчётов; - визуализация данных в Power BI и Superset; - мониторинг и оптимизация производительности запросов в Snowflake; - интеграция PostgreSQL и MS SQL; - использование Docker и Kubernetes для контейнеризации ETL-компонентов; - создание детальных технических проектных документов; - сотрудничество с командой аналитиков; - проведение тестирования системы; - настройка CI/CD-конвейеров с помощью GitLab CI/CD.

Подробнее
FinTech & Banking • Logistics & Transport • Media
СБ
Сергей Б.
Минск
Data инженер
Senior
3 896,1 Р/час
Apache AirFlow
Apache Hadoop
Apache Kafka
Apache Spark
Bash scripting
ClickHouse
Cloud Functions
Data
DataLens
Docker
+40

Дата инженер / Системный Аналитик с опытом работы более 5 лет. Я являюсь опытным специалистом, которому нравится создавать новаторские и эффективные решения. У меня обширный опыт в разработке и глубокое понимание современных технологий. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель – достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (DataLens, Object Storage, Virtual Machines, Data Proc, Cloud Functions, Managed Kubernetes, Managed Service for PostgreSQL, KMS, IAM, Monitoring). Базы данных PostgreSQL, Greenplum, Oracle, ClickHouse, MongoDB, Redis. Брокеры сообщений Apache Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда»,, Схема «Снежинка»,), Сущность-Связь (ER) Моделирование, Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Kubernetes, Bash скриптинг. Системы контроля версий Git, GitLab, GitHub.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • FinTech & Banking • Manufacturing
ЛМ
Лев М.
Vrane
Бизнес/системный аналитик
Senior
3 724,98 Р/час
level
chatgpt3
NX
UI
AI
langchain
CH
ES
language
Zephyr
+71

Лев — бизнес/системный аналитик с 4-летним опытом работы в проектах. Он обладает глубокими знаниями и навыками в области разработки и анализа программного обеспечения, а также в смежных областях, таких как бизнес-анализ, управление проектами и психология. Лев работал над проектами в различных отраслях, включая e-commerce & retail, fintech & banking и manufacturing. В его портфолио есть проекты по интеграции искусственного интеллекта в индустрии дейлифэнтэзи спорта, диджитал-трансформации в Sberbank CIB и автоматизации отчётности в «Сибинтеке» (Роснефть). На каждом проекте Лев выполнял широкий спектр задач, включая анализ требований, разработку технических спецификаций и требований, тестирование, анализ данных, взаимодействие с заказчиками и пользователями, дизайн баз данных и интерфейсов.

Подробнее
FinTech & Banking • Manufacturing
КХ
Кирилл Х.
Белгород
Java разработчик
Middle
2 857,14 Р/час
PostgreSQL
Git
SQL
Oracle
Spring Boot
Maven
GitLab
Apache
VBA
Kafka
+14

Java-разработчик с опытом работы на проектах в сфере FinTech более 2х лет. Специализация: - Spring Boot; - SQL; - Liquibase; - Apache Kafka; - Maven; - Git; - GitLab; - Criteria API/Specification; - Java 11. Опыт работы: - Проект «Разработка сервиса SBERCONNECT» (отрасль — FinTech & Banking). Роль — разработчик Java. Выполненные работы: оптимизация и написание запросов PostgreSQL с помощью SQL и Criteria API, разработка Spring Boot приложения, интеграция с другими сервисами по REST API, написание скриптов для Liquibase, доработка UI с помощью HTML и Thymeleaf. - Работы на МРСК Урал, Сибур, РусАгро, Магнит, НЛМК (отрасль — Manufacturing). Роль — разработчик ABAP. Выполненные работы: знание предметной области IS-U, HCM, MM, WF, GRC, SD, работа с отчётами, выгрузка данных в формате MS Word/Excel/PDF, объектно-ориентированное программирование, использование BAPI и BADI.

Подробнее
E-commerce & Retail • EdTech • FinTech & Banking • FoodTech
ДП
Дмитрий П.
Санкт-Петербург
QA авто
Senior
3 701,3 Р/час
Selenium WebDriver
Redmine
HTML5
Grafana
IOS
PHP
AWS
GitLab
MS Windows
Базы данных
+65

Hard skills: ● Функциональное тестирование прикладного программного обеспечения и веб-ресурсов в различных средах и конфигурациях. ● Внешнее тестирование ● Внутреннее тестирование и тестирование API. ● Тестирование на мобильных устройствах (iOS, Android) ● Автоматические тесты с помощью Python->Pytest (Selenium Webdriver). ● Также Java+Selenium+Allure Blackbox testing ● Навыки создания и формализации процессов разработки и тестирования ● Создавать собственные сценарии и отчеты о тестировании. ● Кроссбраузерное тестирование. ● Разработка выпуска ● Настройка и работа с CI/DI ● Правильное представление ошибок с помощью алгоритма повторных попыток. ● Работа с любыми ошибками, хранящимися в системах ● Разработка через итерацию ● Использование программного обеспечения для шифрования, сертификатов, виртуальных машин и сети. ● Знание языков программирования (HTML,CSS,PHP,JavaScript,mySQL) ● Поддержка и консультация клиентов ● SCRUM-подход ● Использую Slack, hipchat и т. д. для взаимодействия с командой. Soft skills: ● Коммуникация с командой разработчиков Research ● Критическое мышление ● Исследования ● Нестандартное мышление ● Свободный метод поиска Инструменты: Code store - GitHub, Gitlab, BitBucket, TFS Performance tests - Grafana, LoadRunner, Jmeter, Yandex tank Bug tracker - Redmine, Trac, Assembla, BugZilla, Jira,Trello, Youtrack, Bitrix24, DataBase - MySQL, PostgresQL, MS SQL Server, DBeaver CI/CD systems - Teamcity, CircleCI, Heroku, Codeship Code - Python, HTML,CSS, PHP, JavaScript, Cypress framework, Jest, Puppeteer OS - XX MS Windows Server, MS SQL Server, MS IIS Server, Linux, Ubuntu VM solutions - Docker, VMWare, VirtualBox, HyperV, Parallels Saas store - AWS, Digital ocean, Hetzner, MS Azure

Подробнее