Максим П. Инженер БД, Middle+

ID 20395

МП

Максим П.

Мужчина

Беларусь, Минск, UTC+3

Ставка

4 545,45 Р/час

НДС не облагается

Специалист доступен с 10 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Инженер БД

Грейд

Middle+

Навыки

Apache AirFlow

Apache Hadoop

apache hive

Apache NiFi

Apache Spark

athena

AWS

Bash scripting

Bitbucket

ClickHouse

cloud

Cloud Functions

CloudWatch

Data

DataLens

Docker

Docker Compose

EKS

etc

functions

Git

GitHub

GreenPlum

HDFS

Java

Jenkins

Kubernetes

Lambda

MongoDB

Numpy

Object

Oracle

Pandas

PostgreSQL

PySpark

Python

RDS

Redis

SNS

SQL

SQS

Steps

Storage

Vault

Yandex Cloud

Моделирование

схема звезда

схема снежинка

нормализация денормализация

emr

msk

proc

compute

Отрасли

AgroTech

Cloud Services

Travel, Hospitality & Restaurant business

Знание языков

Английский — B2

Главное о специалисте

Дата Инженер баз данных с опытом работы более 5 лет. Квалифицированный специалист с обширным опытом работы в области проектирования, разработки и оптимизации решений для обработки и хранения данных. Уверенно использую широкий стек технологий, включая Java, Python, SQL, Apache Airflow, Hadoop, HDFS, Hive, Yandex Cloud и AWS, для реализации сложных проектов и автоматизации процессов. Обладаю навыками разработки и управления крупномасштабными системами, такими как DWH и Data Lake, а также оптимизацией ETL/ELT-процессов для повышения производительности. Внимательно слежу за последними тенденциями в отрасли, что позволяет внедрять инновационные решения для достижения наилучших результатов. Стремлюсь развивать свои компетенции и вносить значительный вклад в реализацию стратегических целей команды и компании.

Проекты (6 лет 3 месяца)

ПЛАТФОРМА ДАННЫХ ДЛЯ СЕТИ РЕСТОРАНОВ БЫСТРОГО ПИТАНИЯ

Роль

Дата Инженер

Обязанности

В рамках проекта мы создали масштабируемую инфраструктуру для интеграции данных из различных источников (потоковые и событийно-управляемые данные, данные о рекламе, логистике и т. д.) в режиме реального времени. Обязанности ● Написание пользовательских операторов, хуков, сенсоров и триггеров для Apache Airflow при помощи плагинов; ● Автоматизировал задачи обработки данных в Yandex Cloud с использованием Yandex Cloud Functions и Airflow; ● Разрабатывал и оптимизировал архитектуру Data Lake для хранения и обработки больших объемов данных; ● Разработал ETL процессы для загрузки данных в Greenplum, минимизировав время обработки больших наборов данных ● Разрабатывал пайплайны данных в Apache Airflow для обеспечения обработки данных в Data Lake и DWH; ● Автоматизировал тестирование ETL-процессов с помощью специализированных библиотек Python, таких как unittest и pytest; ● Реализовал процессы загрузки данных в DWH с учётом бизнес-логики и аналитических требований; ● Работал с различными форматами данных, включая CSV, JSON, Parquet, Avro, и оптимизировал их хранение и обработку; ● Разрабатывал сложные процедуры на PL/pgSQL для автоматизации расчёта метрик и бизнес-логики в PostgreSQL; ● Автоматизировал создание и управление версиями образов Docker с использованием инструментов CI/CD, а именно - Jenkins; ● Разрабатывал Spark-процессы для обработки данных в реальном времени; ● Писал SQL-функции для расчёта агрегатов с нестандартной логикой, оптимизируя сложные вычисления; ● Внедрил механизмы бэкапов для Kubernetes-кластера; ● Работа с особенностями СУБД PostgreSQL (структура каталога, статистика использования, план запроса, транзакции, журнал предзаписи) ● Настроил эффективное распределение данных между сегментами Greenplum для улучшения производительности; ● Разработал сложные SQL-запросы для обработки больших объемов данных в реальном времени; ● Выполнял аудит производительности Greenplum кластера, устраняя проблемы с памятью и процессорами; ● Написал исчерпывающую документацию по всем процессам автоматизации тестирования; ● Применение SQL-триггеров и процедур для автоматизации бизнес-логики; ● Тесное сотрудничество с командой DevOps для создания комплексных и надежных пайплайнов CI/CD.

Стек специалиста на проекте

PostgreSQL, Docker, XML, SQL, Python, Jenkins, Kubernetes, GitHub, Data, PowerShell, Pandas, Numpy, GreenPlum, Object, Apache Spark, Cloud Functions, Microsoft, Storage, Docker Compose, Apache AirFlow, Redis, Yandex Cloud, PySpark, cloud, DataLens, Bash scripting, Identity Server

Отрасль проекта

Travel, Hospitality & Restaurant business

Период работы

Декабрь 2022 - По настоящее время (2 года 11 месяцев)

ФЕРМЕРСКИЙ ПРОЕКТ

Роль

Дата Инженер

Обязанности

Программное решение для сельского хозяйства, позволяющее клиентам и их пользователям получать важную информацию о земельных ресурсах в выбранных сельскохозяйственных районах. Оно объединяет в себе передовые технологии и надежную аналитику данных. Обязанности ● Решение технических вопросов, связанных с данными (в частности, вопросы миграции данных / ETL); ● Написание SQL-запросов и сложных аналитических процедур, их анализ и оптимизация; ● Оптимизировал ETL-процессы для минимизации времени загрузки данных в DWH; ● Разрабатывал, тестировал и настраивал пайплайны данных в Apache NiFi для автоматизации потоков данных между различными системами; ● Использовал Apache NiFi для мониторинга и обработки данных в реальном времени, включая фильтрацию, преобразование и маршрутизацию данных; ● Оптимизировал запросы для ClickHouse, чтобы уменьшить время обработки больших объемов данных в OLAP-системах; ● Настроил механизмы уведомлений в Airflow для отправки оповещений в случае ошибок; ● Управлял схемами баз данных в Oracle, включая настройку ролей и пользователей; ● Использовал Jenkins для автоматизации процессов сборки, тестирования и развертывания; ● Оптимизировал схемы хранения данных в ClickHouse для уменьшения объема хранимой информации; ● Адаптировал существующий SQL-код под современные стандарты базы данных; ● Работал с Jenkins-плагинами для расширения функциональности пайплайнов; ● Разрабатывал архитектуру CI/CD для автоматизации процесса релиза; ● Настроил интеграцию Airflow с системами логирования для отслеживания выполнения задач; ● Настраивал Kubernetes кластеры в облачных средах - AWS EKS; ● Переработка схемы "снежинка" в DWH для повышения аналитического потенциала и оптимизации существующих аналитических запросов; ● Документировал сложные PL/SQL-коды для облегчения их поддержки. ● Работа с особенностями СУБД PostgreSQL. ● Работа с принципами построения составных SQL запросов (CTE, рекурсивные, вложенные); ● Анализ журналы БД, тяжелых запросов, узких мест в производительности БД

Стек специалиста на проекте

Docker, XML, SQL, Python, Oracle, Bitbucket, MongoDB, Jenkins, Kubernetes, AWS, etc, ClickHouse, Lambda, Pandas, Numpy, Apache Spark, T-SQL, Docker Compose, Apache AirFlow, SQS, S3, SNS, CloudWatch, Apache NiFi, EKS, PySpark, Steps, RDS, Bash scripting, functions, athena

Отрасль проекта

AgroTech

Период работы

Апрель 2021 - Ноябрь 2022 (1 год 8 месяцев)

СИСТЕМА ВЫСТАВЛЕНИЯ СЧЕТОВ

Роль

Дата Инженер

Обязанности

Биллинговая система для поставщиков цифровых услуг, позволяющая хранить и контролировать финансовую и техническую информацию, а также информацию об оборудовании. Проект представляет собой автоматизированную систему учета, обработки, анализа информации о финансовых операциях и построения финансовых отчетов за определенный период времени для отслеживания динамики. Обязанности ● Написание и оптимизация сложных SQL-запросов; ● Создание пайплайнов с использованием Apache Spark; ● Разработка и оптимизация ETL/ELT процессов для построения и поддержки хранилищ данных (DWH); ● Интеграция данных из множества источников с использованием Java; ● Загрузка данных из различных источников в Hadoop HDFS; ● Установка и настройка Greenplum для поддержки миграции данных из Data Lake. ● Обработка и проверка целостности данных перед загрузкой; ● Управление ресурсами Hadoop, мониторинг производительности, настройка кластеров для повышения их устойчивости и производительности; ● Реализация механизмов мониторинга и обработки ошибок в пайплайнах на основе Java; ● Работа с разными форматами данных (JSON, CSV, Parquet, Avro, ORC и другими); ● Использование Apache Airflow для планирования заданий ELT/ETL; ● Организация данных в соответствии с требованиями проекта; ● Развертывание и управление кластерами обработки данных, такими как Apache Hadoop и Apache Spark; ● Тестирование SQL-баз данных и устранение ошибок; ● Разработка и внедрение механизмов резервного копирования и восстановления данных для обеспечения их надежности и доступности; ● Написание Bash-скриптов и Dockerfile; ● Очистка данных с использованием Pandas. ● Работа с принципами построения составных SQL запросов (CTE, рекурсивные, вложенные); ● Анализ журналы БД, тяжелых запросов, узких мест в производительности БД

Стек специалиста на проекте

PostgreSQL, Docker, Java, SQL, Python, Bitbucket, MongoDB, Pandas, Numpy, GreenPlum, Apache Hadoop, Apache Spark, Docker Compose, Apache AirFlow, HDFS, PySpark, apache hive, Bash scripting

Отрасль проекта

Cloud Services

Период работы

Август 2019 - Март 2021 (1 год 8 месяцев)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Похожие специалисты

E-commerce & Retail • FinTech & Banking

Описание пока отсутствует

Подробнее

E-commerce & Retail • Media

BI-разработчик / Дата аналитик с 4+ годами опыта. Чтобы сделать проект высокого уровня, я ориентируюсь на результат, а не на процесс. Благодаря такому подходу я декомпозирую сложные, длительные задачи на короткие спринты. Я готова выслушать требования, задать вопросы и предложить свои идеи по их улучшению. Языки программирования Python, SQL. BI и визуализация данных Apache Superset, Yandex DataLens, Matplotlib, Seaborn. Data Science Pandas, Numpy. Облачные технологии Azure(Data Factory, Data Lake, Synapse, Cosmos DB, DataBricks, SQL Azure, etc.), GCP(Compute Engine, BigQuery, BigTable, Cloud Functions, Cloud Storage, etc). Data Modeling Dimensional Modeling (Star схема, Snowflake схема), Entity-Relationship (ER) Modeling, Data Vault Modeling, Нормализация / Денормализация. Базы данных PostgreSQL, MySQL, Clickhouse, Redis. Маркетинг Google Analytics, Yandex Metrics. Системы контроля версий Git, Github, Bitbucket. Домены Электронная коммерция, Музыкальный магазин Достижения SQL оптимизация Проведены проверки кода SQL для обеспечения соблюдения стандартов кодирования и выявления возможностей оптимизации, что привело к снижению скорости кода SQL на 20 % и повышению удобства сопровождения рабочих процессов обработки данных. Оптимизация дашбордов Интегрирование расширенных средств визуализации, такие как тепловые карты, древовидные карты и расширенные диаграммы, в информационные панели для выявления скрытых тенденций и закономерностей в данных, что позволяет принимать решения и повысить операционную эффективность на 20%.

Подробнее

E-commerce & Retail • Manufacturing • Telecom

Андрей — инженер баз данных уровня Senior из Москвы с опытом работы в сферах Telecom, Manufacturing и E-commerce & Retail. Специализируется на проектировании и оптимизации хранилищ данных, работе с Big Data и ETL-процессами. Владеет широким спектром технологий и инструментов, включая Apache AirFlow, Apache Spark, Hadoop, PostgreSQL, Oracle, Microsoft SQL Server, ClickHouse, Greenplum и другие. Имеет опыт работы на следующих проектах: - МегаФон: миграция корпоративного хранилища данных, проектирование многоуровневой архитектуры DWH, внедрение практик DataOps. - Тера Интегро: разработка и оптимизация распределённых DWH, создание алерт-систем на базе Zabbix, потоковая обработка данных. - НЛМК: миграция данных, оптимизация PostgreSQL, поддержка проектов и разрешение инцидентов, разработка ETL-процессов. - IQVIA: разработка и оптимизация хранилищ данных, стриминговая обработка данных, моделирование данных, обработка больших данных с использованием Apache Spark.

Подробнее

FinTech & Banking • LifeStyle

Senior Data Engineer с более чем 9 годами профильного опыта и более 20 лет в IT (старт карьеры в качестве руководителя проектов и технического директора). Активный опыт в разработке и поддержке хранилищ данных, автоматизации процессов обработки данных и создании аналитических решений. Специализируется на проектировании DWH, разработке ETL-пайплайнов с использованием Greenplum, Airflow, Spark, и визуализации данных в Power BI и Superset. Имеет опыт управления распределенными командами, системного администрирования и аналитики. Ориентирован на оптимизацию процессов, обеспечение качества данных и тесное взаимодействие с бизнесом для реализации требований.

Инженер данных полного цикла с опытом проектирования, построения и поддержки корпоративных DWH, ETL-процессов и BI-отчётности. Участвовал в проектах на базе Clickhouse, Postgres, Oracle, MS SQL и SAP BI. Внедрил более 500 DAG-процессов в Apache Airflow, организовал мониторинг через Grafana, интегрировал API-данные в хранилище. Ориентирован на результат, предпочитает гибкий подход к инструментам и бизнес-задачам.

Подробнее

Недавно просмотренные специалисты

EdTech • Government & Public Sector • Manufacturing

Описание пока отсутствует

Подробнее

Cloud Services • Social Networking

Backend разработчик с опытом более 3 лет Основной упор на Python и его фреймворки (FastAPI, Django) Есть опыт работы с Frontend (TypeScript+React) Ответственное отношение к работе Четкое выстраивание процессов разработки Хорошие коммуникативные навыки и способность работать в команде Высокая ответственность и внимательность к деталям

Подробнее

FinTech & Banking • FoodTech • IoT

Хороший кандидат, опыт в финтехе более 2х лет(с неофициальным), по Java 3 года(с неофициальными проектами) Кандидат о себе: "Считаю себя усидчивым и внимательным к деталям человеком, что помогает находить баги и подробно описывать найденные дефекты. Помимо указанных выше навыков, имел опыт работы с RabbitMQ, Firebase, Pipeline. Принимал участие в: Хакатоне LET'S GO DIGITAL HACKATHON и чемпионате для QA BUGBUSTERS 2024"

Подробнее

E-commerce & Retail • FinTech & Banking • Insurance

Описание пока отсутствует

Подробнее

GameDev • Logistics & Transport

ОГ

Олег Г.

Москва

Системный администратор

Администрирование серверов Linux

Кандидат обладает большим и широким опытом работы в IT-подразделениях, как в области системного администрирования, так и в DevOPs направлении. Умеет грамотно обеспечивать работу IT-инфраструктуры. Администрировал, настраивал и сопровождал ActiveDirectory, MS Windows Server, Linux(CentOS), есть опыт администрирования БД: MS SQL, PotgreSQL. Умеет оптимизировать процессы, в том числе с помощью внедрения средств автоматизации.

Подробнее

Максим П. Инженер БД, Middle+

Похожие специалисты

Недавно просмотренные специалисты

Подпишитесь на нашу рассылку