Герман В. Data инженер, Middle+

ID 23395

ГВ

Герман В.

Мужчина

Беларусь, Минск, UTC+3

Ставка

3 545,15 Р/час

вкл. НДС 5% (131.43 Р)

Специалист доступен с 2 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data инженер

Грейд

Middle+

Навыки

Alembic

Apache

Apache AirFlow

Apache Spark

athena

Avro

AWS

AWS glue

Bash scripting

Bitbucket

DBT

DevOps

Docker

documentation

DynamoDB

EC2

ecr

emr

FastAPI

Flask

functions

Git

GitHub

GitLab

GitLab CI/CD

glue

GreenPlum

Hadoop

HDFS

Kafka

Lambda

Matplotlib

MongoDB

MySQL

Numpy

Oracle

Pandas

PostgreSQL

Pydantic

PySpark

Python

RabbitMQ

RDS

Redshift

SciPy

Snowflake

SQL

SQLAlchemy

Steps

Testing

Базы данных

Контроль версий

Compose

MS SQL

Отрасли

E-commerce & Retail

Знание языков

Английский — B2

Главное о специалисте

Data-инженер с опытом работы в отрасли электронной коммерции и ритейла более 3 лет. Участвовал в проекте по внедрению платформы снабжения и планирования для крупного производственного предприятия. Выполнял обязанности по управлению командой дата-инженеров, обсуждал архитектуру системы, подключался к источникам данных, оптимизировал SQL-запросы, создавал конвейеры Airflow, работал с Pandas, разрабатывал хранимые процедуры, настраивал соединения Kafka, проектировал витрины данных и HDFS. Работал над созданием простого в интеграции приложения для персонализированной бизнес-аналитики на базе искусственного интеллекта. Занимался разработкой конечных точек Flask, нормализацией данных, контролем операций хранилища данных, разработкой моделей DBT, использовал Pandas, NumPy и SciPy, разрабатывал функции с помощью AWS Lambda. Принимал участие в разработке платформы для сбора и обработки больших объёмов данных из различных источников. Администрировал базы данных, разрабатывал и оптимизировал сложные SQL-запросы, использовал Apache Spark, обрабатывал крупномасштабные наборы данных с помощью AWS EMR, выполнял статистические вычисления с помощью SciPy.

Проекты (5 лет 11 месяцев)

Проект по внедрению платформы снабжения и планирования для крупного производственного предприятия.

Роль

Инженер данных

Обязанности

Проект по внедрению платформы снабжения и планирования для крупного производственного предприятия. Платформа объединяет множество источников данных и предоставляет заказчику оптимальные маршруты и материалы для создания продукции. Обязанности: ● Участие в обсуждении архитектуры для обеспечения масштабируемости и производительности системы. ● Управление командой дата-инженеров, постановка задач и обеспечение эффективного выполнения задач. ● Сотрудничество с заинтересованными сторонами бизнеса и другими проектами. ● Подключение к различным источникам данных для получения, хранения и преобразования данных в соответствии с потребностями проекта. ● Оптимизация SQL-запросов в базах данных PostgreSQL и Oracle для повышения производительности и сокращения времени выполнения. ● Создание и планирование конвейеров Airflow для автоматизации процессов ETL, извлечения, преобразования и загрузки данных в хранилище данных. ● Использование Pandas для преобразования данных и применения пользовательской логики для очистки, фильтрации и подготовки данных для дальнейшей обработки. ● Написание сложных SQL-запросов и хранимых процедур для обработки данных, агрегирования и бизнес-логики. ● Настройка соединений Kafka для потоковой передачи данных в реальном времени и обеспечения интеграции с последующими процессами. ● Разработка процессов на основе таймера для запуска действий через запланированные интервалы, улучшающих автоматизацию рабочих процессов. ● Оптимизация производительности Airflow за счет улучшения планирования задач, управления зависимостями и эффективного масштабирования конвейеров. ● Создание витрин данных для информационных панелей FineBI, обеспечивающих эффективное агрегирование данных для получения глубокой бизнес-аналитики. ● Проектирование и внедрение HDFS для эффективного хранения данных в распределенной файловой системе. ● Оптимизация производительности процесса чтения/записи данных в HDFS. ● Интеграция GreenPlum с другими источниками данных (PostgreSQL, Hadoop) для обеспечения единой платформы для аналитики и отчетности. ● Внедрение ETL процессов для обработки данных в GreenPlum. ● Чтение и обработка сообщений Avro от Kafka для извлечения и хранения соответствующей информации для аналитики. ● Обеспечение корректного преобразования данных на каждом этапе конвейера, сохранение точности и согласованности данных. ● Разработка и использование пользовательских операторов Airflow для управления конкретными задачами, которые не могут быть решены встроенными операторами. ● Обсуждение требований к интеграции с клиентами для согласования потоков данных, форматов и взаимодействия с системой.

Стек специалиста на проекте

PostgreSQL, Docker, Python, Oracle, GitLab, Apache, Avro, Hadoop, Pandas, SQLAlchemy, Numpy, GreenPlum, Pydantic, Docker Compose, Apache AirFlow, HDFS, GitLab CI/CD

Отрасль проекта

E-commerce & Retail

Период работы

Июнь 2023 - По настоящее время (2 года 5 месяцев)

Простое в интеграции приложение для персонализированной бизнес-аналитики.

Роль

Инженер данных

Обязанности

Простое в интеграции приложение для персонализированной бизнес-аналитики — по всем функциям, от разработки до финансов и производства — на базе искусственного интеллекта. Продукт, благодаря использованию искусственного интеллекта, упрощает и автоматизирует процессы в компаниях, а также предоставляет ключевую информацию и рекомендации о том, какое решение принять дальше. Основная цель — протестировать самые современные технологии для решения бизнес-задач. Обязанности: ● Создание конечных точек Flask для реализации взаимодействия с бэкэндом ● Написание сложных SQL-запросов и хранимых процедур. ● Проведение нормализации данных ● Контроль операций хранилища данных (DWH) ● Разработка моделей DBT ● Общение с заинтересованными сторонами бизнеса ● Использовал Pandas, NumPy и SciPy для очистки, нормализации и разработки функций данных, чтобы обеспечить высококачественный ввод для моделей машинного обучения. ● Разработка функций с помощью AWS Lambda ● Разработка скриптов трансформации Python ● Использование AWS Athena для интерактивного запроса больших наборов данных, хранящихся в S3, оптимизации поиска данных и обеспечения быстрого анализа без необходимости дополнительной инфраструктуры. ● Создание конвейеров ETL/ELT с помощью Apache Airflow ● Разработка алгоритмов для группировки клиентов на основе покупательского поведения, демографических данных и данных о вовлеченности для поддержки персонализированных маркетинговых стратегий. ● Преобразование нормализованных данных в удобные бизнес-схемы ● Организация DWH и оптимизация его производительности ● Написание тестов для проверки корректности функций. ● Разработка скриптов Python для расширенного преобразования данных и интеграции искусственного интеллекта в рабочие процессы. ● Управление процессами миграции и трансформации данных ● Проведение проверок кода и поддержание стандартов кодирования.

Стек специалиста на проекте

PostgreSQL, Docker, SQL, Python, Bitbucket, AWS, Redshift, Lambda, Pandas, SciPy, SQLAlchemy, Numpy, Testing, Pydantic, Alembic, Flask, Docker Compose, Apache AirFlow, S3, EKS, Steps, RDS, ecr, DBT, documentation, functions, athena

Отрасль проекта

E-commerce & Retail

Период работы

Февраль 2021 - Май 2023 (2 года 4 месяца)

Платформа собирает и обрабатывает большие объемы данных из различных источников, предоставляя ценную информацию и рекомендации.

Роль

Инженер данных

Обязанности

Платформа собирает и обрабатывает большие объемы данных из различных источников, предоставляя ценную информацию и рекомендации. Пользователи могут исследовать данные с помощью интерактивной визуализации, выполнять расширенный анализ и создавать индивидуальные отчеты. Целью этого проекта является помощь в принятии обоснованных решений, повышение вовлеченности клиентов и повышение общей эффективности маркетинга. Обязанности: ● Администрирование внутренних и облачных баз данных. ● Разработка и оптимизация сложных SQL-запросов и хранимых процедур. ● Использование Apache Spark для эффективной обработки и анализа терабайтов данных, обеспечивающее масштабируемое машинное обучение. ● Очистка и агрегирование данных с помощью Apache Spark ● Обработка крупномасштабных наборов данных с помощью AWS EMR, оптимизация рабочих процессов Apache Spark для распределенной обработки и преобразования данных. ● Выполнение сложных статистический вычислений с помощью SciPy для получения значимой информации и проверки предположений о данных. ● Проектирование и внедрение конвейеров ETL с помощью AWS Glue для автоматизации каталогизации данных, обнаружения схем и преобразования данных. ● Использование AWS Athena для запроса структурированных и полуструктурированных данных непосредственно из S3, что позволяет выполнять специальную аналитику и составлять отчеты. ● Контроль и оптимизация операций хранилища данных (DWH) ● Анализ поведения системы для выявления недостатков, настройки производительности и рекомендаций по возможностям оптимизации производительности. ● Общение с заинтересованными сторонами бизнеса по поводу системных требований ● Выявление и исключение аномалий из набора данных ● Проведение профилирования и анализа данных для обеспечения точности, полноты и согласованности данных. ● Проверка преобразований и миграции данных ● Проведение очистки данных для достижения наилучшего качества данных.

Стек специалиста на проекте

PostgreSQL, Docker, Python, Bash, GitLab, AWS, Lambda, Pandas, SciPy, Numpy, FastAPI, Apache Spark, Docker Compose, S3, Gitlab CI, Snowflake, PySpark, RDS, glue, athena, emr

Отрасль проекта

E-commerce & Retail

Период работы

Декабрь 2019 - Февраль 2021 (1 год 3 месяца)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Образование

Высшее

Учебное заведение

БГУ

Специальность

Математики и информатики

Завершение учебы

2022 г.

Похожие специалисты

E-commerce & Retail • FinTech & Banking

Владлена — data-инженер уровня middle+ из Минска (Беларусь). Обладает опытом работы с различными инструментами и технологиями, включая Alembic, Apache AirFlow, AWS, Docker, ETL, FastAPI, GitHub Actions, GitLab CI/CD, Python, SQLAlchemy и другие. Владлена участвовала в нескольких проектах в сферах FinTech & Banking и E-commerce & Retail: - Обрабатывала и трансформировала большие данные из разных источников в хранилище. - Разрабатывала и оптимизировала ETL-пайплайны на Apache Airflow, Python и SQL. - Интегрировала данные из различных источников в централизованное хранилище. - Оптимизировала SQL-запросы в Snowflake, PostgreSQL и других базах данных. - Настраивала механизмы ретраев, SLA и уведомлений в Airflow. - Автоматизировала процессы очистки, нормализации, дедупликации и агрегации данных.

Подробнее

Cloud Services • E-commerce & Retail • FinTech & Banking

Специалист с более чем 5-летним опытом в области Data Engineering. Обладает глубокими знаниями в разработке, оптимизации и поддержке ETL/ELT-процессов, а также в обработке и анализе больших данных. Уверенно владеет Python, SQL и современными технологиями обработки данных, включая Apache Airflow, Snowflake, GCP и AWS. Имеет успешный опыт построения масштабируемых аналитических и интеграционных платформ в сферах финтеха, e-commerce и real-time мониторинга. Отличается высоким уровнем технической экспертизы, вниманием к деталям и умением обеспечивать надежную и производительную архитектуру данных в условиях высокой нагрузки.

Подробнее

E-commerce & Retail • FinTech & Banking

Data Engineer с опытом работы на проектах в сфере E-commerce & Retail и FinTech & Banking. На проектах занимался разработкой аналитических платформ, DWH и систем аналитики. Обязанности: - разработка ETL-пайплайнов в Apache Airflow и Apache NiFi; - обработка больших объёмов данных с использованием PySpark, Pandas, NumPy; - оптимизация интеграции Hadoop (HDFS); - агрегация данных в ClickHouse для BI-отчётов; - визуализация данных в Power BI и Superset; - мониторинг и оптимизация производительности запросов в Snowflake; - интеграция PostgreSQL и MS SQL; - использование Docker и Kubernetes для контейнеризации ETL-компонентов; - создание детальных технических проектных документов; - сотрудничество с командой аналитиков; - проведение тестирования системы; - настройка CI/CD-конвейеров с помощью GitLab CI/CD.

Подробнее

E-commerce & Retail • IoT • Telecom

Андрей — Data инженер уровня Senior из Минска, Беларусь. Специализируется на разработке и оптимизации аналитических платформ и хранилищ данных (DWH). Имеет опыт работы с ETL/ELT-процессами, облачными сервисами AWS, инструментами Apache Airflow, Apache Kafka, Apache Spark, а также с базами данных PostgreSQL, MySQL, Oracle и Snowflake. Участвовал в проектах для отраслей E-commerce & Retail, IoT и Telecom. Среди проектов — разработка аналитической платформы для розничной сети, интеграция данных из CRM, ERP и POS-систем, автоматизация обновления данных и улучшение доступа к аналитике через BI-панели. Также занимался разработкой DWH для IT-компании, преобразованием сырых данных из Data Lake и их интеграцией в DWH для решения ML-задач. Обладает навыками работы с системами контроля версий Git, GitLab, Bitbucket, а также опытом настройки CI/CD-конвейеров. Создавал техническую документацию и сотрудничал с командами аналитиков для согласования решений по обработке данных.

Подробнее

E-commerce & Retail • FinTech & Banking • Government & Public Sector

Кирилл — data-инженер из Ростова-на-Дону. Обладает опытом работы на проектах в сферах FinTech & Banking, Government & Public Sector и E-commerce & Retail. На проекте для компании из сферы FinTech & Banking занимался обработкой больших объёмов информации, анализом данных, разработкой дата-пайплайнов и организацией data quality. Использовал Python, bash, Hadoop, Greenplum, PL/pgSQL, Atlassian, Jupyter, Hue, Hive, Airflow, Superset, Power Bi, PySpark, Pandas, PyArrow. Для государственной компании разрабатывал детальный слой и строил витрины, писал пайплайны по доставке и обработке данных. Использовал Python, Apache Airflow, Git, Posgresql. В качестве python-разработчика для госструктуры создавал скрипты для автоматизации бизнес-процессов и администрирования оборудования, а также писал процедуры для баз данных. В работе использовал Python, Bash, FastAPI, Sqlalchemy, ansible, postman, Git, pgsql, Linux, Docker, Prometheus, Grafana и др. Опыт работы на позиции python-разработчика включал аналитику данных и контроль data quality, разработку скриптов по автоматизации и эксплуатацию измерительной техники. Использовал Python, bash, MySQL, Postgresql, Astra Linux, SecretNet. На последнем месте работы в сфере E-commerce & Retail занимался интеграцией реляционных и нереляционных источников, настройкой мониторинга и алертинга, нормализацией и очисткой данных. Работал со стеком из MongoDB, Postgres, S3, YandexCloud, Greenplum, Python, SQL, Ni-Fi, Airflow, Kafka, k8s, Jenkins, Github, ELK, Grafana, Vault.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • EdTech

АЩ

Алексей Щ.

Смоленск

Битрикс24 разработчик

Архитектура, оптимизация, масштабирование, управление командой Backend-разработчик с более чем 6 годами опыта в создании высоконагруженных и отказоустойчивых систем. Успешно реализовал проекты в разных сферах: от e-commerce до SaaS-решений. Ключевые навыки: - Языки и технологии: JavaScript, PHP, Docker, RabbitMQ - Архитектура: Микросервисы, монолиты - Базы данных: PostgreSQL, MySQL, Redis, оптимизация запросов - Управление: Опыт руководства командой (3-5 человек), планирование задач, code review, наставничество Что я принесу в ваш проект? ✅ Надежность – пишу чистый, поддерживаемый код с покрытием тестами ✅ Масштабируемость – проектирую системы, способные выдерживать высокие нагрузки ✅ Эффективность – оптимизирую производительность и снижаю затраты на инфраструктуру ✅ Организацию – умею выстраивать процессы в команде для быстрого и предсказуемого результата Опыт работы: - Team Lead / Senior Backend Developer - Увеличил отказоустойчивость системы, снизив downtime на 40% - Оптимизировал запросы к БД, ускорив API на 25% - Выстроил процессы code review и CI/CD, сократив время релизов в 2 раза - Backend Developer - Разработал микросервисную архитектуру с нуля - Интегрировал платежные системы и CRM Почему я? Не просто пишу код, а решаю бизнес-задачи: автоматизирую процессы, сокращаю издержки и помогаю продукту расти. Готов к сложным вызовам и быстро вливаюсь в команду.

Подробнее

E-commerce & Retail • Government & Public Sector

Вадим — Java-разработчик уровня Middle из Москвы. Специализируется на разработке с использованием Java и Spring Boot. Имеет опыт работы с базами данных PostgreSQL и SQL, а также с инструментами автоматизации тестирования, такими как Jenkins CI, GitLab CI и Docker. Владеет английским языком на уровне B2. Имеет опыт работы в отраслях Government & Public Sector и E-commerce & Retail. Участвовал в проектах «Экзон Групп (Гаскар интеграция)» и «Petshopru». В проекте «Экзон Групп (Гаскар интеграция)» занимал роль инженера по автоматизации тестирования, разработал фреймворк для тестировки продукта СОД, занимался автоматизацией тест-кейсов, разработкой функционала фреймворка тестировки, написанием документации и переработкой старого кода. В проекте «Petshopru» занимался анализом требований и дизайном тест-кейсов в сотрудничестве с командой QA и аналитиком, оптимизировал процессы тестирования для улучшения эффективности.

Подробнее

BioTech, Pharma, Health care & Sports • FinTech & Banking

- Более 5-ти лет опыта бизнес- и системного анализа в коммерческих или государственных проектах - Опыт работы с внешними и внутренними интеграционными взаимодействиями (REST API, SOAP, ESB, Apache Kafka, RabbitMQ) - Опыт работы с СУБД: PostgreSQL, MS SQL, Oracle DB - Опыт разработки технических заданий, руководства пользователей, программ и методик испытаний - Опыт выявления и управления требованиями (бизнес-требования, функциональные и нефункциональные требования к ПО) - Участие более чем в 16-ти проектах различных сфер в качестве бизнес- и системного аналитика, а также product owner или менеджера проектов - Опыт работы в каскадных (Waterfall) и гибких (Scrum) методологиях Участие в качестве спикера на конференциях, презентациях

Технические компетенции: Системное администрирование: - Администрирование Windows и Linux систем - Работа с терминальными средами (cmd, PowerShell, bash, zsh, alias) - Управление доменными структурами - Настройка и мониторинг файрволов (iptables, Windows Firewall) - Конфигурация DNS-серверов - Конфигурация маршрутизации и сетевой инфраструктуры Разработка и веб-технологии: - Фронтенд: HTML5, CSS3, JavaScript - Бэкенд: PHP, Python - Работа с базами данных: MariaDB, MySQL - Фреймворки: Flask, FastAPI - Версионирование: Git, GitLab Практический опыт и достижения: Автоматизация процессов: - Разработка bash-скриптов для автоматизации рутинных задач - Автоматизация установки Linux-систем с дополнительным ПО (ускорение процесса на 50%) - Скрипты для введения компьютеров в домен (ускорение процесса на 40%) - Автоматизация установки и обновления драйверов - Оптимизация процессов удаления и установки программного обеспечения (ускорение процесса на 60%) Веб-разработка: - Разработка и поддержка веб-проектов (доступны на GitHub и в облачном хранилище) - Создание веб-приложений с регистрацией и интеграцией с базами данных - Опыт работы с REST API - Внедрение систем аутентификации и авторизации