Владимир С. Data инженер, Senior

ID 26033

ВС

Владимир С.

Мужчина

Беларусь, Минск, UTC+3

Ставка

3 766,23 Р/час

НДС не облагается

Специалист доступен с 2 сентября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data инженер

Грейд

Senior

Навыки

Apache AirFlow

Apache Hadoop

apache hive

Apache Spark

Bash scripting

ClickHouse

debezium

Docker

Docker Compose

GitHub

GitHub Actions

GreenPlum

HDFS

Kafka

Kubernetes

MongoDB

Numpy

Pandas

PostgreSQL

PySpark

Python

SQL

Отрасли

E-commerce & Retail

Знание языков

Английский — B2

Главное о специалисте

Здравствуйте, меня зовут Владимир. Я — дата-инженер с более чем трёхлетним опытом, специализирующийся на построении надёжных и масштабируемых аналитических систем. За это время мне удалось реализовать решения, превращающие разрозненные массивы кликов, транзакций и событий в полноценные платформы, помогающие бизнесу принимать обоснованные решения и увеличивать доход. В рамках своей работы я проектировал архитектуру хранилищ данных на Greenplum и ClickHouse, разрабатывал отказоустойчивые ETL-процессы с использованием Apache Spark и PySpark, эффективно обрабатывал большие объёмы данных в Hadoop и HDFS, а также оптимизировал SQL-запросы до высокопроизводительных значений. Я обладаю опытом интеграции Apache Airflow с различными системами, включая написание собственных операторов, и умею выстраивать CI/CD-процессы, обеспечивая стабильную и безопасную поставку кода. Также я активно участвовал в настройке и сопровождении среды на базе Docker и Kubernetes, с особым вниманием к качеству кода, тестированию и документации.

Проекты (3 года 7 месяцев)

Платформа анализа поведения клиентов для ритейл-сети

Роль

Дата-инженер

Обязанности

Платформа анализа поведения клиентов для ритейл-сети Описание: Аналитическая платформа для комплексного анализа поведения клиентов. Система собирает и обрабатывает данные о кликах на сайте, истории покупок и активности в программах лояльности для построения подробных профилей клиентов. С помощью методов продвинутой аналитики и моделей машинного обучения предсказывается намерение совершить покупку, выполняется сегментация клиентов и персонализируются маркетинговые кампании. Платформа способствует увеличению удержания клиентов и росту продаж за счет точечного и релевантного взаимодействия. Основные обязанности: ● Оптимизация структуры хранения данных в Data Lake для эффективного анализа и отчетности; ● Разработка и оптимизация запросов в Apache Hive для работы с большими данными, хранящимися в HDFS; ● Проведение встреч со стейкхолдерами для уточнения требований и адаптации технических решений под изменяющиеся бизнес-задачи; ● Разработка масштабируемых ETL-пайплайнов на базе Apache Spark (PySpark) для обработки больших объёмов данных из разнородных источников; ● Проектирование архитектуры хранилища данных (Data Warehouse) в Greenplum; ● Разработка и внедрение пользовательских функций (UDF) на Apache Spark для расширения возможностей обработки данных и повышения гибкости ETL-процессов; ● Написание и поддержка bash-скриптов для автоматизации повседневных задач по управлению данными и запуску ETL процессов; ● Помощь в настройке и отладке Docker-окружения для локальной разработки и тестирования компонентов обработки данных; ● Проведение A/B тестирования запросов в Greenplum с различными вариантами индексов и сортировки для повышения производительности; ● Мониторинг логов PySpark для поиска и устранения ошибок; ● Написание unit-тестов для ключевых компонентов ETL-пайплайнов, обработчиков данных и утилит; ● Интеграция Greenplum с Apache Airflow и PySpark для построения end-to-end ETL пайплайнов; ● Настройка стратегий распределения в Greenplum для повышения производительности запросов; ● Разработка SQL-хранимых процедур для подготовки данных к аналитическим расчетам; ● Написание Python-модулей для интеграции и работы со сторонними API, автоматизируя рутинные задачи; ● Сопровождение сервисов, ETL пайплайнов и аналитических приложений в Kubernetes-кластерах; ● Составление и поддержка актуальной проектной документации, описывающей архитектуру решений и процессы обработки данных; ● Управление конфигурацией базы данных Greenplum, включая настройку параметров, управление ресурсами; ● Анализ и переписывание сложных SQL-запросов для минимизации времени выполнения и снижения нагрузки на базы данных; ● Участие в настройке CI/CD пайплайнов для автоматического тестирования и выката новый решений с помощью GitHub Actions; ● Оптимизация схем хранения данных в Greenplum с учетом колоночной архитектуры и партиционирования; ● Настройка и поддержка линтеров (flake8, isort, black) в проектах с Python для соблюдения единого код-стиля; ● Ревью кода и рефакторинг. Команда: 1 тех. лид, 3 дата-инженера, 2 BI разработчика, 1 аналитик данных, 1 DevOps инженер, 1пм. Технологический стек: Python, SQL, Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Hive, Apache Airflow, PostgreSQL, Greenplum, MongoDB, Pandas, NumPy, Docker, Docker Compose, Kubernetes (K8s), Bash scripting, GitHub, GitHub Actions

Стек специалиста на проекте

PostgreSQL, Docker, SQL, Python, MongoDB, GitHub Actions, Kubernetes, GitHub, Pandas, Numpy, GreenPlum, Apache Hadoop, Apache Spark, Docker Compose, Apache AirFlow, HDFS, PySpark, apache hive, Bash scripting

Отрасль проекта

E-commerce & Retail

Период работы

Июль 2023 - По настоящее время (2 года 3 месяца)

Сервис по подбору автомобилей

Роль

Дата-инженер

Обязанности

Сервис по подбору автомобилей Описание: Разработка интеллектуального сервиса подбора автомобилей, ориентированного на конечного пользователя. Система предлагала наиболее подходящие автомобили на основе введенных параметров, используя обширную базу данных транспортных средств с множеством технических и пользовательских характеристик. Главной задачей было обеспечить эффективную обработку, агрегацию и анализ данных из различных источников, а также построение масштабируемой архитектуры для поддержки персонализированного подбора. Основные обязанности: ● Сбор данных из различных источников данных и их нормализация с помощью Pandas и NumPy; ● Создание и оптимизация DAGs в Apache Airflow для определения порядка выполнения задач, зависимостей между ними и расписания запуска; ● Написание SQL запросов для агрегации бизнес-метрик в ClickHouse; ● Cоздание и поддержка пользовательских плагинов и операторов Apache Airflow для реализации специфических задач обработки и анализа данных; ● Оптимизация производительности кластера Hadoop путем настройки параметров конфигурации, оптимизации запросов и процессов, а также мониторинга и решения проблем производительности; ● Написание сложных SQL-триггеров и процедур в PostgreSQL; ● Создание и оптимизация сложных SQL-запросов для аналитики данных, включая использование функций ClickHouse для обработки больших объемов данных; ● Разработка и поддержка архитектуры данных на базе Hadoop, включая создание схем данных, определение хранилищ данных и организацию процессов загрузки; ● Использование Kafka для CDC через Debezium для чтения ивентов в PostgreSQL и их репликацию в ClickHouse; ● Организация мультистейдж-сборок Docker для уменьшения размера контейнерных образов и ускорения процессов деплоя; ● Разработка и внедрение кастомных Spark UDF на Python для реализации бизнес-логики, недоступной средствами стандартного Spark API; ● Разработка и оптимизация процессов извлечения, преобразования и загрузки данных с использованием Apache Spark для подготовки данных к анализу и обработке; ● Написание тестов; ● Подготовка и поддержка технической документации для приложений и сервисов. Команда: 1 тех. лид, 4 дата-инженера, 2 BI разработчика / аналитика данных, 1 DevOps инженер, 1пм. Технологический стек: Python, SQL, Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Hive, Apache Airflow, PostgreSQL, Clickhouse, Debezium, Kafka, Pandas, NumPy, Docker, Docker Compose, Bash scripting, GitHub

Стек специалиста на проекте

PostgreSQL, Docker, SQL, Python, GitHub, ClickHouse, Pandas, Numpy, Apache Hadoop, Apache Spark, Kafka, Docker Compose, Apache AirFlow, HDFS, PySpark, apache hive, Bash scripting, debezium

Отрасль проекта

E-commerce & Retail

Период работы

Март 2022 - Июнь 2023 (1 год 4 месяца)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Образование

Высшее

Учебное заведение

Белорусский государственный университет информатики и радиоэлектроники

Специальность

Специальность: Информатика и технологии проектирования

Завершение учебы

2022 г.

Похожие специалисты

E-commerce & Retail • FinTech & Banking

Меня зовут Кирилл, я дата-инженер с опытом работы более трех лет, и я убежден, что мои навыки и знания станут ценным дополнением к вашей команде. Моя экспертиза охватывает разработку и оптимизацию ETL/ELT-процессов, работу с большими данными и внедрение эффективных решений для аналитики, что позволяет мне успешно справляться с задачами в сложных распределенных системах. В проекте биллинговой системы я разрабатывал ETL-пайплайны с использованием Apache Spark, настраивал мониторинг производительности кластеров Greenplum и Hadoop, а также внедрял автоматизированные проверки кода, что повысило эффективность обработки данных. В банковском проекте я создавал OLAP-кубы, оптимизировал SQL-запросы и интегрировал аналитические системы, обеспечивая надежность и высокую производительность инфраструктуры. Мой технологический стек включает Python, SQL, Apache Spark, Airflow, Greenplum, Kubernetes и другие современные инструменты, что позволяет мне гибко подходить к решению задач. Мои сильные стороны — это глубокое понимание оптимизации данных, автоматизация процессов и разработка масштабируемых решений. Я уверен, что мой опыт поможет ускорить выполнение ваших задач, оптимизировать инфраструктуру и внедрить передовые инструменты.

Подробнее

E-commerce & Retail • Logistics & Transport

Дата Инженер / Бизнес-Аналитик с опытом работы более 5+ лет. Квалифицированный специалист с богатым опытом использования различных технологий для решения сложных задач. Мой опыт позволяет мне эффективно ориентироваться в стеке технологий и быстро находить наиболее эффективные решения. Стремлюсь быть в курсе последних событий в отрасли, чтобы всегда обеспечивать наилучшие результаты. Языки программирования Python, SQL. Инженерия данных Apache Airflow, Apache Spark, PySpark, Apache Hadoop, Apache Hive, HDFS. Облачные сервисы Yandex Cloud (DataLens, Object Storage, Compute Cloud, Data Proc, Virtual Machines, Cloud Functions, Managed Service for ClickHouse, Managed Service for PostgreSQL). Базы данных PostgreSQL, MySQL, Redis, ClickHouse, Greenplum, MongoDB. Брокеры сообщений Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Нормализация / Денормализация. DevOps Docker, Docker Compose, Bash scripting, Kubernetes. Системы контроля версий Git, GitHub, Bitbucket.

Подробнее

AI & Robotics • FinTech & Banking • Travel, Hospitality & Restaurant business

Дата-Инженер с опытом работы более 6 лет. Моя цель в работе - стремление добиваться результатов, превосходящих чьи либо ожидания. Я понимаю важность соответствия моей работы конкретным требованиям каждого клиента и умею создавать эффективные стратегии, соответствующие потребностям. Я всегда ищу идеальное решение для всех задач каждого клиента. Языки программирования Python, SQL, Java. Инженерия данных Apache Hadoop, HDFS, Apache Hive, Apache Spark, PySpark, Apache Airflow, dbt, Snowflake. Облачные сервисы Yandex Cloud(DataLens, Object Storage, Compute Cloud, Data Proc, Cloud Functions, Managed Service for PostgreSQL). Базы данных ClickHouse, MS SQL, PostgreSQL, MongoDB, Redis. Брокеры сообщений Kafka. Data Science Pandas, NumPy. Визуализация данных Power BI, Tableau. Бэкенд Spring (MVC, Boot, Security, Data), FastAPI. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Bash scripting, Kubernetes. Системы контроля версий Git, Bitbucket, GitHub.

Подробнее

FinTech & Banking • Logistics & Transport • Media

Дата инженер / Системный Аналитик с опытом работы более 5 лет. Я являюсь опытным специалистом, которому нравится создавать новаторские и эффективные решения. У меня обширный опыт в разработке и глубокое понимание современных технологий. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель – достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (DataLens, Object Storage, Virtual Machines, Data Proc, Cloud Functions, Managed Kubernetes, Managed Service for PostgreSQL, KMS, IAM, Monitoring). Базы данных PostgreSQL, Greenplum, Oracle, ClickHouse, MongoDB, Redis. Брокеры сообщений Apache Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда»,, Схема «Снежинка»,), Сущность-Связь (ER) Моделирование, Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Kubernetes, Bash скриптинг. Системы контроля версий Git, GitLab, GitHub.

Подробнее

E-commerce & Retail • FinTech & Banking

Дата-инженер с опытом работы более 5 лет. Языки программирования Python, SQL. Инженерия данных HDFS, Apache Hadoop, Apache Hive, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (Object Storage, Compute Cloud, Data Proc, Virtual Machines, Managed Kubernetes, IAM, Cloud Functions, Managed Service for PostgreSQL). Базы данных PostgreSQL, ClickHouse, Greenplum, MongoDB, Elasticsearch, MS SQL, Redis. Брокеры сообщений Apache Kafka. Анализ данных Pandas, NumPy. Визуализация данных Power BI, Kibana. Бэкенд FastAPI, Flask. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Медальонная Архитектура, Data Vault, Нормализация / Денормализация. DevOps Docker, Docker Compose, Kubernetes, Bash scripting. Системы контроля версий Git, GitHub, Bitbucket.

Подробнее

Недавно просмотренные специалисты

Описание пока отсутствует

● Специалист по платформе “1С:Предприятие 8”. ● Сопровождение и доработка конфигураций 1С: ЗУП 3.1, БП 3.0, Управление МФО и КПК, Итилиум, ВДГБ: Ломбард 3, БГУ 1.0, УТ 11. ● Обновление типовых/нетиповых конфигураций. ● Работа с хранилищем конфигурации. ● Работа с механизмом расширений. ● Управляемые формы. ● Запросы. ● СКД. ● Разработка с использованием БСП. ● HTTP-сервисы, web-сервисы. ● Механизм XDTO. ● Настройка синхронизаций данных. ● Разработка обменов данными, Конвертация данных ред. 2. ● Реализация интеграций со сторонними системами, сайтами. ● Ускорение и оптимизация 1С. ● Навыки постановки задач разработчику и контроля результатов. ● Навыки проведения код-ревью. ● Ведение документации в Confluence. ● Работа в системах управления проектами и задачами (JIRA). ● Работа с СУБД MS SQL, написание простых запросов. ● Знание нотации системного моделирования (UML). ● Описание тест-кейсов. ● Подготовка инструкций для пользователей. ● Знание основ управленческого, бухгалтерского, налогового учета.

Подробнее

BioTech, Pharma, Health care & Sports • E-commerce & Retail • EdTech • RnD • Urban technology

Я разработчик полного цикл разработки, внедрения, развития и сопровождения проектов. Обладаю глубокими техническими знаниями, способен разрабатывать продукт от стадии анализа до передачи в эксплуатацию. Я ответственный работник, коммуникабельный, хорошо вливаюсь в атмосферу коллектива. Серьезно отношусь к своим обязанностям и всегда стремлюсь выполнять работу добросовестно и качественно. Открыт к новым идеям, а также совершенствованию и наработке новых знаний и опыта.

Подробнее

BioTech, Pharma, Health care & Sports • E-commerce & Retail • FinTech & Banking

Никита — Senior Python разработчик из Ульяновска. Специализируется на разработке приложений с использованием Angular, Django, DRF. Имеет опыт работы с Git, GitLab, Grafana, PostgreSQL, PyCharm, SQL. Владеет операционными системами Linux и MS Windows. Участвовал в разработке проектов в отраслях E-commerce & Retail, FinTech & Banking, BioTech, Pharma, Health care & Sports. Среди проектов, над которыми работал Никита: - интернет-магазин микрокомпонентов (E-commerce & Retail); - системы управления кассами (FinTech & Banking); - личный кабинет партнёров компании (FinTech & Banking); - корпоративный портал страховой компании (BioTech, Pharma, Health care & Sports); - система продажи страховых продуктов (E-commerce & Retail). Общая продолжительность работы на проектах — 4 года 10 месяцев.

- Соблюдение принципов SOLID, DRY, KISS, ACID - Применение паттернов проектирования - Выбор подходящих структур данных - Использование Stream API, Generic, Collections - Настройка Spring boot (Core, Data, AOP, MVC+Web, Security, Rest, Testing, Actuator) - Конфигурация и создание микросервисов - Взаимодействие между сервисами по rest и kafka - Написание внутреннего api, используя openAPI - Аутентификация пользователя через JWT - Использование CI/CD, k8s, сборка релизов - Создание docker образов - Работа с реляционной БД PostgreSQL - Код ревью, грумминг, планирование, декомпозиция задач - Написание тестов, используя JUnit и Mockito

Подробнее

Владимир С. Data инженер, Senior

Похожие специалисты

Недавно просмотренные специалисты

Подпишитесь на нашу рассылку