Ислам И. Data инженер, Senior

ID 13721

ИИ

Ислам И.

Мужчина

Объединенные Арабские Эмираты, Абу-Даби, UTC+4

Ставка

4 624,11 Р/час

вкл. НДС 5% (171.43 Р)

Специалист доступен с 19 сентября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data инженер

Грейд

Senior

Навыки

Ansible

Apache

Apache AirFlow

API

Architecture

Avro

CI/CD

Clang

Clean Code

ClickHouse

cloud

code

Composer

Data

Data Warehouse

DBT

debezium

Design Patterns

Docker

Docker Swarm

ETL

Exasol

Flask

GCP

GitHub

Hadoop

HDFS

Hive

Java

Kafka

Kafka Streams

Kotlin

Kubernetes

language

Linear

Native

ngineering

Nginx

optimization

PHP

Python

quality

river

Snowflake

Spark

Spring

Storage

Symfony

Systemd

TeamCity

tools

Unit testing

Vertica

Yarn

DWH

Detection

Zookeeper

ДО

Планирование

Программное обеспечение

Работа в команде

Elasticsearch

Testing

Аналитика

Microservices

Рефакторинг

Разработка

SQL

Jira

PostgreSQL

SAS Data Integration Studio

Отрасли

E-commerce & Retail

FinTech & Banking

Logistics & Transport

Social Networking

Проекты (8 лет 4 месяца)

Dating app

Роль

Data Engineer

Обязанности

● Работа в команде над разработкой и предоставлением масштабируемой, надежной и удобной платформы данных с упором на поддержание целостности данных и соблюдение соглашений об уровне обслуживания. ● Исследовал и разработал ряд инновационных решений для обработки и маршрутизации потоков данных с использованием Kafka. включая проверку, преобразование и обогащение в реальном времени. Эти решения позволили сократить время разделения событий по типам с 30-40 минут до 3-5 минут, а также существенно снизить загрузку ресурсов и дать возможность обрабатывать до 8 миллионов событий в секунду. ● Реализован анализатор сообщений в реальном времени на основе Kafka с использованием Kotlin, позволяющий владельцам данных получать доступ к конкретным данным и фильтровать их на основе событий. ● Внедрены значительные улучшения в приложении Anomaly Detection: обнаружение проблем в данных временных рядов, включая показатели DAU/WAU, авторизации пользователей и платежей, а также широкий спектр технических показателей. Сотрудничал с пользователями AD для улучшения существующих инструментов и внедрения новых функций. ● Приложения перенесены из локальной среды в облако, мигрированы с Exasol на Snowflake. ● Повышена стабильность конвейера предварительно агрегированных показателей (с задержкой 5–15 минут для миллиардов показателей). ● Управление кластерами ClickHouse и Hadoop: планирование мощности и распределение ресурсов, реализация хаоса. инженерные практики. ● Обслуживание кластера Kafka: обновление с версии 2.8 до версии 3.0, затем до версии 3.5, переход с ZooKeeper на KRaft, обновляя до последних версий все библиотеки Kafka, используемые в приложениях, взаимодействующих с брокерами Kafka. ● Инфраструктура команды: o Платформа отслеживания: более 3,5 млн сообщений в секунду. o Hadoop: более 130 узлов, около 4 ПБ данных. o ClickHouse: 5 геораспределенных кластеров, около 30 серверов, тысячи таблиц. o Kafka: 5 брокеров, JBOD, 10 ТБ, ~2500 производителей с несбалансированной ставкой. o Сервисы GCP и более 20 серверов обработки (кроме Hadoop) в разных ЦОД.

Стек специалиста на проекте

PostgreSQL, Kotlin, Zookeeper, ClickHouse, Hadoop, Kafka, Detection, SAS Data Integration Studio, AD, GCP, Exasol, Snowflake

Отрасль проекта

Social Networking

Период работы

Июнь 2021 - По настоящее время (4 года 4 месяца)

Онлайн сервис путешествий

Роль

Data Engineer / Server Side Software Engineer

Обязанности

● Разработанная схема данных DWH. ● Разработан конвейер для доставки и обогащения данных о потоке кликов из ElasticSearch в ClickHouse. ● Создание самописного приложения поиска аномалий в timeseries-данных на основе предсказаний. и вот вся математика предсказаний была в ClickHouse и реализация алгоритмов была как раз на уровне sql-запросов ● Создана система ChangeDataCapture(CDC) на базе Debezium. ● Создана система витрины данных с использованием Airflow и Exasol. ● Разработана система тестирования. ● Обученные пользователей и аналитиков, использующих систему A/B-тестирования и DWH. ● Онбординг новых членов команды.

Стек специалиста на проекте

PostgreSQL, Elasticsearch, SQL, ClickHouse, Аналитика, DWH, Testing, Apache AirFlow, Exasol, debezium

Отрасль проекта

Logistics & Transport

Период работы

Январь 2020 - Июнь 2021 (1 год 6 месяцев)

Avito

Роль

Backend PHP Developer

Обязанности

● Перевел существующую логика веб приложения с монолита на микросервисы. ● Разработал API для внешнего интерфейса и мобильных приложений. ● Рефакторинг кода внутри монолита.

Стек специалиста на проекте

PostgreSQL, API, PHP, SQL, Microservices, Рефакторинг

Отрасль проекта

E-commerce & Retail

Период работы

Май 2019 - Декабрь 2019 (8 месяцев)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Да

Образование

Высшее

Учебное заведение

Российский государственный аграрный университет

Специальность

Магистр "информационные системы в логистике"

Завершение учебы

2016 г.

Похожие специалисты

E-commerce & Retail • EdTech • RnD

Алексей — опытный Data инженер с более чем шестилетним опытом работы в проектах RnD, E-commerce & Retail и EdTech. В портфолио Алексея есть несколько успешных проектов: Customer360, разработка программного обеспечения для бухгалтерского учёта для одного из крупнейших розничных продавцов товаров для дома, Apache Superset по визуализации данных для целей BI, внутренний проект, направленный на решение проблем повторного развёртывания групп DAG Airflow на учётных записях Kohls и IAS, IAS Python Upgrade, настройка и поддержка кластера Hadoop/Spark, разработка приложений на Hadoop/Spark для научных целей. Алексей участвовал в разработке и поддержке групп DAG Airflow для преобразования данных, включая сшивание данных; разработал и спроектировал Metadag Airflow DAG, которая автоматизирует и повышает уровень понимания процессов в команде C360; выполнил общую миграцию из локальных в облачные сервисы; получил большой опыт в разработке приложений Flask, выполнении миграций БД с использованием SQLAlchemy и Alembic; разработал внутреннюю систему контроля доступа для приложения Superset; разработал пакет Python3 airflow-redeploy, который упрощает процесс повторного развёртывания групп DAG через официальный REST API и плагин REST API.

Подробнее

E-commerce & Retail • FinTech & Banking

В Data с 2021 года, коммерческий опыт Data Engineer более 4 лет. Занимался тестированием ETL процессов, написанием автотестов и инструментов для тестирования в команде из 6 ETL QA инженеров. Занимался разработкой и внедрением фреймворка DQ для проверки качества данных в команде из 13 DQ инженеров. Также разрабатывал ETL процессы для построения витрин для дальнейшего анализа и выявления аномалий при сравнении данных из разных источников. Ключевые навыки: SQL, Python, Apache Spark, Hadoop, S3, Apache Airflow, Parquet, Kafka, ETL, ClickHouse, Trino, Git, CI/CD, Системный анализ, Тестирование (Data Quality), РСУБД (ClickHouse, Greenplum, Oracle, PostgreSQL), XML, JSON, Data Analysis, Big Data, DWH, Docker, Apache Hive, Apache Iceberg, Soda Core, Pytest, BI, SAS, Git, CI/CD, BI, Jira, Confluence

Подробнее

E-commerce & Retail • FinTech & Banking

Артём — опытный Data-инженер, специализирующийся на разработке платформ данных и интеграции различных источников информации. Обладает навыками работы с такими инструментами, как PostgreSQL, Clickhouse, Kafka, Elasticsearch, Airflow, Spring, а также имеет опыт использования технологий Apache Ignite, Hadoop, Hive, Spark, PySpark. Артём участвовал в нескольких проектах, где проявил себя как специалист по разработке сложных архитектур данных. В одном из проектов он разработал платформу данных с нуля, организовал процесс миграции из различных источников и оптимизировал существующие таблицы Clickhouse. В другом проекте Артём разработал продукт для расчёта активов с весом риска для отдела рисков. Он также реализовал конвейеры данных, создал платформу для модульного тестирования и разработал индивидуальную интеграцию с различными внутренними API.

Подробнее

AI & Robotics • E-commerce & Retail • Logistics & Transport • Telecom

Сергей — Data-инженер уровня Senior из Набережных Челнов. Специализируется на работе с большими данными и имеет опыт в отраслях E-commerce & Retail, AI & Robotics, Logistics & Transport, Telecom. Ключевые навыки: работа с базами данных (PostgreSQL, Oracle, MySQL), ETL/ELT-процессы, Apache Airflow, ClickHouse, Hadoop, Kafka, Scala, Spark, DataLens, Power BI, Confluence, Git, Kubernetes. Имеет опыт работы на следующих проектах: - Проект для крупного ритейла: миграция данных из различных источников, оптимизация процессов обработки данных, использование DBT, Trino, Helm, Groovy-скрипты для доработки компонентов Apache NiFi. - EasyCode: организация DWH-хранилища, автоматизация ETL/ELT-процессов, работа с ClickHouse, PostgreSQL, Google Sheets, визуализация данных в DataLens. - Мега маркет: разработка цифровых решений для e-commerce, миграция данных в ClickHouse и Greenplum, работа с Firebase, MsSQL, Яндекс.Метрика, Google Analytics. - KazanExpress: автоматизация отчётности и визуализация данных, создание дашбордов в DataLens, формирование витрин данных в ClickHouse. - МТС: формирование отчётности по продажам B2C и B2B, работа с MySQL, Oracle BI, Power BI.

Подробнее

Manufacturing • Telecom

4.5+ лет опыта в роли Data Engineer: проектирование архитектуры, разработка и оптимизация высоконагруженных DWH и ELT/ETL процессов. Опыт с Big Data и потоковой обработкой: реализация пайплайнов на Spark и Flink, обработка десятков ТБ данных в час. Построение DWH с нуля: Wildberries — централизованный DWH для всех бизнес-доменов, включая 50+ интеграций и Clickstream (50+ ТБ/день). Оптимизация производительности: сокращение инцидентов на 90%, ускорение выполнения ETL-процессов в 2 раза, рост доступности данных благодаря внедрению DQ и Data Governance. Работа с распределёнными системами хранения и СУБД: HDFS, Iceberg, Hive, Clickhouse, Greenplum, MongoDB, Oracle, PostgreSQL. Организация интеграций и CDC: внедрение Debezium + Kafka Connect, миграция с Hadoop на Clickhouse (500+ ТБ данных). Опыт менторства и лидерства: наставничество, проведение технических собеседований, обучение команд-заказчиков по работе с ресурсами DWH. Широкий технологический стек: Airflow, Dagster, dbt, Spark, Flink, Kafka, Trino, Kubernetes, Docker, Gitlab CI/CD, OpenMetadata.

Подробнее

Недавно просмотренные специалисты

FinTech & Banking • Logistics & Transport • Media

Дата инженер / Системный Аналитик с опытом работы более 5 лет. Я являюсь опытным специалистом, которому нравится создавать новаторские и эффективные решения. У меня обширный опыт в разработке и глубокое понимание современных технологий. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель – достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (DataLens, Object Storage, Virtual Machines, Data Proc, Cloud Functions, Managed Kubernetes, Managed Service for PostgreSQL, KMS, IAM, Monitoring). Базы данных PostgreSQL, Greenplum, Oracle, ClickHouse, MongoDB, Redis. Брокеры сообщений Apache Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда»,, Схема «Снежинка»,), Сущность-Связь (ER) Моделирование, Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Kubernetes, Bash скриптинг. Системы контроля версий Git, GitLab, GitHub.

Подробнее

BioTech, Pharma, Health care & Sports • E-commerce & Retail • FoodTech • GameDev • LifeStyle • Social Networking

В работе нравятся математические задачи, стратегический подход и планирование. Большая часть опыта связана с разработкой финтех проектов (фонды, инвестиции). Также участвовал в разработке мессенджеров с повышенной системой безопасности, health care/sport приложений.

Подробнее

E-commerce & Retail • Logistics & Transport

АГ

Артем Г.

Москва

JavaScript разработчик

Программное обеспечение

scout

Токены

+32

Занимаюсь фронтом уже 3 года. Уверенно чувствую себя в разработке SPA-приложений с flux архитектурой. Умею хорошо вписываться в команду, выстраивать границы и выжимать из командной игры максимальную пользу

Подробнее

E-commerce & Retail • FinTech & Banking

МШ

Максим Ш.

Санкт-Петербург

Бизнес/системный аналитик