Проект в архиве Data инженер

71089
Подбор по данному проекту завершён. Посмотрите наш каталог актуальных запросов, найдите подходящие и предложите ваших специалистов.
Ритейл

Data инженер

Middle Middle+
Кол-во специалистов
1
Длительность проекта
до 31.05.2027
Объем участия в проекте
Высокая нагрузка
~160 ч/мес
Формат взаимодействия
Удаленно
Требуемая локация специалиста
Россия, Беларусь
Доступность специалиста
Строго по времени Мск
Требуемое гражданство специалиста
РФ и РБ
О клиенте
Отрасль
Ритейл

Обязательные требования

- ETL/ELT пайплайны; - Работа с API; - Обработка больших объемов данных; - SQL на продвинутом уровне: сложные join’ы, оконные функции, оптимизация запросов под большие объемы, понимание планов выполнения; - Практический опыт работы (не «знаком», а делал в проде): Greenplum (понимание MPP, распределение данных, оптимизация), ClickHouse (построение витрин, работа с большими таблицами), MS SQL Server; - Опыт работы с consumer/producer; - Понимание семантики доставки и обработки сообщений; - Уверенная работа с REST API (пагинация, ретраи, обработка ошибок); - S3-совместимые хранилища: чтение/запись, организация данных, партиционирование; - Важна самостоятельность и ответственность за результат.

Дополнительные требования

- Опыт работы с Trino (федеративные запросы, работа с несколькими источниками); - Опыт построения DWH (staging / dds / marts); - Понимание data lineage и контроля качества данных; - Опыт orchestration (Airflow или аналоги).

Задачи на проекте

- Разработка и поддержка пайплайнов загрузки и трансформации HR-данных; - Интеграция источников (API, Kafka, БД, файловые хранилища); - Построение витрин и обеспечение их консистентности; - Оптимизация производительности и стоимости обработки данных; - Обеспечение стабильности (обработка сбоев, ретраи, мониторинг).

Этапы отбора

Этапы отбора: 1. Интервью с рекрутером SkillStaff 2. Техническое интервью (2 ч) 3. Менеджерский этап (1 ч).

Описание проекта и команды

Заказчик - крупный ритейлер. Требуется инженер данных, который превратит разрозненные кадровые события в чистый, надежный и готовый к анализу слой данных. Важна самостоятельность и ответственность за результат.

Обязательные требования

- ETL/ELT пайплайны; - Работа с API; - Обработка больших объемов данных; - SQL на продвинутом уровне: сложные join’ы, оконные функции, оптимизация запросов под большие объемы, понимание планов выполнения; - Практический опыт работы (не «знаком», а делал в проде): Greenplum (понимание MPP, распределение данных, оптимизация), ClickHouse (построение витрин, работа с большими таблицами), MS SQL Server; - Опыт работы с consumer/producer; - Понимание семантики доставки и обработки сообщений; - Уверенная работа с REST API (пагинация, ретраи, обработка ошибок); - S3-совместимые хранилища: чтение/запись, организация данных, партиционирование; - Важна самостоятельность и ответственность за результат.

Дополнительные требования

Задачи на проекте

Этапы отбора

Описание проекта и команды