Проект в архиве Data инженер
71089
Подбор по данному проекту завершён.
Посмотрите наш каталог актуальных запросов, найдите подходящие и предложите ваших специалистов.
Ритейл
Data инженер
Middle
Middle+
Ставка в час
Кол-во специалистов
1
Длительность проекта
до 31.05.2027
Объем участия в проекте
Высокая нагрузка
~160 ч/мес
Формат взаимодействия
Удаленно
Требуемая локация специалиста
Россия, Беларусь
Доступность специалиста
Строго по времени Мск
Требуемое гражданство специалиста
РФ и РБ
О клиенте
Отрасль
Ритейл
Обязательные требования
- ETL/ELT пайплайны;
- Работа с API;
- Обработка больших объемов данных;
- SQL на продвинутом уровне: сложные join’ы, оконные функции, оптимизация запросов под большие объемы, понимание планов выполнения;
- Практический опыт работы (не «знаком», а делал в проде): Greenplum (понимание MPP, распределение данных, оптимизация), ClickHouse (построение витрин, работа с большими таблицами), MS SQL Server;
- Опыт работы с consumer/producer;
- Понимание семантики доставки и обработки сообщений;
- Уверенная работа с REST API (пагинация, ретраи, обработка ошибок);
- S3-совместимые хранилища: чтение/запись, организация данных, партиционирование;
- Важна самостоятельность и ответственность за результат.
Дополнительные требования
- Опыт работы с Trino (федеративные запросы, работа с несколькими источниками);
- Опыт построения DWH (staging / dds / marts);
- Понимание data lineage и контроля качества данных;
- Опыт orchestration (Airflow или аналоги).
Задачи на проекте
- Разработка и поддержка пайплайнов загрузки и трансформации HR-данных;
- Интеграция источников (API, Kafka, БД, файловые хранилища);
- Построение витрин и обеспечение их консистентности;
- Оптимизация производительности и стоимости обработки данных;
- Обеспечение стабильности (обработка сбоев, ретраи, мониторинг).
Этапы отбора
Этапы отбора:
1. Интервью с рекрутером SkillStaff
2. Техническое интервью (2 ч)
3. Менеджерский этап (1 ч).
Описание проекта и команды
Заказчик - крупный ритейлер.
Требуется инженер данных, который превратит разрозненные кадровые события в чистый, надежный и готовый к анализу слой данных. Важна самостоятельность и ответственность за результат.
Обязательные требования
- ETL/ELT пайплайны;
- Работа с API;
- Обработка больших объемов данных;
- SQL на продвинутом уровне: сложные join’ы, оконные функции, оптимизация запросов под большие объемы, понимание планов выполнения;
- Практический опыт работы (не «знаком», а делал в проде): Greenplum (понимание MPP, распределение данных, оптимизация), ClickHouse (построение витрин, работа с большими таблицами), MS SQL Server;
- Опыт работы с consumer/producer;
- Понимание семантики доставки и обработки сообщений;
- Уверенная работа с REST API (пагинация, ретраи, обработка ошибок);
- S3-совместимые хранилища: чтение/запись, организация данных, партиционирование;
- Важна самостоятельность и ответственность за результат.