ТП
Татьяна П.
Женщина, 28 лет
Россия, Москва, UTC+3
Ставка
3 142,85 Р/час
НДС не облагается
Специалист доступен с 31 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Инженер БД
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Data Engineer с более чем 5 годами опыта в разработке ETL-процессов, создании и поддержке витрин данных, а также автоматизации процессов обработки данных. Специализируется на интеграции данных из различных источников, проектировании хранилищ данных и оптимизации пайплайнов с использованием Airflow, PySpark, и dbt. Имеет опыт управления удаленными командами, обеспечения качества данных и построения аналитических отчетов. Ориентирована на повышение эффективности процессов, улучшение качества данных и тесное взаимодействие с бизнесом для реализации требований.
Проекты
(5 лет 1 месяц)
Разработка и поддержка витрин данных для аналитики и коммерческого API
Роль
Data Engineer
Обязанности
- Сбор и подготовка данных из различных источников для создания витрин.
- Автоматизация процессов сбора данных с использованием Apache Airflow и Python.
- Проектирование и наполнение таблиц различных слоев хранилища данных (PostgreSQL, ClickHouse).
- Разработка витрин для коммерческого API, обеспечивающих бизнес-требования.
- Выполнение ad-hoc запросов и выгрузок для аналитиков и бизнеса.
- Участие в проектировании и оптимизации фреймворка на dbt для трансформации данных.
- Обеспечение качества данных и валидация загружаемых данных.
- Настройка CI/CD для автоматизации процессов обработки данных.
- Документирование процессов и взаимодействие с бизнесом для уточнения требований.
Достижения
- Ускорила процесс подготовки витрин, сократив время обработки данных на 20%.
- Обеспечила стабильность и качество данных для коммерческого API.
- Внедрила dbt-фреймворк, упростив трансформацию неструктурированных данных.
Стек специалиста на проекте
PostgreSQL, SQL, Python, ClickHouse, Apache AirFlow, DBT
Отрасль проекта
LifeStyle
Период работы
Сентябрь 2023 - Июль 2025
(1 год 11 месяцев)
Создание и поддержка пайплайнов обработки данных для аналитики
Роль
Data Engineer
Обязанности
- Разработка и поддержка ETL-пайплайнов с использованием Apache Airflow и Pandas.
- Интеграция данных из API различных сервисов в хранилище данных.
- Контроль качества поступающих данных и их валидация.
- Автоматизация отчетности для бизнес-пользователей.
- Оптимизация процессов обработки данных для повышения производительности.
- Настройка CI/CD для автоматического запуска пайплайнов.
- Документирование процессов обработки данных и их передача команде.
- Взаимодействие с бизнесом для уточнения требований к данным.
- Тестирование и отладка пайплайнов для минимизации ошибок.
Достижения
- Автоматизировала процесс формирования отчетов, сократив время подготовки на 30%.
- Обеспечила высокое качество данных, минимизировав ошибки в хранилище.
- Ускорила интеграцию данных из внешних API.
Стек специалиста на проекте
Git, SQL, Python, Pandas, Apache AirFlow, CI/CD
Отрасль проекта
LifeStyle
Период работы
Август 2022 - Сентябрь 2023
(1 год 2 месяца)
Сбор и подготовка датасетов для аналитики
Роль
Data Engineer
Обязанности
- Сбор и подготовка датасетов для аналитических задач.
- Обеспечение качества данных и их валидация перед загрузкой.
- Администрирование удаленного сервера для обработки данных.
- Написание технических заданий для команды разметчиков.
- Управление удаленной группой разметчиков данных (до 10 человек).
- Настройка инструментов для обработки данных и их тестирование.
- Оптимизация процессов разметки данных для повышения производительности.
- Документирование процессов и обучение команды.
- Взаимодействие с заказчиками для согласования требований.
Достижения
- Успешно подготовила и передала более 50 датасетов для аналитики.
- Сократила время разметки данных за счет автоматизации процессов.
- Обеспечила стабильную работу сервера для обработки данных.
Стек специалиста на проекте
SQL, Python, Linux
Отрасль проекта
LifeStyle
Период работы
Ноябрь 2021 - Август 2022
(10 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Дипломы и сертификаты
ClickHouse для аналитиков и разработчиков (Stepik) 2023 г.
Экспресс-курс Greenplum для аналитиков и разработчиков (Stepik) 2023 г.
Промышленное машинное обучение (Coursera) 2022 г.
Data Engineer (Karpov Courses) 2022 г.
ведение в машинное обучение (Coursera) 2021 г.
Образование
Высшее
Учебное заведение
Национальный исследовательский университет "Высшая школа экономики"
Специальность
Машинное обучение и высоконагруженные системы
Завершение учебы
2025 г.
Высшее
Учебное заведение
Московский государственный технический университет им. Н.Э. Баумана
Специальность
Автоматизированные системы обработки информации и управления
Завершение учебы
2020 г.