ВВ
Владлена В.
Женщина, 25 лет
Беларусь, Минск, UTC+3
Ставка
4 155,84 Р/час
НДС не облагается
Специалист доступен с 3 июля 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data инженер
Грейд
Навыки
Отрасли
Знание языков
Английский — B1
Главное о специалисте
Специалист с более чем 5-летним опытом в области Data Engineering. Обладает глубокими знаниями в разработке, оптимизации и поддержке ETL/ELT-процессов, а также в обработке и анализе больших данных. Уверенно владеет Python, SQL и современными технологиями обработки данных, включая Apache Airflow, Snowflake, GCP и AWS. Имеет успешный опыт построения масштабируемых аналитических и интеграционных платформ в сферах финтеха, e-commerce и real-time мониторинга. Отличается высоким уровнем технической экспертизы, вниманием к деталям и умением обеспечивать надежную и производительную архитектуру данных в условиях высокой нагрузки.
Проекты
(5 лет 1 месяц)
Проект был направлен на обработку и трансформацию больших данных из различных источников в хранилище
Роль
Data Engineer
Обязанности
Проект был направлен на обработку и трансформацию больших данных из различных источников в хранилище, с приведением их в состояние, готовое для дальнейшего аналитического использования. В рамках проекта обеспечивалась быстрая и бесперебойная доставка данных, включающая этапы предварительной обработки и очистки. Платформа обработки больших данных позволила оптимизировать процесс и гарантировала высокую производительность даже при работе с масштабными объемами информации.
● Разработка ETL-пайплайнов на Apache Airflow, Python и SQL для обработки данных.
● Интеграция данных из различных источников (CSV, XLS, API) в централизованное хранилище.
● Оптимизация ETL-процессов для минимизации времени выполнения, снижения нагрузки на инфраструктуру и повышения отказоустойчивости
● Настройка механизма ретраев, SLA и уведомлений в Airflow для обеспечения надежности выполнения ETL-процессов
● Автоматизация процессов очистки, нормализации, дедупликации и агрегации данных с использованием Python и Pandas
● Разработка и оптимизация сложных SQL-запросов в Snowflake с использованием CTE, Window Functions и Materialized Views для ускорения аналитики
● Мониторинг производительности ETL-процессов, настройка алертов и логирования
● Оптимизация SQL-запросов и индексации в Snowflake и BigQuery для сокращения времени обработки запросов
● Использование Docker для контейнеризации ETL-компонентов.
● Разработка unit- и integration-тестов для ETL-пайплайнов с использованием Pytest
● Настройка CI/CD-процессов для автоматического деплоя и тестирования ETL-компонентов
● Разработка стратегий бэкапа и восстановления данных в хранилищах GCP и Snowflake
● Создание технической документации в Confluence, включая описание архитектуры, схемы потоков данных и руководства по эксплуатации
● Наставничество и консультирование команды по вопросам оптимизации ETL-процессов, написания SQL-запросов и работы с хранилищами данных
Стек специалиста на проекте
Docker, SQL, Python, Bash, GitLab, BigQuery, Pandas, Numpy, Docker Compose, Apache AirFlow, GCP, Snowflake, GitLab CI/CD
Отрасль проекта
Cloud Services
Период работы
Сентябрь 2023 - Июнь 2025
(1 год 10 месяцев)
Платформа управления кредитными продуктами
Роль
Data Engineer
Обязанности
Платформа управления кредитными продуктами предназначена для обработки и хранения данных о финансовых операциях, интеграции с внешними сервисами и предоставления аналитической информации. Система обеспечивает масштабируемость, надежность и высокую скорость обработки данных, что позволяет автоматизировать ключевые процессы, связанные с управлением кредитными продуктами и их анализом.
● Разработка и оптимизация ETL-пайплайнов с использованием Apache Airflow для интеграции данных из внешних API в платформу управления кредитными продуктами
● Создание кастомных операторов и сенсоров в Apache Airflow для автоматизации загрузки и обработки данных, а также мониторинга выполнения задач
● Разработка SQL-запросов для оптимизации производительности и сокращения времени выполнения запросов в ClickHouse
● Настройка доступа к данным в промежуточном слое с помощью AWS Glue (Data Catalog, crawlers) и AWS Athena
● Разработка и внедрение стратегии резервного копирования и восстановления данных в PostgreSQL и ClickHouse
● Анализ и оптимизация SQL-запросов в PostgreSQL для улучшения производительности работы с данными и сокращения времени отклика
● Разработка и поддержка пайплайнов для мониторинга ключевых метрик с использованием AWS CloudWatch
● Создание и настройка AWS Lambda для автоматизации обработки и трансформации данных в режиме реального времени
● Оптимизация работы с AWS RDS и PostgreSQL для повышения скорости чтения и записи данных в базе данных
● Мониторинг и устранение причин дефектов, связанных с данными
● Сотрудничество с командой аналитиков данных.
Стек специалиста на проекте
glue, AWS, athena, ClickHouse, Bash, DBeaver, GitHub, Tableau, S3, Docker Compose, EC2, Docker, Python, GitHub Actions, Lambda, CloudWatch, Apache AirFlow, RDS, PostgreSQL
Отрасль проекта
FinTech & Banking
Период работы
Август 2022 - Август 2023
(1 год 1 месяц)
Разработка платформы для сбора, обработки и анализа данных о финансовых транзакциях
Роль
Data Engineer
Обязанности
Разработка платформы для сбора, обработки и анализа данных о финансовых транзакциях в режиме реального времени. Система позволяла интегрироваться с различными внешними сервисами, анализировать большие объемы данных и предоставлять удобные отчёты для мониторинга ключевых показателей. Проект включал автоматизацию процессов обработки данных, обеспечение высокой производительности и отказоустойчивости.
● Разработка и поддержка ETL-пайплайнов в Apache Airflow для обработки и трансформации данных
● Поддержка API на FastAPI для обеспечения быстрого доступа к данным и реализации механизмов аутентификации
● Оптимизация DAG-ов в Apache Airflow для уменьшения времени выполнения и более эффективного управления зависимостями задач
● Создание аналитических витрин в Power BI для мониторинга финансовых метрик и выявления аномалий
● Оптимизация хранимых процедур и индексов в MSSQL для ускорения выполнения запросов
● Разработка системы уведомлений и алертов для оперативного реагирования на сбои
● Настройка Snowflake в качестве основного хранилища данных для надежного и масштабируемого хранения финансовых транзакций с обеспечением удобного доступа к данным для аналитики и отчетности.
Стек специалиста на проекте
Docker, Python, Bash, GitLab, Hadoop, Pandas, SQLAlchemy, Numpy, FastAPI, Pydantic, Alembic, Docker Compose, Apache AirFlow, Snowflake, MSSQL, Trino
Отрасль проекта
FinTech & Banking
Период работы
Май 2021 - Март 2022
(11 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет