Анастасия Т. Data инженер, Senior

ID 29531
АТ
Анастасия Т.
Женщина, 36 лет
Россия, Санкт-Петербург, UTC+3
Ставка
3 376,62 Р/час
НДС не облагается
Специалист доступен с 2 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data инженер
Грейд
Senior
Навыки
Apache
Apache AirFlow
Apache Spark
Apache Tomcat
Aqinity
Data
datastage
dbvisualizer
domino
HTML
IBM
IBM WebSphere
Iceberg
infosphere
JQuery
Kubernetes
lotusscript
Lotust
Object
PostgreSQL
proc
PySpark
Python
SQL
Storage
Trino
XML
Yandex Cloud
Application
BPM
cognos
CRM
CVS
Data Vault
developer
DevOps
Docker
Docker Compose
ER
ERP
Git
GitHub
IBM DB2
Jenkins
Lotus Notes
modelio
mural
MySQL
Numpy
Oracle
Pandas
PuTTY
Rational
schema
Shell Scripting
Snowflake
srm
star
Отрасли
FinTech & Banking
Hardware
Знание языков
Английский — B2
Главное о специалисте
Дата-инженер с 4-летним опытом создания комплексных решений для обработки данных, от классических DWH до современных Data Lake в облачной среде. Специализируюсь на проектировании и разработке масштабируемых ETL/ELT пайплайнов (Apache Airflow, Apache Spark), построении архитектуры Data Lake на базе Apache Iceberg и организации унифицированного доступа к данным с помощью Trino. Обладаю опытом работы с enterprise-стеком (IBM DataStage, DB2) и глубокими знаниями Python и SQL для оптимизации и автоматизации процессов. Сфокусирована на оптимизации производительности запросов (Trino, Spark) и построении масштабируемых моделей данных для создания надежн
Проекты   (3 года 5 месяцев)
ПЛАТФОРМА ДЛЯ БАНКА
Роль
Data-инженер
Обязанности
Проектировала и разворачивала архитектуру Data Lake на базе объектного хранилища и формата таблиц Apache Iceberg в облачной среде Yandex Cloud; Проводила согласование бизнес-терминов и агрегатов между заинтересованными сторонами при формировании витрины; Разрабатывала и поддерживала идемпотентные ETL/ELT пайплайны в Apache Airflow для инкрементальной и полной загрузки данных; Внедряла Trino как основной движок для федеративных ad-hoc запросов, объединяя данные из Data Lake и PostgreSQL; Оптимизировала производительность Trino через настройку коннекторов и анализ планов выполнения запросов (EXPLAIN ANALYZE); Выполняла концептуальное и логическое моделирование хранилища данных с учетом предметной области, частоты обновлений и требований к аналитической отчетности; Настраивала отказоустойчивый кластер Apache Airflow с использованием CeleryExecutor для масштабирования задач; Координировала интеграцию данных из различных источников в единое хранилище с учетом различий в форматах и частоте поступления данных; Интегрировала пайплайны с системами контроля версий (GitHub) и настраивала CI/CD для автоматического деплоя DAG'ов; Применяла техники партиционирования и бакетирования в Apache Spark и Trino для ускорения обработки больших объемов данных; Разрабатывала структуру дата мартов на основе пользовательских сценариев, SLA и требований к детализации; Участвовала в выборе и валидации подходов к денормализации при проектировании хранилища с целью оптимизации аналитических запросов; Настраивала загрузку витрин с учетом инкрементального подхода и требований к временным срезам; Работала с данными (выявление аномалий в данных и проработка трендов), в т.ч. обрабатывала Ad-hoc-запросы; Консультировала разработчиков ETL по соответствию модели хранилища и бизнес-логике, выявляя потенциальные отклонения на ранних этапах; Реализовывала логику медленно меняющихся измерений (SCD Type 2) для корректной обработки исторических данных.
Стек специалиста на проекте
PostgreSQL, Docker, SQL, Python, Kubernetes, Apache, GitHub, Data, Pandas, Numpy, Object, Apache Spark, Storage, Docker Compose, Apache AirFlow, Yandex Cloud, PySpark, Trino, Iceberg, proc
Отрасль проекта
FinTech & Banking
Период работы
Ноябрь 2024 - По настоящее время  (1 год)
IBM - ALLEGRO SIW (ИНФОРМАЦИОННОЕ ХРАНИЛИЩЕ УСЛУГ)
Роль
Data-инженер
Обязанности
Соотносила результаты анализа данных с бизнес-целями и KPI предприятия с учетом отраслевой специфики и с последующим формированием прогнозов, гипотез посредством применения теории вероятности и мат. статистики; Написание и оптимизация SQL-запросов; Сбор, измерение и анализ точных данных; Реализация стратегий визуализации данных для удовлетворения ожиданий клиента и гибкого изменения деталей в процессе проектирования; Создавала и оптимизировала представления (views) и материализованные представления для унификации доступа к данным; Устранение технических проблем для отдела путем обеспечения руководства и руководства для решения проблемы в базах данных DB2 и Oracle.
Стек специалиста на проекте
HTML, MySQL, XML, SQL, Python, Oracle, Jenkins, PuTTY, Apache Tomcat, CVS, Pandas, Numpy, IBM, JQuery, Lotus Notes, Shell Scripting, IBM WebSphere, IBM DB2, Aqinity, lotus, domino, lotusscript, mural, cognos, datastage, infosphere, dbvisualizer
Отрасль проекта
Hardware
Период работы
Сентябрь 2023 - Октябрь 2024  (1 год 2 месяца)
IBM - GBS NA
Роль
Data-инженер
Обязанности
Проектирование, оптимизация, разработка и развертывание джобов в IBM DataStage; Извлечение, преобразование и передача больших объемов данных как простой, так и очень сложной структуры; Создавала и изменяла таблицы с помощью DDL-скриптов; Перенос джобов и последовательностей с сервера DataStage v8.1 на v8.7; Тестирование джобов, исправление ошибок и перенос кода в CVS; Контроль качества данных при их интеграции в ETL пайплайнах; Проводила ревизию и оптимизацию JOIN-операций в SQL запросах для ускорения выборок; Создание технической документации; Общение с заказчиком в процессе работы над текущими вопросами.
Стек специалиста на проекте
HTML, XML, SQL, PuTTY, CVS, IBM, JQuery, Shell Scripting, Application, IBM WebSphere, IBM DB2, developer, datastage, dbvisualizer, Rational
Отрасль проекта
Hardware
Период работы
Июнь 2022 - Август 2023  (1 год 3 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
ГГУ им.Ф.Скорины
Специальность
Автоматизированные системы обработки информации
Завершение учебы
2012 г.

Похожие специалисты

FinTech & Banking • Logistics & Transport • Media
СБ
Сергей Б.
Минск
Data инженер
Senior
3 896,1 Р/час
Apache AirFlow
Apache Hadoop
Apache Kafka
Apache Spark
Bash scripting
ClickHouse
Cloud Functions
Data
DataLens
Docker
+40

Дата инженер / Системный Аналитик с опытом работы более 5 лет. Я являюсь опытным специалистом, которому нравится создавать новаторские и эффективные решения. У меня обширный опыт в разработке и глубокое понимание современных технологий. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель – достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (DataLens, Object Storage, Virtual Machines, Data Proc, Cloud Functions, Managed Kubernetes, Managed Service for PostgreSQL, KMS, IAM, Monitoring). Базы данных PostgreSQL, Greenplum, Oracle, ClickHouse, MongoDB, Redis. Брокеры сообщений Apache Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда»,, Схема «Снежинка»,), Сущность-Связь (ER) Моделирование, Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Kubernetes, Bash скриптинг. Системы контроля версий Git, GitLab, GitHub.

Подробнее
E-commerce & Retail • Logistics & Transport
АЛ
Алексей Л.
Минск
Data инженер
Senior
3 896,1 Р/час
Apache AirFlow
Apache Hadoop
apache hive
Apache Spark
ClickHouse
cloud
Cloud Functions
Data
DataLens
HDFS
+35

Дата Инженер / Бизнес-Аналитик с опытом работы более 5+ лет. Квалифицированный специалист с богатым опытом использования различных технологий для решения сложных задач. Мой опыт позволяет мне эффективно ориентироваться в стеке технологий и быстро находить наиболее эффективные решения. Стремлюсь быть в курсе последних событий в отрасли, чтобы всегда обеспечивать наилучшие результаты. Языки программирования Python, SQL. Инженерия данных Apache Airflow, Apache Spark, PySpark, Apache Hadoop, Apache Hive, HDFS. Облачные сервисы Yandex Cloud (DataLens, Object Storage, Compute Cloud, Data Proc, Virtual Machines, Cloud Functions, Managed Service for ClickHouse, Managed Service for PostgreSQL). Базы данных PostgreSQL, MySQL, Redis, ClickHouse, Greenplum, MongoDB. Брокеры сообщений Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Нормализация / Денормализация. DevOps Docker, Docker Compose, Bash scripting, Kubernetes. Системы контроля версий Git, GitHub, Bitbucket.

Подробнее
AI & Robotics • FinTech & Banking • Travel, Hospitality & Restaurant business
МК
Матвей К.
Минск
Data инженер
Senior
4 155,84 Р/час
Apache AirFlow
Apache Hadoop
apache hive
Apache Spark
Bash scripting
Bitbucket
boot
ClickHouse
cloud
Cloud Functions
+43

Дата-Инженер с опытом работы более 6 лет. Моя цель в работе - стремление добиваться результатов, превосходящих чьи либо ожидания. Я понимаю важность соответствия моей работы конкретным требованиям каждого клиента и умею создавать эффективные стратегии, соответствующие потребностям. Я всегда ищу идеальное решение для всех задач каждого клиента. Языки программирования Python, SQL, Java. Инженерия данных Apache Hadoop, HDFS, Apache Hive, Apache Spark, PySpark, Apache Airflow, dbt, Snowflake. Облачные сервисы Yandex Cloud(DataLens, Object Storage, Compute Cloud, Data Proc, Cloud Functions, Managed Service for PostgreSQL). Базы данных ClickHouse, MS SQL, PostgreSQL, MongoDB, Redis. Брокеры сообщений Kafka. Data Science Pandas, NumPy. Визуализация данных Power BI, Tableau. Бэкенд Spring (MVC, Boot, Security, Data), FastAPI. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Bash scripting, Kubernetes. Системы контроля версий Git, Bitbucket, GitHub.

Подробнее

Недавно просмотренные специалисты

AI & Robotics • FinTech & Banking • Logistics & Transport • Social Networking
ДТ
Дмитрий Т.
Санкт-Петербург
DevOps
Senior
3 313,95 Р/час
Docker
Python
Maven
Linux
Jenkins
Kubernetes
GitLab
AWS
Prometheus
OpenShift
+22

Дмитрий — DevOps-инженер уровня Middle+ из Санкт-Петербурга. Специализируется на автоматизации процессов разработки и эксплуатации программного обеспечения. Имеет опыт работы с OpenShift, Kubernetes, Istio, Jenkins, Argo CD, Python, Groovy, Maven, Linux и другими технологиями. Участвовал в проектах в сферах FinTech & Banking, Social Networking, Logistics & Transport, AI & Robotics. На проекте SberEsm в роли DevOps Engineer занимался созданием и траблшутингом CI/CD-пайплайнов, миграцией систем, администрированием приложений в OpenShift и DropApp, управлением релизами и приемочными тестами, автоматизацией рабочих процессов. На проекте VK Workmail/VK Teams в роли On-Prem DevOps Engineer / Инженер по наблюдаемости отвечал за интеграцию и поддержку экосистемы продукта VK Workspace, администрирование Kubernetes-кластеров, кластеров баз данных, настройку инструментов мониторинга. Также работал на проектах TMS, Челнок, Optera и JAICP, где занимался улучшением CI/CD-пайплайнов, администрированием сервисов больших данных, внедрением подхода Infrastructure as a Code, мониторингом состояния систем и другими задачами.

Подробнее
E-commerce & Retail • EdTech • FinTech & Banking • LifeStyle • Urban technology
ИА
Ирина А.
Ульяновск
React Native разработчик
Middle
2 597,4 Р/час
JavaScript
Kotlin
Swift
REST API
Webpack
Firebase
Redux
Socket.io
TypeScript
MobX
+31

Soft Skills: Социальные компетенции: - Грамотная письменная и устная речь - Высокий эмоциональный интеллект - Коммуникабельность - Гибкость и принятие критики - Неконфликтность Интеллектуальные компетенции: - Умение видеть и решать проблему - Умение сосредоточиться на важных деталях для получения максимального результата - Аналитический склад ума - Творческое мышление - Оперирование фактами Волевые компетенции: - Ориентированность на результат - Стрессоустойчивость - Управление временем Лидерские компетенции: - Ответственность - Планирование - Опыт работы преподавателем Hard Skills: Языки программирования: - JS - С++ - Основы java (android native) - Основы matlab Базы данных: - MySQL - PostgreSQL Фреймворки: - React - React Native - Angular Agile-методологии: - Scrum - Kanban - Agile

Подробнее