Анастасия Т. Data инженер, Senior

ID 29531

АТ

Анастасия Т.

Женщина, 36 лет

Россия, Санкт-Петербург, UTC+3

Ставка

3 376,62 Р/час

НДС не облагается

Специалист доступен с 2 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data инженер

Грейд

Senior

Навыки

Apache

Apache AirFlow

Apache Spark

Apache Tomcat

Aqinity

Data

datastage

dbvisualizer

domino

HTML

IBM

IBM WebSphere

Iceberg

infosphere

JQuery

Kubernetes

lotusscript

Lotust

Object

PostgreSQL

proc

PySpark

Python

SQL

Storage

Trino

XML

Yandex Cloud

Application

BPM

cognos

CRM

CVS

Data Vault

developer

DevOps

Docker

Docker Compose

ERP

Git

GitHub

IBM DB2

Jenkins

Lotus Notes

modelio

mural

MySQL

Numpy

Oracle

Pandas

PuTTY

Rational

schema

Shell Scripting

Snowflake

srm

star

Отрасли

FinTech & Banking

Hardware

Знание языков

Английский — B2

Главное о специалисте

Дата-инженер с 4-летним опытом создания комплексных решений для обработки данных, от классических DWH до современных Data Lake в облачной среде. Специализируюсь на проектировании и разработке масштабируемых ETL/ELT пайплайнов (Apache Airflow, Apache Spark), построении архитектуры Data Lake на базе Apache Iceberg и организации унифицированного доступа к данным с помощью Trino. Обладаю опытом работы с enterprise-стеком (IBM DataStage, DB2) и глубокими знаниями Python и SQL для оптимизации и автоматизации процессов. Сфокусирована на оптимизации производительности запросов (Trino, Spark) и построении масштабируемых моделей данных для создания надежн

Проекты (3 года 5 месяцев)

ПЛАТФОРМА ДЛЯ БАНКА

Роль

Data-инженер

Обязанности

Проектировала и разворачивала архитектуру Data Lake на базе объектного хранилища и формата таблиц Apache Iceberg в облачной среде Yandex Cloud; Проводила согласование бизнес-терминов и агрегатов между заинтересованными сторонами при формировании витрины; Разрабатывала и поддерживала идемпотентные ETL/ELT пайплайны в Apache Airflow для инкрементальной и полной загрузки данных; Внедряла Trino как основной движок для федеративных ad-hoc запросов, объединяя данные из Data Lake и PostgreSQL; Оптимизировала производительность Trino через настройку коннекторов и анализ планов выполнения запросов (EXPLAIN ANALYZE); Выполняла концептуальное и логическое моделирование хранилища данных с учетом предметной области, частоты обновлений и требований к аналитической отчетности; Настраивала отказоустойчивый кластер Apache Airflow с использованием CeleryExecutor для масштабирования задач; Координировала интеграцию данных из различных источников в единое хранилище с учетом различий в форматах и частоте поступления данных; Интегрировала пайплайны с системами контроля версий (GitHub) и настраивала CI/CD для автоматического деплоя DAG'ов; Применяла техники партиционирования и бакетирования в Apache Spark и Trino для ускорения обработки больших объемов данных; Разрабатывала структуру дата мартов на основе пользовательских сценариев, SLA и требований к детализации; Участвовала в выборе и валидации подходов к денормализации при проектировании хранилища с целью оптимизации аналитических запросов; Настраивала загрузку витрин с учетом инкрементального подхода и требований к временным срезам; Работала с данными (выявление аномалий в данных и проработка трендов), в т.ч. обрабатывала Ad-hoc-запросы; Консультировала разработчиков ETL по соответствию модели хранилища и бизнес-логике, выявляя потенциальные отклонения на ранних этапах; Реализовывала логику медленно меняющихся измерений (SCD Type 2) для корректной обработки исторических данных.

Стек специалиста на проекте

PostgreSQL, Docker, SQL, Python, Kubernetes, Apache, GitHub, Data, Pandas, Numpy, Object, Apache Spark, Storage, Docker Compose, Apache AirFlow, Yandex Cloud, PySpark, Trino, Iceberg, proc

Отрасль проекта

FinTech & Banking

Период работы

Ноябрь 2024 - По настоящее время (1 год)

IBM - ALLEGRO SIW (ИНФОРМАЦИОННОЕ ХРАНИЛИЩЕ УСЛУГ)

Роль

Data-инженер

Обязанности

Соотносила результаты анализа данных с бизнес-целями и KPI предприятия с учетом отраслевой специфики и с последующим формированием прогнозов, гипотез посредством применения теории вероятности и мат. статистики; Написание и оптимизация SQL-запросов; Сбор, измерение и анализ точных данных; Реализация стратегий визуализации данных для удовлетворения ожиданий клиента и гибкого изменения деталей в процессе проектирования; Создавала и оптимизировала представления (views) и материализованные представления для унификации доступа к данным; Устранение технических проблем для отдела путем обеспечения руководства и руководства для решения проблемы в базах данных DB2 и Oracle.

Стек специалиста на проекте

HTML, MySQL, XML, SQL, Python, Oracle, Jenkins, PuTTY, Apache Tomcat, CVS, Pandas, Numpy, IBM, JQuery, Lotus Notes, Shell Scripting, IBM WebSphere, IBM DB2, Aqinity, lotus, domino, lotusscript, mural, cognos, datastage, infosphere, dbvisualizer

Отрасль проекта

Hardware

Период работы

Сентябрь 2023 - Октябрь 2024 (1 год 2 месяца)

IBM - GBS NA

Роль

Data-инженер

Обязанности

Проектирование, оптимизация, разработка и развертывание джобов в IBM DataStage; Извлечение, преобразование и передача больших объемов данных как простой, так и очень сложной структуры; Создавала и изменяла таблицы с помощью DDL-скриптов; Перенос джобов и последовательностей с сервера DataStage v8.1 на v8.7; Тестирование джобов, исправление ошибок и перенос кода в CVS; Контроль качества данных при их интеграции в ETL пайплайнах; Проводила ревизию и оптимизацию JOIN-операций в SQL запросах для ускорения выборок; Создание технической документации; Общение с заказчиком в процессе работы над текущими вопросами.

Стек специалиста на проекте

HTML, XML, SQL, PuTTY, CVS, IBM, JQuery, Shell Scripting, Application, IBM WebSphere, IBM DB2, developer, datastage, dbvisualizer, Rational

Отрасль проекта

Hardware

Период работы

Июнь 2022 - Август 2023 (1 год 3 месяца)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Образование

Высшее

Учебное заведение

ГГУ им.Ф.Скорины

Специальность

Автоматизированные системы обработки информации

Завершение учебы

2012 г.

Похожие специалисты

Описание пока отсутствует

Подробнее

FinTech & Banking • Logistics & Transport • Media

Дата инженер / Системный Аналитик с опытом работы более 5 лет. Я являюсь опытным специалистом, которому нравится создавать новаторские и эффективные решения. У меня обширный опыт в разработке и глубокое понимание современных технологий. Проактивный командный игрок с отличными навыками коммуникации, способен быстро осваивать новые технологии и методологии. Ставлю требования бизнеса на первое место. Независимо от того, работаю я самостоятельно или в составе команды, моя цель – достигать результатов, которые превосходят ожидания и способствуют успеху бизнеса. Языки программирования Python, SQL. Инженерия данных Apache Hadoop, HDFS, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (DataLens, Object Storage, Virtual Machines, Data Proc, Cloud Functions, Managed Kubernetes, Managed Service for PostgreSQL, KMS, IAM, Monitoring). Базы данных PostgreSQL, Greenplum, Oracle, ClickHouse, MongoDB, Redis. Брокеры сообщений Apache Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда»,, Схема «Снежинка»,), Сущность-Связь (ER) Моделирование, Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Kubernetes, Bash скриптинг. Системы контроля версий Git, GitLab, GitHub.

Подробнее

E-commerce & Retail • Logistics & Transport

Дата Инженер / Бизнес-Аналитик с опытом работы более 5+ лет. Квалифицированный специалист с богатым опытом использования различных технологий для решения сложных задач. Мой опыт позволяет мне эффективно ориентироваться в стеке технологий и быстро находить наиболее эффективные решения. Стремлюсь быть в курсе последних событий в отрасли, чтобы всегда обеспечивать наилучшие результаты. Языки программирования Python, SQL. Инженерия данных Apache Airflow, Apache Spark, PySpark, Apache Hadoop, Apache Hive, HDFS. Облачные сервисы Yandex Cloud (DataLens, Object Storage, Compute Cloud, Data Proc, Virtual Machines, Cloud Functions, Managed Service for ClickHouse, Managed Service for PostgreSQL). Базы данных PostgreSQL, MySQL, Redis, ClickHouse, Greenplum, MongoDB. Брокеры сообщений Kafka. Data Science Pandas, NumPy. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Нормализация / Денормализация. DevOps Docker, Docker Compose, Bash scripting, Kubernetes. Системы контроля версий Git, GitHub, Bitbucket.

Подробнее

AI & Robotics • FinTech & Banking • Travel, Hospitality & Restaurant business

Дата-Инженер с опытом работы более 6 лет. Моя цель в работе - стремление добиваться результатов, превосходящих чьи либо ожидания. Я понимаю важность соответствия моей работы конкретным требованиям каждого клиента и умею создавать эффективные стратегии, соответствующие потребностям. Я всегда ищу идеальное решение для всех задач каждого клиента. Языки программирования Python, SQL, Java. Инженерия данных Apache Hadoop, HDFS, Apache Hive, Apache Spark, PySpark, Apache Airflow, dbt, Snowflake. Облачные сервисы Yandex Cloud(DataLens, Object Storage, Compute Cloud, Data Proc, Cloud Functions, Managed Service for PostgreSQL). Базы данных ClickHouse, MS SQL, PostgreSQL, MongoDB, Redis. Брокеры сообщений Kafka. Data Science Pandas, NumPy. Визуализация данных Power BI, Tableau. Бэкенд Spring (MVC, Boot, Security, Data), FastAPI. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Нормализация / Денормализация, Data Vault 2.0. DevOps Docker, Docker Compose, Bash scripting, Kubernetes. Системы контроля версий Git, Bitbucket, GitHub.

Подробнее

E-commerce & Retail • FinTech & Banking

Дата-инженер с опытом работы более 5 лет. Языки программирования Python, SQL. Инженерия данных HDFS, Apache Hadoop, Apache Hive, Apache Spark, PySpark, Apache Airflow. Облачные технологии Yandex Cloud (Object Storage, Compute Cloud, Data Proc, Virtual Machines, Managed Kubernetes, IAM, Cloud Functions, Managed Service for PostgreSQL). Базы данных PostgreSQL, ClickHouse, Greenplum, MongoDB, Elasticsearch, MS SQL, Redis. Брокеры сообщений Apache Kafka. Анализ данных Pandas, NumPy. Визуализация данных Power BI, Kibana. Бэкенд FastAPI, Flask. Моделирование данных Многомерное Моделирование (Схема «Звезда», Схема «Снежинка»), Моделирование Сущность-Связь (ER), Медальонная Архитектура, Data Vault, Нормализация / Денормализация. DevOps Docker, Docker Compose, Kubernetes, Bash scripting. Системы контроля версий Git, GitHub, Bitbucket.

Подробнее

Недавно просмотренные специалисты

AI & Robotics • FinTech & Banking • Logistics & Transport • Social Networking

Дмитрий — DevOps-инженер уровня Middle+ из Санкт-Петербурга. Специализируется на автоматизации процессов разработки и эксплуатации программного обеспечения. Имеет опыт работы с OpenShift, Kubernetes, Istio, Jenkins, Argo CD, Python, Groovy, Maven, Linux и другими технологиями. Участвовал в проектах в сферах FinTech & Banking, Social Networking, Logistics & Transport, AI & Robotics. На проекте SberEsm в роли DevOps Engineer занимался созданием и траблшутингом CI/CD-пайплайнов, миграцией систем, администрированием приложений в OpenShift и DropApp, управлением релизами и приемочными тестами, автоматизацией рабочих процессов. На проекте VK Workmail/VK Teams в роли On-Prem DevOps Engineer / Инженер по наблюдаемости отвечал за интеграцию и поддержку экосистемы продукта VK Workspace, администрирование Kubernetes-кластеров, кластеров баз данных, настройку инструментов мониторинга. Также работал на проектах TMS, Челнок, Optera и JAICP, где занимался улучшением CI/CD-пайплайнов, администрированием сервисов больших данных, внедрением подхода Infrastructure as a Code, мониторингом состояния систем и другими задачами.

Подробнее

E-commerce & Retail • EdTech • FinTech & Banking • LifeStyle • Urban technology

ИА

Ирина А.

Ульяновск

React Native разработчик

Soft Skills: Социальные компетенции: - Грамотная письменная и устная речь - Высокий эмоциональный интеллект - Коммуникабельность - Гибкость и принятие критики - Неконфликтность Интеллектуальные компетенции: - Умение видеть и решать проблему - Умение сосредоточиться на важных деталях для получения максимального результата - Аналитический склад ума - Творческое мышление - Оперирование фактами Волевые компетенции: - Ориентированность на результат - Стрессоустойчивость - Управление временем Лидерские компетенции: - Ответственность - Планирование - Опыт работы преподавателем Hard Skills: Языки программирования: - JS - С++ - Основы java (android native) - Основы matlab Базы данных: - MySQL - PostgreSQL Фреймворки: - React - React Native - Angular Agile-методологии: - Scrum - Kanban - Agile

Подробнее

E-commerce & Retail • FoodTech • Telecom

Высококвалифицированный и мотивированный разработчик программного обеспечения. Имеет сильные технические знания в сочетании с отличными навыками коммуникации. Правильно расставляет приоритеты и способен справляться с несколькими задачами одновременно. Всегда полностью вовлечен в процесс разработки. Умеет работать в команде.

- Опыт разработки с 2020 года; - Опыт рефакторинга кода, код-ревью; - Разработка API; - Опыт написания тестов; - Опыт исследования гипотез, умение генерировать идеи для развития и улучшения продукта; - Выполнение функций DevOps; Образование: Томский государственный университет систем управления и радиоэлектроники (Специалист по информационной безопасности)