София Я. Data инженер, Senior

ID 27471
СЯ
София Я.
Женщина, 26 лет
Россия, Москва, UTC+3
Ставка
3 802,05 Р/час
вкл. НДС 5% (140.95 Р)
Специалист доступен с 4 июля 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data инженер
Грейд
Senior
Навыки
Apache
Apache AirFlow
Big Data
BigQuery
CI/CD
ClickHouse
Dagster
DBT
Docker
DWH
Elasticsearch
Grafana
Groovy
Hadoop
Java
Kafka
Kubernetes
metrics
MSSQL
NiFi
Oracle
PostgreSQL
Python
REST API
Scala
Snowflake
Spark
SQL
Vertica
victoria
Отрасли
E-commerce & Retail
Telecom
Знание языков
Английский — C1
Главное о специалисте
София — Senior Data инженер из Москвы с опытом работы в отраслях Telecom и E-commerce & Retail. Имеет высшее образование по специальности «бизнес-информатика» с дополнительной специализацией в области биоинформатики. Владеет английским языком на уровне C1. Ключевые навыки: Apache, Apache AirFlow, Big Data, BigQuery, CI/CD, ClickHouse, Dagster, DBT, Docker, DWH, Elasticsearch, Grafana, Groovy, Hadoop, Java, Kafka, Kubernetes, MSSQL, NiFi, Oracle, PostgreSQL, Python, REST API, Scala, Snowflake, Spark, SQL, Vertica, Victoria. Опыт работы на проектах: - Выгрузка данных по мобильным приложениям компании «Билайн». Разработка высокопроизводительных конвейеров данных с использованием Apache NiFi, Spark и Kafka, обрабатывающих до 1 ТБ ежедневно. - Разработка интеграций на проекте «Нефтехим». Создание рабочих процессов ETL на основе метаданных с использованием Apache Airflow и NiFi, интегрирующих REST API и внутренние источники данных. Общая продолжительность работы на проектах — 2 года 3 месяца.
Проекты   (4 года 5 месяцев)
Выгрузка данных по мобильным приложениям компании “Билайн”
Роль
Data Engineer
Обязанности
Команда: 1-3 человека Архитектура: Микросервисная Обязанности: Разрабатывала высокопроизводительные конвейеры данных с использованием Apache NiFi, Spark и Kafka, обрабатывающие до 1 ТБ ежедневно Разработка оптимизированного хранилища HDFS и Hive, сокращающее занимаемое пространство на 50% за счет расширенного разбиения на разделы и форматов ORC/Parquet Работа с запросами (оптимизация, чтение, хранение и т.д.) Построение и хранение данных Развертывание конвейеров CI/CD для DAG на базе Scala, оптимизирующие автоматизацию и поддержку рабочих процессов, специфичных для домена. Обеспечение и поддержка основных потоков данных, лежащие в основе 90% панелей управления аналитического отдела. Повышение качества данных за счет интеграции регистрации и мониторинга с Grafana, Victoria Metrics и ElasticSearch. Работа с большими данными Cборка, компиляция и развертывания приложений в контейнерной среде
Стек специалиста на проекте
DBT, Grafana, ClickHouse, Spark, Groovy, Hive, Elasticsearch, Java, API, Scala, MVP, Yandex, Hadoop, Kafka, Apache NiFi, Big Data, DWH, VictoriaMetrics, SQL, Docker, CI/CD
Отрасль проекта
Telecom
Период работы
Июнь 2023 - По настоящее время  (2 года 2 месяца)
Разработка интеграций на проекте Нефтехим
Роль
Data Engineer
Обязанности
Команда: 10-12 человек Архитектура: Микросервисная Обязанности: Разработка рабочих процессов ETL на основе метаданных с использованием Apache Airflow и NiFi, интегрирующие REST API и внутренние источники данных. Разработка предоставленных чистых семантических слоёв, позволяющих создавать эффективные панели мониторинга для заинтересованных сторон в бизнесе. Документирование потоков данных и программные системы, улучшающие взаимодействие в команде и эффективность адаптации
Стек специалиста на проекте
PostgreSQL, Docker, SQL, Oracle, MVP, ETL, Vertica, Apache AirFlow, NiFi
Отрасль проекта
E-commerce & Retail
Период работы
Март 2021 - Июнь 2023  (2 года 4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Высшая школа экономики (НИУ ВШЭ), Москва.
Специальность
Степень бакалавра в области бизнес-информатики, факультет бизнеса и менеджмента, дополнительная специализация в области биоинформатики, факультет компьютерных наук
Завершение учебы
2022 г.

Похожие специалисты

E-commerce & Retail • FinTech & Banking
АМ
Артем М.
Москва
Data инженер
Middle+
5 844,15 Р/час
Basics
Java
Pl/SQL
Python
R
SAS
Scala
SQL
Docker
GitLab CI/CD
+49

Артём — опытный Data-инженер, специализирующийся на разработке платформ данных и интеграции различных источников информации. Обладает навыками работы с такими инструментами, как PostgreSQL, Clickhouse, Kafka, Elasticsearch, Airflow, Spring, а также имеет опыт использования технологий Apache Ignite, Hadoop, Hive, Spark, PySpark. Артём участвовал в нескольких проектах, где проявил себя как специалист по разработке сложных архитектур данных. В одном из проектов он разработал платформу данных с нуля, организовал процесс миграции из различных источников и оптимизировал существующие таблицы Clickhouse. В другом проекте Артём разработал продукт для расчёта активов с весом риска для отдела рисков. Он также реализовал конвейеры данных, создал платформу для модульного тестирования и разработал индивидуальную интеграцию с различными внутренними API.

Подробнее
E-commerce & Retail • FinTech & Banking • Government & Public Sector
КН
Кирилл Н.
Ростов-на-Дону
Data инженер
Middle+
3 896,1 Р/час
Ansible
Apache AirFlow
Astra Linux
Atlassian
Bash
Bitbucket
Cassandra
Celery
CI/CD
Docker
+66

Кирилл — data-инженер из Ростова-на-Дону. Обладает опытом работы на проектах в сферах FinTech & Banking, Government & Public Sector и E-commerce & Retail. На проекте для компании из сферы FinTech & Banking занимался обработкой больших объёмов информации, анализом данных, разработкой дата-пайплайнов и организацией data quality. Использовал Python, bash, Hadoop, Greenplum, PL/pgSQL, Atlassian, Jupyter, Hue, Hive, Airflow, Superset, Power Bi, PySpark, Pandas, PyArrow. Для государственной компании разрабатывал детальный слой и строил витрины, писал пайплайны по доставке и обработке данных. Использовал Python, Apache Airflow, Git, Posgresql. В качестве python-разработчика для госструктуры создавал скрипты для автоматизации бизнес-процессов и администрирования оборудования, а также писал процедуры для баз данных. В работе использовал Python, Bash, FastAPI, Sqlalchemy, ansible, postman, Git, pgsql, Linux, Docker, Prometheus, Grafana и др. Опыт работы на позиции python-разработчика включал аналитику данных и контроль data quality, разработку скриптов по автоматизации и эксплуатацию измерительной техники. Использовал Python, bash, MySQL, Postgresql, Astra Linux, SecretNet. На последнем месте работы в сфере E-commerce & Retail занимался интеграцией реляционных и нереляционных источников, настройкой мониторинга и алертинга, нормализацией и очисткой данных. Работал со стеком из MongoDB, Postgres, S3, YandexCloud, Greenplum, Python, SQL, Ni-Fi, Airflow, Kafka, k8s, Jenkins, Github, ELK, Grafana, Vault.

Подробнее
FinTech & Banking • Logistics & Transport • Media • Telecom
РД
Роман Д.
Београд
Data инженер
Middle+
3 596,53 Р/час
Python
PostgreSQL
Apache AirFlow
GreenPlum
SQL
Git
Docker
Kafka
Hadoop
Oracle
+41

Роман — опытный Data-инженер уровня Middle+ с опытом работы более 4 года. Он обладает широким спектром навыков в области разработки и аналитики данных, включая знание Python, PostgreSQL, Apache AirFlow, GreenPlum, SQL, Git, Docker, Kafka, Hadoop, Oracle, ETL, DWH, PySpark, Jira, Hive, Clickhouse, Data, MySQL, BI, API, FastAPI, Pl/SQL, MongoDB, Redis, Spark, Apache Spark, Bash, Confluence, GitLab CI/CD, Grafana, HDFS, CI/CD, GitLab, oozie, Scala, Akka, HTTP, REST, Jenkins, Jupyter Notebook. Роман работал над проектами в таких отраслях, как медиа, телекоммуникации, логистика и транспорт, финтех и банкинг. На проектах он занимался созданием и поддержкой ETL-конвейеров, рефакторингом кода, настройкой мониторинга и алертинга, проектированием решений для DWH и разработкой REST API. Опыт Романа включает работу в IT-компании, где он участвовал в создании изолированной среды разработки для аналитиков, а также в телекоммуникационной компании, автомобильном бизнесе и банке. В последнем проекте он разработал витрину данных, которая сэкономила компании порядка 80 млн рублей в квартал.

Подробнее

Недавно просмотренные специалисты

E-commerce & Retail • Telecom
СЯ
София Я.
Москва
Data инженер
Senior
3 802,05 Р/час
Dagster
DBT
NiFi
metrics
Grafana
ClickHouse
Spark
Groovy
BigQuery
Elasticsearch
+30

София — Senior Data инженер из Москвы с опытом работы в отраслях Telecom и E-commerce & Retail. Имеет высшее образование по специальности «бизнес-информатика» с дополнительной специализацией в области биоинформатики. Владеет английским языком на уровне C1. Ключевые навыки: Apache, Apache AirFlow, Big Data, BigQuery, CI/CD, ClickHouse, Dagster, DBT, Docker, DWH, Elasticsearch, Grafana, Groovy, Hadoop, Java, Kafka, Kubernetes, MSSQL, NiFi, Oracle, PostgreSQL, Python, REST API, Scala, Snowflake, Spark, SQL, Vertica, Victoria. Опыт работы на проектах: - Выгрузка данных по мобильным приложениям компании «Билайн». Разработка высокопроизводительных конвейеров данных с использованием Apache NiFi, Spark и Kafka, обрабатывающих до 1 ТБ ежедневно. - Разработка интеграций на проекте «Нефтехим». Создание рабочих процессов ETL на основе метаданных с использованием Apache Airflow и NiFi, интегрирующих REST API и внутренние источники данных. Общая продолжительность работы на проектах — 2 года 3 месяца.

Подробнее
FinTech & Banking • RnD • Telecom
НС
Никита С.
Москва
DWH разработчик
Senior
3 981,88 Р/час
MapReduce
GitLab
governance
Yarn
ClickHouse
Spark
Hive
Data
Git
Bitbucket
+28

Моя основная экспертиза — разработка и развитие современных хранилищ данных (DWH), Data Lake House и решение сложных инфраструктурных задач. За плечами больше четырех лет успешного внедрения решений, позволяющих эффективно управлять огромными объемами информации. Я хотел бы развиваться в области изучения передовых подходов и новейших технологий, открывающих новые горизонты анализа больших данных и способствующих повышению эффективности бизнес-процессов компаний. В достижении поставленных целей мне помогают такие качества, как высокий уровень самоорганизации, постоянная жажда профессионального роста, активное участие в специализированных лекциях и семинарах, стремление совершенствовать технические знания и развивать экспертизу.

Подробнее