Андрей К. Data инженер, Middle+
ID 27819
АК
Андрей К.
Мужчина, 41 год
Россия, Краснодар, UTC+3
Ставка
2 954,3 Р/час
вкл. НДС 5% (109.52 Р)
Специалист доступен с 31 августа 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data инженер
Грейд
Навыки
Отрасли
Знание языков
Английский — B1
Главное о специалисте
Андрей — Data инженер уровня Middle+ из Краснодара. Специализируется на работе с большими данными и имеет опыт в отраслях FinTech & Banking, Realty & Constructoring, BioTech, Pharma, Health care & Sports. Владеет английским языком на уровне B1.
Ключевые навыки: Python, Ruby, SQL, Apache AirFlow, Django, Psycopg2, Pydantic, PySpark, Pytest, Rails, Requests, SQLAlchemy, CI/CD, ClickHouse, Docker, GitHub, GitLab, GreenPlum, HTML5, Kafka, PostgreSQL, RabbitMQ, Big Data, CSS3, GraphQL, Hadoop, REST, RSpec, DWH, ETL ELT, Grafana, JupyterNoteBook, oltp, Prometheus, Spark, Confluence, Git, Jira.
Имеет опыт работы на следующих проектах:
- Shieldpay (FinTech & Banking): оптимизация данных, настройка ClickHouse-кластера, реализация автообновления ключевых метрик, внедрение CI/CD пайплайнов в GitLab, создание документации по ETL-процессам.
- Строительная компания (Realty & Constructoring): разработка backend части приложения, проведение нагрузочного и интеграционного тестирований, рефакторинг и оптимизация запросов и скриптов, проектирование и внедрение решений для улучшения масштабируемости и отказоустойчивости хранилища данных.
- Антифрод система для крупного российского банка (FinTech & Banking): разработка и оптимизация данных, обработка потоковых данных, ETL/ELT процессы, аналитика и витрины данных, документирование и процессы.
- Система противодействия обналичиванию (FinTech & Banking): разработка алгоритмов детекции, визуализация угроз, оперативный мониторинг.
- Разработка платформы лояльности для сети медицинских учреждений (BioTech, Pharma, Health care & Sports): создание микросервисов на Ruby/Python, реализация REST API, оптимизация запросов к PostgreSQL, развёртывание Grafana/Prometheus.
Проекты
(5 лет 2 месяца)
Антифрод система для крупного российского банка
Роль
Data Engineer
Обязанности
Проект направлен на разработку системы для обнаружения мошенничества в режиме реального времени с использованием технологий больших данных. Система анализирует транзакции с использованием данных о клиентах, их картах, местах проживания и истории звонков.
Что реализовывал:
Разработка и оптимизация данных
• Спроектировал и оптимизировал структуру БД, что сократило время выполнения аналитических запросов на 35%
• Разработал 150+ сложных SQL/pgSQL-запросов для обработки транзакционных данных
• Реализовал механизмы валидации данных, повысив их качество на 25%
Обработка потоковых данных
• Построил pipeline обработки данных в реальном времени с использованием Apache Kafka (задержка <500 мс)
• Настроил 7 Kafka-консьюмеров для обработки 1M+ событий/день
ETL/ELT процессы
• Разработал 12 ETL-процессов в Apache Airflow для автоматической обработки данных
• Интегрировал 5 источников данных: PostgreSQL, Hadoop HDFS, REST API, лог-файлы, IoT-устройства
• Создал систему мониторинга пайплайнов с 95% uptime
Аналитика и витрины данных
• Построил 20+ витрин данных в Greenplum для бизнес-аналитики
• Оптимизировал Hive-запросы, сократив время выполнения на 40%
• Внедрил автоматическое обновление ключевых метрик каждые 2 часа
Документирование и процессы
• Создал 50+ страниц технической документации в Confluence
• Автоматизировал 70% рутинных задач (очистка данных, алертинг)
• Внедрил CI/CD пайплайны для ETL-процессов в GitLab
Стек специалиста на проекте
PostgreSQL, Docker, Jira, Confluence, SQL, Python, GitLab, pgAdmin, Hive, Spark, Pandas, GreenPlum, Apache Hadoop, Kafka, JupyterNoteBook, Apache AirFlow, HDFS, PySpark, NiFi, DBT, hue, greеnplum
Отрасль проекта
FinTech & Banking
Период работы
Сентябрь 2022 - Июль 2025
(2 года 11 месяцев)
Система противодействия обналичиванию
Роль
Data Engineer
Обязанности
Автоматическое выявление транзакций-проводников ("мулов") с точностью 89% для блокировки мошеннических схем.
Что реализовывал:
Алгоритмы детекции
Разработал 7 правил для выявления "мулов":
Аномальная активность новых карт (+300% к обычным клиентам)
Циклы переводов "кружком"
Совпадение IP/устройств у разных пользователей
Достигнута точность 89% (F1-score)
Визуализация угроз
Построил графовые модели в Neo4j для выявления сетей:
Обнаружено 15+ преступных групп (от 50 до 200 аккаунтов)
Выявлены шаблоны обналичивания через фриланс-биржи
Оперативный мониторинг
Настроил автоматические алерты в Grafana:
Подозрительные цепочки переводов
Массовые регистрации с одних устройств
Снизил FP-срабатывания на 35%
Стек специалиста на проекте
SQL, Python, Grafana, Kubernetes, Hive, Spark, ClickHouse, Hadoop, GreenPlum, Kafka, Neo4j, Мониторинг, HDFS, PySpark, Анализ
Отрасль проекта
FinTech & Banking
Период работы
Ноябрь 2022 - Сентябрь 2023
(11 месяцев)
Разработка платформы лояльности для сети медицинских учреждений
Роль
Ruby/Python - разработчик
Обязанности
Проект направлен на создание надежных сервисов и программ лояльности для клиентов учреждений
Что реализовывал:
Разработка ядра платформы
• Создал 8 микросервисов на Ruby/Python для обработки транзакций лояльности
• Реализовал REST API (Swagger-документирование) для интеграции с фронтендом
• Оптимизировал запросы к PostgreSQL, сократив время ответа API с 1200ms → 400ms
Система мониторинга
• Развернул Grafana/Prometheus (15+ дашбордов) для трекинга:
активности пользователей
эффективности бонусных программ
нагрузки на сервисы
• Настроил алертинг для 95% критических метрик
Качество кода
• Достиг 85% покрытия через RSpec/pytest (120+ юнит-тестов)
• Опубликовал библиотеку freight_calc на RubyGems (200+ скачиваний)
Процессы
• Внедрил GitLab CI/CD для автоматического тестирования и деплоя
• Уменьшил время код-ревью на 30% через шаблоны merge request
Стек специалиста на проекте
PostgreSQL, Docker, Python, Grafana, Prometheus, GreenPlum, Аналитика, Ruby on Rails, Flask, Django, Redis, GitLab CI/CD, PySpark, кеширование
Отрасль проекта
BioTech, Pharma, Health care & Sports
Период работы
Январь 2022 - Ноябрь 2022
(11 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Дополнительное
Учебное заведение
Philippines national IT standards foundation
Специальность
Инженер информационных технологий
Завершение учебы
2026 г.