Ильнар Б. Data инженер, Senior

ID 28163
ИБ
Ильнар Б.
Мужчина, 24 года
Россия, Самара, UTC+4
Ставка
2 623,37 Р/час
НДС не облагается
Специалист доступен с 12 июля 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data инженер
Грейд
Senior
Навыки
Agile
Bitbucket
BPMN
CI/CD
CSS
Data
deepseek
Django
Docker
ETL-процессы
gigachat
Git
GitHub Pages
governance
Graph
Hadoop
HDFS
Hive
hiveql
HTML
HuggingFace
JavaScript
Jenkins
JupyterNoteBook
Kanban
LaTex
llama
llm
Matplotlib
MinIo
NetworkX
OKR
Pandas
Pipelines
Polars
PostgreSQL
process
PySpark
Python
React
REST API
Scrum
Seaborn
SQL
SQLite
TDD
автоматизация
анализ
Базы данных
Визуализация
Документирование
менторство
преподавание
Работа с интеграциями
Разработка технической документации
Отрасли
EdTech
FinTech & Banking
Знание языков
Английский — B1
Главное о специалисте
Инженер данных и тимлид с опытом в финансовом секторе, образовании и цифровых технологиях. Специализируется на создании масштабируемых ETL-процессов, внедрении GenAI-решений, графовых моделей знаний и автоматизации аналитики. Внедрил Polars и RAG-подходы в банковских системах, построил графовую базу знаний, успешно руководил командой Data-специалистов. Обладает высоким уровнем владения Python, SQL, Spark, GenAI и ML-инструментами, а также лидерскими и преподавательскими компетенциями.
Проекты   (4 года 2 месяца)
Разработка и внедрение GenAI-решений, графовых баз знаний и внутренних Data-продуктов
Роль
Team Lead / Старший Data Engineer
Обязанности
- Управление командой: формирование технических задач, распределение ролей, постановка OKR и контроль прогресса, организация канбан-доски, проведение ретро-сессий, менторинг новых сотрудников. - Разработка решений на базе GenAI: обучение и настройка LLM-моделей (GigaChat, Deepseek) для автоматизации документооборота; реализация Retrieval-Augmented Generation (RAG) архитектуры для поиска информации в базе корпоративных данных. - Разработка инструментов для аналитиков: создание API-интерфейса SQL-запросов на базе библиотеки Polars, что позволило аналитикам запускать обработку по HDFS без участия инженеров; настройка ipywidgets в Jupyter для визуальных интерфейсов разведочного анализа. - Построение Knowledge Graph: реализация GraphRAG-прототипа на основе networkx, настройка визуализации связей через pyvis, разметка сущностей в документах и построение семантических графов бизнес-процессов. - Внедрение ML-инструментов: интеграция моделей Hugging Face для классификации и фильтрации документов, прототипирование на PyTorch. - Поддержка инфраструктуры: управление кодовой базой, внедрение CI/CD пайплайнов, контроль качества данных, оптимизация пайплайнов и архитектуры данных.
Достижения
- Сокращено время подготовки актов с 8 часов до 30 минут - Точность поисковых систем выросла на 25% - Производительность команды увеличена на 30%
Стек специалиста на проекте
PostgreSQL, Python, Scrum, Hive, Базы данных, PyTorch, Jupyter, PySpark, Polars, Graph, llm, rag, NetworkX
Отрасль проекта
FinTech & Banking
Период работы
Декабрь 2024 - Июль 2025  (8 месяцев)
Оптимизация ETL и внедрение Process Mining
Роль
Middle Data Engineer
Обязанности
- Оптимизация ETL-процессов: миграция с Pandas на Polars, внедрение ленивых вычислений (.lazy()), настройка пайплайнов обработки транзакционных данных, адаптация к специфике HDFS. - Проектирование Process Mining: автоматическая разметка событий бизнес-процессов (выпуск кредитов, обслуживание ATM) с визуализацией на BPMN-диаграммах; разработка алгоритмов сопоставления временных цепочек. - Мониторинг бизнес-процессов: настройка SberPM-дэшбордов, внедрение трекеров и метрик; определение точек деградации операций и формирование отчётов по отклонениям. - Автоматизация отчётности: внедрение LaTeX-шаблонов, интеграция с Jenkins-контейнером, настройка параметризованных актов для аудита; генерация PDF-отчётов по сценарию.
Достижения
- Ускорение ETL в 5 раз, снижение памяти на 40% - Сокращение анализа бизнес-процессов с 3 дней до 4 часов - Шаблонизация отчётности и повышение прозрачности аудита
Стек специалиста на проекте
PostgreSQL, SQL, BPMN, Python, Jenkins, Hive, LaTex, HDFS, PySpark, Polars
Отрасль проекта
FinTech & Banking
Период работы
Февраль 2024 - Декабрь 2024  (11 месяцев)
Анализ транзакций и визуальная отчётность
Роль
Junior Data Engineer
Обязанности
- Поддержка ETL и Big Data: построение пайплайнов обработки данных на PySpark, настройка сессий и логики запросов к HDFS, внедрение группировки и оптимизации SQL-запросов. - Разработка визуальных отчётов: автоматизация генерации графиков в Matplotlib и Seaborn, настройка параметров отображения, цветовых схем, пояснений и слияний данных. - Освоение новых технологий: адаптация библиотеки Polars под текущие пайплайны, сравнение производительности с Pandas, внесение предложений по архитектуре. - Взаимодействие с аналитиками: консультации по запросам, помощь в построении SQL-логики, формирование обучающих материалов по работе с новым стеком.
Достижения
- Время обработки снижено на 30% - Подготовка отчётов ускорена в 2 раза - Упрощено взаимодействие аналитиков с отчётными данными
Стек специалиста на проекте
PostgreSQL, Git, Python, Matplotlib, Seaborn, Jupyter, PySpark, Polars, hiveql
Отрасль проекта
FinTech & Banking
Период работы
Август 2023 - Февраль 2024  (7 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
Московский финансово-промышленный университет «Синергия»
Специальность
Цифровые технологии
Завершение учебы
2027 г.
Высшее
Учебное заведение
Самарский государственный университет путей сообщения
Специальность
Цифровые технологии в образовании
Завершение учебы
2024 г.
Высшее
Учебное заведение
Поволжская государственная социально-гуманитарная академия
Специальность
Прикладная информатика
Завершение учебы
2022 г.

Похожие специалисты

Cloud Services • E-commerce & Retail • FinTech & Banking • Manufacturing
ВГ
Василий Г.
Санкт-Петербург
Data инженер
Senior
4 155,84 Р/час
agale
Agile
Altera
Apache AirFlow
cdc
CI/CD
ClickHouse
Code Review
dags
Data
+59

Василий Гладких — инженер данных с более чем шестилетним опытом в разработке и сопровождении ETL-процессов, оптимизации баз данных и построении аналитических систем. Работал в сферах промышленной автоматизации, финансового сектора, консалтинга и e-commerce, последовательно развивая экспертизу в управлении потоками данных, трансформации бизнес-логики и интеграции разнотипных систем. Василий обладает углублёнными техническими компетенциями в языках программирования Python, SQL, PySpark, владеет инструментами Apache Airflow, Knime, Alteryx, Git и системами визуализации — Tableau, Power BI, SSRS. Уверенно работает с аналитическими СУБД: ClickHouse, Vertica, Hive, MSSQL, PostgreSQL, реализует надёжные пайплайны обработки данных для хранилищ и Data Lake-сред. Его решения помогли сократить задержки обработки данных, увеличить надёжность поставки информации и повысить скорость генерации ключевых бизнес-показателей. Василий активно взаимодействует с бизнесом и разработчиками, умеет переводить бизнес-требования в технологические архитектуры, ведёт документацию и сопровождает проекты end-to-end.

Подробнее
EdTech • Hardware
СП
Сергей П.
Санкт-Петербург
Data инженер
Lead
4 349,14 Р/час
Agile
Apache
Apache Hadoop
Apache Spark
Apache Superset
arch
arrow
Bash
C/C++
CentOS
+63

• Сильные технические и математические навыки, умение быстро осваивать инструменты и алгоритмы для работы с данными благодаря богатому и глубокому опыту сфере анализа и исследований • Приобрел успешный опыт в Data Science, начиная от научных исследований (c 2010), потом практических задач для ИТ инфраструктуры инновационного экопарка переработки отходов, и сейчас в проектировании функциональных требований к архитектуре и в сборке и разработке ML моделей и подходов для сложных аналитических систем (умного озера, СУДД, банка, телекоммуникаций) • Эксперт в языке Python (PyCharm & Jupyter) для решения задач по Data Science и для анализа данных (также есть опыт веб разработки в Django & Flask) • Работает с библиотеками, такими как Pandas (+Dask), NumPy, Matplotlib (seaborn, plotly), Statsmodels, SciPy, Scikit-learn и Keras, NTLK, PySpark • Моделировал данные для машинного обучения • Знаком с архитектурой и компонентами экосистемы Big Data, включая GreenPlum, HDFS и облачные хранилища, такие как S3 (MinIO) • Понимает особенности работы с колончатыми базами данных, особенности написания запросов и их последовательной оптимизации, влияние вида запроса на скорость работы и нагрузку на базу данных, задачи и операции, которые требуют специфического решения для колончатых баз данных • Обладает опытом работы с BI инструментами, включая Power BI, Apache Superset (эксперт), Zeppelin • Имеет опыт использования контейнеризации и оркестрации с Docker, включая CI/CD процессы в GitLab • Знаком с ETL инструментами Apache AirKow, DBT, Spark • Также владеет знанием языков программирования C, C++, Java Script, HTML, CSS • Управляет проектами и пользуется инструментами Jira, ConНuence • Обладает опытом работы в Agile среде (- Scrum, Kanban) с использованием инструментов управления проектами, таких как Jira и ConНuence Coursera. Введение в квантовые вычисления. Нейронные сети и глубокое обучение.

Подробнее
E-commerce & Retail • FinTech & Banking • Government & Public Sector
КН
Кирилл Н.
Ростов-на-Дону
Data инженер
Middle+
3 896,1 Р/час
Ansible
Apache AirFlow
Astra Linux
Atlassian
Bash
Bitbucket
Cassandra
Celery
CI/CD
Docker
+66

Кирилл — data-инженер из Ростова-на-Дону. Обладает опытом работы на проектах в сферах FinTech & Banking, Government & Public Sector и E-commerce & Retail. На проекте для компании из сферы FinTech & Banking занимался обработкой больших объёмов информации, анализом данных, разработкой дата-пайплайнов и организацией data quality. Использовал Python, bash, Hadoop, Greenplum, PL/pgSQL, Atlassian, Jupyter, Hue, Hive, Airflow, Superset, Power Bi, PySpark, Pandas, PyArrow. Для государственной компании разрабатывал детальный слой и строил витрины, писал пайплайны по доставке и обработке данных. Использовал Python, Apache Airflow, Git, Posgresql. В качестве python-разработчика для госструктуры создавал скрипты для автоматизации бизнес-процессов и администрирования оборудования, а также писал процедуры для баз данных. В работе использовал Python, Bash, FastAPI, Sqlalchemy, ansible, postman, Git, pgsql, Linux, Docker, Prometheus, Grafana и др. Опыт работы на позиции python-разработчика включал аналитику данных и контроль data quality, разработку скриптов по автоматизации и эксплуатацию измерительной техники. Использовал Python, bash, MySQL, Postgresql, Astra Linux, SecretNet. На последнем месте работы в сфере E-commerce & Retail занимался интеграцией реляционных и нереляционных источников, настройкой мониторинга и алертинга, нормализацией и очисткой данных. Работал со стеком из MongoDB, Postgres, S3, YandexCloud, Greenplum, Python, SQL, Ni-Fi, Airflow, Kafka, k8s, Jenkins, Github, ELK, Grafana, Vault.

Подробнее
E-commerce & Retail • EdTech • RnD
АК
Алексей К.
Белград
Data инженер
Senior
4 110,32 Р/час
Python
Hadoop
Apache AirFlow
AWS
AWS RDS
Bash
beams
Big Data
BigQuery
C++
+106

Алексей — опытный Data инженер с более чем шестилетним опытом работы в проектах RnD, E-commerce & Retail и EdTech. В портфолио Алексея есть несколько успешных проектов: Customer360, разработка программного обеспечения для бухгалтерского учёта для одного из крупнейших розничных продавцов товаров для дома, Apache Superset по визуализации данных для целей BI, внутренний проект, направленный на решение проблем повторного развёртывания групп DAG Airflow на учётных записях Kohls и IAS, IAS Python Upgrade, настройка и поддержка кластера Hadoop/Spark, разработка приложений на Hadoop/Spark для научных целей. Алексей участвовал в разработке и поддержке групп DAG Airflow для преобразования данных, включая сшивание данных; разработал и спроектировал Metadag Airflow DAG, которая автоматизирует и повышает уровень понимания процессов в команде C360; выполнил общую миграцию из локальных в облачные сервисы; получил большой опыт в разработке приложений Flask, выполнении миграций БД с использованием SQLAlchemy и Alembic; разработал внутреннюю систему контроля доступа для приложения Superset; разработал пакет Python3 airflow-redeploy, который упрощает процесс повторного развёртывания групп DAG через официальный REST API и плагин REST API.

Подробнее
AI & Robotics • E-commerce & Retail • FinTech & Banking • Manufacturing
АП
Александр П.
Минск
Data инженер
Senior
4 935,06 Р/час
Data Analysis
Keras
language
Machine learning
Matplotlib
Numpy
OOP
Pandas
programming
Python
+64

Александр — опытный специалист в области Data Engineering с более чем 13-летним опытом работы на различных проектах. Он обладает глубокими знаниями и навыками в таких областях, как машинное обучение, анализ данных, программирование на Python и работа с большими данными. В своей работе Александр участвовал в разработке сервисов для быстрого поиска информации по Confluence компании, решения для оптимизации продаж в электронной коммерции с помощью умного поиска и умных рекомендаций, а также в научно-исследовательском проекте по обнаружению объектов на моментальных снимках физических процессов. Кроме того, он работал над многофункциональным приложением для инженеров, которое использует данные промышленного производства для расчёта оставшегося жизненного цикла устройства и вероятности отказа оборудования. Александр также имеет опыт работы в качестве разработчика клиентской части, где он занимался созданием конструктора бизнес-рассылок, дизайном и прототипом рекламных писем. Больше всего ему нравилось заниматься исследованиями пользовательского опыта, UX-анализом продуктов и проведением интервью с пользователями. Я ML-инженер с более чем двухлетним опытом. В IT, в целом, 10+ лет. До Data Science занимался Front-End разработкой в EPAM Systems. Обладаю успешным опытом как разработки ML-приложений на Python, так и всестороннего анализа данных.

Подробнее

Недавно просмотренные специалисты

FinTech & Banking • IoT • Logistics & Transport • Urban technology
ХЗ
Хожиакбарбек З.
Ташкент
Android разработчик
Middle+
3 636,36 Р/час
Kotlin
Mockito
Firebase
MVVM
Realm
Kotlin coroutines
Push Notifications
Androidx
Koin
Room
+18

4+ года опыта работы. В РФ работал на таких проектах, как: - Суперапп (одно из самых популярных приложений такси (и не только) в России) - Госуслуги в топовом банке РФ - IoT проект по управлению шлагбаумами в Москве и Санкт-Петербурге. В рамках проекта, в том числе, сделал полный рефактор совместно с младшим разработчиком, переведя с MVP на MVVM - Участвовал в разработке небольших приложений как старший разработчик. Например, приложение для пользователей игры. Имеет опыт менторства сотрудников и доведения их до высокого уровня за короткий период. В Узбекистане с нуля поднял большие проекты Ипотека и ~Госуслуги. Занимался поддержкой мобильного приложения ТУРКИСТОН в единственном числе. Также есть ряд небольших реализованных проектов, в том числе для учебного центра. Заинтересован в техническом развитии, позитивно относится к получению нового опыта. Примечание: не хотел бы работать с кредитными продуктами.

Подробнее