МУ
Максим У.
Мужчина, 32 года
Россия, Казань, UTC+3
Ставка
3 142,85 Р/час
НДС не облагается
Специалист доступен с 6 октября 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Разработчик баз данных
Грейд
Навыки
Отрасли
Знание языков
Английский — B2
Главное о специалисте
Специализируюсь на работе с различными базами данных, настройкой ETL процессов, построением интеграций с различными ресурсами, а также автоматизированном сборе (парсинг, скраппинг) структурированной/неструктурированной информации.
Принимал участие в проектах компаний широкого перечня отраслей: видеохостинги, коммерческие банки, агентства недвижимости, а также финтех и производственные стартапы. Осуществлял разметку контента с помощью искусственного интеллекта, настраивал пайплайны для машинного обучения, оптимизировал отказоустойчивость процессов, аналитически собрал процесс для динамической сверки строимости разметки ручной и LLM.
Разработал бэкенд коммерческого приложения для корпоративных клиентов банка.
Руководил командой хранилища данных европейского стартапа для постройки архитектуры хранилища данных, подготовки к масштабированию, настройки системы качества данных и разработки интеграций с внешними сервисами.
Проекты
(9 лет)
Видеохостинг
Роль
Архитектор DWH
Обязанности
- Осуществил миграцию ETL процессов из Nirvana в Airflow для интеграции инструментов ДзенПлатформы в контур ВК.
- Разработал и реализовал методику расчета затрат на разметку
крауд-платформ против разметки с помощью LLM.
- Разработал промты для определения категории видео/постов/рекламы исходя из текста, изображения, аудио, иногда - раскадровки.
- Доработал узкие места ETL процессов, которые влияли на результаты разметки.
- Обучил несколько ML-моделей на catboost для классификации контента по категориям.
- Собрал дашборды(Datalens) для руководителей для анализа качества, скорости и стоимости разметки.
Основной стек: Python, Ytsaurus, Nirvana, Hitman, Airflow, Oneflow, Datalens
Стек специалиста на проекте
API, Python, ETL, Kafka, Apache AirFlow, CatBoost, Работа с интеграциями, DataLens, hitman, llm, ytsaurus
Отрасль проекта
Media
Период работы
Ноябрь 2024 - Июнь 2025
(8 месяцев)
Корпоративный блок Банка
Роль
Дата-инженер/Разработчик (Архитектор DWH)
Обязанности
Изначально работал в команде сборки фичей для витрин данных для корпоративного блока банка.
- Разработка фичей для расчета клиентских метрик; разработка интеграций с внешними источниками для обогащения существующих витрин.
- Разработка инструментов для автоматизации миграции данных: сбор метаинформации об объектах, удаление мусора,
создание объектов по подобию, создание тестовых слоев данных, оптимизация объектов.
- Написал временное решение взамен Airflow - шедулер, запускающий по расписанию SQL скрипты.
- Начал разрабатывать методологию валидации клиентских атрибутов для формирования знаний о покупателях продуктов экосистемы и улучшения конверсии.
Далее работал в команде разработки коммерческого продукта, где доработал бэкенд приложения для интеграции данных из различных источников (API, веб-сайты, облачные хранилища, 1С) в корпоративное хранилище данных (DWH), которое разворачивалось в контуре Сбера.
- Написал интеграцию с Apache Nifi для создания базовых ETL процессов для миграции данных.
- Написал интеграцию с 1С миграции данных в Postgres: получение списка объектов в составе схем, получение атрибутного состава, слияние нескольких объектов, чтобы
получить вид "как в интерфейсе программы".
Стек специалиста на проекте
PostgreSQL, API, SQL, Python, Teradata, Kubernetes, *nix, Hive, Spark, Hadoop, GreenPlum, ETL, Kafka, DWH, 1С, Apache AirFlow, Apache NiFi, Superset, PySpark
Отрасль проекта
FinTech & Banking
Период работы
Август 2022 - Ноябрь 2024
(2 года 4 месяца)
Европейский стартап в области производства
Роль
Тимлид команды хранилища данных (Архитектор DWH)
Обязанности
Руководил командой из двух дата-инженеров.
- Разработали аналитические витрины по заказу
бизнес-пользователей.
- Построили систему контроля качества данных с оповещением в BI об ошибках.
- Спроектировали несколько специфических операторов для Airflow для работы с Salesforce, Zendesk, ActivityRecords.
- Переписали модели источников в Looker, чтобы
пользователи могли сами накликать дашборд.
- Периодически выполняли технические работы для улучшения масштабируемости баз данных (после добавления новых юрлиц в состав холдинга), отказоустойчивости ETL (администрирование работы воркеров) и добавления фичей, которые могли бы ускорить работу аналитиков.
Стек специалиста на проекте
BI, Zendesk, Apache AirFlow, Salesforce, Snowflake, PySpark, DBT, Построение дашбордов, Looker BI
Отрасль проекта
Manufacturing
Период работы
Ноябрь 2021 - Декабрь 2022
(1 год 2 месяца)
Формат работы
Тип занятости
Фулл-тайм, Парт-тайм (20 ч/день)
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Дипломы и сертификаты
Аттестат ФСФР серии 2.0 2018 г.
Образование
Высшее
Учебное заведение
НИУ ВШЭ
Специальность
Фондовый рынок и инвестиции
Завершение учебы
2016 г.