Руслан Х. Data Scientist, Senior

ID 30924

РХ

Руслан Х.

Мужчина, 41 год

Россия, Уфа, UTC+5

Ставка

4 415,58 Р/час

НДС не облагается

Специалист доступен с 14 сентября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data Scientist

Грейд

Senior

Навыки

Apache AirFlow

Apache Hadoop

apache hive

Apache Kafka

Apache Spark

ClickHouse

Docker

Elasticsearch

ETL

GitLab

GOlang

milvus

Pytest

Python

Scala

SQL

Нереляционные БД (NoSQL)

Отрасли

Social Networking

Проекты (5 лет 2 месяца)

NDA

Роль

Data Engineer

Обязанности

Обязанности: - Проектирование и реализация архитектуры хранилища данных на основе модели hNhM с учетом требований производительности и масштабируемости. - Оптимизация структуры данных и индексации для повышения скорости запросов и обработки данных. - Проектирование и разработка SQL-моделей для трансформации исходных данных в аналитические таблицы, которые будут использоваться для отчетности. - Создание и поддержка пайплайнов извлечения, трансформации и загрузки данных (ETL) с использованием DBT для обеспечения актуальности и доступности данных. - Интеграция DBT с системами CI/CD для автоматизации развертывания моделей и тестов в различных средах (разработка, тестирование, продакшен). - Настройка мониторинга выполнения задач DBT и отладка возможных ошибок или проблем, возникающих в процессе трансформации данных. - Разработка и внедрение девяти конвейров поставки данных через Oozie, включая настройку триггеров, обработку ошибок и мониторинг выполнения. - Обеспечение интеграции с Hadoop и Kafka, включая настройку потоковой передачи данных и их трансформацию. - Оптимизация процессов ETL (Extract, Transform, Load) для повышения их эффективности и снижения времени обработки. - Проектирование и реализация порядка 20 DAG'ов (Directed Acyclic Graphs) в Apache Airflow для автоматизации процессов загрузки и обработки данных. - Настройка мониторинга и алертов для отслеживания состояния выполнения DAG'ов и быстрого реагирования на сбои. - Разработка документации по использованию и поддержке созданных DAG'ов для команды. - Анализ текущих библиотек и инструментов, используемых в Data Science (DS) и Data Engineering (DE), для выявления пробелов и возможностей для улучшения. - Разработка новых модулей и функций в библиотеке, включая инструменты для работы со Spark - Проектирование и реализация процесса инкрементальной загрузки данных из трех различных баз данных (Firebird, PostgreSQL, MSSQL) в единое хранилище на базе PostgreSQL. - Оптимизация процесса загрузки для минимизации времени простоя и снижения нагрузки на источники данных. - Проведение тестирования на предмет целостности и точности загружаемых данных - Разработка и внедрение логики загрузки данных с использованием Apache Airflow, включая создание задач, настройку зависимостей и параметров выполнения. - Интеграция логики с существующими процессами ETL для обеспечения согласованности и целостности данных.

Стек специалиста на проекте

PostgreSQL, Apache Kafka, Docker, Java, SQL, Kubernetes, ClickHouse, Apache Hadoop, Apache Spark, Apache AirFlow, GOlang, PySpark, DBT

Отрасль проекта

Social Networking

Период работы

Ноябрь 2023 - По настоящее время (1 год 11 месяцев)

Роль

Data Engineer

Обязанности

Обязанности: - Проведение анализа требований к данным и проектирование схемы базы данных в Clickhouse, оптимизированной для аналитических запросов. - Создание таблиц, индексов и других объектов базы данных с учетом специфики используемых данных и частоты их обновления. - Разработка и реализация порядка 15 DAG'ов в Apache Airflow для автоматизации процессов загрузки данных из внутренних источников (MySQL, Hadoop) и внешних источников (парсинг сайтов и загрузка XML). - Настройка триггеров и расписаний для выполнения загрузок, а также обработка ошибок и уведомлений о статусе выполнения. - Оптимизация процессов ETL (Extract, Transform, Load) для повышения производительности и надежности загрузки данных. - Разработка скриптов для парсинга данных с веб-сайтов с использованием библиотек, таких как BeautifulSoup или Scrapy, а также настройка обработки полученных данных. - Создание механизмов для автоматической загрузки и обработки XML-файлов, включая валидацию данных и их преобразование в формат, совместимый с Clickhouse. - Обеспечение регулярного обновления данных из внешних источников с помощью настройки периодических задач. - Проведение анализа существующих аналитических скриптов на предмет производительности, включая использование инструментов профилирования и мониторинга. - Выявление узких мест и неэффективных запросов, а также разработка рекомендаций по их оптимизации. - Рефакторинг SQL-запросов для улучшения их производительности, включая использование индексов, подзапросов и других методов оптимизации. - Переписывание алгоритмов обработки данных для повышения их скорости выполнения и снижения потребления ресурсов. - Проведение тестирования оптимизированных скриптов на различных объемах данных для оценки их производительности и корректности. - Документирование изменений и результатов тестирования для дальнейшего анализа и использования командой

Стек специалиста на проекте

MySQL, Docker, XML, Java, Python, Scala, Kubernetes, ClickHouse, Scrapy, Apache Hadoop, GOlang, apache hive, BeautifulSoup4

Отрасль проекта

Social Networking

Период работы

Декабрь 2021 - Ноябрь 2023 (2 года)

Билайн

Роль

Data Engineer

Обязанности

Обязанности: - Проведение детального анализа текущих SQL-запросов для понимания их логики, структуры и функциональности. - Выявление узких мест в производительности и определение областей, требующих оптимизации. - Разработка архитектуры кода для реализации бизнес-логики в Scala, включая выбор подходящих библиотек и инструментов Spark для обработки данных. - Определение структуры данных и форматов, необходимых для эффективной работы с Spark. - Переписывание сложных SQL-запросов на Scala с использованием DataFrame API и Spark SQL, обеспечивая эквивалентный функционал и производительность. - Использование функций Spark для обработки больших объемов данных, таких как map, reduce, join, filter и других, для достижения необходимого результата.

Стек специалиста на проекте

MySQL, Docker, Python, Scala, Kubernetes, Spark, Apache Hadoop, apache hive

Отрасль проекта

Social Networking

Период работы

Март 2022 - Июнь 2022 (4 месяца)

Формат работы

Тип занятости

Фулл-тайм

Формат работы

Удаленно

Командировки

Не готов

Релокация

Не готов

Готов работать на зарубежных проектах

Нет

Образование

Высшее

Учебное заведение

Уфимский государственный авиационный технический университет

Специальность

Факультет информатики и робототехники Моделирование и исследование операций в организационно-технических системах

Завершение учебы

2007 г.

Похожие специалисты

EdTech • FinTech & Banking • Travel, Hospitality & Restaurant business

▪ Data Scientist c более чем 5 летним опытом в области анализа данных и машинного обучения в различных отраслях, включая банковское дело, финансовые услуги, e-commerce и стартапах. ▪ Применение передовых методов анализа данных и машинного обучения для глубокого анализа текущих данных и процессов (уверенное использование ML-методов, как классических, так и DL), оптимизации операций и извлечения ценных инсайтов, а также их адаптации к бизнес-потребностям. ▪ Разработка и проектирование систем разной сложности в соответствии с техническими требованиями и задачами, включая высокоэффективные, высоконагруженные и масштабируемые микросервисные приложения. Написание кода в соответствии с PEP 8 ▪ Глубокий анализ существующих решений, их улучшение и адаптация к требованиям бизнес-процессов. ▪ Опыт работы с облачными сервисами (Sber Cloud, Azure) и настройкой CI/CD процессов (Gitlab, Jenkins). ▪ Коммуникабельность, мотивация и способность быстро вливаться в текущие процессы команды с целью достижения результатов. ▪ Менторинг новых сотрудников, участие в демо и внутренних конференциях, написание статей ▪ Проведение code review

Опыт разработки в data science, разработке и аналитике более 6 лет Участие в проектах классического ML, NLP, CV Аналитика, разработка ML решения, тестирование и выкатка в прод Аналитические и организационные навыки Опыт руководства коллективом: 3 разработчика

Подробнее

AI & Robotics • FinTech & Banking • Marketing, Advertising & Design • Telecom

5 лет в создании AI, высшее техническое образование. Опыт в нишах AdTech, FinTech, Телеком, Искусства. Проекты управления рекламными кампаниями, прогнозирования оттока клиентов, в Big Data, в банковских рисках.

Подробнее

AI & Robotics • BioTech, Pharma, Health care & Sports • RnD

Описание пока отсутствует

Подробнее

E-commerce & Retail • IoT • Manufacturing • Telecom

Дмитрий — опытный специалист в области Data Science с опытом работы более 5 лет. Он обладает глубокими знаниями и навыками в таких областях, как машинное обучение, обработка данных и программирование на Python. Дмитрий работал над проектами для различных отраслей, включая электронную коммерцию, производство, IoT и телекоммуникации. На каждом проекте он выполнял широкий спектр задач, от разработки алгоритмов до внедрения систем машинного обучения. В своей работе Дмитрий уделяет особое внимание точности и эффективности решений. Он успешно внедрял инновационные подходы для повышения точности обнаружения аномалий, оптимизации рабочих процессов и улучшения пользовательского опыта. ДОСТИЖЕНИЯ Победитель MLHack В команде, занявшей первое место на хакатоне MLHack, организованном Botan Investments 1-е место на хакатоне «BlackDay» Победитель хакатона T-Systems «Black Day» с проектом Blockchain ЛИЧНЫЕ ПРОЕКТЫ Приложение для незрячих людей, которое решает задачу субтитрования изображений, используя модель внимания с LSTM и CNN, получая изображения с камеры телефона и превращая их в связный текст, а затем текст в аудио. Решение задачи генерации, не защищенных авторским правом изображений из предложений, благодаря AttnGAN. Это решение заняло первое место на хакатоне MLHack.

Подробнее

Недавно просмотренные специалисты

Описание пока отсутствует

Описание пока отсутствует

Подробнее

E-commerce & Retail • FinTech & Banking

СД

Сергей Д.

Минск

Full Stack разработчик

• Программист с более чем 5-летним опытом разработки приложений с использованием различных платформ и технологий. • Большой базовый опыт разработки на Java • Способность находить творческие решения сложных проблем. • Отличный командный работник с навыками коучинга и наставничества. • Разработка back-end и front-end. • Rest API • Разработка мобильных приложений для Android • Объектно-ориентированное проектирование и анализ • Отличные коммуникативные навыки и способность хорошо работать в команде или в индивидуальной среде • Легко обучаем, открыт для новых технологий и знаний, ответственен, коммуникабелен и стрессоустойчив. • Работа с пользователями для установления требований к продукту и определения приоритетов. • Точная оценка времени разработки. • Изучение альтернативных конфигураций и внедрение лучших решений. • Анализ данных и проведение тестирования на совместимость и обеспечение качества продукта.

Языки программирования: PHP 7/8 - 4.5 года JavaScript - 4.5 года Технологии: MySQL - 4.5 года Laravel - 3.5 года HTML - 3 года CSS - 1 год MVC - 4 года REST - 2.5 года Redis - 2.5 года NGINX - 2.5 года Apache - 4.5 года Terminal/Bash - 4.5 года Composer - 4 года Другое: Аудит кода и архитектуры. Архитектура базы данных. Разработки ботов в ТГ и ВК.

Подробнее

EdTech • FinTech & Banking