Александр Е. Data Scientist, Lead
ID 30069
АЕ
Александр Е.
Мужчина, 24 года
Россия, Санкт-Петербург, UTC+3
Ставка
7 142,85 Р/час
НДС не облагается
Специалист доступен с 3 октября 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Русский — C2
Английский — C1
Главное о специалисте
# Александр — Lead Data Scientist & Innovation Leader
## Профессиональный профиль
**Ведущий специалист по искусственному интеллекту и инновациям** с 7+ летним опытом трансформации бизнес-процессов через внедрение cutting-edge ML/AI решений. Сочетаю глубокую техническую экспертизу с лидерскими навыками и предпринимательским мышлением. **Автор научных публикаций** в области искусственного интеллекта и ИИ в медицине.
**Образование:** Бакалавриат и магистратура СПбГУ по направлению «Прикладная математика и информатика»
**Ключевые достижения:**
- Привлек инвестиции и основал медтех стартап на российском рынке
- Сократил операционные расходы клиентов на 80+ млн рублей через автоматизацию
- Построил production-ready LLM инфраструктуру, ускорившую time-to-market на 40%
- Руководил командами до 15+ специалистов в крупнейших российских компаниях
## Экспертные области
**Индустрии:** FinTech & Banking • Healthcare & MedTech • Cybersecurity • Insurance • Social Networks
**Технологический стек:**
- **AI/ML:** Deep Learning, Computer Vision, NLP, LLM, MLOps
- **Языки:** Python, TCL, SQL
- **Инфраструктура:** Docker, Kubernetes, CI/CD, GPU clusters (H100/A100)
- **Управление:** Team Leadership, Product Strategy, R&D Management
## Ключевой опыт
### Go Invest | Team Lead Data Scientist
**Построение enterprise LLM платформы для финтех**
- Архитектура и развертывание production LLM инфраструктуры на GPU кластере H100
- Автоматизация CI/CD pipeline для моделей, сократившая время деплоя до 30 дней
- Разработка сервиса суммаризации новостей, повысившего engagement на 35%
- **Управление командой:** внедрение OKR и code review, ускорение релизов на 25%
### РОСБАНК | Tech Lead Data Scientist
**Цифровая трансформация документооборота и клиентского сервиса**
- Классификация документооборота: **экономия 80 млн рублей** через автоматизацию
- Кластеризация заявок: **ускорение обработки на 200%**
- Юридический чат-бот: **экономия 15 человеко-часов/неделю** на консультациях
Проекты
(9 лет)
Go Invest
Роль
Team Lead DS
Обязанности
# Опыт Lead Data Scientist - LLM Infrastructure & Team Management
## Построение корпоративной LLM инфраструктуры
**Техническое лидерство:**
- Архитектура и развертывание production-ready среды для LLM inference на GPU кластере H100
- Контейнеризация ML workloads с Docker и оркестрация через Kubernetes
- Внедрение CI/CD pipeline для автоматизированного тестирования и деплоя моделей
- Создание изолированной среды внутри корпоративного контура с соблюдением security policies
**Результаты:**
- Сокращение времени подготовки окружения для новых проектов на 40%
- Стандартизация процессов разработки и тестирования LLM решений
- Обеспечение reproducibility и version control для ML экспериментов
## Автоматизация жизненного цикла LLM моделей
**MLOps и DevOps:**
- Разработка end-to-end pipeline для автоматического деплоя обновленных языковых моделей
- Интеграция систем мониторинга производительности и качества inference
- Внедрение blue-green deployment стратегии для zero-downtime обновлений
- Автоматизация процессов валидации и A/B тестирования новых версий моделей
**Результаты:**
- Сокращение цикла вывода модели в production с нескольких месяцев до 30 дней
- Повышение reliability системы через автоматизированное тестирование
- Снижение manual overhead при обновлении моделей на 80%
## Продуктовая разработка: Сервис суммаризации новостей
**Product Leadership:**
- Разработка и внедрение LLM-based сервиса автоматической суммаризации финансовых новостей
- Интеграция с существующими системами инвестиционной платформы
- Оптимизация качества суммаризации под специфику финансового контента
- Внедрение персонализации контента на основе пользовательских предпочтений
**Бизнес-результаты:**
- Повышение engagement инвестиционного сообщества на 35%
- Увеличение времени пребывания пользователей на платформе
- Автоматизация процесса создания дайджестов новостей
## Управление командой и процессами разработки
**Team Leadership:**
- Внедрение системы OKR (Objectives and Key Results) для alignment команды с бизнес-целями
- Установка процессов code review и pair programming для повышения качества кода
- Создание knowledge sharing практик и технической документации
- Менторинг junior специалистов и развитие технических компетенций команды
**Процессные улучшения:**
- Увеличение скорости релизов на 25% через оптимизацию workflow
- Снижение количества production bugs на 40% благодаря улучшенному code review
- Повышение team velocity и predictability планирования
## Ключевые технические компетенции
**LLM Infrastructure:**
- GPU cluster management (H100, A100)
- Model serving frameworks (vLLM, TensorRT-LLM, Triton)
- Containerization и orchestration (Docker, Kubernetes)
- MLOps tools (MLflow, Weights & Biases, Kubeflow)
**DevOps & CI/CD:**
- Infrastructure as Code (Terraform, Ansible)
- CI/CD pipelines (GitLab CI, Jenkins)
- Monitoring и observability (Prometheus, Grafana, ELK stack)
- Security и compliance в ML системах
**Team & Product Management:**
- Agile/Scrum methodologies
- OKR framework implementation
- Technical mentoring и knowledge transfer
- Cross-functional collaboration с product и business teams
Стек специалиста на проекте
Docker, Python, Управление командой, Code Review, CI/CD, автоматизация, llm, внедрение системы
Отрасль проекта
FinTech & Banking
Период работы
Ноябрь 2024 - Август 2025
(10 месяцев)
РОСБАНК
Роль
Tech Lead DS
Обязанности
## Автоматизация классификации документооборота
**Техническое решение:**
- Разработка NLP-системы для автоматической классификации входящих документов
- Внедрение multi-class classification с использованием BERT-based моделей
- Интеграция с корпоративными системами документооборота (СЭД)
- Создание pipeline для обработки документов различных форматов (PDF, DOC, сканы)
**Архитектура системы:**
- OCR модуль для извлечения текста из сканированных документов
- Preprocessing pipeline для нормализации и очистки текстовых данных
- Ensemble моделей: RuBERTa + классические ML алгоритмы для повышения точности
- API для интеграции с существующими бизнес-процессами
**Бизнес-результаты:**
- Ускорение обработки входящих документов в 3-5 раз
- Экономия операционных расходов: 80 млн рублей в год
- Снижение человеческих ошибок при маршрутизации документов на 95%
- Автоматизация 85% рутинных операций с документами
## Интеллектуальная кластеризация заявок
**ML-подход:**
- Разработка unsupervised learning системы для группировки похожих обращений
- Применение техник topic modeling (LDA, BERTopic) для выявления тематических кластеров
- Создание системы автоматического роутинга заявок к соответствующим специалистам
- Внедрение similarity search для поиска аналогичных решенных кейсов
**Технические компоненты:**
- Vector embeddings для семантического представления текстов заявок
- Clustering алгоритмы (DBSCAN, K-means, Hierarchical clustering)
- Real-time обработка новых заявок с автоматическим присвоением кластера
- Dashboard для мониторинга распределения нагрузки по отделам
**Результаты оптимизации:**
- Ускорение обработки обращений на 200%
- Сокращение времени первичной обработки заявки с 2-3 дней до 4-6 часов
- Повышение качества распределения заявок между специалистами
- Автоматическое выявление приоритетных и срочных обращений
## Юридический чат-бот для внутренних консультаций
**Conversational AI:**
- Разработка domain-specific чат-бота для юридических консультаций сотрудников
- Fine-tuning языковых моделей на корпоративной юридической базе знаний
- Интеграция с внутренними правовыми документами и регламентами
- Создание системы escalation для сложных вопросов к живым юристам
**Техническая реализация:**
- RAG (Retrieval-Augmented Generation) архитектура для точных ответов
- Vector database для хранения и поиска релевантных юридических документов
- Intent classification для определения типа запроса
- Система логирования и аналитики для улучшения качества ответов
**Операционная эффективность:**
- Экономия 15 человеко-часов юристов в неделю (780 часов в год)
- Мгновенные ответы на 70% типовых юридических вопросов
- Снижение нагрузки на юридический отдел на 40%
- Повышение доступности юридических консультаций для всех сотрудников
## Автоматизация ответов правоохранительным органам
**Regulatory Compliance Automation:**
- Разработка системы автоматической генерации корректных ответов на запросы правоохранителей
- Создание template-based генерации с проверкой соответствия правовым требованиям
- Интеграция с корпоративными базами данных для извлечения необходимой информации
- Внедрение workflow для review и approval сгенерированных ответов
**Компоненты системы:**
- NLU модуль для анализа входящих запросов от правоохранительных органов
- Knowledge graph корпоративных данных для точного извлечения информации
- Template engine для генерации структурированных ответов
- Compliance checker для проверки соответствия правовым нормам
**Результаты автоматизации:**
- Сокращение времени подготовки ответов с 5-7 дней до 1-2 дней
- Стандартизация формата и качества ответов
- Снижение рисков правовых нарушений при подготовке документов
- Автоматизация 60% процессов взаимодействия с правоохранительными органами
## Ключевые технические компетенции
**NLP & Document Processing:**
- Transformer models (BERT, RuBERTa, GPT)
- OCR и document parsing (Tesseract, AWS Textract)
- Text classification и clustering
- Named Entity Recognition (NER)
**Legal Tech Stack:**
- Regulatory compliance frameworks
- Legal document analysis
- Contract intelligence
- Risk assessment automation
**System Integration:**
- Enterprise Document Management Systems
- Workflow automation platforms
- API development для legacy systems
- Real-time processing pipelines
**Business Impact:**
- Process optimization и cost reduction
- Regulatory compliance automation
- Operational efficiency improvement
- Risk mitigation через автоматизацию
Стек специалиста на проекте
Документооборот, Разработка, Кластеризация, Классификация, Создание чат-ботов
Отрасль проекта
FinTech & Banking
Период работы
Март 2024 - Ноябрь 2024
(9 месяцев)
Индивидуальное предпринимательство / частная практика /
Роль
Lead Data Scientist
Обязанности
## 1. Система верификации пользователя для кредитного агрегатора
**Роль Lead DS:**
- Архитектура end-to-end ML pipeline для real-time скоринга
- Интеграция данных из БКИ, банковских API, соцсетей, госреестров
- Ансамбль моделей: XGBoost/LightGBM + нейросети + временные ряды
- Внедрение MLOps: мониторинг drift, A/B тесты, автопереобучение
**Технические решения:**
- Feature engineering для структурированных и неструктурированных данных
- Система объяснимости решений (SHAP, feature importance)
- Bias detection и fairness метрики для соответствия регулятивным требованиям
- Микросервисная архитектура с горизонтальным масштабированием
## 2. Система переозвучки аудио и видео с переводом
**Роль Lead DS:**
- Интеграция multi-modal AI pipeline: ASR → NMT → TTS
- Оптимизация качества перевода и синтеза речи
- Управление латентностью и производительностью системы
- Валидация через метрики BLEU, WER, MOS
**Технические решения:**
- Speech-to-Text с поддержкой множественных языков и акцентов
- Neural Machine Translation с контекстной адаптацией
- Voice cloning для сохранения эмоциональной окраски
- Синхронизация аудио-видео потоков
**Результаты:**
- Автоматизация процесса локализации контента
- Поддержка 15+ языковых пар
- Качество перевода на уровне профессиональных переводчиков
- Сокращение времени локализации в 10 раз
## 3. HTTP-сервис модерации контента с RuBERTa
**Роль Lead DS:**
- Fine-tuning RuBERTa под задачи модерации контента
- Создание balanced dataset и data augmentation стратегий
- Оптимизация inference для production (latency < 100ms)
- Настройка threshold'ов для различных типов контента
**Технические решения:**
- Transformer-based классификация с multi-label output
- REST API с batch и real-time обработкой
- Система мониторинга model drift и performance
- Контейнеризация и горизонтальное масштабирование
## 4. Методика оптимального расположения офисов МФЦ
**Роль Lead DS:**
- Формулировка multi-objective optimization задачи
- Интеграция геопространственных, демографических, транспортных данных
- Разработка алгоритмов оптимизации (генетические, симуляция отжига)
- Валидация через симуляцию и исторические данные
**Технические решения:**
- GIS анализ и обработка пространственных данных
- Моделирование потоков посетителей и транспортной доступности
- Оптимизация по критериям: покрытие населения, операционные расходы, время доступа
- Интерактивные визуализации для поддержки принятия решений
## Ключевые компетенции Lead DS
**Техническое лидерство:**
- Архитектура ML систем от прототипа до продакшена
- MLOps и управление жизненным циклом моделей
- Интеграция разнородных источников данных
- Оптимизация производительности и масштабирования
**Управление проектами:**
- Формулировка технических требований из бизнес-задач
- Управление рисками и техническим долгом
- A/B тестирование и экспериментальный дизайн
- Соответствие регулятивным требованиям
**Бизнес-воздействие:**
- Трансформация бизнес-процессов через автоматизацию
- Измеримые улучшения ключевых метрик
- Масштабируемые решения для высоконагруженных систем
- ROI-ориентированная разработка продуктов
Стек специалиста на проекте
Видео, roberta
Отрасль проекта
RnD
Период работы
Январь 2018 - Март 2024
(6 лет 3 месяца)
Формат работы
Тип занятости
Фулл-тайм, Парт-тайм (4 ч/день)
Формат работы
Удаленно
Командировки
Готов
Релокация
Внутри страны, За границу
Готов работать на зарубежных проектах
Да
Образование
Высшее
Учебное заведение
Высшее 2023 Санкт-Петербургский государственный университет,,
Санкт-Петербург
Специальность
Прикладная математика и информатика Навыки
Завершение учебы
2023 г.
Высшее
Учебное заведение
СПбГУ
Специальность
ПМИ
Завершение учебы
2025 г.