АК
Алексей К.
Мужчина, 36 лет
Россия, Казань, UTC+3
Ставка
3 922,07 Р/час
НДС не облагается
Специалист доступен с 1 августа 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
DevOps
Грейд
Навыки
Отрасли
Знание языков
Английский — C1
Главное о специалисте
пытный DevOps-инженер с более чем 14-летним стажем в построении масштабируемой, отказоустойчивой и производительной инфраструктуры для проектов в Web3, геймдеве и AI. Работал с Kubernetes (в том числе bare-metal), облачными платформами AWS и GCP, построением CI/CD-процессов, контейнеризацией и безопасностью. Специализируется на архитектуре платформ, автоматизации процессов, мониторинге, безопасности и оптимизации производительности — как в облаке, так и на железе.
Имеет богатый опыт в разработке решений с использованием Terraform, ArgoCD, Helm, Prometheus и высокой нагрузкой (до 5000+ одновременных соединений с задержкой <10 мс). Внедряет подходы DevSecOps и MLOps, поддерживает модели LLM, системы безопасности на железе, потоковую обработку и управление состоянием блокчейна. Занимался разработкой и внедрением комплексной инфраструктуры MLOps с поддержкой моделей Llama 3 70B и CodeLlama-34B для анализа смарт-контрактов (игры на Web3). Разрабатывал конвейеры CI/CD с использованием GitLab CI, Terraform и Kubernetes для обучения и обслуживания моделей. Опыт с контейнеризацией сервисов LLM с использованием Docker и их развертывание на AWS EKS. Реализовал конвейер MLOps с использованием реестра моделей MLflow, DVC для управления версиями моделей и автоматизированных шлюзов валидации моделей. Разрабатывал комплексный стек мониторинга и наблюдения с использованием Prometheus, Grafana, Jaeger и ELK.
Проекты
(12 лет 3 месяца)
Построение современной, масштабируемой и отказоустойчивой MLOps-инфраструктуры для Web3-гейминга — с фокусом на интеллектуальный анализ смарт-контрактов
Роль
DevOps/Mlops
Обязанности
● Разработка и внедрение комплексной инфраструктуры MLOps с поддержкой моделей Llama 3 70B и CodeLlama-34B для анализа смарт-контрактов (игры на Web3)
● Разработка конвейеров CI/CD с использованием GitLab CI, Terraform и Kubernetes для обучения и обслуживания моделей
● Контейнеризация сервисов LLM с использованием Docker и их развертывание на AWS EKS
● Реализация конвейера MLOps с использованием реестра моделей MLflow, DVC для управления версиями моделей и автоматизированных шлюзов валидации моделей
● Разработка комплексного стека мониторинга и наблюдения с использованием Prometheus, Grafana, Jaeger и ELK
Достижения
● Создал устойчивую основу для масштабируемой ML-аналитики в Web3-играх
● Повысил прозрачность и управляемость моделей в продакшен-среде
● Обеспечивал устойчивость, безопасность и производительность для ML-стека в условиях высокой нагрузки
Стек специалиста на проекте
TensorRT, NVidia, Grafana, Gitlab CI, AWS, GKE, emr, compute, Elasticsearch, ArgoCD, Redis, Prometheus, Ansible, Terraform, Helm, Apache Spark, cloud, S3, MLflow, GCP, EKS, CUDA, EC2, SQL, Docker, Python, Lambda, RDS, PostgreSQL, kinesis, Jenkins, Kubernetes, engine
Отрасль проекта
LifeStyle
Период работы
Апрель 2025 - Июль 2025
(4 месяца)
Создание продакшен-среды на базе Amazon Web Services (AWS) для Web3-игрового сервиса с распределённой архитектурой и микросервисной моделью
Роль
Инженер платформы
Обязанности
● Разработка архитектуры и развертывание продовых кластеров EKS с нуля с использованием Terraform, настройка VPC, групп безопасности и ролей IAM в соответствии с политиками AWS
● Разработка комплексных конвейеров CI/CD с использованием GitHub Actions для непрерывной интеграции и ArgoCD для CD на базе GitOps
● Стандартизированное развертывание приложений с использованием Helm с шаблонами для конфигураций в нескольких средах и автоматическими откатами версий
● Реализовано управление артефактами в Amazon ECR, включая сканирование уязвимостей, политиками жизненного цикла образов и межрегиональную репликацию
● Настроены нативные решения для хранения данных AWS, включая драйвер EBS CSI для постоянных томов, EFS для общего хранилища и интеграцию с S3 для данных приложений
● Развернуты AWS Application Load Balancer (ALB) и Network Load Balancer (NLB) с терминацией SSL, проверки работоспособности и маршрутизации трафика
● Реализован комплексный мониторинг и наблюдение с использованием стека Prometheus и Grafana
● Настроены AWS Service Mesh с помощью AWS App Mesh для взаимодействия микросервисов и управления трафиком
● Автоматизированное управление жизненным циклом кластера с помощью AWS Systems Manager, AWS Config для мониторинга комплаенса и AWS Backup для аварийного восстановления
● Интегрированы методы DevSecOps с AWS Security Hub, Amazon Inspector для оценки уязвимостей и AWS GuardDuty для обнаружения угроз
● Реализовано управление секретами с помощью AWS Secrets Manager и Parameter Store с автоматической ротацией и шифрованием
Достижения
● Создание продовых кластеров AWS EKS с нуля, реализация архитектуры с несколькими зонами доступности для игрового проекта Web3
● Реализация автоматического масштабирования и отказоустойчивости в AWS с использованием Kubernetes HPA и VPA
● Реализация rolling стратегии с использованием нативных средств Kubernetes и AWS Application Load Balancer, что снижает риски ошибок развертывания и обеспечивает бесперебойные обновления
● Оптимизация затрат кластера на 30% благодаря спотовым инстансам AWS Fargate, группам узлов EC2 оптимального размера и автоматизированным политикам масштабирования
Стек специалиста на проекте
hub, ebs, Grafana, backup, guardduty, ecr, AWS, Mesh, load balancer, app, Amazon S3, ArgoCD, Systemd, Prometheus, Config, Terraform, Helm, Security, CodeBuild, EKS, Amazon, Network, Application, Docker, GitHub Actions, Secrets Manager, CloudWatch, EFS, Kubernetes, x-ray, AWS CodeDeploy, store
Отрасль проекта
LifeStyle
Период работы
Май 2024 - Июль 2025
(1 год 3 месяца)
Построение высокопроизводительной и отказоустойчивой Kubernetes-инфраструктуры на базе bare-metal для масштабной многопользовательской онлайн-игры с ончейн логикой, аналогичной World of Warcraft
Роль
Инженер платформы
Обязанности
● Разработка и реализация комплексной миграции с монолитной архитектуры на собственные микросервисы Kubernetes на базе bare-metal с требованиями к сверхнизкой задержке
● Создание кластеров Kubernetes на базе bare-metal для промышленного уровня с расширенными сетевыми возможностями (Calico), настраиваемыми плагинами CNI и высокопроизводительными решениями для хранения данных на базе локальных NVMe SSD-накопители
● Развернуты узлы Arbitrum Nitro в качестве контейнерного уровня данных в Kubernetes для управления состоянием блокчейна и обработки транзакций
● Сетевые узлы L3 настроены как высокопроизводительная инфраструктура очереди сообщений для межсервисного взаимодействия и потоковой передачи событий
● Реализованы рабочие процессы GitOps с ArgoCD и комплексные конвейеры CI/CD с использованием GitLab CI, Jenkins и Ansible для автоматизированного развертывания на физическом сервере
● Настроен многоуровневый стек мониторинга и наблюдения с Prometheus, Grafana, Victoria Metrics и Jaeger, оптимизированный для сред с низкой задержкой
● Разработаны пользовательские диаграммы Helm для развертывания микросервисов с расширенным управлением ресурсами, закреплением ЦП и поддержкой топологии NUMA
● Реализована комплексная инфраструктура безопасности с управлением секретами Hashicorp Vault, политиками RBAC и сканированием уязвимостей для инфраструктуры на физическом сервере
● Управление базами данных PostgreSQL, Redis и ClickHouse в Kubernetes с автоматическим резервным копированием, высокой доступностью и с низкой задержкой
Достижения
● Разработка инфраструктуры Kubernetes на базе bare-metal для MMORPG со сверхнизкой задержкой (аналог World of Warcraft) с onchain логикой (более 5000 одновременных клиентов) и временем отклика менее 10 мс
● Реализация стратегии скользящего развертывания с нулевым временем простоя с использованием кластеров Kubernetes на базе bare-metal и рабочих процессов ArgoCD GitOps
● Оптимизация производительности кластера на базе bare-metal, снижение задержек за счет настраиваемых сетевых настроек и интеграции DPDK
Стек специалиста на проекте
metrics, Trivy, kustomize, Grafana, Gitlab CI, Calico, ClickHouse, Networking, Bash, Git, DevOps, ArgoCD, Linux, Redis, Prometheus, Ansible, Terraform, Helm, Falcon, Jaeger, Vault, Docker, Python, High load, victoria, PostgreSQL, Jenkins, CI/CD, Kubernetes, L3
Отрасль проекта
LifeStyle
Период работы
Декабрь 2023 - Май 2024
(6 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Нет
Образование
Высшее
Учебное заведение
ПФУ
Специальность
Менеджмент
Завершение учебы
2011 г.