ВИ
Василий И.
Мужчина
Россия, Тамбов, UTC+3
Ставка
3 246,75 Р/час
НДС не облагается
Специалист доступен с 29 октября 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Системный аналитик
Грейд
Senior
Навыки
Hugging face transformers
Numpy
Git
Pandas
ONNX
Linux
PyTorch
Jupyter
HuggingFace
NLP
Plotly
Docker
SQL
Python
PostgreSQL
Kubernetes
Отрасли
BioTech, Pharma, Health care & Sports
EdTech
FinTech & Banking
Insurance
LifeStyle
Manufacturing
Telecom
Знание языков
Русский — C2
Английский — C1
Главное о специалисте
Василий — опытный специалист уровня Senior в области Data Science. Обладает навыками работы с большим количеством технологий: Hugging Face Transformers, NumPy, Git, Pandas, ONNX, Linux, PyTorch, Jupyter, Docker, SQL, Python, PostgreSQL, Kubernetes и другими. Василий работал над проектами в различных отраслях: Insurance, EdTech, Information Security, Telecom, Manufacturing, LifeStyle, BioTech, Pharma, Health care & Sports. В проектах он выполнял роли AI инженера, основателя стартапа, тимлида, архитектора, инженера-программиста, ведущего программиста и руководителя предприятия. Среди реализованных проектов: - Разработка прототипа чат-бота для создания аналитических помощников. - Создание решения для эффективного поиска и кластеризации коллекции документов. - Проектирование и реализация Data Vault 2.0 для построения масштабируемых и гибких хранилищ данных. - Участие в разработке комплексной системы автоматизации деятельности фитнес-центров. - Внедрение централизованной системы учёта между филиалами и центральным офисом.
Проекты   (17 лет 3 месяца)
Чат-бот
Роль
AI инженер
Обязанности
Разработка прототипа чат-бота, использующего локально запускаемые открытые и внешние проприетарные языковые модели (LLM), для создания аналитических помощников, включая аналитика "5 Почему", SWOT-аналитика и системного аналитика для первоначального интервьюирования клиента об основных требованиях к ПО. - Использовал библиотеки XGBoost, LightGBM; - Использовал в проекте кластеризации текстов по таксономии при автоматизированном подборе гиперпараметров; - Использовал Langchain для унификации доступа к локальным (ollama) и удаленным моделям (OpenAI API (together, groq), Google Gemini), интегрировал поддержку стриминга langchain runnable в формат OpenAI API для упрощения интеграции FastAPI сервиса с другими компонентами; - Глубокое понимание принципов работы Kafka, включая архитектуру брокеров сообщений, секционирование и репликацию данных, а также ее применение для обработки потоковых данных в реальном времени; - Разработка технической документации (технические задания, спецификации, руководства пользователя) для программных решений, обеспечивая чёткое описание требований и архитектуры систем Работа в области Data Science: - Глубокий опыт, начиная от базовой аналитики pandas и визуализации в Jupyter, до уровня тренировки собственных моделей для обработки естественного языка и оптимизации алгоритма поиска текстовой информации в многомерном пространстве. -Создавал информационные панели и визуализации результатов анализа (Tableau, Power BI) для представления выводов бизнес-заказчикам и поддержки принятия решений, а так же разрабатывал и тестировал алгоритмы обработки данных, включая предварительную очистку, нормализацию и разработку функций, для повышения качества моделей - Использовал RNN и LSTM при выполнении практических заданий в рамках курса Стенфорда CS224n в 2019. Не использовал с тех пор. Тренировал собственные трансформеры (encoder, encoder+decoder) в рамках проекта про проекции пространства; - Иерархические алгоритмы кластеризации из библиотеки scikit; HDBSCAN; самостоятельно реализовал рекурсивный/иерархический K-Means; самостоятельно реализовал алгоритм ступенчатой кластеризации на основе заданной таксономии, адаптировал для выполнения на GPU. Самостоятельно реализовал и адаптировал для выполнения на GPU k-nn поиск с поддержкой различных метрик (l1, l2, ассиметричная метрика на основе KL-Divergance) Numpy/CuPy/Pandas/Zarr/Dask; - Самостоятельно реализова и адаптировал для GPU алгоритм ембеддинга графов на основе физической симуляции движения частиц в многомерном пространстве; разработал комбинаторный алгоритм для вычисления эмбеддинга ноды в графе на основе различных метрик схожести; использовал готовые библиотеки для эмбеддинга на основе метода градиентного спуска Numpy/CuPy/PyTorch/Tensorboard Прототип исследует потенциал моделей LLM в решении реальных задач, с фокусом на конфиденциальности и локальном развертывании моделей. Успешно протестировал прототип, получив положительную обратную связь от пользователей, демонстрирующую эффективность моделей LLM в предоставлении ценных сведений и анализа. Прототип доступен по ссылке: https://5w.p.cuerdox.com с гостевой учетной записью client@example.com / client:0325
Стек специалиста на проекте
FastAPI, XGBoost, PyTorch, HTTPS, Mean, Lightgbm, Dask, Tensorboard, client, llm, OpenAI API, RNN, l2
Отрасль проекта
Insurance
Период работы
Январь 2025 - По настоящее время  (10 месяцев)
Свой стартап: Graph Space Navigation Lab
Роль
Основатель/Системный аналитик/инженер-программист
Обязанности
На проекте не было выделенных системных аналитиков, поэтому работал непосредственно с требованиями заказчика и формализовывал их для целей разработки/тестирования. Так же работал с аналитиками заказчиков, часто помогал уточнять функциональные и нефункциональные требования исходя из технических возможностей стека технологий / инфраструктуры. В рамках внутренней разработки систем внутри компаний, с внешними заказчиками от лица компании, индивидуальные проекты с частными заказчиками Разработка решения для эффективного поиска и кластеризации коллекции документов с учетом иерархической структуры таксономии концептов: - Исследование методов преобразования графов и таксономий в высокоразмерное векторное представление (graph embeddings) с использоавнием физической симуляции, градиентного спуска и комбинаторного подхода; - В рамках задачи проекции пространства ембеддинг модели в пространство таксономии проводил эксперименты с различными архитектурами полносвязных нейронных сетей, в том числе с автоматизированным поиском оптимального количества слоев/функций активации) PyTorch/RayTune/Tensorboard; - Разрабатывал технические задания для платежной системы, для медицинской аналитической информационной системы - Самостоятельно реализовал пошаговый процесс подготовки исходных документов для последующей кластеризации в многомерном пространстве ембеддингов - начиная от парсинга и конвертации документов в текстовое представление в Markdown, разделение на фрагменты, ембеддинг каждого фрагмента, синтаксический анализ и аггрегация до уровня документа; реализовал поддержку различных фич для поиска (CLS, AVG, особый режим аггрегирования на базе гистограммы фрагмента) Pandas/Numpy/Zarr, ряд специализированных библиотек для парсинга документов; - Анализ и разработка методов снижения размерности и проекции пространства таксономии в пространство представления текстовых документов на основе малых языковых моделей с использованием классификационных и регрессионных нейронных сетей на базе полносвязной (FCNN) и трансформерной (только кодирование, кодирование + декодирование) архитектур. - Анализ эффективности симметричных и асимметричных метрик дистанции при поиске, кластеризации и построении графа ближайших соседей. (Много общего с FAISS). - Разработка высокопроизводительного алгоритма классификации, поиска и кластеризации массива текстовых документов с учетом комбинации иерархических семантических связей, определенных в таксономии концептов, адаптированного для выполнения на графических процессорах семейства nVidia. - Понимание сервисной архитектуры, протоколов и принципов интеграции: Непосредственный опыт с REST/SOAP на Java (JAX-RS, JAX-WS), Python (FastAPI) - Опыт работы с API; Разнообразный - внешние системы, платежные шлюзы (шифрование/цифровая подпись запросов), текущие проекты с LLM строятся на 80% на базе готовых API - Опыт работы с системами управления проектами и задачами (TFS, Jira и другие); - Применение методологии Data Vault для построения гибких и масштабируемых хранилищ данных. Разработка и поддержка структур Data Vault (хабы, ссылки, сателлиты). - Интеграция данных из различных источников в DWH; - Написание сложных SQL-запросов для анализа данных и генерации отчетов (Сложные вложенные запросы с группировками и курсорами, подготовка иерархических отчетов с агрегацией данных); - Настройка и администрирование Oracle для обеспечения высокой доступности и производительности. - Работа с инструментами мониторинга и анализа производительности СУБД Oracle AWR, SQL Tuning Advisor) - Построение и сопровождение собственного независимого инфраструктурного/вычислительного кластера на базе продуктов с открытым исходным кодом (Linux / KVM / LXC / Synology). - Прототип приложения каскадной кластеризации https://tc.p.cuerdox.com - Прототип приложения визуализации WordNet https://te.p.cuerdox.com - Преобладающие технологии: Python, NumPy, CuPy, Pandas, Zarr, PyTorch, Ray Tune, Jupyter, Plotly/Dash, HuggingFace, Linux, Docker.
Стек специалиста на проекте
Docker, Python, Linux, Pandas, Numpy, KVM, LXC, PyTorch, Jupyter, HTTPS, HuggingFace, NVidia, Graph, cupy, FAISS
Отрасль проекта
EdTech
Период работы
Март 2018 - Ноябрь 2024  (6 лет 9 месяцев)
Intellective
Роль
Тимлид/Архитектор/Системный аналитик
Обязанности
Совмещал роли Тимлида и Архитектора. В команде основного продукта возглавлял группу 2-5 разработчиков. Работа на языке программирования Python, Java (сертификация от Oracle), С#, а так же с инструментами Big Data (Hadoop, AirFlow, Spark, Kafka) - Обучал и повышал квалификацию новых сотрудников; - Практический опыт проектирования и реализации Data Vault 2.0 для построения масштабируемых и гибких хранилищ данных. - Опыт поддержки информационных систем и сопровождения пользователей: Отвечал за внедрение информационной системы на региональном уровне и обучал сотрудников подведомственных организаций работе с системой; опыт поддержки проектных команд разработки в роли лида команды продуктовой разработки - Настраивал автоматизацию процессов в Jira (уведомления, переходы между статусами), сократив время на выполнение рутинных операций команды - Разработка хабов, ссылок и сателлитов для обеспечения историчности данных и поддержки изменений в бизнес-требованиях; - Работа с командой тестировщиков и разработчиков для внедрения инструментов Big Data в процессы клиентской аналитики: Работал с распределенными математическими вычислениями на кластере и видеокартах (Dask, Ray), а так же опыт расчета моделей физического взаимодействия частиц на видеокарте. - Работа с сетевыми технологиями, протоколами и принципами интеграции автоматизированных систем: настраивал интеграционные процессы с использованием промежуточного программного обеспечения (Kafka), обеспечивая бесперебойную работу распределённых систем - Моделировал бизнес-процессы с помощью UML (диаграммы вариантов использования, диаграммы состояний) и BPMN, выявлял узкие места и предлагал решения, повысившие эффективность операций - Рефакторинг существующих систем, добавление новых функциональных модулей, индивидуальная заказная разработка - Участвовал в проработке вариантов развития основного продукта (гибко конфигурируемый пользовательских интерфейс, модуль индексации и поиска, модуль автоматизации бизнес-процессов); - Участвовал в планировании архитектуры и реализации специализированных демонстрационных решений для различных отраслей на базе основного продукта; - Разрабатывал архитектуру интеграции с внешними системами с использованием проприетарных и открытых стандартов (IBM Content Navigator, Alfresco ECM, CMIS); - Участвовал в разработке аналитического модуля для интеграции с IBM Case Management - Консультировал проектные команды по методам адаптации основного продукта; - Курировал обновление версии продукта с сохранением обратной совместимости с проектными решениями; - Работа с Oracle Database в высоконагруженных средах, включая проектирование, оптимизацию и администрирование; - Использование библиотек Pandas, NumPy и SQLAlchemy для работы с данными и взаимодействия с базами данных; - Разработка и оптимизация сложных SQL-запросов в SAS для обработки больших объемов данных; - Настройка и администрирование баз данных GreenPlum для хранения и обработки больших объемов структурированных данных; - Разработка скриптов на Python для автоматизации задач обработки данных, интеграции API и анализа данных; - Настройка и использование Hadoop (HDFS, MapReduce) для хранения и обработки больших данных; - Проектирование и реализация Data Vault 2.0 для построения масштабируемых и гибких хранилищ данных; - Написание Bash-скриптов для автоматизации рутинных задач, таких как обработка файлов, мониторинг системы и запуск ETL-процессо; - Преобладающие технологии: Java, JavaScript, ExtJS; Apache Lucene; IBM WebSphere, Oracle Weblogic, GlassFish Application Servers; IBM DB2, Oracle DB, PostgreSQL; IBM FileNet P8, IBM Case Analyzer, IBM Content Navigator; Alfresco ECM; jBPM.
Стек специалиста на проекте
PostgreSQL, API, Java, JavaScript, BPMN, Python, UML, Oracle, Apache, WebLogic, Hadoop, Oracle Database, Lucene, GlassFish, Pandas, SQLAlchemy, Numpy, GreenPlum, IBM, Context, Big Data, Ext.js, Alfresco, jBPM, Application, IBM WebSphere, Use case diagram, IBM DB2, HDFS, SAS, Identity Server, MapReduce, Navigator, SQL запросы, FileNet, analyzer, Data Vault 2.0
Отрасль проекта
FinTech & Banking
Период работы
Декабрь 2013 - Март 2018  (4 года 4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно, Офис
Командировки
Готов
Релокация
Внутри страны, За границу
Готов работать на зарубежных проектах
Да
Образование
Высшее
Учебное заведение
Тамбовский государственный технический университет, Тамбов
Специальность
Факультет информационнных технологий, Прикладная информатика в экономике
Завершение учебы
2007 г.

Похожие специалисты

Недавно просмотренные специалисты

Cloud Services • FinTech & Banking
ДГ
Дмитрий Г.
Минск
Backend разработчик
Middle+
3 766,23 Р/час
ArtemisMQ
Grafana
Postman
debezium
core
HTTP
Groovy
Data
Liquibase
Flyway
+50

Java-разработчик с более чем четырьмя годами опыта в области коммерческой разработки. Обладаю глубокими знаниями Java Core и большим опытом работы со Spring Framework, включая Spring Boot, Spring Security, Spring Data, Spring Cloud и Spring Integration, PostgreSQL и Oracle (PL/SQL), Redis, Flyway и Liquibase. Работал с различными инструментами для построения запросов, такими как JOOQ и Hibernate, а также с мессенджерами и очередями, включая Apache Kafka и RabbitMQ. Имею опыт интеграции микросервисов с внешними системами через различные протоколы, включая REST, SOAP и WebSocket, а также с использованием JSON и XML. В своей работе активно использую Docker для контейнеризации приложений и решения задач мониторинга и логирования с помощью Grafana, Prometheus и Elasticsearch. Быстро осваиваю новые технологии, обладаю хорошими коммуникативными навыками и эффективно работаю в команде. Имею опыт написания юнит- и интеграционных тестов с использованием JUnit и Mockito, а также работы с системами контроля версий Git. Стремлюсь к постоянному развитию и расширению технического стека, интересуюсь новыми подходами к разработке и активно применяю их в работе.

Подробнее
HRTech • Insurance • Urban technology
ИВ
Илья В.
Пенза
Java разработчик
Middle+
2 987,01 Р/час
Grafana
Spring AOP
Keycloack
Postman
Spring Data
Spring Data JPA
Spring Cloud
Zabbix
Spring MVC
Scheduler
+43

Java-разработчик с 4-летним опытом работы. Участвовал в разработке коробочных страховых продуктов: настраивал интеграцию систем с помощью Spring Batch, проектировал базу данных и микросервисы, реализовывал бизнес-процессы для Camunda 8. Внедрил новый подход написания модулей в сервис для пакетной обработки данных, благодаря чему разработка новых модулей ускорилась на 50%. Создавал сервис для дистанционной аренды недвижимости: разрабатывал REST API приложения, работал с базой данных, писал тесты. Реализовал стартер с использованием АОП для логирования в Kafka и мониторинга времени выполнения методов. Разрабатывал систему по постановке целей и проверке компетенций сотрудников компаний: писал микросервисы, выполнял задачи от аналитиков, участвовал в распиле монолита на микросервисы. Работал над созданием системы комплексного решения для ведения проектной деятельности в IT-компании: разрабатывал микросервисы по задачам от аналитиков. Инициировал внедрение механизма обмена данными между микросервисами с использованием Apache Kafka.

Подробнее
E-commerce & Retail • FinTech & Banking • GameDev • Information Security • Manufacturing
АД
Александр Д.
Москва
QA ручной
Lead
3 246,75 Р/час
Управление командой
itunes
trader
Регрессионное тестирование
Redmine
Play
Тест-планы
Information
support
Java 2
+151

Александр — опытный IT-специалист в области QA. Обладает навыками работы с различными инструментами и технологиями, такими как Agile, API, Atlassian, Black box testing, Confluence, Framework, Functional testing, Integration testing, Jira, Kanban, Manual testing, Postman, Project management, QA, Redmine, REST, REST API, Scrum, Test case, Testing, TestRail, UI-тестирование, Unit testing. Александр работал на нескольких проектах, где занимал позиции QA lead, Senior QA engineer, QA Manager / Главный тестировщик, QA Engineer, Руководитель отдела тестирования. Он успешно руководил командами, выстраивал процессы тестирования, взаимодействовал со смежными командами и участвовал в разработке тестовой документации. На текущем проекте Александр занимается формированием команды тестировщиков, управлением командой, выстраиванием процессов тестирования и коммуникацией с другими командами. Также он участвует в тестировании каждого релиза и контролирует корректное движение задач в Jira. За время его работы количество обращений от пользователей сократилось с 50–60 до 5 в неделю, а время отклика на дефект — с 2–3 дней до 2–8 часов.

Подробнее