Владимир К. Data Scientist, Senior
ID 11957
ВК
Владимир К.
Мужчина, 38 лет
Россия, Москва, UTC+3
Ставка
4 500 Р/час
НДС не облагается
Специалист доступен с 14 декабря 2024 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Знание языков
Английский — C1
Главное о специалисте
Языки программирования Python, C, C++, Java, JS, Julia, SQL, C#, Prolog
Фреймворки, библиотеки TensorFlow 1/2, PyTorch, Pandas, Numpy, Sklearn, Spacy, Matplotlib/Seaborn, MATLAB, NLTK, RASA, OpenCV, CUDA, boto3, данные ГИС
ML-экспертиза Обработка естественного языка:
- NER, QA, Chatbots, Intents Matching, Text Classification, Sentiment Analysis, Emotion Detection, Text Abstraction, Text Generation, Clustering, Language Translation
- Трансформаторы, BERT, RoBERTa, all-mpnet-base-v2, GPT-3, HDBSCAN, UMAP, RNNs, LSTMs, GRUs, LDA, Gaussians, LSH, K-means
Компьютерное зрение
- Классификация изображений, обнаружение объектов, сегментация изображений, распознавание таблиц, распознавание структуры таблиц, OCR, распознавание лиц, 3D реконструкция лиц, создание подписей к изображениям
- Визуальные трансформаторы, DETR, TableFormer, ConvNets, YOLO3/4, YOLOX, Mask R-CNNs, Fast R-CNNs, Faster R-CNNs, ResNets, VGG, GANs
Классические и другие ОД:
- Анализ временных рядов, скоринговые модели, регрессии, предикторы, линейная регрессия, логистическая регрессия, SVM, деревья решений, градиентный бустинг (XGBoost, CatBoost), ансамбли, байесовцы, уменьшение размерности, PCA, PCE, t-SNE
Контролируемое, полу контролируемое, неконтролируемое обучение и обучение с подкреплением
Базы данных Postgres, DynamoDB, NEO4J, JanusGraph, SQLAlchemy
Облачные сервисы AWS (SQS, SNS, SageMaker, Lambdas, EC2, S3, Textract, VPC, CloudTrail и т.д.), GСloud
Разработка программного обеспечения Git, Docker, Podman, Linux, Bash, Ansible, Sentry, GitLab CI/CD, Conda, Jupyter, VS Code, Pycharm
Другие инструменты/навыки Отлично
Проекты
(9 лет 6 месяцев)
BAL
Роль
Data Scientist / System Architect
Обязанности
Роль ведущего разработчика в небольшой команде, работавшей над программным продуктом для анализа и прогнозирования времени обработки виз. Я начал работу с разработки whitepaper и имел множество обязанностей (в основном все, кроме веб-/мобильного/дизайна), включая:
- Общий дизайн и архитектура системы.
- Распределенная система очередей для непрерывного парсинга внешних веб-сайтов (на основе Redis).
- Многочисленные конвейеры данных и ETL, включая Databricks ETL.
- Аналитика и наука о данных для нужд компании, анализ временных рядов и прогнозирование.
- Несколько бэкэнд-микросервисов.
- Проектирование и разработка баз данных (Postgres, Redis).
- Ответственность за AWS DevOps, интеграция между сервисами (ec2, s3, dynamo, lambdas, cloudwatch и т.д.). Административные задачи.
- Инструменты мониторинга, включая Sentry и мониторинг очередей.
Стек специалиста на проекте
AWS, Redis, ETL, PostgreSQL
Отрасль проекта
Information Security
Период работы
Октябрь 2023 - Март 2024
(6 месяцев)
LoyaltyLoop
Роль
Data Scientist, NLP
Обязанности
Создал движок анализа данных для комментариев, отзывов и опросов, который включает в себя:
- Несколько вариантов моделирования тем (трансформаторное и статистическое + их комбинации).
- Анализ настроения, выявление эмоций, скоринговые модели.
- Поиск долгосрочных трендов и изменений отношения покупателей во времени.
- Визуальные представления процесса кластеризации, тем и облаков слов.
- Метрики качества и статистика.
- Полная разработка бэкенда с использованием AWS S3, EC2 Instances, SageMaker, DynamoDB, Lambdas, VPC и других сервисов AWS.
Стек специалиста на проекте
LambdaCD, gamemaker, AWS S3, VPC, EC2, DynamoDB
Отрасль проекта
Telecom
Период работы
Апрель 2022 - Сентябрь 2022
(6 месяцев)
WorldQuant
Роль
Senior Machine Learning Engineer
Обязанности
Разработка графов знаний и графовых баз данных (Neo4J, JanusGraph, TigerGraph), переносом SQL-баз данных и текстовых наборов данных компании в NEO4J, реализацией графовых скриптов и алгоритмов, разработкой графовых ML-моделей, а также повышением скорости и точности существующих алгоритмов.
Стек специалиста на проекте
Neo4j, SQL, JANUS, Machine learning
Отрасль проекта
Telecom
Период работы
Ноябрь 2021 - Февраль 2022
(4 месяца)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Не готов
Релокация
Не готов
Готов работать на зарубежных проектах
Да
Дипломы и сертификаты
Machine learning, Stanford, Coursera 2016 г.
Machine learning, University of Washington, 1, Coursera 2016 г.
Machine learning, University of Washington, 2, Coursera 2016 г.
Machine learning, University of Washington, 3, Coursera 2016 г.
Machine learning, University of Washington, 4, Coursera 2016 г.
ELTS Australia, overall score(band) 8 2019 г.
Образование
Высшее
Учебное заведение
Московский государственный технический университет имени Н.Э. Баумана (МГТУ)
Специальность
BCS (бакалавр компьютерных наук)
Завершение учебы
2012 г.
Высшее
Учебное заведение
Российский национальный исследовательский медицинский университет
Специальность
Magna Cumme Laude, диплом врача-специалиста
Завершение учебы
2009 г.