Салман Ч. Data Scientist, Senior

ID 9069

СЧ

Салман Ч.

Мужчина

Россия, Москва, UTC+3

Ставка

3,750 Р/час

НДС не облагается

Специалист доступен с 1 января 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее

О специалисте

Специализация

Data Scientist

Грейд

Senior

Навыки

Numpy

Pandas

Python

SciPy

XGBoost

SQL

Data Analysis

Computer Vision

Matplotlib

Seaborn

PyTorch

Scikit-learn

Ridge

Lasso

CatBoost

Voting

shap

BeautifulSoap

yolov5

HuggingFace

aiogram

Docker

Yandex Cloud

A/B testing

Beautiful soup

Optuna

GridSearch

Отрасли

Telecom

Travel, Hospitality & Restaurant business

Главное о специалисте

Data scientist с широким набором навыков в области анализа данных и машинного обучения. Ключевые компетенции включают регрессию, классификацию, кластеризацию, работу с деревьями решений, ансамблевыми моделями (включая Random Forest и градиентные бустинги), а также модели прогнозирования временных рядов. Опытен в области нейронных сетей и компьютерного зрения. В моем арсенале такие библиотеки, как NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn, PyTorch, XGBoost, LightGBM, statsmodels и PySpark. Мой опыт также включает в себя разведывательный анализ данных, их предобработку и feature engineering. Успешно применял LLM и CNN в своих проектах. Помимо этого, есть опыт работы с инструментами, такими как SQL, Git, Bash, Docker, Streamlit и HuggingFace. Среди моих дополнительных навыков можно выделить A/B-тестирование и высокую способность к самообучению в процессе работы.

Проекты (2 года 10 месяцев)

Проект для ИП-врача. Instagram: @skinexpert_valeria

Роль

Data Scientist

Обязанности

Проект "CosmoBot" - Telegram-бот, который является персональным ассистентом для решения проблем с кожей и страхом перед посещением косметолога. Проект решает задачи анализа косметических продуктов и обработки отзывов, а также предоставляет пользователю рекомендации и информацию о препаратах. Развернут на YandexCloud с помощью Docker. Tech stack: BeautifulSoup, Pandas, YOLOv5, HuggingFace, Aiogram, Docker, YandexCloud. - Парсинг данных о лекарствах с использованием библиотеки BeautifulSoup. - Предобработка и очистка данных. - Разработка Telegram-бота с использованием библиотеки Aiogram. - Реализация NLP-элемента проекта, который выполняет суммаризацию отзывов. - Работа с Docker, деплой бота на YandexCloud

Стек специалиста на проекте

Docker, Pandas, aiogram, Yandex Cloud, yolov5, HuggingFace, BeautifulSoap

Отрасль проекта

Travel, Hospitality & Restaurant business

Период работы

Июнь 2023 - По настоящее время (1 год 1 месяц)

Hawking Bros

Роль

Data Analyst

Обязанности

Tech stack: Python, Pandas, Numpy, Matplotlib/Plotly/Seaborn, Scikit-learn, SciPy, SQL, Tableau, Git 1. Проведение EDA для определения связей и трендов в данных о взаимодействии юзеров с IT-системами 2. Устранение аномалий, заполнение пропусков, feature engineering 3. Feature creation и применение преобразований к данным для улучшения перфоманса моделей 4. Решение задач кластеризации для выделения групп похожих пользователей 5. Проведение A/B тестирования, проверка гипотез и статистической значимости для оценки эффективности разработанных IT-систем. 6. Подготовка отчетов и дашбордов для демонстрации данных руководству о выполненной работе 7. Выполнение ad-hoc аналитики по запросам руководства

Стек специалиста на проекте

Docker, Pandas, Beautiful soup, aiogram, A/B testing, Yandex Cloud, yolov5, HuggingFace

Отрасль проекта

Telecom

Период работы

Февраль 2022 - Август 2023 (1 год 7 месяцев)

Elbrus Coding Bootcamp

Роль

Data Scientist

Обязанности

(1) FindMyMovie - рекомендательная система для усовершенствования поиска фильмов пользователями. сам руководства Tech Stack: PyTorch, Streamlit & HuggingFace, Faiss. - Парсинг данных - Работа с BERT - Работа с faiss - Написание приложения на Streamlit (2) House Prices - Advanced Regression Techniques (Kaggle Competion) - feature engineering, применение ML-моделей для предсказания цен на недвижмость. Tech Stack: Ridge, Lasso, XGBoost, CatBoost, Voting, GridSearchCV&Optune, shap - EDA, заполнение пропусков, работа с выбросами, масштабирование числовых признаков, энкодинг категориальных признаков, логарифмирование таргета. - Построение матрицы корелляции, анализ permutation importance с помощью библиотеки shap -> исключение признаков. - Тюнинг гиперпараметров моделей (Optune, GridSearchCV) - Обучение и применение Ridge, Lasso, XGBoost, CatBoost, LightGBM, а также Voting (линейная модель+ бустинг) с кросс-валидацией Результат: Вошел в 5% участников по результатам соревнования. На моем GitHub также есть проекты с использованием Inception, ResNet, AutoEncoder, LSTM, YOLOv5, GPT-2, BERT.

Стек специалиста на проекте

XGBoost, CatBoost, Optuna, Ridge, Lasso, Voting, shap, GridSearch

Отрасль проекта

Telecom

Период работы

Сентябрь 2021 - Февраль 2022 (6 месяцев)

Формат работы

Удаленно

Командировки

Готов

Релокация

Не готов

Готов работать на зарубежных проектах

Да

Дипломы и сертификаты

Elbrus Bootcamp Data Science 2022 г.

Образование

Высшее

Учебное заведение

НИУ ВШЭ

Специальность

анализ

Завершение учебы

2023 г.

Похожие специалисты

AI & Robotics • Manufacturing

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Описание пока отсутствует

Обладая опытом в области машинного обучения и анализа данных, являюсь настоящим сторонником решения сложных задач и поиска эффективных решений. Мои подходы к решению задач улучшили бизнес-процессы в значительной степени.

Подробнее

FinTech & Banking • Manufacturing

Python Spark SciPy Spacy PyMystem3 Pandas SkLearn Seaborn XGBoost LightGBM Статистический анализ A/B тесты SQL Keras torch pytorch MySQL PostgreSQL Git Hadoop Data Analysis HuggingFace

Подробнее

E-commerce & Retail • Travel, Hospitality & Restaurant business

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее

Недавно просмотренные специалисты

Telecom • Travel, Hospitality & Restaurant business

Описание пока отсутствует

Подробнее

LifeStyle • Logistics & Transport • Realty & Constructoring • RnD • Travel, Hospitality & Restaurant business

React testing library

Ответственный веб-разработчик, командный игрок и проактивный сотрудник с 4+ годами в коммерческой разработке. Работал над проектами как «с нуля», так и с существующими продуктами. Участвовал в полном цикле разработки проекта - от MVP до продуктов «в продакшене». Имеет опыт работы в малых и средних распределенных командах с использованием agile-методологий и инструментов управления проектами (Trello, Jira и т. д.). Сейчас фокус на JS технологическом стеке - React.

Подробнее

FinTech & Banking • Media

Описание пока отсутствует

Подробнее

AI & Robotics • E-commerce & Retail • Logistics & Transport • RnD

Инженер баз данных с более чем 3 годами опыта в ИТ-сфере. Отличное знание баз данных PostgreSQL, MySQL, а также языков SQL и Python. Умение писать логику и скрипты для разных целей. Практические навыки визуализации и оптимизации данных. Сильные аналитические способности, а также хорошие коммуникативные навыки. Готов получать новые знания и навыки для работы над различными проектами. PostgreSQL, MySQL Percona-Toolkit Python, VBA, SQL, pl/pgSQL PowerBI Docker/Docker Compose Ansible ProxySQL Windows, Linux Git

Подробнее