Оставьте заявку, мы подберем для вас подходящего специалиста за 48 часов!
Премия рунета

Салман Ч. Data Scientist, Senior

ID 9069
СЧ
Салман Ч.
Мужчина
Россия, Москва, UTC+3
Ставка
3,750 Р/час
НДС не облагается
Специалист доступен с 1 января 2025 г.

Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.

Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Senior
Навыки
Numpy
Pandas
Python
SciPy
XGBoost
SQL
Data Analysis
ML
Computer Vision
Matplotlib
Seaborn
PyTorch
Scikit-learn
Ridge
Lasso
CatBoost
Voting
shap
BeautifulSoap
yolov5
HuggingFace
aiogram
Docker
Yandex Cloud
A/B testing
Beautiful soup
Optuna
GridSearch
Отрасли
Telecom
Travel, Hospitality & Restaurant business
Главное о специалисте
Data scientist с широким набором навыков в области анализа данных и машинного обучения. Ключевые компетенции включают регрессию, классификацию, кластеризацию, работу с деревьями решений, ансамблевыми моделями (включая Random Forest и градиентные бустинги), а также модели прогнозирования временных рядов. Опытен в области нейронных сетей и компьютерного зрения. В моем арсенале такие библиотеки, как NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn, PyTorch, XGBoost, LightGBM, statsmodels и PySpark. Мой опыт также включает в себя разведывательный анализ данных, их предобработку и feature engineering. Успешно применял LLM и CNN в своих проектах. Помимо этого, есть опыт работы с инструментами, такими как SQL, Git, Bash, Docker, Streamlit и HuggingFace. Среди моих дополнительных навыков можно выделить A/B-тестирование и высокую способность к самообучению в процессе работы.
Проекты   (2 года 10 месяцев)
Проект для ИП-врача. Instagram: @skinexpert_valeria
Роль
Data Scientist
Обязанности
Проект "CosmoBot" - Telegram-бот, который является персональным ассистентом для решения проблем с кожей и страхом перед посещением косметолога. Проект решает задачи анализа косметических продуктов и обработки отзывов, а также предоставляет пользователю рекомендации и информацию о препаратах. Развернут на YandexCloud с помощью Docker. Tech stack: BeautifulSoup, Pandas, YOLOv5, HuggingFace, Aiogram, Docker, YandexCloud. - Парсинг данных о лекарствах с использованием библиотеки BeautifulSoup. - Предобработка и очистка данных. - Разработка Telegram-бота с использованием библиотеки Aiogram. - Реализация NLP-элемента проекта, который выполняет суммаризацию отзывов. - Работа с Docker, деплой бота на YandexCloud
Стек специалиста на проекте
Docker, Pandas, aiogram, Yandex Cloud, yolov5, HuggingFace, BeautifulSoap
Отрасль проекта
Travel, Hospitality & Restaurant business
Период работы
Июнь 2023 - По настоящее время  (1 год 1 месяц)
Hawking Bros
Роль
Data Analyst
Обязанности
Tech stack: Python, Pandas, Numpy, Matplotlib/Plotly/Seaborn, Scikit-learn, SciPy, SQL, Tableau, Git 1. Проведение EDA для определения связей и трендов в данных о взаимодействии юзеров с IT-системами 2. Устранение аномалий, заполнение пропусков, feature engineering 3. Feature creation и применение преобразований к данным для улучшения перфоманса моделей 4. Решение задач кластеризации для выделения групп похожих пользователей 5. Проведение A/B тестирования, проверка гипотез и статистической значимости для оценки эффективности разработанных IT-систем. 6. Подготовка отчетов и дашбордов для демонстрации данных руководству о выполненной работе 7. Выполнение ad-hoc аналитики по запросам руководства
Стек специалиста на проекте
Docker, Pandas, Beautiful soup, aiogram, A/B testing, Yandex Cloud, yolov5, HuggingFace
Отрасль проекта
Telecom
Период работы
Февраль 2022 - Август 2023  (1 год 7 месяцев)
Elbrus Coding Bootcamp
Роль
Data Scientist
Обязанности
(1) FindMyMovie - рекомендательная система для усовершенствования поиска фильмов пользователями. сам руководства Tech Stack: PyTorch, Streamlit & HuggingFace, Faiss. - Парсинг данных - Работа с BERT - Работа с faiss - Написание приложения на Streamlit (2) House Prices - Advanced Regression Techniques (Kaggle Competion) - feature engineering, применение ML-моделей для предсказания цен на недвижмость. Tech Stack: Ridge, Lasso, XGBoost, CatBoost, Voting, GridSearchCV&Optune, shap - EDA, заполнение пропусков, работа с выбросами, масштабирование числовых признаков, энкодинг категориальных признаков, логарифмирование таргета. - Построение матрицы корелляции, анализ permutation importance с помощью библиотеки shap -> исключение признаков. - Тюнинг гиперпараметров моделей (Optune, GridSearchCV) - Обучение и применение Ridge, Lasso, XGBoost, CatBoost, LightGBM, а также Voting (линейная модель+ бустинг) с кросс-валидацией Результат: Вошел в 5% участников по результатам соревнования. На моем GitHub также есть проекты с использованием Inception, ResNet, AutoEncoder, LSTM, YOLOv5, GPT-2, BERT.
Стек специалиста на проекте
XGBoost, CatBoost, Optuna, Ridge, Lasso, Voting, shap, GridSearch
Отрасль проекта
Telecom
Период работы
Сентябрь 2021 - Февраль 2022  (6 месяцев)
Формат работы
Формат работы
Удаленно
Командировки
Готов
Релокация
Не готов
Готов работать на зарубежных проектах
Да
Дипломы и сертификаты
Elbrus Bootcamp Data Science 2022 г.
Образование
Высшее
Учебное заведение
НИУ ВШЭ
Специальность
анализ
Завершение учебы
2023 г.

Похожие специалисты

AI & Robotics • Manufacturing
ДК
Даниил К.
Минск
Data Scientist
Middle+
4,250 Р/час
Apache Spark
API
AWS
Azure
Bash scripting
BLoC
CloudWatch
Data Factory
DevOps
Docker
+66

Специалист по данным / Инженер по Машинному Обучению с опытом работы 3 года. Специалист по данным с сильным математическим образованием и хорошими навыками программирования. Обладает универсальным набором навыков, охватывающим инженерию данных и анализ данных, с возможностью адаптации к динамичной рабочей среде. Специализируется на обработке естественного языка, компьютерном зрении и прогнозирующем моделировании в различных областях бизнеса. Имеет опыт работы на всех этапах обработки и анализа данных, от понимания бизнес проблем до внедрения моделей ML в эксплуатацию. Языки программирования: Python. Технологии программирования gradio. Data science Pandas, Numpy, Seaborn, Plotly. Машинное обучение Scikit-learn, XGBoost, BitsAndBytes. Глубокое обучение PyTorch, Tensorflow, Keras, OpenVINO, TensorRT, TensorBoard, NVIDIA NGC. Компьютерное зрение OpenCV, Torchvision. Обработка естественного языка Hugging Face, OpenAI API, Langchain, PEFT, Spacy, Gensim, NLTK, BERTopic. MLOps MLFlow. Инженерия данных Apache Spark, PySpark. Облачные технологии AWS(Sagemaker, S3, EKS, EC2, Bedrock, DynamoDB, Cloudwatch и т. д.), Azure(Virtual Machines, Spot VM, SQL, ML, Functions, Synapse, Analysis Services, Data Factory, Blob Storage, DevOps, etc). Базы данных Redis, MongoDB, PostgreSQL. DevOps Docker, Docker Compose, Kubernetes (k8s), Bash Scripting. Системы контроля версий Git, Github. Достижения Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга и отслеживания моделей на этапе экспериментов, что позволило сделать процесс разработки более удобным и эффективным, а развертывание моделей машинного обучения - надежным и безопасным. Коммуникационный чат-бот Разработан коммуникационный чат-бот с LLM для разговоров от лица различных персонажей и с ответами на пользовательские запросы.

Подробнее
E-commerce & Retail • Travel, Hospitality & Restaurant business
МГ
Максим Г.
Минск
Data Scientist
Middle+
4,250 Р/час
AllenNLP
Apache AirFlow
Apache Spark
AWS
Azure
BLoC
CloudWatch
Data Factory
Databricks
Docker
+56

Специалист по анализу данных / Инженер по машинному обучению с опытом работы более 3-х лет. Специалист по анализу данных, специализирующийся на дата-центрированных проектах. Умение выявлять бизнес-проблемы и решать их с использованием различных подходов обработки и анализа данных, подтвержденное на практике. Умение работать со полным жизненным циклом проектов машинного обучения: от сбора данных до развертывания обученных решений. Области специализации: обработка естественного языка, модели прогнозирования и компьютерное зрение. Языки программирования Python. Технологии программирования GeoPy. Наука о данных Pandas, Matplotlib, Numpy, Seaborn, Plotly, PowerBI. Машинное обучение Scikit-learn, Hyperopt, kmodes, UMAP, Prophet, Boruta, LightGBM, XGBoost. Глубокое обучение PyTorch, NVIDIA NGC. Компьютерное зрение Tesseract OCR. Обработка естественного языка Hugging Face, AllenNLP, Gensim, NLTK. MLOps MLFlow, Neptune. Инженерия данных pache Airflow, Apache Spark, PySpark. Облачные технологии AWS(Lambda, SageMaker, S3, EC2, ECR, EKS, CloudWatch и т. д.), Azure(VMs, ML, Databricks, Blob Storage, DataFactory). Базы данных PostgreSQL, MySQL, Redis. DevOps Docker, Docker Compose, Kubernetes(k8s). Системы контроля версий Git, Github. Достижения Помощник по юридическим документам Разработал систему для предложения пользователям структуры документов и автодополнения текстовых предложений в типовых юридических контрактах, использующую модели на архитектуре transformer. Настройка инфраструктуры AWS Настроил инфраструктуру AWS для мониторинга моделей и метрик на этапе экспериментирования, что позволило сделать процесс разработки более удобным и эффективным, а также ускорило развертывание моделей машинного обучения. Настройка обработки данных Разработал конвейеры ETL с Azure Databricks и Apache Spark для эффективной интеграции данных из разных источников в центральное хранилище для дальнейшего использования в аналитической платформе.

Подробнее

Недавно просмотренные специалисты

Telecom • Travel, Hospitality & Restaurant business
СЧ
Салман Ч.
Москва
Data Scientist
Senior
3,750 Р/час
GridSearch
Computer Vision
Numpy
Pandas
SciPy
Lasso
shap
Beautiful soup
Scikit-learn
Seaborn
+28

Data scientist с широким набором навыков в области анализа данных и машинного обучения. Ключевые компетенции включают регрессию, классификацию, кластеризацию, работу с деревьями решений, ансамблевыми моделями (включая Random Forest и градиентные бустинги), а также модели прогнозирования временных рядов. Опытен в области нейронных сетей и компьютерного зрения. В моем арсенале такие библиотеки, как NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn, PyTorch, XGBoost, LightGBM, statsmodels и PySpark. Мой опыт также включает в себя разведывательный анализ данных, их предобработку и feature engineering. Успешно применял LLM и CNN в своих проектах. Помимо этого, есть опыт работы с инструментами, такими как SQL, Git, Bash, Docker, Streamlit и HuggingFace. Среди моих дополнительных навыков можно выделить A/B-тестирование и высокую способность к самообучению в процессе работы.

Подробнее