СЧ
Салман Ч.
Мужчина
Россия, Москва, UTC+3
Ставка
3 750 Р/час
НДС не облагается
Специалист доступен с 1 января 2025 г.
Добавьте подходящих специалистов в список и оформите заявку для предварительного бронирования времени специалистов. После оформления заявки ваш персональный менеджер организует прохождение всех необходимых проверок с вами и каждым кандидатом из заявки. Специалист привлекается к проекту только после окончательного подтверждения его выхода с вашей стороны.
Подробнее
О специалисте
Специализация
Data Scientist
Грейд
Навыки
Отрасли
Главное о специалисте
Data scientist с широким набором навыков в области анализа данных и машинного обучения. Ключевые компетенции включают регрессию, классификацию, кластеризацию, работу с деревьями решений, ансамблевыми моделями (включая Random Forest и градиентные бустинги), а также модели прогнозирования временных рядов. Опытен в области нейронных сетей и компьютерного зрения.
В моем арсенале такие библиотеки, как NumPy, Pandas, Matplotlib, Seaborn, Scikit-learn,
PyTorch, XGBoost, LightGBM, statsmodels и PySpark.
Мой опыт также включает в себя разведывательный анализ данных, их предобработку и feature engineering. Успешно применял LLM и CNN в своих проектах.
Помимо этого, есть опыт работы с инструментами, такими как SQL, Git, Bash, Docker, Streamlit и HuggingFace.
Среди моих дополнительных навыков можно выделить A/B-тестирование и высокую способность к самообучению в процессе работы.
Проекты
(3 года 4 месяца)
Проект для ИП-врача. Instagram: @skinexpert_valeria
Роль
Data Scientist
Обязанности
Проект "CosmoBot" - Telegram-бот, который является персональным ассистентом для решения проблем с кожей и страхом перед посещением косметолога. Проект решает задачи анализа косметических продуктов и обработки отзывов, а также предоставляет пользователю рекомендации и информацию о препаратах. Развернут на YandexCloud с помощью Docker.
Tech stack: BeautifulSoup, Pandas, YOLOv5, HuggingFace, Aiogram, Docker, YandexCloud.
- Парсинг данных о лекарствах с использованием библиотеки BeautifulSoup.
- Предобработка и очистка данных.
- Разработка Telegram-бота с использованием библиотеки Aiogram.
- Реализация NLP-элемента проекта, который выполняет суммаризацию отзывов.
- Работа с Docker, деплой бота на YandexCloud
Стек специалиста на проекте
Pandas, HuggingFace, BeautifulSoap, aiogram, Docker, yolov5, Yandex Cloud
Отрасль проекта
Travel, Hospitality & Restaurant business
Период работы
Июнь 2023 - По настоящее время
(1 год 7 месяцев)
Hawking Bros
Роль
Data Analyst
Обязанности
Tech stack: Python, Pandas, Numpy, Matplotlib/Plotly/Seaborn, Scikit-learn, SciPy, SQL, Tableau, Git
1. Проведение EDA для определения связей и трендов в данных о взаимодействии юзеров с IT-системами
2. Устранение аномалий, заполнение пропусков, feature engineering
3. Feature creation и применение преобразований к данным для улучшения перфоманса моделей
4. Решение задач кластеризации для выделения групп похожих пользователей
5. Проведение A/B тестирования, проверка гипотез и статистической значимости для оценки эффективности разработанных IT-систем.
6. Подготовка отчетов и дашбордов для демонстрации данных руководству о выполненной работе
7. Выполнение ad-hoc аналитики по запросам руководства
Стек специалиста на проекте
Pandas, Beautiful soup, HuggingFace, aiogram, Docker, A/B testing, yolov5, Yandex Cloud
Отрасль проекта
Telecom
Период работы
Февраль 2022 - Август 2023
(1 год 7 месяцев)
Elbrus Coding Bootcamp
Роль
Data Scientist
Обязанности
(1) FindMyMovie - рекомендательная система для усовершенствования поиска фильмов
пользователями. сам руководства
Tech Stack: PyTorch, Streamlit & HuggingFace, Faiss.
- Парсинг данных
- Работа с BERT
- Работа с faiss
- Написание приложения на Streamlit
(2) House Prices - Advanced Regression Techniques (Kaggle Competion) - feature engineering, применение ML-моделей для предсказания цен на недвижмость.
Tech Stack: Ridge, Lasso, XGBoost, CatBoost, Voting, GridSearchCV&Optune, shap
- EDA, заполнение пропусков, работа с выбросами, масштабирование числовых признаков, энкодинг категориальных признаков, логарифмирование таргета.
- Построение матрицы корелляции, анализ permutation importance с помощью библиотеки shap -> исключение признаков.
- Тюнинг гиперпараметров моделей (Optune, GridSearchCV)
- Обучение и применение Ridge, Lasso, XGBoost, CatBoost, LightGBM, а также Voting (линейная модель+ бустинг) с кросс-валидацией
Результат: Вошел в 5% участников по результатам соревнования.
На моем GitHub также есть проекты с использованием Inception, ResNet, AutoEncoder, LSTM, YOLOv5, GPT-2, BERT.
Стек специалиста на проекте
GridSearch, Lasso, shap, XGBoost, Voting, Ridge, CatBoost, Optuna
Отрасль проекта
Telecom
Период работы
Сентябрь 2021 - Февраль 2022
(6 месяцев)
Формат работы
Тип занятости
Фулл-тайм
Формат работы
Удаленно
Командировки
Готов
Релокация
Не готов
Готов работать на зарубежных проектах
Да
Дипломы и сертификаты
Elbrus Bootcamp Data Science 2022 г.
Образование
Высшее
Учебное заведение
НИУ ВШЭ
Специальность
анализ
Завершение учебы
2023 г.