15 мая 2024

Lamoda Tech

Делаем моду ближе для каждого и создаем продукты для удобного и вдохновляющего шопинга. Результат — 17 миллионов довольных пользователей ежемесячно и звание крупнейшей fashion & lifestyle платформы в России по версии Data Insight.
Секторы:
Технологии
Сотрудники:
более 500 человек
Локации:
Москва, Санкт-Петербург, Ереван
Локация:
Занятость / Тип договора:
Полный день
/
Работа
Опыт:
От 1 года до 3-х лет
Зарплата:

Junior Data Scientist (Personalization)

В команду персонализации мы ищем Junior Data Scientist, который будет вовлекаться в задачи по разработке рекомендательных систем и развитию модели рекомендации размера.

Почему у нас классно:

  • Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
  • Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность расти и обмениваться знаниями внутри команды.

Мы ожидаем:

  • Опыт работы в пет-проектах или в коммерческих проектах от полугода до года;
  • Владение Python:
  • Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, XGBoost, CatBoost, PyTorch, Spark ML;
  • Знания теории вероятностей и математической статистики; машинного обучения, прогнозного моделирования и методов статистического анализа; алгоритмов и структур данных.

Будет плюсом:

  • Опыт работы с Hadoop \ Hive \ Spark;
  • Опыт работы в операционных системах *nix, работа с bash;
  • Опыт работы с Deep Learning, NLP.

Как мы работаем:

  • Пишем на Python 3.6+ и PySpark 3.0;
  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.