ML для RISC-V: gradient boosting

Градиентный бустинг является важным методом решения задач регрессии и классификации. Исследователям предлагается на выбор несколько «зрелых» реализаций этого метода: xgboost (Community driven), lightgbm (Microsoft Research), catboost (Yandex). Эти проекты в основном рассчитаны на вычисления на gpu (cuda), однако для cpu есть также свои оптимизации.

В последнее время набирает популярность архитектура RISC-V, которая также располагает векторным расширением RISC-V Vector (RVV). Целью данной задачи является проверка работоспособности вышеупомянутых библиотек на RISC-V, изучение в плане поддержки векторизации на CPU, а также реализация поддержки RVV.

Необходимо будет изучить уже имеющиеся оптимизации в выбранной библиотеке и добавить поддержку расширений RVV-0.7 для архитектуры RISC-V. Всё это будет сопровождаться тестами производительности и, в зависимости от уровня обучающегося, рабочим проектом, использующим данную библиотеку. «Живая» платка у нас есть.

  1. Проект lightgbm: https://lightgbm.readthedocs.io
  2. Проект xgboost: https://xgboost.readthedocs.io
  3. Проект CatBoost: https://catboost.ai
Уровень

2 курс, 3 курс, Бакалаврская ВКР, Магистерская ВКР


Руководитель

Смирнов Кирилл Константинович


Консультант

Смирнов Кирилл Константинович


Источник

YADRO