Одним из компонентов отказоустойчивых кластеров от ClusterLabs является менеджер ресурсов pacemaker. В его обязанности входит восстановление работоспособности сервисов при старте или сбое узлов кластера. Для этого строится некоторый ориентированный граф, в узлах которого находятся действия, которые нужно выполнить для перевода кластера в работоспособное состояние. Пример графа можно посмотреть по https://clusterlabs.org/pacemaker/doc/deprecated/en-US/Pacemaker/2.0/html/Pacemaker_Administration/_visualizing_the_action_sequence.html Типичным случаем использования является управление десятком ресурсов (СУБД+web). В компании YADRO система pacemaker используется для управления довольно большим количеством ресурсов. К сожалению, он не рассчитан на такой объем данных, что выражается в слишком долгой работе с графом. Требуется переработать алгоритмы построения и обхода графа, чтобы добиться приемлемой производительности.
Текущее время обработки графа составляет около одной минуты. Требуемое время — порядка миллисекунд. В качестве кодовой базы можно рассматривать оригинальную реализацию на гитхабе https://github.com/ClusterLabs/pacemaker
Проект довольно обширный, в качестве отчуждаемых результатов могут выступать: * алгоритмы + реализация вне pacemaker * минимальная рабочая реализация в рамках pacemaker * продуктовое решение
Еженедельные звонки (30 минут) с представителями YADRO для демонстрации результатов; Коммуникация в Telegram; Инструкция по правильному написанию вопросов: http://tinyurl.com/stack-hints
Остальные кафедральные требования также в силе: текст, доклад, отзыв etc.
Владение Linux, C/C++.
3 курс, Бакалаврская ВКР, Магистерская ВКР
Смирнов Кирилл Константинович
YADRO