Apache DataFusion --- Open Source инфраструктура для создания компонентов, исполняющих запросы к данным, (query execution engine) на языке Rust, используемый преимущественно для решения аналитических задач (OLAP). Эдакий аналог LLVM, но для языков запросов.
Для аналитических задач часто используют графовые модели данных, поддержка которых на данный момент отсутствует в DataFusion. В связи с потребностями в поддержке графовых представлений, крупные СУБД на базе SQL, например, решения от Oracle, реализуют расширение SQL/PGQ (ISO), добавляющее в язык SQL поддержку графовых запросов. Предлагается пойти похожим путем для поэтапного внедрения поддержки графовых запросов в Apache DataFusion: в рамках работы необходимо дополнить существующую реализацию SQL DDL (Data Definition Language) частью расширения SQL/PGQ и оформить запрос на принятие изменений (pull request) в основной репозиторий проекта. А именно, будет необходимо решить следующие задачи.
2 курс
Григорьев Семен Вячеславович
Grigorev Semyon
Кафедра системного программирования СПбГУ