Вопрос:
Здравствуйте, уважаемые коллеги!
Я прохожу курс “от 0 до Linux админа” на платформе Learn Programming Online | Courses for Developers | YODO и столкнулся с проблемой. Мы используем мульти-нодовое HPC с общим NAS в нашей лаборатории биоинформатики. Моя задача - создать модель цен, которая сопоставляет использование HPC с облачным провайдером.
У меня настроен SlurmDB и имеется скрипт, который сопоставляет ресурсы задания с самой дешевой GCP инстанцией, удовлетворяющей запрос ресурса, запрашивает GCP pricing API и возвращает предварительную стоимость вычислений для каждого задания. Это начальная точка, но я осознаю, что многое упущено (например, накладные расходы на запуск, постоянное хранилище, расходы на передачу данных и т.д.).
Я задумываюсь о том, как можно более полноценно следить за использованием кластера и интегрировать это в слой сопоставления стоимости наряду с данными о счетах Slurm. Однако опасаюсь писать свои инструменты, когда уже существуют финопсовые фреймворки, и, к тому же, не хочется увязнуть в процессе, создавая высокозатратный инструментальный профиль.
Кто-то уже создавал подобную систему, которая может принимать данные о системном использовании и переводить их в оценочные затраты на облачное вычисление? Надеюсь, что кто-то уже нашел решение и не придется изобретать велосипед.
Заранее спасибо!