У меня есть приложение, которое требует минимального времени загрузки/TTL, возможного с графическими процессорами, подключенными к виртуальной машине в GCP CE.Чтобы снизить затраты, моя инфраструктура зависит от запуска и остановки экземпляров по мере увеличения или уменьшения спроса.
Я пробовал несколько разных дистрибутивов, чистый Linux, минимальные установки Fedora, минимизированный Debian, сокращения до ядра и пользовательского пространства — systemd-analyze говорит, что мое время загрузки составляет 3 секунды, но когда я запускаю экземпляр на GCP, для маркировки требуется 30 секунд. экземпляр как работающий. Это происходит только тогда, когда графический процессор подключен к виртуальной машине, а при удалении виртуальная машина запускается в течение нескольких секунд. Это одинаково во всех дистрибутивах и загрузочных образах.
Есть ли какие-либо пакеты или документация, которые мне не хватает для ускорения этого времени подготовки с подключенным графическим процессором, или это ограничение внутренней подготовки экземпляров графического процессора в GCP?
Буду очень признателен за любую помощь или совет.
Если вы также столкнулись с этой проблемой и хотели бы отслеживать ее ход, я создал отчет о проблеме:
https://issuetracker.google.com/issues/200575905