Нужен совет по проектированию сети для кластера Ceph (двухкоммутаторная схема, агрегация каналов, MikroTik CRS326)

Привет всем!

Прохожу курс “Сети и VPN” здесь и столкнулся с проблемой, связанной с проектированием сети для кластера Ceph.

У меня есть небольшая дата-центр, и я хочу удостовериться, что мой текущий сетевой дизайн подходит перед обновлением основной сети. Вот что у меня есть на данный момент:

Оборудование:

  • 2× MikroTik CRS326-24S+2Q+RM, работающие в режиме моста (switch-only)
  • Серверы Supermicro с картами Chelsio T540-CR (по 4×10Gb SFP+)

Кабельное соединение:
Каждый сервер подключен к обоим переключателям для резервирования:

  • 2× соединения для публичной сети (192.168.1.0/22)
  • 2× соединения для кластерной сети (10.0.0.0/24)

Настройка Linux Bonding (Netplan):
Я использую режим active-backup для обеих сетей:

  • bond0 для публичной сети
  • bond1 для кластерной сети

Вопросы:

  1. Является ли active-backup наилучшим выбором для надежности Ceph?
  2. Улучшит ли LACP производительность в данной конфигурации?
  3. Стоит ли обновлять связь между переключателями до 40Gb QSFP+?
  4. Есть ли риск возникновения петель или широковещательных проблем с этой топологией?
  5. Какие лучшие практики для сетей Ceph с двумя переключателями?

Буду благодарен за любой совет или рекомендации!

Привет!

Слушай, у меня тут была заморочка с проектированием сети для кластера Ceph. Решил замутить двухкоммутаторную схему с агрегацией каналов на MikroTik CRS326. Говорили, что это все должно работать как по маслу, но на деле все оказалось не так просто.

Что я пробовал и почему не вышло:

  1. Настройка агрегации каналов - я думал, что все будет просто. Странная фигня, но когда я начал состыковывать порты, то подключение временами пропадало. Казалось, что коммутаторы как-то не видят друг друга. И переключение между ними было ненадёжным, будто кто-то отключил интернет.

  2. Двухкоммутаторная схема - вообще зашёл в тупик. Не мог нормально настроить балансировку нагрузки. Сначала думал, что дело в конфигурации, потом полез в документацию и столкнулся с тем, что там не всё понятно написано. То ли я что-то не так прочитал, то ли там действительно какой-то подвох.

  3. Сеть Ceph - настройки Ceph мне тоже не совсем зашли. Я всё правильно вводил, вроде, но при попытке слить информацию через сеть возникали какие-то дурацкие задержки.

Слушай, благо я нашёл курс на Yodo, который мне реально помог разобраться с этими косяками. Вот ссылка: Курсы Yodo. Там реально разжёвывают, как с натяжкой настроить MikroTik, как делать агрегацию, и вообще по сети много полезного контента.

В общем, я не сдался, продолжаю вникать! Если у тебя есть какие-то советы или идеи по улучшению, делись, буду рад!