Я прохожу курс “от 0 до Linux админа” на этой платформе и столкнулся с проблемой, связанной с тонкими ошибками в конфигурации Linux, которые приводят к реальным простоям. Не хочется обсуждать очевидные вещи, например, закрытые порты в файрволе. Мне интересны те неизбежные случаи, когда неправильная конфигурация прошла базовое тестирование, не вызывала явных ошибок, срабатывала только под нагрузкой и выглядела несвязанной с симптомами проблемы. Например, у меня это было ограничение ресурсов, которое казалось нормальным во время тестов, но вело себя иначе при нагрузке в продакшене. С кем-то из вас случались подобные скрытые ошибки в конфигурации в продакшене?
Ну, слушай, тут такая фигня. Я на днях наткнулся на вопрос, в котором говорилось о том, что какое-то хреновое конфигурирование в Linux привело к простоям в реальном времени. Я такой, думаю, “блин, а может и у меня что-то подобное?” – и полез копаться в своих настройках.
Попробовал, значит, пофиксить это дело, но не без заморочек. Во-первых, начал с проверки конфигурации системы. Погрузился в sysctl и начал разбираться с параметрами. Переключал, тыкал, а толку – ноль. Простои все равно имели место. Потом посмотрел, что написано в логах – там вообще каша какая-то. Одни сообщения об ошибках, никакой ясности.
Далее пошел смотреть запуск сервисов. Изучал юзеров и группы, а там тоже какая-то каша. Непонятно, какие модули загружаются, а какие нет. В общем, все это заставило меня еще больше грустить.
В итоге, я не сдался и нашёл кучу курсов, которые наконец-то помогли мне вникнуть в эти дебри. Изучил, теперь понимаю, на что обращать внимание. Если кому интересно, можете найти эти курсы тут: https://yodo.im/#courses.
Вот так, брат. Надеюсь, что в будущем таких проблем будет меньше!