Показаны различия между двумя версиями страницы.
Предыдущая версия справа и слева Предыдущая версия Следующая версия | Предыдущая версия | ||
monitoring:nagios [2015/09/20 16:12] linko22@gmail.com |
monitoring:nagios [2015/09/22 09:56] (текущий) linko22@gmail.com |
||
---|---|---|---|
Строка 8: | Строка 8: | ||
===== Общий пул ===== | ===== Общий пул ===== | ||
+ | Общий пул серверов мы пихаем в файл / | ||
+ | Обычно мы пишем типа так: | ||
+ | |||
+ | < | ||
+ | [server] | ||
+ | server_name_for_nagios ansible_ssh_host=IP.AD.DR.E.SS | ||
+ | ... | ||
+ | </ | ||
+ | |||
+ | Указывать надо оба два параметра, | ||
+ | |||
+ | Эти оба параметра используются для генерации конфига Nagios, а так же для того, что бы выложить настройки NRPE. | ||
+ | |||
+ | В секции [nagios-server] мы указываем адрес сервера на который будут заливаться сгенерированные ansible файлы конфигурации для хостов | ||
===== Серверная часть ===== | ===== Серверная часть ===== | ||
- | В основе серверной части у нас находится некий секретный сервер на котором установлен | + | В основе серверной части у нас находится некий секретный сервер на котором установлен |
+ | |||
+ | ===== Клиентская часть ===== | ||
+ | Туда с помощью ansible накатывают установку NRPE. | ||
+ | |||
+ | |||
+ | ===== Как добавить хост в мониторинг ===== | ||
+ | |||
+ | Для начала мы на том сервере, | ||
+ | |||
+ | После этого мы должны запихать на этот новый сервер ssh ключ, через который мы будем работать когда будем запускать ansible | ||
+ | |||
+ | < | ||
+ | ssh-copy-id IP.AD.DR.E.SS | ||
+ | </ | ||
+ | |||
+ | После того, как мы набрали пароль и ключи успешно скопировался, | ||
+ | |||
+ | < | ||
+ | ansible-playbook / | ||
+ | </ | ||
+ | |||
+ | Если всё прошло успешно, | ||
+ | |||
+ | < | ||
+ | ansible-playbook / | ||
+ | </ | ||
+ | |||
+ | Обычно после этого пишется кучу сообщений об ошибке, | ||
+ | |||
+ | Выполняем просто | ||
+ | |||
+ | < | ||
+ | systemctl restart nagios | ||
+ | </ | ||
+ | |||
+ | ===== Что мы мониторим ===== | ||
+ | |||
+ | Пока что мы мониторим только самый минимум - | ||
+ | * ping | ||
+ | * ssh | ||
+ | * NRPE | ||
+ | * / раздел | ||
+ | |||
+ | Далее будем увеличивать количество объектов для мониторинга | ||
+ | |||
+ | ===== Перестаём мониторить хост ===== | ||
+ | Тут пока автоматики нет, поэтому делаем два действия | ||
+ | |||
+ | - Убираем сам хост из файла **/ | ||
+ | - Заходим в каталог **/ | ||
+ | |||
+ | |||
+ | ===== Проблемы при установке ===== | ||
+ | |||
+ | < | ||
+ | fatal: [server_name] => SSH Error: Permission denied (publickey, | ||
+ | while connecting to ip.add.re.ss: | ||
+ | It is sometimes useful to re-run the command using -vvvv, which prints SSH debug output to help diagnose the issue. | ||
+ | </ | ||
+ | |||
+ | Не прописался ключ на этот сервер, | ||
+ | |||
+ | Надо добиться того, что бы с ноды где стоит нагиос работал корректно заход по ключам без пароля | ||
+ | |||
+ | < | ||
+ | failed: [server_name] => {" | ||
+ | msg: Could not fetch updated apt files | ||
+ | </ | ||
+ | |||
+ | Надо зайти ручками на сервер и запустить **apt-get update** | ||
+ | |||
+ | Ошибки что будут - поправить | ||