Sistema exaustivo de comprobación: revisión interna de los servidores
Core-Admin incluye una completa y creciente lista de comprobadores para revisar numerosos puntos de sus servidores y sistemas, para asegurar que estos están funcionando y para proporcionarle una visión real y actualizada sobre el estado de todo el sistema.
Comprobadores de Core-Admin
El diseño del sistema de comprobación de Core-Admin está basado en el análisis en tiempo real de los logs, a través del monitorizador de logs de Core-Admin, y una lista de comprobadores especializados que son ejecutados por el agente de Core-Admin para asegurar que su servidor está funcionando correctamente. Ambos proporcionan la base para el sistema de comprobación exaustiva que proporciona Core-Admin como plataforma.
Comprobadores listos
Core-Admin incluye un numeroso grupo de comprobadores listo para usar que son capaces de auto detectar el sistema para ver si pueden ejecutar. En tal caso, estos comienzan a trabajar, comprobando regularmente su sistema, produciendo notificaciones útiles cuando se encuentra algo incorrecto.
¡Sistema extensible!
¿Encuentra que algún comprobador no está disponible? Core-Admin le permitirá crear fácilmente nuevos comprobadores que se ajusten a sus necesidades. Podrá añadir opciones personalizadas a sus comprobadores para implementar casi cualquier operación que necesite.
No solo notificaciones
Muchos comprobadores producen no solo notificaciones cuando algo no está funcionando bien. Junto con estas notificaciones el comprobador proporciona muchas opciones que pueden ser utilizadas para corregir el problema, reconfigurar el comprobador o suspenderlo temporalmente (por nombrar algunas opciones).
Lista oficial de comprobadores incluidos en Core-Admin
Lo siguiente es la lista oficialmente soportada, es decir, comprobadores que son mantenidos por ASPL y que están incluidos en todas las ediciones de Core-Admin:
Comprobador | Descripción | Qué soluciona |
---|---|---|
apache2 | Comprobar el funcionamiento actual de apache2 mediante la conexión a los puertos locales detectados. En el caso de que algo no esté funcionando, puede reiniciar el servidor. | Detectar cuando apache2 no está funcionando para reiniciarlo cuando se encuentra en fallo. |
arcconf | Comprobar las tarjetas hardware raid PMC-sierra que soportan la herramienta arcconf. | Permiten detectar fallos raid de manera que los operadores puedan proceder a reemplazar los discos. Debido a la detección temprana, se reduce el riesgo de estar funcionando con un dispositivo en fallo. |
cpu-usage | Comprueba patrones altos de consumo de cpu por procesos individuales o por un grupo de procesos. | Detectar patrones de consumo de cpu excesivos que son usualmente señal de que algo no está funcionando correctamente o que un servicio está siendo mal usado. |
disk-full | Comprueba y vigila que los discos duros no se llenen | Detección temprana para cuando un servidor se está quedando sin espacio |
dns | Comprueba la configuración DNS actual está funcionando y resolviendo nombres | Muchos componentes del servidor dependen de que la configuración DNS esté funcionando correctamente. Sin ella, el servidor produce errores adicionales que de hecho son consecuencia del primer error. |
fstab | Comprobar que todas las declaraciones dentro del /etc/fstab tienen sentido. El comprobador asegura que todos los dispositivos y sistemas de ficheros declarados están soportados | Evitar tener un fichero /etc/fstab con declaración incorrectas lo que puede significar que el servidor no quede usable sobre todo después de reiniciar |
generic-ftp | Comprobar que el servidor FTP local está funcionando. El comprobador soporta proporcionar un usuario y contraseña para comprobación extendida | Asegurar que el servidor FTP está funcionando correctamente |
generic-mail | Comprobar que el servidor local IMAP y POP3 están funcionando. El comprobador soporta proporcionar un usuario y una contraseña para comprobación extendida | Asegura que el servidor IMAP y POP3 funciona correctamente. El comprobador permite reiniciar el servidor cuando se encuentra que no funciona |
generic-smtp | Comprobar que el servidor local SMTP está funcionando. El comprobador soporta proporcionar un usuario y una contraseña para comprobación extendida | Asegura que el servidor SMTP funciona correctamente. El comprobador permite reiniciar el servidor cuando se encuentra que no funciona |
hostname | Comprueba que el nombre de host actual, la ip y las declaraciones internas encajan y son correctas | Muchas aplicaciones pueden mostrar comportamiento errático o mal funcionamiento con un nombre de host incorrectamente configurado |
hpacucli | Comprobar las tarjetas hardware raid HP Smart Array que soportan la herramienta hpacucli. | Permiten detectar fallos raid de manera que los operadores puedan proceder a reemplazar los discos. Debido a la detección temprana, se reduce el riesgo de estar funcionando con un dispositivo en fallo. |
iptables-running | Asegurarse de que el firwall basado en iptables está ejecutando | Permite detectar cuando el firewall está caído cuando no debería. También soporta levantarlo. |
ldap | Comprueba que el servidor local LDAP está funcionando | Permite asegurar que el servidor LDAP está funcionando y proporcionando datos correctos |
loopback-check | Permite asegurar que el dispositivo loopback está presente y funcionando | Muchas aplicaciones muestran un comportamiento errático o mal funcionamiento cuando el dispositivo loopback no está presente o está mal configurado |
mdadm | Comprobar el RAID de linux software basado en la herramienta mdadm | Permiten detectar fallos raid de manera que los operadores puedan proceder a reemplazar los discos. Debido a la detección temprana, se reduce el riesgo de estar funcionando con un dispositivo en fallo. |
megaraid | Comprobar las tarjetas hardware raid MegaRaid que soportan las herramientas megaraidsas-status o megaraid-status. | Permiten detectar fallos raid de manera que los operadores puedan proceder a reemplazar los discos. Debido a la detección temprana, se reduce el riesgo de estar funcionando con un dispositivo en fallo. |
mysql | Comprobar que el servidor MySQL local está funcionando, y que responde a consultas y que tiene conexiones disponibles | Permite asegurar que el servidor MySQL está funcionando y tiene suficientes conexiones disponibles para que los sistemas del servidor que dependen de MySQL funcionen correctamente |
ntp | Comprobar y corregir la hora del servidor mediante la comprobación con un servidor de hora remoto | Asegurar que el servidor está siempre en hora |
rbl-check | Comprobar si alguna de las ips del servidor ha sido listada en las blacklists (DNS rbl) conocidas. | Mejorar la reputación IP de los servidores permitiendo conocer rápidamente cuando han sido listados, qué ip fue listada y qué lista negra es la responsable. |
renamed-process | Implementar varias comprobaciones para encontrar procesos sospechosos con cadenas de carga no esperadas o nombres cambiantes en un intento de ocultarse a si mismo | Ayudar a mejorar la seguridad del sistema detectando patrones comunes sospechosos |
time_wait | Implementar varias comprobaciones para evitar problemas de agotamiento de puertos efímeros | Ayuda a detectar y solucionar problemas de agotamiento de puertos efímeros. |
samba | Comprobar que el servidor samba está funcionando y que está sirviendo peticiones | Asegurar que el servidor samba está funcionando. El comprobador soporta reiniciar el servidor en el caso de que no esté funcionando |
swap-working | Implementa varias comprobaciones sobre la swap para asegurar que está disponible y que su uso no excede de los límites configurados | Asegurar que el sistema funciona bajo valores de memoria razonables. Un algo consumo de swap suele indicar que algo no está funcionando correctamente y que hay un patrón de uso que puede llegar a dar problemas |
syncookie | Comprobar y asegurar que la protección syncookie está habilitada | Asegurar que esta protección básica contra el syn-flood está habilitada |
syn-flood-detect | Comprobar ataques syn-flood and automáticamente bloquearlos | Mejorar la protección contra los ataques de tipo syn-flood |
tmp-working | Realizar varias comprobaciones de la carpeta de sistema /tmp | Asegurar que el directorio temporal está funcionando y está disponible. Muchos componentes del sistema dependen de tener un /tmp funcionando |
unknown-dhcp-servers | Permite detectar servidores DHCP desconodicos/no-experados | Asegurar que los servidores DHCP son conocidos y que no hay otros servidores proporcionando respuestas DHCP |
uptime | Permite hacer un seguimiento del tiempo de arranque y del os reinicios | Detectar varios patrones sospechosos alrededor del tiempo de arranque |
varnish | Comprobar el estado del servidor de caché varnishd y su backend por defecto | Detectar estados incorrectos del varnish, informar de los fallos y opcionalmente reiniciar el servicio |