Monitorización

De castillowiki
Saltar a: navegación, buscar

Recopilación de herramientas útiles para la monitorización de sistemas operativos:

Rendimiento en Linux

/proc/pid/stat:

      pid: 1
              tcomm: (init)
              state: S
               ppid: 0
               pgid: 0
                sid: 0
             tty_nr: 0
           tty_pgrp: -1
              flags: 8388864
            min_flt: 3706
           cmin_flt: 282132
            maj_flt: 19
           cmaj_flt: 212
              utime: 0.030000
              stime: 1.540000
             cutime: 2.840000
             cstime: 2.790000
           priority: 16
               nice: 0
        num_threads: 1
      it_real_value: 67.140000
         start_time: 11.07 09:07 (11158.38s)
              vsize: 1626112
                rss: 130
             rsslim: 4294967295
         start_code: 134512640
           end_code: 134540142
        start_stack: 2948335296
                esp: 2948334000
                eip: 2817780216
            pending: 0000000000000000
            blocked: 0000000000000000
             sigign: 0000000057f0d8fc
           sigcatch: 00000000280b2603
              wchan: 0
              zero1: 0
              zero2: 0
        exit_signal: 0000000000000000
                cpu: 0
        rt_priority: 0
             policy: 0
$ /usr/bin/time -v <programa>

atop

Mescla htop, iotop i iftop.

El resultat és un poc complicat de llegir.

conky

Ejemplo de visualización

Conky es un monitor de sistema para los sistemas X Window. Está disponible para GNU/Linux y FreeBSD. Es un software libre liberado bajo los términos de la licencia GPL. Conky es capaz de monitorear distintas variables de sistema, incluyendo CPU, memoria, swap, espacio de disco, temperaturas, subidas, bajadas, mensajes de sistema, y mucho más. Es completamente configurable, la configuración puede ser un poco difícil de entender, pero es bastante posible realizarla. Conky es un fork de torsmo.

dmidecode

Comando para dar información del hardware del equipo.

Ejemplos:

$ dmidecode  # información de los mensajes del sistema en el arranque y detección de nuevos dispositivos
$ sudo dmidecode -t 16 # Información sobre la RAM, para saber los módulos que puedes instalar.
$ sudo dmidecode -t 17 # Información de los módulos instalados

dstat

El resultado es parecido a vmstat. La diferencia es que colorea la salida y la hace más legible.

Además, aporta muchas opciones de configuración y ampliación y monitoriza muchos parámetros.


hwloc - lstopo

lstopo proporciona una imatge molt útil per a conèixer l'arquitectura de la CPU

Lstopo.png

iostat

Muestra información de procesador y de la E/S a discos.

Esto es parte de una posible salida:

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1,05         5,86        18,18    1598467    4957376
sdb               0,00         0,01         0,00       2766          0
scd0              0,00         0,04         0,00       9784          0

Lo que indica es el dispositivo, las transferencias por segundo, los kb leidos o escritos por segundo y el total leído o escrito.

Si lanzamos este comando:

$ iostat -xkdz
Linux 3.2.0-58-generic-pae (servidor) 	27/03/14 	_i686_	(4 CPU)

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
sda               0,15     0,76    0,26    0,79     5,86    18,22    45,84     0,01   12,36   21,74    9,32   4,24   0,45
sdb               0,00     0,00    0,00    0,00     0,01     0,00     7,99     0,00    1,08    1,08    0,00   0,55   0,00
scd0              0,00     0,00    0,00    0,00     0,04     0,00    76,74     0,00   51,69   51,69    0,00  42,43   0,00

En este caso, muestra más detalle. Las columnas son:

  • rrqms/s: El número de peticiones de lectura por segundo enviadas al dispositivo.
  • wrqms/s: El número de peticiones de escritura por segundo enviadas al dispositivo.
  • r/s: El número de lecturas completadas por el dispositivo por segundo.
  • w/s: El número de escrituras completadas por el dispositivo por segundo.
  • rkB/s: El número de sectores en kilobytes leidos por el dispositivo por segundo.
  • wkB/s: El número de sectores en kilobytes escritos por el dispositivo por segundo.
  • avgrq-sz: El tamaño medio en sectores de las peticiones hechas al dispositivo.
  • avgqu-sz: El tamaño medio de la cola de peticiones.
  • await: El tiempo de espera medio en milisegundos.
  • r_await: El tiempo de espera medio en milisegundos para lectura.
  • w_await: El tiempo de espera medio en milisegundos para escritura.

lshw

$ lshw -html > hardware.html

Hace una web con la información de hardware del ordenador.

mpstat

Muestra la actividad para cada procesador y los datos globales. Como otros programas del paquete sysstat, acepta un parámetro numérico que indica el intervalo de actualización.

$ mpstat -P ALL 1

Este comando extrae la información de cada procesador cada segundo.

Esta distribución por procesadores o núcleos permite encontrar hilos muy activos o cargas mal distribuidas. Puede ser útil para el desarrollador de software.

Por defecto, estos son los datos que proporciona:

CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest   %idle

Que corresponden a la CPU, el % de uso de programas de usuario, procesos con prioridad, tiempo para el kernel, tiempo de espera de E/S, Servicio a interrupciones de hardware, servicio a interrupciones de software, tiempo perdido con la planificación multiprocesador, tiempo para correr como un procesador virtual y tiempo inactivo sin esperar E/S ni procesos.

ncdu

Comando muy útil, una especie de mejora del du. Permite ver gràficamente cuanto ocupan en disco los directorios.

NeoFetch

neofetch es un programa muy simple para dar una información básica del sistema. Es configurable y puede servir para compartir la captura con otros o como identificador rápido de la máquina a la que estás conectado.

nmon

# apt-get install nmon
# nmon

Nmon.png

Para poder ver automáticamente los datos deseados hay que exportar una variable:

# export NMON=mndc 

Luego al ejecutarlo ya no hay que usar las letras indicadas en la variable

Se puede pedir que guarde los datos para analizarlos o hacer gráficas:

# nmon -f -s2 -c 30
  • -f indica que lo guarde en una hoja de cálculo .
  • -s2 es la frecuencia de actualización (2 segundos).
  • -c 30 es la cantidad de veces que se ha de actualizar.

sar

El comando sar sirve para ver datos del sistema y generar informes. Recoge multitud de estadísticas del sistema.

En primer lugar, hay que habilitar la recogida de datos por sar en /etc/default/sysstat. De esta manera va guardando información cada 15 minutos por defecto. Para cambiar la frecuencia: /etc/cron-d/sysstat

A continuación, podemos probar si sar funciona:

$ sar 1 3

Nos muestra estadísticas cada 1 segundo 3 veces. El resultado es igual que el de mpstat en este caso.

El primer número son los segundos y el otro la cantidad de veces. Este parámetro es igual para todos los programas del paquete systat. Sar va recogiendo internamente datos, por lo que después de un tiempo se pueden lanzar estos comandos sin los números para ver las estadísticas anteriores.

Algunas de las opciones más importantes:

  • -u: Muestra el uso de CPU. Se le puede poner el parámetro ALL para que muestre todos los datos.
  • -P: Muestra el uso de cada CPU o núcleo. Se puede combinar con ALL para que los muestre todos o con el número de CPU que queremos mostrar.
  • -r: Muestra estadísticas de uso de memoria.
  • -S: Información sobre la memoria SWAP.
  • -R: Información sobre las páginas liberadas, usadas o guardadas por segundo.
  • -B: Estadísticas sobre la paginación.
  • -W: Estadísticas sobre SWAP.
  • -b: Información sobre la E/S del disco.
  • -w: Información sobre los procesos creados por segundo y los cambios de contexto por segundo.
  • -q: Carga media en los últimos minuto, 5 minutos y 15 minutos.
  • -n: Estadísticas de red. Acepta palabras clave. Estas son
    • DEV – Displays network devices vital statistics for eth0, eth1, etc.,
    • EDEV – Display network device failure statistics
    • NFS – Displays NFS client activities
    • NFSD – Displays NFS server activities
    • SOCK – Displays sockets in use for IPv4
    • IP – Displays IPv4 network traffic
    • EIP – Displays IPv4 network errors
    • ICMP – Displays ICMPv4 network traffic
    • EICMP – Displays ICMPv4 network errors
    • TCP – Displays TCPv4 network traffic
    • ETCP – Displays TCPv4 network errors
    • UDP – Displays UDPv4 network traffic
    • SOCK6, IP6, EIP6, ICMP6, UDP6 are for IPv6
    • ALL – This displays all of the above information.

sensors

Comando simple que ayuda a saber si la temperatura y otros parámetros físicos son los adecuados.

top y htop

Nos muesta en tiempo real los procesos que más están consumiendo.

El % de CPU es la suma de todos los procesadores o núcleos.

Es una manera fácil y rápida de monitorizar. Por eso es una de las más utilizadas.

El problema de top es que puede no mostrar todos los procesos que consumen CPU. Algunos procesos tienen tiempos de CPU muy cortos y ocurren mientras el top se actualiza. Top no facilita el tratamiento posterior de los datos. En cualquier caso se puede lanzar en modo batch con -b y recoger los datos en un fichero.

Con la opción -d se cambia el delay, es decir, el tiempo entre actualizaciones. si es demasiado corto puede ser ilegible y, además, consume más CPU. En tiempo de ejecución.

Con la opción -i se ocultan los procesos que están en espera. Esta opción también se puede usar en tiempo de ejecución.

Presionando 1 mostramos todas las CPU o núcleos por separado.

Con e y E se cambia la manera en que se muestra la memoria para hacerla más legible por los humanos.

Con F podemos seleccionar las columnas que son visibles y ordenar por la que queramos.

htop Es una mejora en cuanto a legibilidad y usabilidad. Muestra la carga de los núcleos por separado. [1] [2]

uptime

$ uptime
17:30:05 up  3:52,  2 users,  load average: 0.09, 0.12, 0.13

Los últimos tres números son la carga media del último minuto, 5 y 15 minutos. Considera la carga como el número medio de procesos que están bien en un estado ejecutable o ininterrumpido. Un proceso en un estado ejecutable está utilizando la CPU o en espera para utilizar la CPU. Un proceso en estado ininterrumpido está esperando algún tipo de acceso de E/S, por ejemplo, a la espera de disco.

Los promedios se toman en los tres intervalos de tiempo. promedios de carga no están normalizados por el número de CPU en un sistema, por lo que una carga de media 1 significa, con una CPU, que está cargado todo el tiempo. Mientras que con 4 CPU, está activo un 25%.

Solo deberíamos usarlo como pista. En sistemas multiprocesador hay que tener en cuenta la normalización.

vmstat

Proporciona información sobre procesos y memória virtual. Se puede pedir que lo haga una cantidad determinada de repeticiones y definir la frecuencia de actualización.

Red en Linux

Las herramientas básicas para monitorizar la red en Linux son ping, traceroute, ifconfig, ip, iptables y sobretodo netstat.

Algunos comandos netstat:

$ netstat -a # todas las conexiones.
$ netstat -at # todas las conexiones TCP.
$ netstat -ant # Sin dns, para ir más rápido.
$ sudo netstat -nlpt # Los programas que están detras de las conexiones.
$ sudo netstat -ltpe # Los usuarios que usan esas conexiones
$ netstat -s # Estadísticas
$ while [ 1 ]; do netstat -atnp | grep ESTA; sleep 1;  done # Lista de las conexiones que se van estableciendo
$ netstat -np | grep -v ^unix # conexiones y los programas, quitando los sockets de unix
$ old=$(netstat -s | grep 'total' | tr -s " " | cut -d" " -f2); \
while true; do c=$(netstat -s | grep 'total' | tr -s " " | cut -d" " -f2); \
n=$((c-old)); for i in $(seq 1 $n); do echo -n '*'; done; echo ''; old=$c;  sleep 0.5; done 
$ old=$(netstat -s | grep 'total' | tr -s " " | cut -d" " -f2); \
while true; do c=$(netstat -s | grep 'total' | tr -s " " | cut -d" " -f2); \
n=$((c-old)); n=$(($n<47?$n:47));  for i in $(seq 1 $n); do co=$((i/2+232)); \
echo -ne "\e[38;5;${co}m█\e[0m"; done; echo ' '; old=$c;  sleep 1; done

Monitoritzar els clients amb iptables

Además de estas, podemos encontrar algunas que muestran la información de forma más amigable:

bmon

Similar a nload, con una interfaz más detallada, muestra el ancho de banda por interfaz de red y con un gráfico ASCII.

bwm-ng

Muy simple monitor de velocidades en las interfaces de red. Si la resolución de la terminal es buena, puede mostrar la velocidad con un gráfico:

$ bwm-ng -o curses2

O en csv para hacer estadísticas después:

$ bwm-ng -o csv

cbm

Una interfaz simple con pocas opciones que muestra el volumen de tráfico en un instante de tiempo.

dstat

Muestra la carga del sistema con una salida compatible con herramientas de terminal, se puede pedir que sólo saque los datos de la red:

$ dstat -nt

Etherape

Es un programa con GUI que muestra el tráfico de la red. [3]

ifstat

$ ifstat -t -i eth0 0.5

Muestra el ancho de banda en un formato parecido al vmstat u otros. Lo bueno es que se puede enviar por pipes o guardar en ficheros para analizarlo con herramientas de terminal.

iftop

Muestra el ancho de banda por socket. Con la opción -n no resuelve el nombre y puede ir más rápido.

iptraf

Un completo programa que da información sobre el ancho de banda y las tarjetas de red. Muy potente y fácil de usar [4]

mtr

Combina las funciones de ping y traceroute en una herramienta.

Mtr.png

nethogs

Funciona de forma muy parecida a top, pero para monitorizar el uso de la red de los procesos.

netcat

Ver ncat

netwatch

$ sudo apt-get install netdiag
sudo netwatch -e eth0 -nt

Forma parte del paquete netdiag y sirve para mostrar las conexiones entre nuestras interfaces de red y hosts remotos.

nload

Muestra en tiempo real el ancho de banda de cada interfaz de red. Lo hace con un gráfico.

pkstat

$ sudo pktstat -i eth0 -nt

Muestra las conexiones activas y la velocidad de cada una. Es bastante interesante para descubrir qué conexiones están consumiendo el ancho de banda.

slurm

Otro gráfico ASCII con colores para monitorizar la velocidad de una interfaz de red.

$ slurm -s -i eth0

speedometer

$ speedometer -r eth0 -t eth0

Otro monitor con gràficos atractivos del tráfico entrante o saliente de una interfaz de red.

tcptrack

Similar a iftop, muestra el ancho de banda en cada socket.

vnstat

Se trata de un demonio que va recopilando datos de la red todo el tiempo. Se puede comprobar que está en marcha:

$ service vnstat status
 * vnStat daemon is running

Es puede usar para hacer estudios semanales o mensuales, mejor que para monitorizar en tiempo real.

https://www.cyberciti.biz/tips/keeping-a-log-of-daily-network-traffic-for-adsl-or-dedicated-remote-linux-box.html

Benchmark de red

Netperf

Necesita un cliente y un servidor y mide diferentes aspectos del rendimiento de la red. Soporta multitud de tests y se pueden ver y usar ejemplos en /usr/share/doc/netperf/examples.

Al instalarlo en Ubuntu puede que ya deje el servidor netserver en marcha.

https://people.freebsd.org/~pjd/netperf/

Iperf

Es muy parecido al Netperf en cuanto al funcionamiento. Aunque Netperf tiene muchas funciones, Iperf es más usado y se encuentra más información sobre él. [5]

To run iperf as the server, use $iperf -s -p port, where ‘port’ can be any random port.

On the client side, to connect to the server, use $iperf -c server_ip -p server_port.

Monitores de flujo de red con GUI

Ntopng

Es casi el estandar de ese tipo de monitores. Proporciona datos históricos del flujo por la red. Usa una base de datos redis-server y se accede via web.

Flowbat

http://www.flowbat.com/download.html

Darkstat

https://unix4lyfe.org/darkstat/

NFSen

http://nfsen.sourceforge.net/#mozTocId301830

Enlaces

TODO:

perf, df, du, nethogs, collectl, saidar, glances, atop, lsof http://askubuntu.com/questions/182886/how-to-get-average-network-load-instead-of-instant http://www.brendangregg.com/USEmethod/use-linux.html http://techblog.netflix.com/2015/11/linux-performance-analysis-in-60s.html http://www.cyberciti.biz/faq/linux-cpuid-command-read-cpuid-instruction-on-linux-for-cpu/ ( Netdata: https://github.com/firehol/netdata/blob/master/README.md https://github.com/firehol/netdata/wiki/You-should-install-QoS-on-all-your-servers) https://sysdig.com/blog/linux-troubleshooting-cheatsheet/?twitterID=nixCraft http://cb.vu/unixtoolbox.xhtml https://enc.com.au/2016/05/07/displaying-linux-memory/ http://www.monitorix.org/ http://blog.packagecloud.io/eng/2016/06/22/monitoring-tuning-linux-networking-stack-receiving-data/ http://opensourceforu.com/2016/10/network-performance-monitoring/ https://www.digitalocean.com/community/tutorials/how-to-monitor-your-ubuntu-16-04-system-with-sysdig https://www.cyberciti.biz/hardware/how-to-use-corefreq-cpu-monitoring-software-on-linux/