mirroir readonly du Gitit wiki.evolix.org (attention, ne rien commiter/merger sur ce dépôt) https://wiki.evolix.org
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

6.4 KiB

categories title
monitoring Howto InfluxDB

InfluxDB est une base de données de séries temporelles. Nous l’utilisons en combinaison avec collectd et Grafana.

Installation

Nous utilisons les dépôts fournis par InfluxData pour avoir une version stable plus récente.

# wget https://repos.influxdata.com/influxdb.key -O /etc/apt/trusted.gpg.d/influxdb.asc
# chown _apt /etc/apt/trusted.gpg.d/influxdb.asc
# echo "deb https://repos.influxdata.com/debian buster stable" > /etc/apt/sources.list.d/influxdb.list
# apt update
# apt install influxdb
# systemctl start influxdb.service

$ influx -version
InfluxDB shell version: 1.7.10

$ systemctl status influxdb
● influxdb.service - InfluxDB is an open-source, distributed, time series database
   Loaded: loaded (/lib/systemd/system/influxdb.service; enabled; vendor preset: enabled)
     Docs: https://docs.influxdata.com/influxdb/
 Main PID: 2351 (influxd)
    Tasks: 9 (limit: 4915)
   CGroup: /system.slice/influxdb.service
           └─2351 /usr/bin/influxd -config /etc/influxdb/influxdb.conf

Configuration

Le fichier de configuration se trouve dans /etc/influxdb/influxdb.conf.

On peut désactiver la collection de statistiques internes à InfluxDB, et ne faire écouter le serveur HTTP qu’en local. Ce dernier permet d’afficher des graphes à des fins de tests uniquement.

[monitor]
  store-enabled = false
[http]
   bind-address = "127.0.0.1:8086"

Collectd

Pour récupérer les métriques envoyées par collectd, il suffit d’activer le listener :

[[collectd]]
  enabled = true
  bind-address = ":25826"
  database = "collectd"
  typesdb = "/usr/share/collectd"

Puis télécharger le fichier, si collectd n’est pas installé sur la machine :

# mount -o remount,rw /usr
# mkdir /usr/local/share/collectd/
# wget https://raw.githubusercontent.com/collectd/collectd/master/src/types.db -O /usr/local/share/collectd/
# chmod 755 /usr/local/share/collectd/
# chmod 644 /usr/local/share/collectd/types.db
# mount -o remount /usr

Administration

Emplacement des données

Par défaut les données sont stockées dans /var/lib/influxdb/. Pour modifier l’emplacement dans /opt/influxdb/, on peut procéder ainsi :

Éditer /etc/influxdb/influxdb.conf :

[meta]
  # Where the metadata/raft database is stored
#  dir = "/var/lib/influxdb/meta"
  dir = "/opt/influxdb/meta"

[data]
  # The directory where the TSM storage engine stores TSM files.
#  dir = "/var/lib/influxdb/data"
  dir = "/opt/influxdb/data"

  # The directory where the TSM storage engine stores WAL files.
#  wal-dir = "/var/lib/influxdb/wal"
  wal-dir = "/opt/influxdb/wal"

Puis déplacer les anciennes données :

# systemctl stop influxdb.service
# cp -a  /var/lib/influxdb/ /opt/
# systemctl start influxdb.service

Si on veut faire un lien symbolique dans /home/influxdb/, on peut procéder ainsi :

# systemctl stop influxdb.service
# mkdir /home/influxdb
# chown influxdb: /home/influxdb
# chmod 755 /home/influxdb/
# mv /var/lib/influxdb/* /home/influxdb/
# rmdir /var/lib/influxdb/
# ln -s /home/influxdb/ /var/lib/
# systemctl start influxdb.service

Structure de la base

Il peut être intéressant de naviguer dans la base de données afin de comprendre comment sont stockées les données, et ainsi afficher des graphes avec plus de facilité :

# influx
Connected to http://localhost:8086 version 1.7.10
InfluxDB shell version: 1.7.10
> SHOW DATABASES
name: databases
name
----
collectd
> USE collectd
Using database collectd
> SHOW MEASUREMENTS
name: measurements
name
----
cpu_value
disk_value
load_longterm
load_midterm
load_shortterm
snmp_rx
snmp_tx
tcpconns_value
> SELECT * FROM snmp_rx,snmp_tx LIMIT 5
name: snmp_rx
time                host   type       type_instance value
----                ----   ----       ------------- -----
1527610980434511472 Switch if_packets machine A     4241766500
1527611039463879536 Switch if_octets  machine B     9414616763688
1527611039463903506 Switch if_octets  machine C     59780133577
1527611039463953500 Switch if_octets  machine D     109232798624
1527611039556165882 Switch if_packets machine B     7925165702

name: snmp_tx
time                host   type       type_instance value
----                ----   ----       ------------- -----
1527610980434511472 Switch if_packets machine A     11434830808
1527611039463879536 Switch if_octets  machine B     174654547558
1527611039463903506 Switch if_octets  machine C     135392659943
1527611039463953500 Switch if_octets  machine D     9179809568001
1527611039556165882 Switch if_packets machine B     396998647

Supprimer des mesures

On peut vouloir supprimer une mesure particulière, par exemple dans le cas où une machine n’est plus sur le switch :

> SHOW SERIES FROM snmp_rx,snmp_tx WHERE type_instance='machine A'
key
---
snmp_rx,host=Switch,type=if_octets,type_instance=machine\ A
snmp_rx,host=Switch,type=if_packets,type_instance=machine\ A
snmp_tx,host=Switch,type=if_octets,type_instance=machine\ A
snmp_tx,host=Switch,type=if_packets,type_instance=machine\ A
> DROP SERIES FROM snmp_rx,snmp_tx WHERE type_instance='machine A'

Rétention

Par défaut, les données sont gardées sur une durée illimitée, et l’intervalle de vérification de la rétention est de 30 minutes.

Si on ne souhaite pas utiliser la rétention, on peut la désactiver :

[retention]
   # Determines whether retention policy enforcement enabled.
   enabled = false

Si au contraire, on veut avoir une rétention d’un an, il faut modifier la politique :

# influx
> use collectd
> SHOW RETENTION POLICIES
name    duration shardGroupDuration replicaN default
----    -------- ------------------ -------- -------
autogen 0s       168h0m0s           1        true

> ALTER RETENTION POLICY "autogen" ON "collectd" DURATION 52w REPLICATION 1 DEFAULT
> SHOW RETENTION POLICIES
name     duration  shardGroupDuration replicaN default
----     --------  ------------------ -------- -------
autogen  8736h0m0s 168h0m0s           1        true

Et on peut augmenter l’intervalle de vérification de la rétention :

[retention]
   # Determines whether retention policy enforcement enabled.
   enabled = false

  # The interval of time when retention policy enforcement checks run.
  check-interval = "24h"