22
0
Fork 0
wiki/HowtoInfluxDB.md

333 lines
11 KiB
Markdown
Raw Permalink Normal View History

2018-06-25 14:56:26 +02:00
---
categories: monitoring
title: Howto InfluxDB
...
* Documentation : <https://docs.influxdata.com/influxdb>
[InfluxDB](https://www.influxdata.com/time-series-platform/influxdb/) est une base de données de séries temporelles. Nous l'utilisons en combinaison avec [collectd](HowtoCollectd) et [Grafana](HowtoGrafana).
## Installation
Nous utilisons les dépôts fournis par InfluxData pour avoir une version stable plus récente.
~~~
2023-07-27 09:42:48 +02:00
# wget -q https://repos.influxdata.com/influxdata-archive_compat.key
# echo '393e8779c89ac8d958f81f942f9ad7fb82a25e133faddaf92e15b16e6ac9ce4c influxdata-archive_compat.key' | sha256sum -c && cat influxdata-archive_compat.key | gpg --dearmor > /etc/apt/trusted.gpg.d/influxdata-archive_compat.gpg
# rm influxdata-archive_compat.key
# chmod 644 /etc/apt/trusted.gpg.d/influxdata-archive_compat.gpg
2021-10-18 15:40:54 +02:00
# echo "deb https://repos.influxdata.com/debian bullseye stable" > /etc/apt/sources.list.d/influxdb.list
2018-06-25 14:56:26 +02:00
# apt update
# apt install influxdb
# systemctl start influxdb.service
$ influx -version
2021-10-18 15:43:13 +02:00
InfluxDB shell version: 1.8.10
2018-06-25 14:56:26 +02:00
$ systemctl status influxdb
● influxdb.service - InfluxDB is an open-source, distributed, time series database
2021-10-18 15:43:13 +02:00
Loaded: loaded (/lib/systemd/system/influxdb.service; enabled; vendor preset: enabled)
Active: active (running) since Mon 2021-10-18 15:41:32 CEST; 30s ago
Docs: https://docs.influxdata.com/influxdb/
Process: 78443 ExecStart=/usr/lib/influxdb/scripts/influxd-systemd-start.sh (code=exited, status=0/SUCCESS)
Main PID: 78444 (influxd)
Tasks: 10 (limit: 2340)
Memory: 12.0M
CPU: 119ms
CGroup: /system.slice/influxdb.service
└─78444 /usr/bin/influxd -config /etc/influxdb/influxdb.conf
2018-06-25 14:56:26 +02:00
~~~
## Configuration
2020-02-11 14:52:19 +01:00
Le fichier de configuration se trouve dans `/etc/influxdb/influxdb.conf`.
2018-06-27 12:37:40 +02:00
On peut désactiver la collection de statistiques internes à InfluxDB, et ne faire écouter le serveur HTTP qu'en local. Ce dernier permet d'afficher des graphes à des fins de tests uniquement.
2018-06-25 14:56:26 +02:00
~~~
[monitor]
store-enabled = false
[http]
bind-address = "127.0.0.1:8086"
~~~
2022-04-26 12:00:16 +02:00
### Authentification
* Documentation : <https://docs.influxdata.com/influxdb/v1.8/administration/authentication_and_authorization/>
L'authentification ici permettra à ce que la base de données ne soit pas accessible à n'importe qui, d'autant plus que n'importe quel utilisateur Unix peut s'y connecter.
2022-04-26 12:00:16 +02:00
On commence par créer un utilisateur avec les droits administrateur :
~~~
# influx
Connected to http://localhost:8086 version 1.8.10
InfluxDB shell version: 1.8.10
> CREATE USER <username> WITH PASSWORD '<password>' WITH ALL PRIVILEGES
> SHOW USERS
user admin
---- -----
<username> true
~~~
On modifie la configuration dans `/etc/influxdb/influxdb.conf` pour activer l'authentification :
~~~
[http]
auth-enabled = true
~~~
Puis on redémarre influxDB :
~~~
# systemctl restart influxdb
~~~
On s'authentifiera ensuite via la commande `auth` :
2022-04-26 12:00:16 +02:00
~~~
# influx
Connected to http://localhost:8086 version 1.8.10
InfluxDB shell version: 1.8.10
> auth
username: root
password:
~~~
2022-04-28 11:28:57 +02:00
Ou, avec la commande `influx`, en laissant l'arguement `-password` vide mais bien présent pour qu'il soit demandé à l'utilisateur :
2022-04-26 12:00:16 +02:00
~~~
# influx -username root -password ''
password:
Connected to http://localhost:8086 version 1.8.10
InfluxDB shell version: 1.8.10
>
~~~
Attention, si le mot de passe donné n'est pas le bon, aucune erreur n'est affichée, mais les commandes ayant besoin d'être authentifiées seront en erreur.
Si on utilise [Grafana](HowtoGrafana#ajouter-une-source), il faut ensuite le configurer pour s'authentifier afin qu'il puisse lire les données.
2018-06-25 14:56:26 +02:00
### Collectd
Pour récupérer les métriques envoyées par [collectd](/HowtoCollectd), il suffit d'activer le listener :
2018-06-25 14:56:26 +02:00
~~~
[[collectd]]
enabled = true
bind-address = ":25826"
database = "collectd"
2020-04-16 19:52:28 +02:00
typesdb = "/usr/share/collectd"
2018-06-25 14:56:26 +02:00
~~~
Puis télécharger le fichier, si collectd n'est pas installé sur la machine :
~~~
# mount -o remount,rw /usr
# mkdir /usr/local/share/collectd/
# wget https://raw.githubusercontent.com/collectd/collectd/master/src/types.db -O /usr/local/share/collectd/
# chmod 755 /usr/local/share/collectd/
# chmod 644 /usr/local/share/collectd/types.db
# mount -o remount /usr
~~~
#### Authentification
Ici, l'authentification concerne l'écriture des données par le collecteur dans la base de données.
On modifie la configuration `/etc/influxdb/influxdb.conf` :
~~~
[[collectd]]
[…]
security-level = "sign"
auth-file = "</path/to/auth_file>"
~~~
Le `security-level` peut être `none` (aucune authentification), `sign` (données signées avec HMAC-SHA-256), ou `encrypt` (données chiffrées avec AES-256, et intégrité assurée avec SHA-1).
Le fichier `auth-file` doit contenir le ou les utilisateur(s) avec la syntaxe suivante :
~~~
user0: foo
user1: bar
~~~
Attention aux droits de ce fichier : il doit n'être lisible et n'appartenir qu'à l'utilisateur `influxdb`.
Il faut ensuite configurer [collectd](/HowtoCollectd#plugin-network) pour qu'il s'authentifie lorsqu'il envoie ses données.
2018-06-25 14:56:26 +02:00
## Administration
2018-11-21 11:04:06 +01:00
### Emplacement des données
Par défaut les données sont stockées dans `/var/lib/influxdb/`. Pour modifier l'emplacement dans `/opt/influxdb/`, on peut procéder ainsi :
Éditer `/etc/influxdb/influxdb.conf` :
~~~
[meta]
# Where the metadata/raft database is stored
# dir = "/var/lib/influxdb/meta"
dir = "/opt/influxdb/meta"
[data]
# The directory where the TSM storage engine stores TSM files.
# dir = "/var/lib/influxdb/data"
dir = "/opt/influxdb/data"
# The directory where the TSM storage engine stores WAL files.
# wal-dir = "/var/lib/influxdb/wal"
wal-dir = "/opt/influxdb/wal"
~~~
Puis déplacer les anciennes données :
~~~
# systemctl stop influxdb.service
# cp -a /var/lib/influxdb/ /opt/
# systemctl start influxdb.service
~~~
2020-02-11 15:04:11 +01:00
Si on veut faire un lien symbolique dans `/home/influxdb/`, on peut procéder ainsi :
~~~
# systemctl stop influxdb.service
# mkdir /home/influxdb
# chown influxdb: /home/influxdb
# chmod 755 /home/influxdb/
# mv /var/lib/influxdb/* /home/influxdb/
# rmdir /var/lib/influxdb/
# ln -s /home/influxdb/ /var/lib/
# systemctl start influxdb.service
~~~
2018-06-27 12:42:52 +02:00
### Structure de la base
2018-06-25 14:56:26 +02:00
Il peut être intéressant de naviguer dans la base de données afin de comprendre comment sont stockées les données, et ainsi afficher des graphes avec plus de facilité :
~~~
# influx
2020-02-11 14:52:19 +01:00
Connected to http://localhost:8086 version 1.7.10
InfluxDB shell version: 1.7.10
2018-06-25 14:56:26 +02:00
> SHOW DATABASES
name: databases
name
----
collectd
> USE collectd
Using database collectd
> SHOW MEASUREMENTS
name: measurements
name
----
cpu_value
disk_value
load_longterm
load_midterm
load_shortterm
snmp_rx
snmp_tx
tcpconns_value
> SELECT * FROM snmp_rx,snmp_tx WHERE time > now()-1h LIMIT 5
2018-06-25 14:56:26 +02:00
name: snmp_rx
time host type type_instance value
---- ---- ---- ------------- -----
1527610980434511472 Switch if_packets machine A 4241766500
1527611039463879536 Switch if_octets machine B 9414616763688
1527611039463903506 Switch if_octets machine C 59780133577
1527611039463953500 Switch if_octets machine D 109232798624
1527611039556165882 Switch if_packets machine B 7925165702
name: snmp_tx
time host type type_instance value
---- ---- ---- ------------- -----
1527610980434511472 Switch if_packets machine A 11434830808
1527611039463879536 Switch if_octets machine B 174654547558
1527611039463903506 Switch if_octets machine C 135392659943
1527611039463953500 Switch if_octets machine D 9179809568001
1527611039556165882 Switch if_packets machine B 396998647
~~~
2018-06-27 12:42:52 +02:00
### Supprimer des mesures
2018-06-25 14:56:26 +02:00
On peut vouloir supprimer une mesure particulière, par exemple dans le cas où une machine n'est plus sur le switch :
~~~
> SHOW SERIES FROM snmp_rx,snmp_tx WHERE type_instance='machine A'
key
---
snmp_rx,host=Switch,type=if_octets,type_instance=machine\ A
snmp_rx,host=Switch,type=if_packets,type_instance=machine\ A
snmp_tx,host=Switch,type=if_octets,type_instance=machine\ A
snmp_tx,host=Switch,type=if_packets,type_instance=machine\ A
> DROP SERIES FROM snmp_rx,snmp_tx WHERE type_instance='machine A'
2018-06-27 12:42:52 +02:00
~~~
### Rétention
Par défaut, les données sont gardées sur une durée illimitée, et l'intervalle de vérification de la rétention est de 30 minutes.
Si on ne souhaite pas utiliser la rétention, on peut la désactiver :
~~~
[retention]
# Determines whether retention policy enforcement enabled.
enabled = false
~~~
2018-06-27 14:32:45 +02:00
Si au contraire, on veut avoir une rétention d'un an, il faut modifier la politique :
2018-06-27 12:42:52 +02:00
~~~
# influx
> use collectd
> SHOW RETENTION POLICIES
name duration shardGroupDuration replicaN default
---- -------- ------------------ -------- -------
autogen 0s 168h0m0s 1 true
2018-06-27 14:32:45 +02:00
> ALTER RETENTION POLICY "autogen" ON "collectd" DURATION 52w REPLICATION 1 DEFAULT
2018-06-27 12:42:52 +02:00
> SHOW RETENTION POLICIES
name duration shardGroupDuration replicaN default
---- -------- ------------------ -------- -------
2018-06-27 14:32:45 +02:00
autogen 8736h0m0s 168h0m0s 1 true
2018-06-27 12:42:52 +02:00
~~~
Et on peut augmenter l'intervalle de vérification de la rétention :
~~~
[retention]
# Determines whether retention policy enforcement enabled.
2021-06-15 16:28:53 +02:00
enabled = true
2018-06-27 12:42:52 +02:00
# The interval of time when retention policy enforcement checks run.
check-interval = "24h"
2019-12-28 23:22:14 +01:00
~~~
2021-12-15 11:01:01 +01:00
### Monitoring
Le [check NRPE](HowtoIcinga) suivant peut être mis en place :
~~~
command[check_influxdb]=/usr/lib/nagios/plugins/check_http -I 127.0.0.1 -u /health -p 8086 -r '"status":"pass"'
~~~
2022-02-03 11:18:07 +01:00
### Continuous Query
Les "continuous queries" (ou requêtes continues) sont des requêtes qui sont exécutées automatiquement et périodiquement sur les données en temps réel, pour ensuite en stocker le résultat.
Par exemple, pour créer des mesures "switch_bps_tx" et "switch_bps_rx" avec le champ "bitspersec" où est converti le nombre total d'octets transmis par une interface et récupéré toutes les minutes, en une mesure en bits par secondes, toutes les minutes également :
~~~
# influx
> CREATE CONTINUOUS QUERY "Interface-Traffic-Conversion_TX" ON collectd BEGIN SELECT non_negative_derivative(mean(value), 1s) * 8 AS bitspersec INTO collectd.autogen.switch_bps_tx FROM collectd.autogen.snmp_tx WHERE type = 'if_octets' GROUP BY host, type_instance, time(1m) END
> CREATE CONTINUOUS QUERY "Interface-Traffic-Conversion_RX" ON collectd BEGIN SELECT non_negative_derivative(mean(value), 1s) * 8 AS bitspersec INTO collectd.autogen.switch_bps_rx FROM collectd.autogen.snmp_rx WHERE type = 'if_octets' GROUP BY host, type_instance, time(1m) END
> SHOW CONTINUOUS QUERIES
name: collectd
name query
---- -----
Interface-Traffic-Conversion_TX CREATE CONTINUOUS QUERY "Interface-Traffic-Conversion_TX" ON collectd BEGIN SELECT non_negative_derivative(mean(value), 1s) * 8 AS bitspersec INTO collectd.autogen.switch_bps_tx FROM collectd.autogen.snmp_tx WHERE type = 'if_octets' GROUP BY host, type_instance, time(1m) END
Interface-Traffic-Conversion_RX CREATE CONTINUOUS QUERY "Interface-Traffic-Conversion_RX" ON collectd BEGIN SELECT non_negative_derivative(mean(value), 1s) * 8 AS bitspersec INTO collectd.autogen.switch_bps_rx FROM collectd.autogen.snmp_rx WHERE type = 'if_octets' GROUP BY host, type_instance, time(1m) END
~~~