wiki/HowtoElasticsearch.md

---
title: Howto Elasticsearch
...

_Page en cours de vérification._

* Documentation : <https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html>
* Forum : <https://discuss.elastic.co/c/elasticsearch>

## Installation

Vu le développement actif d'Elasticsearch, nous préconisons l'installation des paquets Debian distribués par Elasticsearch :

~~~
# echo "deb http://packages.elastic.co/elasticsearch/2.x/debian stable main" | tee -a /etc/apt/sources.list.d/elasticsearch-2.x.list
# wget -qO - https://packages.elastic.co/GPG-KEY-elasticsearch | apt-key add -
# apt install elasticsearch openjdk-7-jre
~~~

Pour que le démon soit géré automatiquement par systemd :

~~~
# systemctl enable elasticsearch
~~~

## Configuration

Il est conseillé de ne pas activer le logging stdout vers la console, mais de conserver seulement vers les logs. (`/var/log/elasticsearch`).
Dans `/etc/elasticsearch/logging.yml`

~~~{.diff}
-rootLogger: ${es.logger.level}, console, file
+rootLogger: ${es.logger.level}, file
~~~

Si on a un `/tmp` en _noexec_, il faut changer le chemin, au risque d'avoir l'erreur suivante.

~~~
[2016-06-15 14:53:05,714][WARN ][bootstrap                ] unable to load JNA native support library, native methods will be disabled.
java.lang.UnsatisfiedLinkError: /tmp/jna--1985354563/jna3461912487982682933.tmp: /tmp/jna--1985354563/jna3461912487982682933.tmp: failed
to map segment from shared object: Operation not permitted
~~~

Dans `/etc/default/elasticsearch` :

~~~
ES_JAVA_OPTS="-Djava.io.tmpdir=/var/lib/elasticsearch/tmp"
~~~

Assurez-vous de créer le répertoire :

~~~
# mkdir /var/lib/elasticsearch/tmp
# chown elasticsearch: /var/lib/elasticsearch/tmp
~~~

## Plugins utiles

### Kopf - web admin interface for elasticsearch

<https://github.com/lmenezes/elasticsearch-kopf>

~~~
# /usr/share/elasticsearch/bin/plugin install lmenezes/elasticsearch-kopf
~~~

## Mode cluster

_Paragraphe à revoir car l'auto-découverte et le multicast ont changé._

Exemples avec 3 instances nommés **elastic1**, **elastic2** et **elastic3**.

Spécifier un nom de cluster dans `elasticsearch.yml` sur chaque machine.

~~~
cluster.name: mycluster
~~~

On donnera un nom aux nœuds avec la directive suivante :

~~~
node.name: "elastic1"
~~~

En analysant les logs de **elastic2** on verra ceci :

~~~
/var/log/elasticsearch/mycluster.log:
[2013-10-03 15:52:59,863][INFO ][transport                ] [elastic2] bound_add
ress {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/192.168.4.205:9300]}
[2013-10-03 15:53:03,247][INFO ][cluster.service          ] [elastic2] detected_
master [elastic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]], added {[el
astic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]],}, reason: zen-disco-
receive(from master [[elastic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300
]]])
[2013-10-03 15:53:03,338][INFO ][discovery                ] [elastic2] mycluster
/aFsNsA7pRa2_injvAU5Hwg
[2013-10-03 15:53:03,362][INFO ][http                     ] [elastic2] bound_add
ress {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/192.168.4.205:9200]}
[2013-10-03 15:53:03,362][INFO ][node                     ] [elastic2] started
~~~

Indiquant que le master a été détecté.

Et sur **elastic1**, le master :

~~~
[2013-10-03 15:53:03,176][INFO ][cluster.service          ] [elastic1] added {[e
lastic2][aFsNsA7pRa2_injvAU5Hwg][inet[/192.168.4.205:9300]],}, reason: zen-disco
-receive(join from node[[elastic2][aFsNsA7pRa2_injvAU5Hwg][inet[/192.168.4.205:9
300]]])
[2013-10-03 15:54:37,112][INFO ][cluster.service          ] [elastic1] added {[e
lastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9300]],}, reason: zen-disco
-receive(join from node[[elastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9
300]]])
~~~

Indique que les deux slaves ont été ajoutés.

On peut consulter le status en faisant des requêtes de types RESTFul. :

~~~
curl 'http://localhost:9200/_nodes?pretty=true'
~~~

Si le master passe en DOWN, un autre est élu.

~~~
[2013-10-03 16:15:53,892][INFO ][discovery.zen            ] [elastic2] master_le
ft [[elastic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]]], reason [shut
_down]

[2013-10-03 16:15:53,920][INFO ][cluster.service          ] [elastic2] master {n
ew [elastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9300]], previous [elas
tic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]]}, removed {[elastic1][3
tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]],}, reason: zen-disco-receive(f
rom master [[elastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9300]]])
~~~

Pour éviter de faire des requêtes multicast (mode auto-découverte). On spécifiera la liste des nœuds dans la configuration des instances.

~~~
discovery.zen.ping.multicast.enabled: false
discovery.zen.ping.unicast.hosts: ["elastic2", "elastic3"]
~~~

## Check Nagios

On check sur la page `/_cat/health` si le status n'est pas en **red**.

~~~
/usr/lib/nagios/plugins/check_http -I 127.0.0.1 -u /_cat/health?h=st -p 9200 -r 'red' --invert-regex
~~~

## Backup

La sauvegarde se fait par snapshots, dans un ou plusiers dépôts.

On crée le dépôt sur le filesystem :

~~~
# mkdir /home/backup-elasticsearch
# chown elasticsearch: /home/backup-elasticsearch
~~~

*Note :* en cas de cluster multi-nœuds, il faut penser que le filesystem doit être partagé (via NFS par exemple) car chaque nœud ne gère que ses propres données.

Le dépôt doit être référencé dans la configuration `/etc/elasticsearch/elasticsearch.yml` :

~~~
path.repo: ["/home/backup-elasticsearch"]
~~~

Après restart d'Elasticsearch on lui fait créer le snapshot **evobackup** :

~~~
$ curl -XPUT 127.0.0.1:9200/_snapshot/evobackup -d '{"type": "fs", "settings": {"location": "/home/backup-elasticsearch/evobackup", "compress": true}}'
~~~

Enfin, dans un script qui tourne régulièrement, on provoque la fixation d'un snapshot :

~~~{.bash}
$ date=$(date +%H)
$ curl -s -X DELETE "127.0.0.1:9200/_snapshot/evobackup/h${date}" | grep -v acknowledged..true
$ curl -s -X PUT "127.0.0.1:9200/_snapshot/evobackup/h${date}?wait_for_completion=true" -o /tmp/es_snapshot_h${date}.log
~~~

Ici, on crée un snapshot portant le numéro de l'heure courante. Il est supprimé avant d'être recréé afin d'avoir des snapshots "roulants".

## Principe de fonctionnement

_Basé sur le livre <http://exploringelasticsearch.com/book>_

On utilisera l'outil cURL pour faire les requêtes.
En plaçant à la fin d'une URI `?pretty=true` on pourra obtenir un JSON formaté, plus lisible pour les humains.

### Avec une base de données d'exemple

Nous allons utiliser une BDD d'exemple pour faire des tests.

Télécharger, <https://github.com/andrewvc/ee-datasets/archive/master.zip>, décompresser l'archive et exécuter le programme Java qui va injecter la BDD "movie_db" dans votre cluster ES.

~~~{.bash}
$ java -jar elastic-loader.jar http://localhost:9200 datasets/movie_db.eloader
~~~

La BDD movie_db contient quelques noms de films, avec leurs informations associés (genre, date, acteurs, …).

Pour consulter tout son contenu :

~~~{.bash}
$ curl http://localhost:9200/movie_db/_search?pretty=true
~~~

### En créant une BDD

#### Opérations CRUD

Créer un index (équivalent d'une base de données) nommé *planet* :

~~~{.bash}
$ curl -X PUT localhost:9200/planet
~~~

Créer un type de donnée nommé « hacker » :

~~~
$ curl -X PUT localhost:9200/planet/hacker/_mapping -d '
{
    "hacker": {
        "properties": {
            "handle": {
                "type": "string"
            },
            "age": {
                "type": "long"
            }
        }
    }
}
'
~~~

Créer un document de type hacker avec l'ID 1 :

~~~{.bash}
$ curl -X PUT localhost:9200/planet/hacker/1 -d '{"handle": "jean-michel", "age": 18}'
~~~

Voir son contenu :

~~~{.bash}
$ curl localhost:9200/planet/hacker/1?pretty=true
~~~

Mise à jour du champ âge :

~~~{.bash}
$ curl -X POST localhost:9200/planet/hacker/1/_update -d '{"doc": {"age": 19}}'
~~~

Suppression du document :

~~~{.bash}
$ curl -X DELETE localhost:9200/planet/hacker/1
~~~

#### Recherche basique

Recréons un index de test :

~~~
$ curl -X DELETE localhost:9200/planet
$ curl -X PUT localhost:9200/planet -d '
{
    "mappings": {
        "hacker": {
            "properties": {
                "handle": {
                    "type": "string"
                },
                "hobbies": {
                    "type": "string",
                    "analyzer": "snowball"
                }
            }
        }
    }
}
'
~~~

Ajoutons quelques documents :

~~~
$ curl -X PUT localhost:9200/planet/hacker/1 -d '
{
    "handle": "mark",
    "hobbies": ["rollerblading", "hacking", "coding"]
}
'

$ curl -X PUT localhost:9200/planet/hacker/2 -d '
{
    "handle": "gondry",
    "hobbies": ["writing", "skateboarding"]
}
'

$ curl -X PUT localhost:9200/planet/hacker/3 -d '
{
    "handle": "jean-michel",
    "hobbies": ["coding", "rollerblades"]
}
'
~~~

Recherchons ceux qui ont pour hobby *rollerblading* :

~~~
$ curl -X POST localhost:9200/planet/hacker/_search?pretty=true -d '
{
    "query": {
        "match": {
            "hobbies": "rollerblading"
        }
    }
}
'
~~~

On obtiens 2 résultats, _jean-michel_ et _mark_. Pourtant le hobby de _jean-michel_ n'est pas _rollerblading_ mais _rollerblades_, alors comment Elastic Search l'a trouvé ?
C'est parce qu’il comprend que _rollerblading_ et _rollerblades_ sont très similaires ! Cela grâce à l'analyseur de type « snowball » que nous avons indiqué lors de la création du type _hobbies_. Cela indique à ES qu'il s'agit non pas d'une chaîne de caractère banale mais du texte Anglais (Gestion des autres langues ?).

## snapshots

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/modules-snapshots.html

Création d'un répertoire pour accueillir les snapshots :

~~~
# mkdir /home/backup-elasticsearch
# chown elasticsearch:elasticsearch /home/backup-elasticsearch
# chmod 750 /home/backup-elasticsearch
# vim /etc/elasticsearch/elasticsearch.yml

path.repo: ["/home/backup-elasticsearch"]

$ curl -XPUT 'http://localhost:9200/_snapshot/backup' -d '{
"type": "fs",
    "settings": {
        "location": "/home/backup-elasticsearch",
       "compress": true
    }
}'
{"acknowledged":true}
~~~

ATTENTION, dans le cadre d'un cluster, chaque noeud écrira ses données
dans son répertoire local… et ne les effacera pas en cas de DELETE.
Il faut donc centraliser ce répertoire via un montage NFS !

Vérifier les infos du répertoire pour les snapshots :

~~~
$ curl -XGET 'http://localhost:9200/_snapshot/?pretty'

---
{
  "backup" : {
    "type" : "fs",
    "settings" : {
      "compress" : "true",
      "location" : "/home/backup-elasticsearch"
    }
  }
}
~~~

Supprimer les infos sur le répertoire des snapshots :

~~~
$ curl -s -XDELETE "localhost:9200/_snapshot/backup?pretty"

---
{"acknowledged":true}
~~~

Créer un snapshot :

~~~
$ curl -s -XPUT "localhost:9200/_snapshot/backup/snapshot_test?wait_for_completion=true"
$ ls -l /home/backup-elasticsearch
-rw-r--r--  1 elasticsearch elasticsearch   34 Apr 11 01:35 index
drwxr-xr-x 22 elasticsearch elasticsearch 4096 Apr 11 01:35 indices
-rw-r--r--  1 elasticsearch elasticsearch 3006 Apr 11 01:35 metadata-snapshot_test
-rw-r--r--  1 elasticsearch elasticsearch  419 Apr 11 01:35 snapshot-snapshot_test
~~~

Supprimer un snapshot :

~~~
$ curl -s -XDELETE "localhost:9200/_snapshot/backup/snapshot_test"
~~~

Si l'on tente de créer un snapshot déjà existant, on obtiendra :

~~~
{"error":"InvalidsnapshotNameException[[backup:snapshot_test] Invalid snapshot name [snapshot_test], snapshot with such name already exists]","status":400}
~~~

Lister les snapshots :

~~~
$ curl -XGET "localhost:9200/_snapshot/backup/_all?pretty=true"

---
  "snapshots" : [ {
    "snapshot" : "snapshot_201403190415",
    "indices" : [...],
    "state" : "SUCCESS",
    "start_time" : "2014-03-19T03:15:03.380Z",
    "start_time_in_millis" : 1395198903380,
    "end_time" : "2014-03-19T03:16:33.381Z",
    "end_time_in_millis" : 1395198993381,
    "duration_in_millis" : 90001,
...
   "snapshot" : "snapshot_201403201222",
    "indices" : [...],
    "state" : "SUCCESS",
    "start_time" : "2014-03-20T11:22:07.441Z",
    "start_time_in_millis" : 1395314527441,
    "end_time" : "2014-03-20T11:22:56.176Z",
    "end_time_in_millis" : 1395314576176,
    "duration_in_millis" : 48735,
    "failures" : [ ],
    "shards" : {
      "total" : 86,
      "failed" : 0,
      "successful" : 86
~~~

Pour faire des backups on pourra utiliser un script comme celui-ci :

~~~
# Clean old snapshots (keep 10 snaps).
cd /home/backup-elasticsearch
for i in $(ls -1d snapshot-* | head -n -10 | sed s'/snapshot-snapshot_//g'); do curl -s -XDELETE "localhost:9200/_snapshot/backup/snaps
hot_${i}"; done
# Take a snapshot on master node.
date=$(date +%Y-%m-%d)
curl -s -XDELETE "localhost:9200/_snapshot/backup/snapshot_${date}" | grep -v acknowledged..true
curl -s -XPUT "localhost:9200/_snapshot/backup/snapshot_${date}?wait_for_completion=true" -o /tmp/es_snapshot_${date}.log
~~~
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								---
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								title: Howto Elasticsearch
 								...
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								_Page en cours de vérification._
-												Changements des liens en vrais liens

											
										
										
											2016-10-05 09:38:39 +02:00
+								* Documentation : <https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html>
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								* Forum : <https://discuss.elastic.co/c/elasticsearch>
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								## Installation
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Vu le développement actif d'Elasticsearch, nous préconisons l'installation des paquets Debian distribués par Elasticsearch :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
 								# echo "deb http://packages.elastic.co/elasticsearch/2.x/debian stable main" | tee -a /etc/apt/sources.list.d/elasticsearch-2.x.list
 								# wget -qO - https://packages.elastic.co/GPG-KEY-elasticsearch | apt-key add -
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								# apt install elasticsearch openjdk-7-jre
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								Pour que le démon soit géré automatiquement par systemd :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
 								# systemctl enable elasticsearch
 								~~~
 								## Configuration
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								Il est conseillé de ne pas activer le logging stdout vers la console, mais de conserver seulement vers les logs. (`/var/log/elasticsearch`).
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								Dans `/etc/elasticsearch/logging.yml`
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								~~~{.diff}
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								-rootLogger: ${es.logger.level}, console, file
 								+rootLogger: ${es.logger.level}, file
 								~~~
 								Si on a un `/tmp` en _noexec_, il faut changer le chemin, au risque d'avoir l'erreur suivante.
 								~~~
 								[2016-06-15 14:53:05,714][WARN ][bootstrap                ] unable to load JNA native support library, native methods will be disabled.
 								java.lang.UnsatisfiedLinkError: /tmp/jna--1985354563/jna3461912487982682933.tmp: /tmp/jna--1985354563/jna3461912487982682933.tmp: failed
 								to map segment from shared object: Operation not permitted
 								~~~
 								Dans `/etc/default/elasticsearch` :
 								~~~
 								ES_JAVA_OPTS="-Djava.io.tmpdir=/var/lib/elasticsearch/tmp"
 								~~~
 								Assurez-vous de créer le répertoire :
 								~~~
 								# mkdir /var/lib/elasticsearch/tmp
 								# chown elasticsearch: /var/lib/elasticsearch/tmp
 								~~~
 								## Plugins utiles
 								### Kopf - web admin interface for elasticsearch
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								<https://github.com/lmenezes/elasticsearch-kopf>
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								# /usr/share/elasticsearch/bin/plugin install lmenezes/elasticsearch-kopf
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
 								## Mode cluster
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								_Paragraphe à revoir car l'auto-découverte et le multicast ont changé._
 								Exemples avec 3 instances nommés **elastic1**, **elastic2** et **elastic3**.
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								Spécifier un nom de cluster dans `elasticsearch.yml` sur chaque machine.
 								~~~
 								cluster.name: mycluster
 								~~~
 								On donnera un nom aux nœuds avec la directive suivante :
 								~~~
 								node.name: "elastic1"
 								~~~
 								En analysant les logs de **elastic2** on verra ceci :
 								~~~
 								/var/log/elasticsearch/mycluster.log:
 								[2013-10-03 15:52:59,863][INFO ][transport                ] [elastic2] bound_add
 								ress {inet[/0:0:0:0:0:0:0:0:9300]}, publish_address {inet[/192.168.4.205:9300]}
 								[2013-10-03 15:53:03,247][INFO ][cluster.service          ] [elastic2] detected_
 								master [elastic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]], added {[el
 								astic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]],}, reason: zen-disco-
 								receive(from master [[elastic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300
 								]]])
 								[2013-10-03 15:53:03,338][INFO ][discovery                ] [elastic2] mycluster
 								/aFsNsA7pRa2_injvAU5Hwg
 								[2013-10-03 15:53:03,362][INFO ][http                     ] [elastic2] bound_add
 								ress {inet[/0:0:0:0:0:0:0:0:9200]}, publish_address {inet[/192.168.4.205:9200]}
 								[2013-10-03 15:53:03,362][INFO ][node                     ] [elastic2] started
 								~~~
 								Indiquant que le master a été détecté.
 								Et sur **elastic1**, le master :
 								~~~
 								[2013-10-03 15:53:03,176][INFO ][cluster.service          ] [elastic1] added {[e
 								lastic2][aFsNsA7pRa2_injvAU5Hwg][inet[/192.168.4.205:9300]],}, reason: zen-disco
 								-receive(join from node[[elastic2][aFsNsA7pRa2_injvAU5Hwg][inet[/192.168.4.205:9
 ]]])
 								[2013-10-03 15:54:37,112][INFO ][cluster.service          ] [elastic1] added {[e
 								lastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9300]],}, reason: zen-disco
 								-receive(join from node[[elastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9
 ]]])
 								~~~
 								Indique que les deux slaves ont été ajoutés.
 								On peut consulter le status en faisant des requêtes de types RESTFul. :
 								~~~
 								curl 'http://localhost:9200/_nodes?pretty=true'
 								~~~
 								Si le master passe en DOWN, un autre est élu.
 								~~~
 								[2013-10-03 16:15:53,892][INFO ][discovery.zen            ] [elastic2] master_le
 								ft [[elastic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]]], reason [shut
 								_down]
 								[2013-10-03 16:15:53,920][INFO ][cluster.service          ] [elastic2] master {n
 								ew [elastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9300]], previous [elas
 								tic1][3tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]]}, removed {[elastic1][3
 								tn7uHSHR8-donXO6JXFRA][inet[/192.168.4.201:9300]],}, reason: zen-disco-receive(f
 								rom master [[elastic3][CLCB_hU5TeGXLziFcLjY8w][inet[/192.168.4.204:9300]]])
 								~~~
 								Pour éviter de faire des requêtes multicast (mode auto-découverte). On spécifiera la liste des nœuds dans la configuration des instances.
 								~~~
 								discovery.zen.ping.multicast.enabled: false
 								discovery.zen.ping.unicast.hosts: ["elastic2", "elastic3"]
 								~~~
 								## Check Nagios
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								On check sur la page `/_cat/health` si le status n'est pas en **red**.
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								/usr/lib/nagios/plugins/check_http -I 127.0.0.1 -u /_cat/health?h=st -p 9200 -r 'red' --invert-regex
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
 								## Backup
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								La sauvegarde se fait par snapshots, dans un ou plusiers dépôts.
 								On crée le dépôt sur le filesystem :
 								~~~
 								# mkdir /home/backup-elasticsearch
 								# chown elasticsearch: /home/backup-elasticsearch
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								*Note :* en cas de cluster multi-nœuds, il faut penser que le filesystem doit être partagé (via NFS par exemple) car chaque nœud ne gère que ses propres données.
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
 								Le dépôt doit être référencé dans la configuration `/etc/elasticsearch/elasticsearch.yml` :
 								~~~
 								path.repo: ["/home/backup-elasticsearch"]
 								~~~
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								Après restart d'Elasticsearch on lui fait créer le snapshot **evobackup** :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -XPUT 127.0.0.1:9200/_snapshot/evobackup -d '{"type": "fs", "settings": {"location": "/home/backup-elasticsearch/evobackup", "compress": true}}'
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								Enfin, dans un script qui tourne régulièrement, on provoque la fixation d'un snapshot :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ date=$(date +%H)
 								$ curl -s -X DELETE "127.0.0.1:9200/_snapshot/evobackup/h${date}" | grep -v acknowledged..true
 								$ curl -s -X PUT "127.0.0.1:9200/_snapshot/evobackup/h${date}?wait_for_completion=true" -o /tmp/es_snapshot_h${date}.log
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												Revert "retrait de mentions à Git et apt update"

This reverts commit abc497e1d31ecfc812ef620c265dccbc442daf0a.

											
										
										
											2016-09-28 11:45:01 +02:00
+								Ici, on crée un snapshot portant le numéro de l'heure courante. Il est supprimé avant d'être recréé afin d'avoir des snapshots "roulants".
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								## Principe de fonctionnement
 								_Basé sur le livre <http://exploringelasticsearch.com/book>_
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								On utilisera l'outil cURL pour faire les requêtes.
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								En plaçant à la fin d'une URI `?pretty=true` on pourra obtenir un JSON formaté, plus lisible pour les humains.
 								### Avec une base de données d'exemple
 								Nous allons utiliser une BDD d'exemple pour faire des tests.
 								Télécharger, <https://github.com/andrewvc/ee-datasets/archive/master.zip>, décompresser l'archive et exécuter le programme Java qui va injecter la BDD "movie_db" dans votre cluster ES.
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ java -jar elastic-loader.jar http://localhost:9200 datasets/movie_db.eloader
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
 								La BDD movie_db contient quelques noms de films, avec leurs informations associés (genre, date, acteurs, …).
 								Pour consulter tout son contenu :
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ curl http://localhost:9200/movie_db/_search?pretty=true
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
 								### En créant une BDD
 								#### Opérations CRUD
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Créer un index (équivalent d'une base de données) nommé *planet* :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ curl -X PUT localhost:9200/planet
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Créer un type de donnée nommé « hacker » :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -X PUT localhost:9200/planet/hacker/_mapping -d '
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								{
 								    "hacker": {
 								        "properties": {
 								            "handle": {
 								                "type": "string"
 								            },
 								            "age": {
 								                "type": "long"
 								            }
 								        }
 								    }
 								}
 								'
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Créer un document de type hacker avec l'ID 1 :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ curl -X PUT localhost:9200/planet/hacker/1 -d '{"handle": "jean-michel", "age": 18}'
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Voir son contenu :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ curl localhost:9200/planet/hacker/1?pretty=true
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Mise à jour du champ âge :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ curl -X POST localhost:9200/planet/hacker/1/_update -d '{"doc": {"age": 19}}'
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Suppression du document :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								~~~{.bash}
 								$ curl -X DELETE localhost:9200/planet/hacker/1
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								~~~
 								#### Recherche basique
 								Recréons un index de test :
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -X DELETE localhost:9200/planet
 								$ curl -X PUT localhost:9200/planet -d '
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								{
 								    "mappings": {
 								        "hacker": {
 								            "properties": {
 								                "handle": {
 								                    "type": "string"
 								                },
 								                "hobbies": {
 								                    "type": "string",
 								                    "analyzer": "snowball"
 								                }
 								            }
 								        }
 								    }
 								}
 								'
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Ajoutons quelques documents :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -X PUT localhost:9200/planet/hacker/1 -d '
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								{
 								    "handle": "mark",
 								    "hobbies": ["rollerblading", "hacking", "coding"]
 								}
 								'
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -X PUT localhost:9200/planet/hacker/2 -d '
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								{
 								    "handle": "gondry",
 								    "hobbies": ["writing", "skateboarding"]
 								}
 								'
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -X PUT localhost:9200/planet/hacker/3 -d '
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								{
 								    "handle": "jean-michel",
 								    "hobbies": ["coding", "rollerblades"]
 								}
 								'
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								Recherchons ceux qui ont pour hobby *rollerblading* :
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
 								~~~
-												relecture rapide

											
										
										
											2016-10-10 21:34:30 +02:00
+								$ curl -X POST localhost:9200/planet/hacker/_search?pretty=true -d '
-												[WIP] portage de la page Elasticsearch

											
										
										
											2016-09-26 12:01:45 +02:00
+								{
 								    "query": {
 								        "match": {
 								            "hobbies": "rollerblading"
 								        }
 								    }
 								}
 								'
 								~~~
 								On obtiens 2 résultats, _jean-michel_ et _mark_. Pourtant le hobby de _jean-michel_ n'est pas _rollerblading_ mais _rollerblades_, alors comment Elastic Search l'a trouvé ?
 								C'est parce qu’il comprend que _rollerblading_ et _rollerblades_ sont très similaires ! Cela grâce à l'analyseur de type « snowball » que nous avons indiqué lors de la création du type _hobbies_. Cela indique à ES qu'il s'agit non pas d'une chaîne de caractère banale mais du texte Anglais (Gestion des autres langues ?).
 								## snapshots
 								http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/modules-snapshots.html
 								Création d'un répertoire pour accueillir les snapshots :
 								~~~
 								# mkdir /home/backup-elasticsearch
 								# chown elasticsearch:elasticsearch /home/backup-elasticsearch
 								# chmod 750 /home/backup-elasticsearch
 								# vim /etc/elasticsearch/elasticsearch.yml
 								path.repo: ["/home/backup-elasticsearch"]
 								$ curl -XPUT 'http://localhost:9200/_snapshot/backup' -d '{
 								"type": "fs",
 								    "settings": {
 								        "location": "/home/backup-elasticsearch",
 								       "compress": true
 								    }
 								}'
 								{"acknowledged":true}
 								~~~
 								ATTENTION, dans le cadre d'un cluster, chaque noeud écrira ses données
 								dans son répertoire local… et ne les effacera pas en cas de DELETE.
 								Il faut donc centraliser ce répertoire via un montage NFS !
 								Vérifier les infos du répertoire pour les snapshots :
 								~~~
 								$ curl -XGET 'http://localhost:9200/_snapshot/?pretty'
 								---
 								{
 								  "backup" : {
 								    "type" : "fs",
 								    "settings" : {
 								      "compress" : "true",
 								      "location" : "/home/backup-elasticsearch"
 								    }
 								  }
 								}
 								~~~
 								Supprimer les infos sur le répertoire des snapshots :
 								~~~
 								$ curl -s -XDELETE "localhost:9200/_snapshot/backup?pretty"
 								---
 								{"acknowledged":true}
 								~~~
 								Créer un snapshot :
 								~~~
 								$ curl -s -XPUT "localhost:9200/_snapshot/backup/snapshot_test?wait_for_completion=true"
 								$ ls -l /home/backup-elasticsearch
 								-rw-r--r--  1 elasticsearch elasticsearch   34 Apr 11 01:35 index
 								drwxr-xr-x 22 elasticsearch elasticsearch 4096 Apr 11 01:35 indices
 								-rw-r--r--  1 elasticsearch elasticsearch 3006 Apr 11 01:35 metadata-snapshot_test
 								-rw-r--r--  1 elasticsearch elasticsearch  419 Apr 11 01:35 snapshot-snapshot_test
 								~~~
 								Supprimer un snapshot :
 								~~~
 								$ curl -s -XDELETE "localhost:9200/_snapshot/backup/snapshot_test"
 								~~~
 								Si l'on tente de créer un snapshot déjà existant, on obtiendra :
 								~~~
 								{"error":"InvalidsnapshotNameException[[backup:snapshot_test] Invalid snapshot name [snapshot_test], snapshot with such name already exists]","status":400}
 								~~~
 								Lister les snapshots :
 								~~~
 								$ curl -XGET "localhost:9200/_snapshot/backup/_all?pretty=true"
 								---
 								  "snapshots" : [ {
 								    "snapshot" : "snapshot_201403190415",
 								    "indices" : [...],
 								    "state" : "SUCCESS",
 								    "start_time" : "2014-03-19T03:15:03.380Z",
 								    "start_time_in_millis" : 1395198903380,
 								    "end_time" : "2014-03-19T03:16:33.381Z",
 								    "end_time_in_millis" : 1395198993381,
 								    "duration_in_millis" : 90001,
 								...
 								   "snapshot" : "snapshot_201403201222",
 								    "indices" : [...],
 								    "state" : "SUCCESS",
 								    "start_time" : "2014-03-20T11:22:07.441Z",
 								    "start_time_in_millis" : 1395314527441,
 								    "end_time" : "2014-03-20T11:22:56.176Z",
 								    "end_time_in_millis" : 1395314576176,
 								    "duration_in_millis" : 48735,
 								    "failures" : [ ],
 								    "shards" : {
 								      "total" : 86,
 								      "failed" : 0,
 								      "successful" : 86
 								~~~
 								Pour faire des backups on pourra utiliser un script comme celui-ci :
 								~~~
 								# Clean old snapshots (keep 10 snaps).
 								cd /home/backup-elasticsearch
 								for i in $(ls -1d snapshot-* | head -n -10 | sed s'/snapshot-snapshot_//g'); do curl -s -XDELETE "localhost:9200/_snapshot/backup/snaps
 								hot_${i}"; done
 								# Take a snapshot on master node.
 								date=$(date +%Y-%m-%d)
 								curl -s -XDELETE "localhost:9200/_snapshot/backup/snapshot_${date}" | grep -v acknowledged..true
 								curl -s -XPUT "localhost:9200/_snapshot/backup/snapshot_${date}?wait_for_completion=true" -o /tmp/es_snapshot_${date}.log
 								~~~