Passage Howto PostgreSQL en Debian 10 + ajout réplication logique

2019-09-17 23:28:05 +02:00 · 2019-09-17 23:28:05 +02:00 · f86c551a23
parent 877ff6fcca
commit f86c551a23
3 changed files with 139 additions and 16 deletions
--- a/HowtoPostgreSQL.md
+++ b/HowtoPostgreSQL.md
@ -3,7 +3,7 @@ title: Howto PostgreSQL
 categories: databases
 ...

-* Documentation : <https://www.postgresql.org/docs/9.6/static/index.html>
+* Documentation : <https://www.postgresql.org/docs/11/>
 * Rôle Ansible : <https://forge.evolix.org/projects/ansible-roles/repository/show/postgresql>
 * The Internals of PostgreSQL : <http://www.interdb.jp/pg/>

@ -16,8 +16,8 @@ categories: databases

 # apt install postgresql

-# /usr/lib/postgresql/9.6/bin/postgres -V
-postgres (PostgreSQL) 9.6.6
+# /usr/lib/postgresql/11/bin/postgres -V
+postgres (PostgreSQL) 11.5 (Debian 11.5-1+deb10u1)

 # systemctl status postgresql
 ● postgresql.service - PostgreSQL RDBMS
@ -30,7 +30,7 @@ postgres (PostgreSQL) 9.6.6

 # pg_lsclusters
 Ver Cluster Port Status Owner    Data directory               Log file
-9.6 main    5432 online postgres /var/lib/postgresql/9.6/main /var/log/postgresql/postgresql-9.6-main.log
+11 main    5432 online postgres /var/lib/postgresql/11/main /var/log/postgresql/postgresql-11-main.log
 ~~~

 > *Note* : il faut s'assurer d'avoir configuré sa locale système `dpkg-reconfigure locales` avant installation car l'initialisation des bases de données est faite avec la locale du système.
@ -43,31 +43,31 @@ Le dépôt **apt.postgresql.org** permet d'installer des versions différentes d
 Ajouter le dépôt un fichier `/etc/apt/sources.list.d/postgresql.list` :

 ~~~
-deb http://apt.postgresql.org/pub/repos/apt/ stretch-pgdg main
+deb http://apt.postgresql.org/pub/repos/apt/ buster-pgdg main
 ~~~

 Puis récupérer la clé GPG :

 ~~~
-# wget --quiet -O - https://apt.postgresql.org/pub/repos/apt/ACCC4CF8.asc | apt-key add -
+# wget https://apt.postgresql.org/pub/repos/apt/ACCC4CF8.asc -O /etc/apt/trusted.gpg.d/postgresql-org.asc
 ~~~

-On peut ainsi installer proprement PostgresSQL 10 - par exemple - en définissant les priorités via `/etc/apt/preferences.d/postgresql` :
+On peut ainsi installer proprement PostgresSQL 11 - par exemple - en définissant les priorités via `/etc/apt/preferences.d/postgresql` :

 ~~~
 Package: postgresql postgresql-client-common postgresql-common libpq5 libdbd-pg-perl ptop
-Pin: release a=stretch-pgdg
+Pin: release a=buster-pgdg
 Pin-Priority: 999
 ~~~

 Puis :

 ~~~
-# apt install postgresql-10
+# apt install postgresql-11

 # pg_lsclusters
 Ver Cluster Port Status Owner    Data directory               Log file
-10  main    5432 online postgres /var/lib/postgresql/10/main  /var/log/postgresql/postgresql-10-main.log
+11  main    5432 online postgres /var/lib/postgresql/11/main  /var/log/postgresql/postgresql-11-main.log
 ~~~

 ## Administration basique
@ -79,6 +79,7 @@ Ver Cluster Port Status Owner    Data directory               Log file
 Ver Cluster Port Status Owner    Data directory               Log file
 9.6 main    5432 online postgres /var/lib/postgresql/9.6/main /var/log/postgresql/postgresql-9.6-main.log
 10  main    5433 online postgres /var/lib/postgresql/10/main  /var/log/postgresql/postgresql-10-main.log
+11  main    5433 online postgres /var/lib/postgresql/11/main  /var/log/postgresql/postgresql-11-main.log
 ~~~

 ### Lister les requêtes actives
@ -1167,20 +1168,26 @@ huge_pages = on

 Plusieurs solutions de réplication plus ou moins avancées existent avec PostgreSQL :

+
+* _Streaming Replication_ ou _Physique_ : les données sont transférées immédiatement par un processus dédié (_walsender_) dans une connexion réseau établie avec le réplica. Contrairement aux autres solutions, cela nécessite une légère charge supplémentaire par réplica sur le maître pour faire tourner le processus _walsender_. En général ce système est couplé à l'envoi des *WAL* car si le réplica est trop en retard par rapport au master, il va lire les *WAL* jusqu'à avoir rattrapé son retard puis basculera tout seul sur la *streaming replication*
+* _Logique_ : les données sont répliquées au niveau des objets par un système de publication/abonnement
 * _PITR_, _Point In Time Recovery_ : copie des logs de transaction (_WAL_) sur un serveur distant pour archivage. Ils peuvent ensuite être rejoués jusqu'à un point précis en cas de perte de données par exemple.
 * _Warm Standby_ : les _WAL_ sont copiés sous forme d'archive sur un second serveur sur lequel tourne un PostgreSQL en mode _recovery_ constant. Chaque segment reçu est rejoué par PostgreSQL. Il est alors prêt à prendre le relais en cas de panne sur le serveur maître.
 * _Hot Standby_ : le principe est le même que pour le _Warm Standby_, mais le réplica peut être interrogé en lecture. Il y a néanmois une légère différence perpétuelle entre le master et le réplica car le *WAL* est transféré seulement lorsque l'archive a fini d'être écrite.
-* _Streaming Replication_ : les données sont transférées immédiatement par un processus dédié (_walsender_) dans une connexion réseau établie avec le réplica. Contrairement aux autres solutions, cela nécessite une légère charge supplémentaire par réplica sur le maître pour faire tourner le processus _walsender_. En général ce système est couplé à l'envoi des *WAL* car si le réplica est trop en retard par rapport au master, il va lire les *WAL* jusqu'à avoir rattrapé son retard puis basculera tout seul sur la *streaming replication*
 * _Slony_ : système de réplication basé sur l'ajout de triggers sur chaque table à répliquer. Cela nécessite une gestion assez complexe mais c'était la seule façon d'avoir une réplication immédiate avant l'arrivée de la _Streaming Replication_. Cela reste la seule solution pour avoir une réplication au niveau des tables et non de la base entière (par exemple si vous voulez répliquer une table d'un serveur A vers un serveur B, et répliquer une autre table du serveur B vers A).

-Pour plus de détails sur ces solutions, voir ce post sur [dba.stackexange.com](https://dba.stackexchange.com/questions/73812/postgresql-streaming-versus-file-based-replication-in-terms-of-server-behavior). Pour d'autres types de solutions pour avoir de la haute disoponibilite, PostgreSQL a [une page sur cela dans leur documentation](https://www.postgresql.org/docs/current/static/different-replication-solutions.html).
+Pour plus de détails sur ces solutions, voir ce post sur [dba.stackexange.com](https://dba.stackexchange.com/questions/73812/postgresql-streaming-versus-file-based-replication-in-terms-of-server-behavior). Pour d'autres types de solutions pour avoir de la haute disponibilité, PostgreSQL a [une page sur cela dans leur documentation](https://www.postgresql.org/docs/current/static/different-replication-solutions.html).

 > *Note* : l'expédition des logs entre des serveurs pgsql nécessite qu'ils soient à la même version majeure.


-### Streaming Replication
+### Streaming Réplication

-Voir [/HowtoPostgreSQL/Replication]().
+Voir [/HowtoPostgreSQL/ReplicationPhysique]().
+
+### Réplication Logique
+
+Voir [/HowtoPostgreSQL/ReplicationLogique]().

 ### Slony

--- a/HowtoPostgreSQL/ReplicationLogique.md
+++ b/HowtoPostgreSQL/ReplicationLogique.md
@ -0,0 +1,114 @@
+# _Réplication Logique_ avec PostgreSQL
+
+<https://www.postgresql.org/docs/11/logical-replication.html>
+
+## Mise en place
+
+Sur le serveur primaire et réplica, on s'assure d'avoir deux bases :
+
+~~~
+postgres $ createuser -p 5432 -P foo
+Enter password for new role:
+
+postgres $ createdb -p 5432 -O foo foo
+~~~
+
+Sur le serveur primaire, on modifie la directive `wal_level` :
+
+~~~
+wal_level = logical
+~~~
+
+Puis l'on crée un utilisateur `replication` et une publication liée à cette base :
+
+~~~
+postgres $ createuser -p 5432 -P --replication replication
+
+postgres $ psql -p 5432 foo
+
+foo=# GRANT SELECT on ALL TABLES IN SCHEMA public TO replication;
+GRANT
+
+foo=# CREATE PUBLICATION alltables FOR ALL TABLES;
+CREATE PUBLICATION
+~~~
+
+Sur le serveur réplica, on crée une subscription liée à cette base :
+
+~~~
+postgres $ psql -p 5432 foo
+
+foo=# CREATE SUBSCRIPTION mysub CONNECTION 'dbname=foo host=192.0.2.1 port=5436 user=replication password=PASSWORD' PUBLICATION alltables;
+NOTICE:  created replication slot "mysub" on publisher
+CREATE SUBSCRIPTION
+~~~
+
+Attention, contrairement à la réplication physique, rien n'empêche d'écrire sur le serveur réplica.
+
+Ensuite, il faut créer les tables de façon identique sur les deux bases :
+
+~~~
+postgres $ psql -U foo -h 127.0.0.1 -p 5432 foo
+foo=> CREATE TABLE t (a INT);
+~~~
+
+Enfin, l'insertion de données sur le serveur primaire, devrait provoquer le transfert de ces données sur le serveur réplica :
+
+~~~
+LOG:  logical replication table synchronization worker for subscription "mysub", table "t" has started
+~~~
+
+Si besoin, on peut « rafraichir » la subscription sur le serveur replica via la commande :
+
+~~~
+postgres $ psql -p 5432 foo
+
+foo=# ALTER SUBSCRIPTION mysub REFRESH PUBLICATION;
+~~~
+
+
+## Administration
+
+### Ajout / modification d'une table
+
+Si l'on veut ajouter ou modifier une table, il faut :
+
+- créer / modifier la table sur les 2 serveurs maître et réplica
+- relancer la commande suivante sur le serveur maître :
+
+~~~
+postgres $ psql -p 5432 foo
+
+foo=# GRANT SELECT on ALL TABLES IN SCHEMA public TO replication;
+GRANT
+~~~
+
+- relancer la commande suivante sur le serveur réplica :
+
+~~~
+postgres $ psql -p 5432 foo
+
+foo=# ALTER SUBSCRIPTION mysub REFRESH PUBLICATION;
+~~~
+
+On peut ensuite insérer des données sur la nouvelle table qui sera répliquée.
+
+
+## Monitoring
+
+Sur le serveur replica, on peut surveiller le bon fonctionnement de la réplication ainsi :
+
+~~~
+postgres=# select * from pg_subscription ;
+ subdbid | subname | subowner | subenabled |                                subconninfo                                 | subslotname | subsynccommit | subpublications 
+---------+---------+----------+------------+----------------------------------------------------------------------------+-------------+---------------+-----------------
+   16385 | mysub   |       10 | t          | dbname=foo host=192.0.2.1 port=5432 user=replication password=PASSWORD     | mysub       | off           | {alltables}
+(1 row)
+
+postgres=# select * from pg_stat_subscription ;
+ subid | subname |  pid  | relid | received_lsn |      last_msg_send_time       |     last_msg_receipt_time     | latest_end_lsn |        latest_end_time        
+-------+---------+-------+-------+--------------+-------------------------------+-------------------------------+----------------+-------------------------------
+ 16388 | mysub   | 12767 |       | 0/16A58D8    | 2019-09-17 21:09:16.512057+00 | 2019-09-17 21:09:16.512241+00 | 0/16A58D8      | 2019-09-17 21:09:16.512057+00
+~~~
+
+
--- a/HowtoPostgreSQL/ReplicationPhysique.md
+++ b/HowtoPostgreSQL/ReplicationPhysique.md
@ -1,6 +1,8 @@
 # _Streaming Replication_ avec PostgreSQL

-La réplication en flux (_Streaming Replication_) est disponible à partir de la version 9.0 de PostgreSQL. Celle-ci est différente de la réplication logique apparue dans la version 10.
+<https://www.postgresql.org/docs/11/warm-standby.html#STREAMING-REPLICATION>
+
+La réplication en flux (_Streaming Replication_) est disponible à partir de la version 9.0 de PostgreSQL. Celle-ci est aussi appelée _Réplication Physique_ en opposition à la _Réplication Logique_ apparue dans la version 10.

 ## Caractéristiques

@ -16,7 +18,7 @@ Par rapport au mode de réplication _Hot Standby_, l'avantage avec la réplicati

 Pré-requis pour pouvoir mettre en place une infra avec 1 maître et 1 réplicat :

-* même architecture (32 bits/64 bits) sur les 2 serveurs ;
+* même architecture (32 ou 64 bits) sur les 2 serveurs ;
 * même version majeure de PostgreSQL sur les 2 serveurs (et même version mineure est conseillé) ;

 ## Installation de PostgreSQL