@ -140,7 +140,7 @@ Sur le réplica on aura des erreurs de ce type :
## Monitoring
Sur le serveur replica, on peut surveiller le bon fonctionnement de la réplication ainsi :
Sur le serveur secondaire, on peut surveiller le bon fonctionnement de la réplication ainsi, mais cela indique celement l'état sur le secondaire, il ne surveille pas la réplication par rapport au primaire :
~~~
postgres=# select * from pg_subscription ;
@ -155,4 +155,28 @@ postgres=# select * from pg_stat_subscription ;
Pour surveiller la réplication logique depuis le primaire on utilise le check_pgactivity :
<https://github.com/OPMDG/check_pgactivity>
On l'utilise avec le service *replication_slots* qui regarde le nombre de fichier WAL et le nombre de fichier dans pg_replslot pour chaque slot de réplication.
Si les fichiers WAL s'accumule ainsi que les fichiers dans pg_replslot/ c'est qu'il y a un problème de réplication, le check passe en critique est indique quel slot est impacté.
On positionne des valeurs de *warning* et *critique* comme ceci :