Formation Evolix

PostgreSQL

PostgreSQL est une base de données qui met l'accent sur le respect du standard SQL et la sécurité des données. Il se base notamment sur des journaux de transaction (WAL), fichiers binaires qui contient toutes les données avant écriture sur les disques.

# apt install postgresql
# vim sources.list
deb http://apt.postgresql.org/pub/repos/apt/ jessie-pgdg main

Instances :

# pg_ctlcluster < version > < cluster > start|stop|restart|reload|status|promote # pg_lsclusters Ver Cluster Port Status Owner Data directory Log file 9.4 main 5432 online postgres /var/lib/postgresql/9.4/main /var/log/postgresql/postgresql-9.4-main.log # dpkg-reconfigure locales $ /usr/bin/pg_createcluster < version > < cluster >

Attention à la locales

  • configuration :
    `/etc/postgresql/< version >/< instance >/`
  • journaux :
    `/var/log/postgresql/postgresql-< version >-< instance >.log`
  • stockage :
    `/var/lib/postgresql/< version >/< instance >/`
  • binaires et bibliothèques :
    `/usr/lib/postgresql/< version >/< instance >/`
  • etc…
# sudo -u postgres psql

Contenu de pg_hba.conf :

~~~{.diff} - local all all peer + local all all password ~~~ $ createuser -P < login > $ createdb -O < login > < base >
$ dropdb < base >
$ psql -c "ALTER USER < login > WITH PASSWORD 'foo'"
$ dropuser < login >
=# SELECT * FROM pg_user;
=# \du

$  psql -l
= # \d
= # SELECT * FROM pg_database;

SELECT pid, datname, usename, client_addr, query_start, waiting, query FROM pg_stat_activity WHERE state='active' ORDER by query_start;
# aptitude install ptop pgbadger pgadmin3
$ pg_top

Faire un VACUUM FULL sur toutes les bases de données :

$ vacuumdb -a -f -v

ANALYSE sur toutes les tables d'une base de données :

$ psql mydb =# ANALYZE;

Optimisation

  • shared_buffers : quantité de mémoire dédiée à PostgreSQL
  • work_mem : quantité de mémoire par process
  • max_connections

Sauvegarde

$ pg_dump < base > >dump.sql $ pg_dumpall >dump.sql $ psql < base > < dump.sql

Archivage de WAL :

wal_level = 'archive' archive_command = 'rsync %p backup.example.net:/backup/…/archives/%f'
+ barman

Usage

=> CREATE TABLE weather ( city varchar(80), temp_lo int, -- low temperature temp_hi int, -- high temperature prcp real, -- precipitation date date ); => INSERT INTO weather VALUES ('San Francisco', 46, 50, 0.25, '1994-11-27');
=> SELECT * FROM weather;
=> SELECT city, (temp_hi+temp_lo)/2 AS temp_avg, date FROM weather;
=> SELECT * FROM weatherWHERE city = 'San Francisco' AND prcp > 0.0;
=> SELECT DISTINCT city FROM weather ORDER BY city;
=> SELECT * FROM weather, cities WHERE city = name;
=> SELECT weather.city, weather.temp_lo, cities.location FROM weather, cities WHERE cities.name = weather.city;
=> SELECT * FROM weather INNER JOIN cities ON (weather.city = cities.name);
=> SELECT * FROM weather LEFT OUTER JOIN cities ON (weather.city = cities.name);
=> SELECT * FROM weather w, cities c WHERE w.city = c.name;

Pooler de connexions :

  • pgpool
  • pgbouncer

Streaming Replication

master / slave

Slony : réplication des données par trigger

Ne réplique pas le schéma : toutes les bases à créer

  • Avoir une clé primaire sur chaque table à répliquer
    (peut être contourné dans certaines conditions,
    mais fortement déconseillé par les dév. de Slony)
  • Ne pas utiliser la commande SQL "TRUNCATE" (avant PG 8.4)
  • SELECT * from pg_stat_replication;

Initialise le cluster Slony

slonik_init_cluster | slonik

Initialise le set de réplication (ensemble de tables à répliquer), notamment installation des triggers.

slonik_create_set set1 | slonik # zcat /usr/share/doc/slony1-2-bin/examples/slon.conf-sample.gz >/etc/slony1/slon.conf # /etc/init.d/slony1 start $ slonik_subscribe_set set1 node2 | slonik

Autres bases de données relationnelles

  • MySQL / MariaDB : base de données très populaires au sein des infrastructures web
  • SQLite : faile à installer, idéal pour embarquer

Autres bases de données dites "NoSQL"

  • Memcached : base de données clés/valeurs volatile et très performante
  • Redis : ressemble à Memcache, mais persistent et plus riche en fonctionnalités
  • InfluxDB : base de données orientée "métriques"
  • Elasticsearch : moteur distribuée d'indexation et de recherche
  • Neo4j : base de données orientée "graph"
  • Autres : MongoDB, CouchDB, Cassandra, Riak…