18
0
Bifurcation 0

Wget : adds somes tips

Cette révision appartient à :
btatu 2018-01-15 11:17:55 +01:00
Parent e6ff842640
révision 72e24df7d6
1 fichiers modifiés avec 33 ajouts et 7 suppressions

Voir le fichier

@ -7,26 +7,43 @@ categories: tips
# HowTo Wget
Wget est un client HTTP, HTTPS et FTP pour récupérer des pages web distante.
Wget est un client supportant les protocoles HTTP, HTTPS et FTP pour récupérer du contenu distant sur Internet et ainsi que le téléchargement au travers des proxies HTTP.
## Utilisation de base
Exemples d'utilisation :
Récupérer un fichier en limitant la bande passante et le sauvegardant sous un nom différent :
~~~
# apt install wget
$ wget --limit-rate=100K https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso -O debian9.iso
~~~
Exemples d'utilisation :
Télécharger un fichier en mode silencieux avec l'affichage de son avancement :
~~~
$ wget -q --show-progress https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso
~~~
Seulement pour télécharger les fichier dont l'extension est iso :
~~~
$ wget -r -A "*iso" https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/
~~~
Télécharger des fichiers en passant par un proxy :
~~~
$ wget --limit-rate=100K -A *.mpeg -r http://dc5video.debian.net/2005-07-09/
$ http_proxy=http://192.168.14.4:3128 wget -p -H www.thomascook.fr
~~~
Voici les différentes options possibles :
* `-c` : pour reprendre un téléchargement déjà commencé
* `-q` : Pour le mode silencieux
* `-O` : fichier de sortie
* `--show-progress` : Montre la progression du téléchargement
* `-4` : utilise la liaison ipv4
* `-6` : utilise la liaison ipv6
@ -35,7 +52,16 @@ Voici les différentes options possibles :
* `-r` : téléchargement récursif d'un site (mode « aspirateur »)
* `-l <niveau>` (défaut=5) : niveau de répertoires à explorer pour l'aspirateur (`-l 0` : aucun)
* `-a <regex>` : pour limiter à une expression régulière
* `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé (au lieu du répertoire courant)
* `-X /*/*/*/foo,/*/*/*/bar` : Exclu les sous-dossiers portant le nom foo et bar
* `--reject-regex <regex>` : Exclus l'accès aux urls qui match avec l'expression régulière
* `--accept-regex <regex>` : Inclus l'accès aux urls qui match avec l'expression régulière
* `-A` : filtre le contenu que l'on veut récupérer
* `-R "*-mac-*"` : filtre le contenu que l'on ne veut pas récupérer
* `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé
* `-p` : prendre tous les fichiers dont la page a besoin
* `-H` : active le teléchargement de « pages exterieures » au site demandé
* `-nc`: Ne télécharge pas le fichier s'il est déjà présent
* `-H` : active le teléchargement de « pages extérieures » au site demandé
* `-nc` : Ne télécharge pas le fichier s'il est déjà présent
* `-nd` : Ne représente pas l'arborescence de fichier
* `-i <fichier>` : Liste d'URL désignant les fichiers à télécharger
* `-e robots=off` : Ne respecte pas les directives incluse dans robots.txt
* `--no-parent` : Ne monte jamais dans le répertoire parent lors de la récupération récursive