22
0
Fork 0

Wget : adds somes tips

This commit is contained in:
btatu 2018-01-15 11:17:55 +01:00
parent e6ff842640
commit 72e24df7d6
1 changed files with 33 additions and 7 deletions

View File

@ -7,26 +7,43 @@ categories: tips
# HowTo Wget # HowTo Wget
Wget est un client HTTP, HTTPS et FTP pour récupérer des pages web distante. Wget est un client supportant les protocoles HTTP, HTTPS et FTP pour récupérer du contenu distant sur Internet et ainsi que le téléchargement au travers des proxies HTTP.
## Utilisation de base ## Utilisation de base
Exemples d'utilisation :
Récupérer un fichier en limitant la bande passante et le sauvegardant sous un nom différent :
~~~ ~~~
# apt install wget $ wget --limit-rate=100K https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso -O debian9.iso
~~~ ~~~
Exemples d'utilisation : Télécharger un fichier en mode silencieux avec l'affichage de son avancement :
~~~
$ wget -q --show-progress https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso
~~~
Seulement pour télécharger les fichier dont l'extension est iso :
~~~
$ wget -r -A "*iso" https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/
~~~
Télécharger des fichiers en passant par un proxy :
~~~ ~~~
$ wget --limit-rate=100K -A *.mpeg -r http://dc5video.debian.net/2005-07-09/ $ wget --limit-rate=100K -A *.mpeg -r http://dc5video.debian.net/2005-07-09/
$ http_proxy=http://192.168.14.4:3128 wget -p -H www.thomascook.fr $ http_proxy=http://192.168.14.4:3128 wget -p -H www.thomascook.fr
~~~ ~~~
Voici les différentes options possibles : Voici les différentes options possibles :
* `-c` : pour reprendre un téléchargement déjà commencé * `-c` : pour reprendre un téléchargement déjà commencé
* `-q` : Pour le mode silencieux * `-q` : Pour le mode silencieux
* `-O` : fichier de sortie
* `--show-progress` : Montre la progression du téléchargement * `--show-progress` : Montre la progression du téléchargement
* `-4` : utilise la liaison ipv4 * `-4` : utilise la liaison ipv4
* `-6` : utilise la liaison ipv6 * `-6` : utilise la liaison ipv6
@ -35,7 +52,16 @@ Voici les différentes options possibles :
* `-r` : téléchargement récursif d'un site (mode « aspirateur ») * `-r` : téléchargement récursif d'un site (mode « aspirateur »)
* `-l <niveau>` (défaut=5) : niveau de répertoires à explorer pour l'aspirateur (`-l 0` : aucun) * `-l <niveau>` (défaut=5) : niveau de répertoires à explorer pour l'aspirateur (`-l 0` : aucun)
* `-a <regex>` : pour limiter à une expression régulière * `-a <regex>` : pour limiter à une expression régulière
* `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé (au lieu du répertoire courant) * `-X /*/*/*/foo,/*/*/*/bar` : Exclu les sous-dossiers portant le nom foo et bar
* `--reject-regex <regex>` : Exclus l'accès aux urls qui match avec l'expression régulière
* `--accept-regex <regex>` : Inclus l'accès aux urls qui match avec l'expression régulière
* `-A` : filtre le contenu que l'on veut récupérer
* `-R "*-mac-*"` : filtre le contenu que l'on ne veut pas récupérer
* `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé
* `-p` : prendre tous les fichiers dont la page a besoin * `-p` : prendre tous les fichiers dont la page a besoin
* `-H` : active le teléchargement de « pages exterieures » au site demandé * `-H` : active le teléchargement de « pages extérieures » au site demandé
* `-nc`: Ne télécharge pas le fichier s'il est déjà présent * `-nc` : Ne télécharge pas le fichier s'il est déjà présent
* `-nd` : Ne représente pas l'arborescence de fichier
* `-i <fichier>` : Liste d'URL désignant les fichiers à télécharger
* `-e robots=off` : Ne respecte pas les directives incluse dans robots.txt
* `--no-parent` : Ne monte jamais dans le répertoire parent lors de la récupération récursive