Wget : adds somes tips
Cette révision appartient à :
Parent
e6ff842640
révision
72e24df7d6
40
HowtoWget.md
40
HowtoWget.md
|
@ -7,26 +7,43 @@ categories: tips
|
|||
|
||||
# HowTo Wget
|
||||
|
||||
Wget est un client HTTP, HTTPS et FTP pour récupérer des pages web distante.
|
||||
|
||||
Wget est un client supportant les protocoles HTTP, HTTPS et FTP pour récupérer du contenu distant sur Internet et ainsi que le téléchargement au travers des proxies HTTP.
|
||||
|
||||
## Utilisation de base
|
||||
|
||||
Exemples d'utilisation :
|
||||
|
||||
Récupérer un fichier en limitant la bande passante et le sauvegardant sous un nom différent :
|
||||
|
||||
~~~
|
||||
# apt install wget
|
||||
$ wget --limit-rate=100K https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso -O debian9.iso
|
||||
~~~
|
||||
|
||||
Exemples d'utilisation :
|
||||
Télécharger un fichier en mode silencieux avec l'affichage de son avancement :
|
||||
|
||||
~~~
|
||||
$ wget -q --show-progress https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso
|
||||
~~~
|
||||
|
||||
Seulement pour télécharger les fichier dont l'extension est iso :
|
||||
|
||||
~~~
|
||||
$ wget -r -A "*iso" https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/
|
||||
~~~
|
||||
|
||||
Télécharger des fichiers en passant par un proxy :
|
||||
|
||||
~~~
|
||||
$ wget --limit-rate=100K -A *.mpeg -r http://dc5video.debian.net/2005-07-09/
|
||||
$ http_proxy=http://192.168.14.4:3128 wget -p -H www.thomascook.fr
|
||||
~~~
|
||||
|
||||
|
||||
Voici les différentes options possibles :
|
||||
|
||||
* `-c` : pour reprendre un téléchargement déjà commencé
|
||||
* `-q` : Pour le mode silencieux
|
||||
* `-O` : fichier de sortie
|
||||
* `--show-progress` : Montre la progression du téléchargement
|
||||
* `-4` : utilise la liaison ipv4
|
||||
* `-6` : utilise la liaison ipv6
|
||||
|
@ -35,7 +52,16 @@ Voici les différentes options possibles :
|
|||
* `-r` : téléchargement récursif d'un site (mode « aspirateur »)
|
||||
* `-l <niveau>` (défaut=5) : niveau de répertoires à explorer pour l'aspirateur (`-l 0` : aucun)
|
||||
* `-a <regex>` : pour limiter à une expression régulière
|
||||
* `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé (au lieu du répertoire courant)
|
||||
* `-X /*/*/*/foo,/*/*/*/bar` : Exclu les sous-dossiers portant le nom foo et bar
|
||||
* `--reject-regex <regex>` : Exclus l'accès aux urls qui match avec l'expression régulière
|
||||
* `--accept-regex <regex>` : Inclus l'accès aux urls qui match avec l'expression régulière
|
||||
* `-A` : filtre le contenu que l'on veut récupérer
|
||||
* `-R "*-mac-*"` : filtre le contenu que l'on ne veut pas récupérer
|
||||
* `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé
|
||||
* `-p` : prendre tous les fichiers dont la page a besoin
|
||||
* `-H` : active le teléchargement de « pages exterieures » au site demandé
|
||||
* `-nc`: Ne télécharge pas le fichier s'il est déjà présent
|
||||
* `-H` : active le teléchargement de « pages extérieures » au site demandé
|
||||
* `-nc` : Ne télécharge pas le fichier s'il est déjà présent
|
||||
* `-nd` : Ne représente pas l'arborescence de fichier
|
||||
* `-i <fichier>` : Liste d'URL désignant les fichiers à télécharger
|
||||
* `-e robots=off` : Ne respecte pas les directives incluse dans robots.txt
|
||||
* `--no-parent` : Ne monte jamais dans le répertoire parent lors de la récupération récursive
|
Chargement…
Référencer dans un nouveau ticket