diff --git a/HowtoWget.md b/HowtoWget.md index e3dab8c4..df20c11b 100644 --- a/HowtoWget.md +++ b/HowtoWget.md @@ -7,26 +7,43 @@ categories: tips # HowTo Wget -Wget est un client HTTP, HTTPS et FTP pour récupérer des pages web distante. - +Wget est un client supportant les protocoles HTTP, HTTPS et FTP pour récupérer du contenu distant sur Internet et ainsi que le téléchargement au travers des proxies HTTP. ## Utilisation de base +Exemples d'utilisation : + +Récupérer un fichier en limitant la bande passante et le sauvegardant sous un nom différent : + ~~~ -# apt install wget +$ wget --limit-rate=100K https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso -O debian9.iso ~~~ -Exemples d'utilisation : +Télécharger un fichier en mode silencieux avec l'affichage de son avancement : + +~~~ +$ wget -q --show-progress https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso +~~~ + +Seulement pour télécharger les fichier dont l'extension est iso : + +~~~ +$ wget -r -A "*iso" https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/ +~~~ + +Télécharger des fichiers en passant par un proxy : ~~~ $ wget --limit-rate=100K -A *.mpeg -r http://dc5video.debian.net/2005-07-09/ $ http_proxy=http://192.168.14.4:3128 wget -p -H www.thomascook.fr ~~~ + Voici les différentes options possibles : * `-c` : pour reprendre un téléchargement déjà commencé * `-q` : Pour le mode silencieux +* `-O` : fichier de sortie * `--show-progress` : Montre la progression du téléchargement * `-4` : utilise la liaison ipv4 * `-6` : utilise la liaison ipv6 @@ -35,7 +52,16 @@ Voici les différentes options possibles : * `-r` : téléchargement récursif d'un site (mode « aspirateur ») * `-l ` (défaut=5) : niveau de répertoires à explorer pour l'aspirateur (`-l 0` : aucun) * `-a ` : pour limiter à une expression régulière -* `-P `: pour spécifier le répertoire foo/ où mettre le contenu téléchargé (au lieu du répertoire courant) +* `-X /*/*/*/foo,/*/*/*/bar` : Exclu les sous-dossiers portant le nom foo et bar +* `--reject-regex ` : Exclus l'accès aux urls qui match avec l'expression régulière +* `--accept-regex ` : Inclus l'accès aux urls qui match avec l'expression régulière +* `-A` : filtre le contenu que l'on veut récupérer +* `-R "*-mac-*"` : filtre le contenu que l'on ne veut pas récupérer +* `-P `: pour spécifier le répertoire foo/ où mettre le contenu téléchargé * `-p` : prendre tous les fichiers dont la page a besoin -* `-H` : active le teléchargement de « pages exterieures » au site demandé -* `-nc`: Ne télécharge pas le fichier s'il est déjà présent \ No newline at end of file +* `-H` : active le teléchargement de « pages extérieures » au site demandé +* `-nc` : Ne télécharge pas le fichier s'il est déjà présent +* `-nd` : Ne représente pas l'arborescence de fichier +* `-i ` : Liste d'URL désignant les fichiers à télécharger +* `-e robots=off` : Ne respecte pas les directives incluse dans robots.txt +* `--no-parent` : Ne monte jamais dans le répertoire parent lors de la récupération récursive \ No newline at end of file