mirroir readonly du Gitit wiki.evolix.org (attention, ne rien commiter/merger sur ce dépôt) https://wiki.evolix.org
Vous ne pouvez pas sélectionner plus de 25 sujets Les noms de sujets doivent commencer par une lettre ou un nombre, peuvent contenir des tirets ('-') et peuvent comporter jusqu'à 35 caractères.

HowtoWget.md 2.8 KiB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667
  1. ---
  2. title: Howto wget
  3. categories: tips
  4. ...
  5. * Page de manuel : <https://www.gnu.org/software/wget/manual/wget.html>
  6. # HowTo Wget
  7. Wget est un client supportant les protocoles HTTP, HTTPS et FTP pour récupérer du contenu distant sur Internet et ainsi que le téléchargement au travers des proxies HTTP.
  8. ## Utilisation de base
  9. Exemples d'utilisation :
  10. Récupérer un fichier en limitant la bande passante et le sauvegardant sous un nom différent :
  11. ~~~
  12. $ wget --limit-rate=100K https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso -O debian9.iso
  13. ~~~
  14. Télécharger un fichier en mode silencieux avec l'affichage de son avancement :
  15. ~~~
  16. $ wget -q --show-progress https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/debian-9.3.0-amd64-netinst.iso
  17. ~~~
  18. Seulement pour télécharger les fichier dont l'extension est iso :
  19. ~~~
  20. $ wget -r -A "*iso" https://ftp.acc.umu.se/cdimage/release/current/amd64/iso-cd/
  21. ~~~
  22. Télécharger des fichiers en passant par un proxy :
  23. ~~~
  24. $ wget --limit-rate=100K -A *.mpeg -r http://dc5video.debian.net/2005-07-09/
  25. $ http_proxy=http://192.168.14.4:3128 wget -p -H www.thomascook.fr
  26. ~~~
  27. Voici les différentes options possibles :
  28. * `-c` : pour reprendre un téléchargement déjà commencé
  29. * `-q` : Pour le mode silencieux
  30. * `-O` : fichier de sortie
  31. * `--show-progress` : Montre la progression du téléchargement
  32. * `-4` : utilise la liaison ipv4
  33. * `-6` : utilise la liaison ipv6
  34. * `--limit-rate=100k` : pour limiter le téléchargement à 100 K**o**/s
  35. * `--no-check-certificate` : Ne vérifie pas la validité des certificats
  36. * `-r` : téléchargement récursif d'un site (mode « aspirateur »)
  37. * `-l <niveau>` (défaut=5) : niveau de répertoires à explorer pour l'aspirateur (`-l 0` : aucun)
  38. * `-a <regex>` : pour limiter à une expression régulière
  39. * `-X /*/*/*/foo,/*/*/*/bar` : Exclu les sous-dossiers portant le nom foo et bar
  40. * `--reject-regex <regex>` : Exclus l'accès aux urls qui match avec l'expression régulière
  41. * `--accept-regex <regex>` : Inclus l'accès aux urls qui match avec l'expression régulière
  42. * `-A` : filtre le contenu que l'on veut récupérer
  43. * `-R "*-mac-*"` : filtre le contenu que l'on ne veut pas récupérer
  44. * `-P <foo>`: pour spécifier le répertoire foo/ où mettre le contenu téléchargé
  45. * `-p` : prendre tous les fichiers dont la page a besoin
  46. * `-H` : active le teléchargement de « pages extérieures » au site demandé
  47. * `-nc` : Ne télécharge pas le fichier s'il est déjà présent
  48. * `-nd` : Ne représente pas l'arborescence de fichier
  49. * `-i <fichier>` : Liste d'URL désignant les fichiers à télécharger
  50. * `-e robots=off` : Ne respecte pas les directives incluse dans robots.txt
  51. * `--no-parent` : Ne monte jamais dans le répertoire parent lors de la récupération récursive