Wget

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 25. joulukuuta 2019 tarkistetusta versiosta . tarkastukset vaativat 11 muokkausta .
GNU Wget
Tyyppi lataushallinta
Tekijä Hrvoje Nikšić [1]
Kehittäjät Mauro Tortonesi, Giuseppe Scrivano ja muut.
Sisään kirjoitettu C [3]
Käyttöliittymä komentorivi
Käyttöjärjestelmä Linux ja muut UNIX-tyyppiset , Windows
Käyttöliittymäkielet venäjä ja 38 muuta kieltä
Ensimmäinen painos tammikuuta 1996
uusin versio
Luodut tiedostomuodot Web-arkistotiedosto
Osavaltio aktiivinen
Lisenssi GPL 3.0+ [4] [5]
Verkkosivusto gnu.org/software/wget/
 Mediatiedostot Wikimedia Commonsissa

Wget [6]  — (GNU Wget) ilmainen ei- vuorovaikutteinen konsoliohjelma tiedostojen lataamiseen verkon kautta. Tukee HTTP- , FTP- ja HTTPS-protokollia ja tukee myös HTTP- välityspalvelimen kautta toimimista . Ohjelma sisältyy lähes kaikkiin GNU/Linux-jakeluihin .

Wget on ei-interaktiivinen ohjelma. Tämä tarkoittaa, että julkaisun jälkeen käyttäjä voi vaikuttaa sen toimintaan vain käyttöjärjestelmän prosessinhallintatyökalujen avulla. Pääsääntöisesti tähän käytetään pikanäppäimiä Ctrl+C, kun on tarpeen keskeyttää ohjelma ja Ctrl+Z siirtää nykyinen tehtävä taustalle. Nykyaikaisissa verkkoselaimissa on yleensä tiedostojen lataustoiminto, mutta koska selain on suunniteltu interaktiiviseen tilaan, suuren tiedostomäärän manuaalinen lataaminen voi olla työlästä. Selaimet eivät yleensä tarjoa keinoja automatisoida näitä tehtäviä. Wget esimerkiksi tukee tiedostossa määritettyjen URL-osoitteiden lataamista. Siten voit tehdä luettelon tiedostoista ja ladata ne milloin tahansa sopivalla hetkellä wget-sovelluksella. Komentoriviliittymän avulla voit ohjata muiden ohjelmien ja komentosarjojen wget- tiedostoja, joita käytetään tiedostojen lataamisen automatisoinnissa (säännölliset päivitykset, palvelimen saatavuuden valvonta jne.).

Wgetin avulla voit ladata mitä tahansa tiedostoja World Wide Webistä (mukaan lukien ( X ) HTML -sivut) käyttämällä http- ja https-protokollia sekä tiedostoja ja hakemistoluetteloita ftp-protokollaa käyttäen.

Tiedostoja voidaan ladata rekursiivisesti HTML-sivujen linkeistä sekä yhdeltä sivustolta, jossa on tietty määrä seuraavia linkkejä, että usealta. Lisäksi ftp:n kautta ladattaessa tiedostot voidaan ladata nimen "maskiin" (eli voit määrittää tiedostoryhmän käyttämällä "*").

Wget tukee tiedoston jatkamista yhteyshäiriön sattuessa.

Wgetille kehitetään jatkoa Wget2 [7] .

Esimerkkejä

Ladataan kaikkia paikallisessa tai ulkoisessa TIEDOSTOSSA määritettyjä URL-osoitteita:

wget -i TIEDOSTO

Lataa tiedostot määritettyyn hakemistoon (-P) [8] :

wget -P /polku/tallennus ftp://ftp.example.org/some_file.iso

Käyttäjätunnuksen ja salasanan käyttäminen FTP/HTTP:ssä (vaihtoehto 1):

wget ftp://login:[email protected]/some_file.iso

Käyttäjätunnuksen ja salasanan käyttäminen FTP/HTTP:ssä (vaihtoehto 2):

wget --user = kirjautuminen --salasana = salasana ftp://ftp.example.org/some_file.iso

Taustalataus (-b):

wget -b ftp://ftp.example.org/some_file.iso

Jatka (-c jatka) aiemmin epätäydellisesti ladatun tiedoston lataamista:

wget -c http://example.org/file.iso

Lataa tarkistamatta varmennetta (--no-check-certificate):

wget --no-check-certificate http://example.org/file.iso

Lataa http://example.org/~user/my-archive/  -hakemiston sisältö (linkki ei saatavilla) ja kaikki sen alihakemistot nousematta hakemistohierarkiassa:

wget -r --no-parent http://example.org/~user/my-archive/

Palvelimen tunnistamista tuetaan myös:

wget --save-cookies cookies.txt \ --post-data 'user=foo&password=bar' \ http://example.org/auth.php

Lataa koko sivusto (rekursion syvyys - 10):

wget -r -l 10 -k -o lokitiedosto.txt -p http://example.org/ -r, --recursive mahdollistaa rekursiivisen latauksen -l , --taso = NUMERO rekursion syvyys ( inf ja 0 - ääretön ) -k, --convert-links tekevät linkeistä paikallisia ladatussa HTML:ssä tai CSS:ssä -o, --output-file = TIEDOSTO kirjoittaa viestit ( lokit ) tiedostoon FILE -p, --page-requisites lataa kaikki kuvat jne., joita tarvitaan HTML-sivun hahmontamiseen -m, --peili lyhyt vaihtoehto, vastaa -N -r -l inf --no-remove-listing.

Tulosta vastauksen sisältö konsoliin:

wget http://example.org --quiet -O -

Palautustila

Ennen versiota 1.12 palauttaa 0 onnistumisesta ja 1 virheestä. Versiosta 1.12 [9] lähtien, virheen sattuessa palauttaa 1 - 8 tyypistä riippuen.

Kritiikki

Wgetin kehitys on hidasta, monia uusia HTTP-, FTP -protokollalaajennuksia, JavaScript - skriptejä ja muita ominaisuuksia ei tueta.

Joissakin tapauksissa cURL voi olla hyvä vaihtoehto , ja rsyncia käytetään yleensä sivustopeilien luomiseen (mitä cURL ei voi [10] ) . Versiossa 1.17 ja uudemmissa tarvitaan prosessorin SSE2-käskyjen tuki.

wget2

Wgetin seuraavan suuren päivityksen pitäisi olla wget2:ssa, jonka on tarkoitus korvata se. wget2:ssa on huomattava määrä parannuksia Wgetiin verrattuna, pääasiassa suorituskyvyn suhteen:

  • HTTP/2-tuki
  • HTTP-pakkaus
  • Rinnakkaiset liitännät
  • TCP Fast Open

ja joukko muita.

wget2:n pääkehittäjä on Tim Rühsen, joka on myös yksi Wgetin pääkehittäjistä ja nykyisistä ylläpitäjistä.

Kloonit

Sulautetuissa järjestelmissä on yleensä rajallinen muisti, ja niissä on klooneja, jotka jäljittelevät GNU Wgetin käyttöliittymää ja käyttäytymistä, mutta niissä on vähemmän vaihtoehtoja, useimmiten vain tiedoston lataaminen:

Katso myös

Muistiinpanot

  1. Wget-kotisivu. . Haettu 6. lokakuuta 2021. Arkistoitu alkuperäisestä 15. syyskuuta 2021.
  2. Shah D. wget-1.21.3 julkaistu  - 2022 .
  3. Avoimen lähdekoodin wget-projekti Open Hubissa: Kielet-sivu - 2006.
  4. https://www.gnu.org/software/wget/
  5. https://git.savannah.gnu.org/cgit/wget.git/tree/README
  6. Komentorivillä olevien *nix -käytäntöjen vuoksi tämä ohjelma kutsutaan sanalla, joka alkaa pienellä kirjaimella:wget
  7. wget2 Gitlabissa Arkistoitu 1. maaliskuuta 2018 Wayback Machinessa 
  8. GNU wget käsikirja . Haettu 6. lokakuuta 2021. Arkistoitu alkuperäisestä 6. lokakuuta 2021.
  9. wget manual Arkistoitu 6. lokakuuta 2021 Wayback Machinen palautustilassa (en)
  10. cURL UKK Arkistoitu 6. lokakuuta 2021 Wayback Machinessa : "Curl ei ole verkkosivustojen peilausohjelma."

Linkit