30/3/2008

Afhalen met wget: directories beperken

Filed under: — cybrarian @ 2:53 pm

Van een website of ftp-site bestanden afhalen met een commando op de command-prompt (of een commando in een shell-script) kan met “wget” (zie …)
Nadeel is dat je een hele hierarchie van mapjes krijgt vanaf de domeinnaam van de site tot en met alle subdirectories. Ook als je een bepaalde subdirectory van de site hebt opgegeven krijg je soms toch nog de inhoud van andere parrallle directories (meestal staat er een link naar het hoger niveau en die wordt ook gevolgd natuurlijk).

Als je niet de hele structuur van de site erbij wil kan je volgende parameters gebruiken:
wget -r -np -nH http://server.site.org/download/demo/
Waarbij
-r betekent dat de subdirectories ook worden gelezen (r van recursief);
met een getal (–level=getal) kan je de diepgang van het aantal gevolgde niveaus bepalen.
– nH betekent dat de host directories niet gemaakt worden (no Host)
– np betekent dat de link naar de bovenliggende directory niet gevolgd wordt (no parent)

Powered by WordPress