Cómo descargar todas las páginas de un sitio web en Linux
Wget es un potente software de código abierto en Linux que se puede usar para descargar contenido de sitios web. A veces es necesario hacer una copia de todo el contenido de un sitio web, tal vez para crear un espejo del sitio o para preservar el contenido actual para su uso posterior. Con Wget, se puede descargar un sitio web completo con un solo comando de una línea.
1.
Asegúrese de que wget esté instalado utilizando el comando "which". Escribir "qué wget", sin comillas, en un terminal mostrará dónde está instalado Wget en las computadoras con Linux. Si Wget no está instalado, utilice las herramientas de instalación de software de la distribución, como Yum o Apt-get para instalar Wget.
2.
Establecer la bandera para reflejar el sitio web. Wget tiene varios indicadores que pueden configurarse para alterar el comportamiento del programa. La bandera "-m" se usa para descargar un sitio web completo. Por ejemplo, escriba:
wget -m www.fake-web-site.com
Esto crea una copia local de "www.fake-web-site.com" en su computadora. De forma predeterminada, Wget crea un directorio con el mismo nombre que el sitio web dentro del directorio en el que se ejecutó.
3.
Compruebe que el contenido se adquirió abriendo la copia local de la página en un navegador.
Cosas necesarias
- wget
Advertencias
- Wget puede consumir una gran cantidad de ancho de banda cuando solicita contenido a un servidor. Además, algunos firewalls pueden interpretar solicitudes rápidas de un solo cliente como un ataque, lo que podría ocasionar que su dirección IP se bloquee temporalmente del servidor. Asegúrese de que el indicador -w esté establecido para limitar el tiempo entre solicitudes. Por ejemplo:
- wget -m -w 10 www.fake-web-site.com
- hará que Wget espere 10 segundos antes de solicitar archivos subsiguientes del servidor.