Ejemplos de uso del comando Wget

Comando wget. En anteriores artículos ya hablamos del comando wget, hoy pondremos unos ejemplos prácticos de uso, para que realmente conozcas el potencial de este comando.

Wget es una utilidad que podemos usar con HTTP, HTTPS y FTP, que son los protocolos de Internet más utilizados.

Su nombre viene de World Wide Web + get. Es realmente bueno a la hora de descargar archivos gran tamaño, descargas recursivas, múltiples descargas de archivos o simplemente para duplicar sitios web o FTP completos.

No es interactivo, por tanto la flexibilidad de su uso es excelente, lo puedes invocar desde scripts, tareas cron, terminales, etc. Incluso funciona en segundo plano, aunque el usuario no está conectado. Como ves es una herramienta realmente útil.

 

Usos del comando Wget

 

No todas las distribuciones linux tienen wget instalado por defecto, por tanto lo instalamos.

Debian, Ubuntu y derivados:

Rhel, Centos y derivados:

OpenSuse:

 

Una vez instalado, podemos comenzar a hacer uso de el. En el ejemplo descargaremos el cms de wordpress.org.es.

ejemplo de salida:

Como puedes ver nos muestra, el progreso, fecha, hora, etc…

 

Ahora lo descargaremos pero modificando en nombre, de manera que cuando descargue se modifique el nombre en destino. Agregamos la extensión:

Descargamos.

ejemplo de salida:

Como ves el archivo a cambiado el nombre… worps.tar.gz.

 

En este caso lo guardaremos en un directorio o carpeta especifico. Usaremos el comando -P.

 

En comando wget, también nos ofrece la posibilidad de limitar la velocidad de descarga, interesante su uso si tienes una conexión lenta. En el ejemplo limitamos a 256k.

ejemplo de salida:

Como ves en la leyenda, el archivo tardo bastante más en descargar.

 

Para evitar que se interrumpa la descarga por cortes o errores de conexión, podemos usar la extensión -c.

 

Para descargar archivos de gran tamaño es recomendable que realices las descargas en segundo plano. Usaremos la extensión -b.

Como ves… aquí la salida es diferente:

Lo que nos indica el mensaje anterior, es que la salida se escribirá en el archivo “wget-log” en el mismo directorio de la descarga. Podemos verificar el estado de la descarga con el siguiente comando:

ejemplo de log:

 

Si tienes problemas con tu conexión a Internet puedes usar -tries, para que lo siga reintentando. En el ejemplo 150 reintentos.

 

Creando un archivo para descargar varios archivos.

Una vez creado editamos el archivo con nano:

agregamos los archivos a descargar…

guardamos y cerramos nano.

Descargamos todos los archivos de descargas.txt con la opción -i.

 

Usando wget con FTP.

 

Descargar una pagina web completa. Este apartado ya lo explicamos en un anterior articulo, de todas formas lo repetimos.

Explicación:

  • –recursive indica que de forma recursiva profundice en el árbol de directorios del sitio remoto.
  • –no-clobber evita re-descargar archivos que ya se hubieran descargado. Lo usamos por si has intentado una primera vez, se ha descargado parte del sitio, y por alguna razón se ha interrumpido y vuelves a lanzar la descarga.
  • –page-requisites, descarga absolutamente todo lo que necesite cada página: imágenes, CSS, etc… .
  • –html-extension, convierte todas las extensiones de fichero a .html. En clave, porque puede contener páginas .asp, php, etc… que en local no podríamos explorar gráficamente.
  • –convert-links, convierte los enlaces a fichero local, de modo que pueda navegar por todos los hipervínculos de forma local, offline.
  • –domains XXX, para que no descargue nada que se salga de este dominio, es decir, algún enlace que apunte a otra página fuera de www.MIPAGE.es.
  • –no-parent, para que no suba a los niveles superiores, sino que solo interesa lo que cuelga de la URL bajo la carpeta xml, no hacia arriba (en caso de que solo quisieras descargar por ejemplo www.MIPAGE.es/archivo/).
  • y al final, la URL de comienzo de descarga.

 

Como puedes ver las posibilidades de wget son inmensas, recuerda hacer un uso constructivo de el.

Ejemplos de uso del comando Wget
5 (100%) 3 Votos

Agregar comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.