Duplicar sitios Web

Aplicaciones 2 de ene. de 2023

Varias herramientas y utilidades para crear un duplicado de una web

En algún momento puede que tengamos la necesidad de almacenar una copia en local de una web, ya sea porque vamos a necesitar visitarla en modo off-line, o porque tememos que la web desaparezca y queremos tener una copia de ella para el futuro.

WGET

Una de las formas más sencillas es crear un 'mirror' de una pagina usando el comando wget:

mkdir duplicado-webs
cd duplicado-webs
wget --mirror --convert-links --adjust-extension --page-requisites  --no-parent https://soloconlinux.org.es

Para instalar wget solo tienes que ejecutar el siguiente comando:

apt-get -y install wget

Sin embargo en determinadas páginas o blogs esto no funciona del todo correctamente y hay determinadas páginas que no se descargan, en ese caso podemos usar algún gestor de creación de mirrors de páginas.

HTTrack

Una aplicación para crear una copia completa de una web desde la línea de comandos es httrack.

Su instalación no puede ser más sencilla:

    apt-get -y install httrack

Dispone de multitud de parámetros para configurar la descarga de un sitio web, aunque funciona perfectamente indicando unicamente la web sobre la que quieres realizar el 'mirroring':

cd /tmp/duplicado-web   
httrack https://soloconlinux.org.es

Procesará todo el sitio web, descargandose incluso los CSS, Fonts y demás elementos necesarios para obtener un duplicado perfecto de la web.

WebHTTrack Website Copier

Se trata de una herramienta, que se ejecuta sobre una instancia de Google Chrome y que utiliza por debajo HTTrack para realizar todo el proceso de una forma gráfica más amistosa que httrack.

webhttrack

Aplicación gráfica para clonado de sitios web

Para instalarla solamente debemos ejecutar:

    apt-get -y install webhttrack

Si la web necesita algún tipo de acceso, permite definir el usuario y contraseña para el acceso, y además te permite clasificar todas las webs que descargues.


Incluye un navegador off-line para poder navegar de forma desconectada por cualquiera de las web que hayas descargado.

Etiquetas

Luis GuLo

🐧 SysAdmin GNU/Linux - 🐳 Docker - 🖥️ Bash Scripting - 🐪 Perl - 🐬 MySQL - 👥 Formador de TI - 👥 Formador de SysAdmin's - 💢 Ansible - ☁️ Cloud Computing - ❤️ Debian GNU/Linux