Duplicar sitios Web
Varias herramientas y utilidades para crear un duplicado de una web
En algún momento puede que tengamos la necesidad de almacenar una copia en local de una web, ya sea porque vamos a necesitar visitarla en modo off-line, o porque tememos que la web desaparezca y queremos tener una copia de ella para el futuro.
WGET
Una de las formas más sencillas es crear un 'mirror' de una pagina usando el comando wget:
mkdir duplicado-webs
cd duplicado-webs
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://soloconlinux.org.es
Para instalar wget solo tienes que ejecutar el siguiente comando:
apt-get -y install wget
Sin embargo en determinadas páginas o blogs esto no funciona del todo correctamente y hay determinadas páginas que no se descargan, en ese caso podemos usar algún gestor de creación de mirrors de páginas.
HTTrack
Una aplicación para crear una copia completa de una web desde la línea de comandos es httrack.
Su instalación no puede ser más sencilla:
apt-get -y install httrack
Dispone de multitud de parámetros para configurar la descarga de un sitio web, aunque funciona perfectamente indicando unicamente la web sobre la que quieres realizar el 'mirroring':
cd /tmp/duplicado-web
httrack https://soloconlinux.org.es
Procesará todo el sitio web, descargandose incluso los CSS, Fonts y demás elementos necesarios para obtener un duplicado perfecto de la web.
WebHTTrack Website Copier
Se trata de una herramienta, que se ejecuta sobre una instancia de Google Chrome y que utiliza por debajo HTTrack para realizar todo el proceso de una forma gráfica más amistosa que httrack.
webhttrack
Aplicación gráfica para clonado de sitios web
Para instalarla solamente debemos ejecutar:
apt-get -y install webhttrack
Si la web necesita algún tipo de acceso, permite definir el usuario y contraseña para el acceso, y además te permite clasificar todas las webs que descargues.
Incluye un navegador off-line para poder navegar de forma desconectada por cualquiera de las web que hayas descargado.