Jack Wallen le guía a través del proceso de clonación de un sitio web con la herramienta de línea de comandos httrack y la interfaz gráfica de usuario webhttrack.

    Si usted es un desarrollador de sitios web, propietario de un negocio o estudiante en el campo de la TI, probablemente se ha encontrado con una instancia en la que necesitaba clonar rápidamente un sitio web. Digamos, por ejemplo, que tiene un sitio que administra que está teniendo problemas; es posible que desee clonar ese sitio y luego comenzar a depurar el clon. Trabajar con el clon ciertamente supera la posibilidad de romper aún más su sitio original.

    Hay muchas maneras de clonar un sitio. Una solución que he usado ofrece opciones de línea de comandos y GUI, y se llama httrack. La aplicación puede utilizarse en Linux, Windows, macOS y Android, y realiza una copia completa de un sitio web para la navegación local. La herramienta de línea de comandos se llama, como es de esperar, httrack. También existe una versión GUI para Linux llamada webhttrack. Voy a demostrar cómo usar tanto la línea de comandos como las herramientas GUI, para que puedas hacer clones rápidos de tus sitios web. Estaré demostrando ambas versiones de Ubuntu Linux.

    Instalación

    Tanto la línea de comandos como las herramientas GUI se pueden encontrar en los repositorios estándar. Para instalarlos, abra una ventana de terminal y ejecute el comando:

    sudo apt install httrack webhttrack

    Cuando se le solicite, escriba la contraseña de sudo, acepte la instalación y permita que se complete. Eso es todo lo que hay que hacer para instalar las herramientas.

    Uso de la línea de comandos

    Primero copiaremos un sitio usando la herramienta de línea de comandos. Esto puede tomar algún tiempo, dependiendo del tamaño de su sitio. El comando para hacer la copia es:

    httrack http://SITE_URL -O LOCALDIRECTORIO

    Donde SITE_URL es la URL real del sitio que desea copiar y LOCALDIRECTORY es el directorio en su unidad local para almacenar la copia. Una vez completado el comando, verá el clon recién creado en LOCALDIRECTORIO. A continuación, puede empezar a trabajar con ese clon sin afectar a su sitio de producción.

    La mayor advertencia al usar esta herramienta es que, dependiendo de cómo se escribió el sitio y cómo está alojado, sus resultados pueden variar. Si encuentra que httrack descarga poco más que un archivo índice, lo más probable es que no funcione en su sitio. He encontrado, hasta ahora, que los sitios de WordPress, especialmente aquellos alojados en hosts de terceros, son casi imposibles de clonar usando esta herramienta.

    uso de GUI

    La herramienta GUI le da un poco más de poder para el usuario. Para iniciar la GUI, abra una ventana de terminal y emita el comando webhttrack. Esto abrirá una ventana del navegador con la interfaz gráfica lista. En la primera pantalla, seleccione su idioma y haga clic en Siguiente >>. En la siguiente ventana (), introduzca un nuevo nombre de proyecto y seleccione una de las categorías predefinidas. Escriba una ruta base para alojar los archivos descargados y haga clic en Siguiente >>.

    En la siguiente ventana ), seleccione la acción a utilizar (ya que se trata de una primera descarga, la predeterminada estará bien) y escriba la URL del sitio de destino en el cuadro de dirección.

    Haga clic en el botón Establecer opciones y podrá configurar opciones como el ID del navegador, las reglas de análisis, las reglas del robot, el número de conexiones, el proxy, los límites, etc. .

    Si ejecuta un clon y descubre que falla, lo más probable es que tenga que volver a visitar la sección Opciones y hacer ajustes. Esto, por supuesto, dependerá del tipo de sitio que estés intentando clonar. Una vez que haya configurado las opciones exactamente como las necesita, haga clic en Aceptar y luego en Siguiente >> y luego haga clic en el botón Inicio>>. En este punto ), el sitio comenzará la clonación (guardándolo en el directorio local configurado.

    Cuando la descarga se complete, puede empezar a trabajar con su clon.

    No es perfecto, pero ayuda

    Siempre y cuando no estés intentando descargar un sitio WordPress, httrack o webhttrack harán un gran trabajo descargando un clon de tu sitio, para que puedas depurar, hacer una copia de seguridad, o cualquiera que sean tus necesidades. Como dije, dependiendo del tipo de sitio con el que quieras trabajar, tendrás que jugar con la configuración para que esto funcione. Pruebe esta práctica herramienta y vea si no termina siendo su herramienta de clonación de sitio.

    Boletín Semanal de Código Abierto

    No se pierda nuestros consejos, tutoriales y comentarios sobre el sistema operativo Linux y las aplicaciones de código abierto. Entregado los martes

    mismo

    Vea también