Ayudando a archivar, archiveteam

Publicado 2024-08-04 by Jaime

Leo en hackernews el esfuerzo de un grupo de archivistas por conservar contenidos de internet y su llamada a colaborar.

Descargo de su página http://archiveteam.org el llamado "Warrior" que te permite descargar en tu ordenador parte de las páginas que se quieren conservar.

Creo una máquina virtual con Virtualbox usando el ova descargado de su página. Lo ejecuto, varios mensajes de que se está actualizando y finalmente una llamada a abrir el navegador.

En el navegador se elige un nombre de usuario y un proyecto. Elijo Reddit que es una comunidad que he leído mucho.

descripción de la imagen

Warrior dice: "Project code is out of date and needs to be upgraded. To remedy this problem immediately, you may reboot your warrior. Retrying after 70 seconds..." y la cosa progresa de 20 en 20 segundos sin arreglarse a pesar de que ya he reinicializado. Lo paro y elijo: "ArchiveTeam's Choice".

Esto si tira y veo inmediatamente un montón de actividad en la ventana del navegador, mostrando localhost:8001. El consumo de memoria parece razonable y las descargas también. El consumo de memoria parece razonable y las descargas también. Iré actualizando si sigo con el proyecto, aún tengo unas cuantas cosas que entender. Actualmente lo veo arhivando los canales públicos de Telegram. Me parece bien.

En las FAQ aclaran que no se puede matar la máquina virtual sin más si no quieres perder lo archivado, aclara que en ese caso las tareas volverán al "pool" al cabo de cierto tiempo y otros warrior podrán reclamarlos.

El método recomendado para parar Warrior sin perder el trabajo hecho es elegir "Shut down" en la interfaz del navegador. También se puede suspender la máquina virtual desde VirtualBox pero si pasan unas cuantas horas el tracker lo re-encolará. Estas cosas no me gustan demasiado, parece uno demasiado presionado por estar con la máquina horas y horas sin apagarla, veremos.