Todo muere, incluida la información | Revisión de tecnología del MIT
Un poco, según los expertos. Por un lado, lo que pensamos que es permanente no lo es. Los sistemas de almacenamiento digital pueden volverse ilegibles en tan solo tres a cinco años. Los bibliotecarios y archivistas se apresuran a copiar las cosas en formatos más nuevos. Pero la entropía sigue ahí, esperando entre bastidores. “Nuestras profesiones y personas a menudo intentan extender la vida normal tanto como sea posible a través de una variedad de técnicas, pero eso siempre contrarresta la corriente”, dice Joseph Janes, profesor asociado de la Escuela de Información de la Universidad de Washington.
Para complicar las cosas, los archivistas ahora se enfrentan a una avalancha de información sin precedentes. En el pasado, los materiales eran escasos y el espacio de almacenamiento limitado. “Ahora tenemos el problema inverso”, dice Janes. «Todo está permanentemente registrado».
En principio, esto podría corregir un error histórico. Durante siglos, innumerables personas no tenían la cultura, el género o la clase socioeconómica adecuada para que su conocimiento o trabajo fuera descubierto, valorado o preservado. Pero la escala masiva del mundo digital ahora presenta un desafío único. Según una estimación de la firma de investigación de mercado IDC del año pasado, la cantidad de datos que las empresas, los gobiernos y las personas crearán en los próximos años será el doble de todos los datos digitales generados anteriormente desde el inicio de la era informática.
Escuelas enteras dentro de algunas universidades se esfuerzan por encontrar mejores enfoques para salvaguardar los datos bajo su patrocinio. El Centro de datos y servicios para las humanidades de la Universidad de Basilea, por ejemplo, ha desarrollado una plataforma de software llamada Knora no solo para archivar los muchos tipos de datos del trabajo de humanidades, sino también para garantizar que las personas puedan leer y usar ellos en el futuro. Y, sin embargo, el proceso es engorroso.
«No podemos salvarlo todo… pero esa no es razón para no hacer lo que podamos».
andrea ogier
“Haces conjeturas y esperas lo mejor, pero hay conjuntos de datos que se pierden porque nadie sabía que serían útiles”, dice Andrea Ogier, decana asociada y directora de servicios de datos en bibliotecas académicas de Virginia Tech.
Nunca hay suficiente gente o dinero para hacer todo el trabajo necesario, y los formatos cambian y se multiplican todo el tiempo. “¿Cómo asignamos mejor los recursos para preservar las cosas? Porque los presupuestos son tan importantes”, dice Janes. «En algunos casos, esto significa que los elementos se registran o almacenan, pero permanecen allí, sin catalogar ni procesar, y por lo tanto es casi imposible encontrarlos o acceder a ellos». En algunos casos, los archivistas terminan rechazando nuevas colecciones.
Los formatos utilizados para almacenar datos son en sí mismos impermanentes. La NASA ha almacenado alrededor de 170 bandas de datos de polvo lunar, recopilados durante la era Apolo. Cuando los investigadores comenzaron a usar las cintas a mediados de la década de 2000, no pudieron encontrar a nadie con la máquina IBM 729 Mark 5 de la década de 1960 necesaria para leerlas. Con un poco de ayuda, el equipo finalmente encontró uno en malas condiciones en el almacén del Museo Australiano de la Computación. Los voluntarios ayudaron a restaurar la máquina.
El software también tiene una vida útil. Ogier recuerda haber intentado examinar un antiguo archivo de hoja de cálculo de Quattro Pro solo para descubrir que no había ningún software disponible capaz de leerlo.