Computación

Internet no olvida

Todo lo que se publica se guarda en las profundidades de algún disco duro en algún servidor de un portal (quizás Facebook, YouTube, repositorios de archivos, respaldos en la nube, etcétera) y eventualmente se puede recuperar.
domingo, 1 de mayo de 2022 · 21:18

CIUDAD DE MÉXICO (proceso.com.mx).–Una de las frases más populares es que Internet no olvida. Y es cierto, todo lo que se publica se guarda en las profundidades de algún disco duro en algún servidor de un portal (quizás Facebook, YouTube, repositorios de archivos, respaldos en la nube, etcétera) y eventualmente se puede recuperar. Es obvio que para ello se requiere de algún medio de almacenamiento y sorprende, por ejemplo, saber que YouTube recibe por minutos unas 500 horas de archivos de video. Y aunque estos puedan ser comprimidos, la cantidad de información a guardar es francamente enorme, pero de verdad, enorme. Desde luego no solamente se suben videos. Facebook recibe por minuto unas 243 mil 55 nuevas fotos y estas se encuentran disponibles en las diferentes páginas del portal para cada usuario. De nuevo, son números impresionantes. Recuérdese, estamos hablando de imágenes POR MINUTO.

Pero algo que tiene Internet es su dinamismo, y las páginas que se crean se modifican constantemente. En muchas ocasiones con el tiempo, las páginas cambian de diseño, se baja información que aparentemente ya no es útil y sin embargo, existen métodos para guardar esta información incluso sin que sus creadores lo sepan o tengan control de esto. Por ejemplo, archive.org, en el 2022, ya había acumulado copias de sitios web que incluye: 34 millones de libros y textos, 7 millones de películas, videos y shows de TV, 800 programas de software, 14 millones de archivos de audio, 4 millones de imágenes, 1 millón de archivos multimedia, 2 millones de clips de TV y 681 mil millones de páginas a través de Wayback Machine, un sistema que saca copias de las páginas de Internet.

Y uno puede preguntarse, ¿para qué sirve, por ejemplo, guardar 800 programas de software que ya nadie usa o le interesa? La realidad es que mantener un registro del pasado nos permite tener perspectiva sobre quiénes somos y hacia dónde vamos. Y el software es al final de cuentas una producción de cómo pensamos, de cómo hemos resuelto los diferentes problemas que a través del cómputo hemos solucionado. Los programas que usábamos en el pasado son una estupenda referencia que nos muestra incluso las dificultades por las que pasamos debidos a las limitaciones que siempre impone el hardware.

Los estudiantes de programación, por ejemplo, no pretenden resolver hoy en día -de cero- los problemas de cómputo que tienen. Hoy en día hay bibliotecas de procedimientos, de rutinas, de funciones, escritas en todos los posibles lenguajes de programación, y que indican cómo resolver los problemas típicos. De esta manera, los programadores de hoy pueden dedicarse a resolver el código particular del problema que tienen y no tener que lidiar con la creación típica de editores de texto, o rutinas que hagan cálculos numéricos o que procesen imágenes, entre otras cuestiones.

Por ejemplo, hoy quienes usamos Windows vemos que se tienen un número interesantes de funciones que da el sistema operativo. Pero curiosamente, estas funciones, “nuevas para los usuarios de Windows”, existen desde hace años en sistemas como Unix, que estableció una serie de prácticas para hacer la programación más ágil y eficiente. De hecho, en el caso del correo electrónico, algunos paquetes de software de Unix -que tiene más de 50 años- hacen cosas que hoy se venden como novedosas en los sistemas operativos modernos.

Por ello, siempre es interesante echarle un ojo a lo que ocurría en el pasado. En Archive.org, por ejemplo, hay una serie de imágenes de discos compactos (CDs), que contienen unos 640 megabytes (cada uno) de rutinas de programación en una serie de tópicos. Muchas empresas de programación, como Borland, por ejemplo, tiene respaldo de sus paquetes de desarrollo en archive.org, incluyendo los discos originales, que pueden ser descargados para quien quiera usarlos. Es evidente que muchos de estos programas quizás ya no se puedan ejecutar en los sistemas operativos modernos, pero bien se puede ver qué hicieron al paso del tiempo y copiar las partes que podrían ayudarnos, eventualmente.

Como ejemplo de las virtudes de archive.org, podría decirles de una experiencia personal: buscaba fotografías de 24 bits (es decir, toda la posible gama de colores que se pueden poner en una pantalla de la PC) para un proyecto de imágenes. Conseguí colecciones con 30 mil y 60 mil imágenes en diversas imágenes binarias de discos compactos. Cabe señalar que estas colecciones hace 30 años de vendían por unos 100 o 2000 dólares y hoy, gracias al mencionado portal, se pueden tener accesibles e incluso, de forma gratuita.

Pero si el lector cree que esto es todo, le sugiero le eche un ojo a b-ok.lat, un sitio que contiene más de 10 millones de libros y 84 millones de artículos técnicos e incluso, mucha de esta información está actualizada y sorprendentemente aunque ilegal para sitios como Facebook, no parece haber restricciones para que los usuarios descarguen gratuitamente unos 10 libros por día. Así que quizás los seres humanos necesitemos más de una vida para poder absorber y usar toda esta información que gracias a que “Internet no olvida” la seguimos teniendo presente.

Comentarios