Las fotos, el backup, y la conectividad que nos prometieron

Últimamente le estoy dando vueltas a cómo hacer el backup a mi colección de fotografías, y eso me ha ido llevando hasta otras divagaciones sobre dónde quiero que esté cada uno de mis datos, y qué seguridad me da que estén allí.

Todo empieza hace ya unos cuantos años, cuando empezaba mi vida laboral poquito antes de cambiar el siglo, en un momento en que cada vez se vislumbraba más el despegue del estilo de vida web. Entonces en el mundo empresarial se hablaba mucho del outsourcing y de la gestión remota de las aplicaciones, pero todavía no nos atrevíamos a hablar muy fuerte de estos temas para los usuarios finales.

Con el tiempo, nos hemos acostumbrado a cosas que en su día nos parecieron descabelladas: Primero fueron las cuentas de Hotmail gratuitas, imprescindibles hasta Gmail osó ofrecer 1Gb a los usuarios, y luego llegó Youtube, que alojaba nuestros videos gratis, y los servía libremente por streaming. Poco a poco hemos ido rompiendo barreras, hasta llegar a tener casi una vida online.

Yo, por ejemplo, me encuentro con que ahora mismo cada PC que utilizo es casi mi PC: Gmail sobre Google Apps aloja el correo de mi dominio y desde hace poco los contactos de mi móvil (powered by Android ;) ), Google Calendar gestiona mi tiempo, Dropbox mis ficheros más imprescindibles, Flickr la cara pública de mis fotos, Google Docs empieza a guardar algunos de mis documentos, y varias y variadas aplicaciones llevan mi vida social (más o menos centralizadas en Friendfeed, que ya casi podría considerar el sustituto de lo un blog personal).

Cada vez se escapa menos a mi mundo online, hasta el punto que si un día me limpian la casa entera, los únicos datos que no podría recuperar serían mi histórico de fotos, y ahí me cruzo con el principio del post: ¿cómo debería hacerles backup?

La alternativa “tradicional” sería usar CDs y DVDs pero, haciendo un cálculo rápido, si en el 2008 he almacenado unas 5000 fotos, divididas en 36 grupos (que a veces son sesiones de una hora, y a veces viajes de una semana), que en total ocupan unos 38 Gb, necesitaría unos 8 o 9 DVDs al año para tener una copia, aunque seguramente serían 10 o 12 si intentamos no liarla dividiendo sesiones largas en varios discos.

Antes de pasarme al mundo reflex hacía del orden de uno o dos discos (en ese caso CDs, porque los DVDs eran caros para ser rentables) de fotos al año, y ahora hablo de 10 o 12 discos (DVDs, porque los BlueRay se van de precio). Siguiendo esta progresión, de multiplicar por 10 el número de consumibles cada 5 años, y si mis manos me dejan hacer fotos hasta los 80, ese año almacenaré cerca de 10.000.000.000 cosas (las que sean) en la estantería. Esta estadística es absurda, porque nadie sabe qué tecnología usaremos entonces, pero la conclusión es que si no me voy adaptando cada cierto tiempo mejor me mudo a una nave industrial :-P

Suponiendo entonces que hoy en día es más cómodo y barato tener discos duros me planteo dos alternativas: un par de discos de 500Gb replicados a mano, o bien dos discos en RAID. Al contrario de la opinión de muchos, yo elegí la primera opción (un disco externo como almacenamiento on-line, que periódicamente conecto a otro PC para hacer backup), porque nunca me ha convencido confiar en la redundancia de datos como única medida de seguridad.

Las razones de esto son varias, pero quedan reflejadas en noticias como ésta: el servicio de blogs Journalspace confiaba en un sistema RAID para mantener la seguridad de sus datos, pero como sus datos fueron sobreescritos por software, los cambios se vieron segura, rápida y eficazmente reflejados en su magnífico sistema de almacenamiento redundante, y no tenían una copia de donde recuperarlos. Uno puede intentar evitar que pase esto con una administración cuidadosa, con un software a la última, y con un sistema de ficheros avanzado con un buen soporte de journaling, pero nadie está libre de un resbalón administrativo, ningún software está libre de bugs, y un apagón puede hacer milagros si Marte está en conjunción con Júpiter o te pilla actualizando el firmware de la controladora.

Si queremos ser molones montemos un almacenamiento jerárquico con nuestros datos más recientes en RAID 0+1, y los más antiguos en sistemas más lentos, pero si nos vamos a gastar esa pasta que no se nos olvide tener una librería de cintas al final y un currito que los lleve a un armario ignífugo lo más lejos posible. Si alguien puede invertir eso para sus fotos personales, que me diga dónde trabaja para echar un currículum.

Cruzando ahora todas las divagaciones, creo que a estas alturas de la vida ya deberíamos estar todos hablando de sistemas de ficheros online seguros, baratos y eficaces. Servicios como Dropbox demuestran que esto no es una utopía, pero aún tenemos muchos handicaps. El principal es que las líneas de comunicaciones WAN actuales aún no son como las LAN de antaño, aunque nos lo hagan creer, porque si bien es posible para gran parte de los usuarios (entre los que desgraciadamente no me incluyo) tener los 10Mbps de bajada que tenía nuestra Ethernet de siempre, pocos pueden disponer de esa velocidad de subida, con lo cual el almacenamiento online se vuelve lento y propenso a cortes.

Me he llegado a plantear darme de alta en servicios como Memopal o Mozi, que podrían ofrecerme este servicio por entre 50 y 70€ anuales, que no es nada descabellado, pero … ¿cuánto tardaría en subir 200Gb de fotos? Con mis 320kbps de subida, así a ojo me salen unos 2 meses de subida intensiva sin hacer absolutamente nada más sin mi PC ni mi ADSL. Podría planteármelo, pero me da pereza pensar en venir de un viaje con 20Gb de fotos y dejar el PC una semana encendido hasta que se sincronicen.

En unos años, cuando las conexiones fijas desaparezcan igual que han desaparecido los teléfonos fijos, y los anchos de banda contra Internet sean comparables, al menos, a las conexiones WIFI actuales (¿alguien dijo WiMAX?), entonces podremos completar la migración a la red en la que llevamos mucho tiempo metidos, y nuestros datos privados estarán igual de online que lo están nuestros datos públicos. Estar siempre conectado no es tener un cliente Twitter en el móvil, sincronizar el correo cada media hora, y subir fotillos borrosas a Twitpic: estar siempre conectado es tener acceso (de lectura, pero también de edición) a tus primeros trabajos del colegio, a tu última nómina, y a las fotos del cumpleaños de tu sobrina con el primer dispositivo conectado a Internet que tengas a mano, sea tu móvil, el netbook de tu novia, el PC de la empresa, el Mac de tu vecino o el respaldo del asiento del avión de un vuelo transoceánico, todo ello con garantías de seguridad y confidencialidad reales. Habrá quien no se fíe de la seguridad que nos proporcione el mundo online, pero suena ingenuo decir eso mientras confiamos en un garabato como firma, en una fecha de caducidad como dato de seguridad de la tarjeta de crédito, o en un fax como prueba judicial.

Todavía nos falta un pelín para llegar a un desligarnos de la posesión de nuestros datos, así que, mientras pueda soltarle el marrón de custodiarlos a algún proveedor de servicios, seguiré teniendo que almacenar en casa mis ficheros RAW. Eso sí, verás como justo cuando necesite recuperar una foto recién borrada, mi maravilloso script backup de una línea (que en un lado empieza por rsync y en el otro por robocopy) no se habrá hecho por algún oscuro motivo.

10 Responses

  1. Gufete says:

    A mi se me ocurre que podrías quedar hacerlo con un amigo, y me explico.

    1º Hago un backup de todas tus cosas importantes. Este backup lo haces multivolumen con el compresor que más te guste. Si quieres, puedes hasta cifrar los ficheros por si no quieres que tu amigo vea el contenido.

    2º Le das a tu amigo “esta primera carga”. Sea por DVD, disco duro externo, quedáis en casa de uno de los dos y lo copias por red… en fin, de la forma que tu veas. Él a tu vez te daría “su primera carga”.

    3º De forma periódica, con la herramienta que más te guste, sincronizáis los contenidos. Sea por Internet, quedando de vez en cuando, como sea. Tu verás la importancia y periodicidad. Internet es especialmente cómoda, sea después de cenar un día cualquiera o un sábado por la mañana.

    Idea 1: elegir un amigo que veas a menudo, como un compi de curro.

    De esta forma, tenemos un P2P distribuido, si quieres cifrado, por lo que el backup lo tienes fuera de casa. Tu tienes un primer backup “near line” (me gusta mucho Time Machine de Apple para esto) y tienes un backup “offline” y fuera de tu casa tirando de tu amigo.

    Si quieres más redundancia-> mete más amigos en el esquema :)

    ¿Herramientas? Pues se me ocurre unison, que es un rsync :) . Un compresor EXTREMO (te recomiendo PAQ http://cs.fit.edu/~mmahoney/compression/#paq). Lo de la compresión EXTREMA (mayúsculas) es porque quieres que tu preciado ancho de banda de subida de Internet no se lo coma hacer un backup.

    Gufete

  2. ganso says:

    Hombre, lo de implicar a tus amigos en tus backups es una idea complicada, pero oye.. puede ser una buena excusa para quedar con gente que hace tiempo que no ves ;)

  3. enhiro says:

    Vaya, debe ser cosa de alguna conjunción planetaria de esas porque justo ayer pensaba yo en lo mismo. En mi caso de momento no sería tan traumatico usar un sistema de backup, porque creo que el total de mis fotos guardadas no llega al tamaño de las que tu puedes hacer en un día de viaje, por lo que veo.

  4. Lucy says:

    Guau!! He leído palabra por palabra y letra por letra. Aparte de una buena lección y repaso tecnológico, es una buena síntesis de una necesidad.

    Hoy por hoy yo también elegiría el almacenamiento en un disco duro externo dado el coste y capacidad de hoy en día, pero a la larga, no creo que sea el sistema más óptimo.

  5. ganso says:

    Como siempre, gracias por los comentarios ;)

    Aprovecho para hacer referencia con una noticia que acabo de leer en Photojojo, y que habla de Backblaze, un sistema de backup online que tiene bastante buena pinta y que tiene la gracia de que te cobran una tarifa plana de $5 al mes ($50 si compras un año completo), subas los datos que subas.

    Para los que manejamos bastantes gigas, no es mala opción… si nuestra subida hacia Internet nos deja permitirnos esos lujos, claro :-/

  6. Vejeta says:

    Hola Goose,

    Para solucionar el problema del backup y que nada sea destruido en los discos existe Venti:
    http://en.wikipedia.org/wiki/Venti

    Venti existe desde hace muchos años en Plan9, pero ya está disponible en otros sistemas.
    Si tienes un servidor Venti, el solito va haciendo copias diarias del estado de tu disco duro. Lo bueno
    es que no ocupa más espacio, ya que si no hay cambios, solo almacena los cambios.

    Y por supuesto, el sistema de ficheros no se verá afectado por despistes que destruyan los datos, ya que el sistema “sólo añade:

    # Since writes are permanent, the file system is append-only (which allows for a simple implementation with lower chance of data-destroying bugs); no file system fragmentation occurs.

    En cuanto me haga con un disco duro externo, con tamaño similar al que indicas, lo voy a poner en funcionamiento.

    !A coger cabrillas!

  7. Un articulo interesantisimo, yo también me estoy planteando los discos duros externos, ahora tengo dos SATA II replicados a mano, cada uno de 500Gb pero aún así tengo que reconocer que me da bastante miedo.

  8. Iker says:

    Una gran reflexión que hace poco pasó también por mi mente. En mi caso acabé haciendo lo mismo que tú; un par de discos duros externos… y a esperar que no se queme la casa con los dos dentro. Además, y como me gusta poder aceder a las fotos en todo momento, uno de los discos es de 2.5″, y así lo puedo llevar siempre encima junto al portátil. Y si no lo llevo encima dejo uno en la ofi y otro en casa. Vamos, que para perder algo tendría que haber un terremoto global o un incendio en todo Vitoria :-P

    Todo esto me surgió cuando empecé a ver que tenía unos 19 DVDs de fotos… ¡¡y por duplicado!! (nunca me he fiado al 100% de un trozo de plástico), así que cuando vi esos 38 DVDs dije… “es momento de cambiar”.

    Ahora sólo me queda la segunda parte de todo esto; antes tenía todos los DVDs catalogados con el iMatch para saber qué foto estaba en qué DVD, pero ahora quiero hacer lo mismo con los discos duros (bueno, con uno valdría) y el LightRoom. Añadir todas las carpetas que tengo creadas, todas con su fecha y descripción básica… y tener un catálogo rápido en el PC. Eso si, reconozco que me da un perezón!! Total, siendo fiel a la hora de poner nombres a las carpetas soy capaz de encontrar casi la foto que quiera con un par de búsquedas o tres en mi disco externo, así que… creo que la idea del LigthRoom seguirá esperando :-P

    Ojalá pronto tengamos una velocidad de subida suficiente como para hacer backups online “rápidos” (poder subir todo en un par de noches o incluso en 6 o 7 sería ideal) porque eso ya sería la leche.

    En fin… me da que cada vez somos más esclavos de nuestra tecnología, cuando debería ser al revés… :-P

    Salu2!
    Iker

  9. ganso says:

    Gracias por el comentario, Iker :)

    En mi caso, uso LightRoom, y una clasificación por carpetas sin etiquetas de ningún tipo, y la cosa funciona bien bien… simplemente tienes que añadir la carpeta raíz local y la del disco externo, y a partir de ahí trabajar íntegramente con él para crear y mover datos, y todo va como la seda.