Digitales Gedächtnis

Unwiederbringlich verlorene Daten: Das Internet vergisst doch

Nach 2,5 Jahren etwa 27 Prozent der Quellen verschwunden
AAA

Unwiederbringlich verlorene Daten: Das Internet vergisst dochUnwiederbringlich verlorene Daten:
Das Internet vergisst doch
Stotternde Politiker, betrunkene Promis, peinliche Party-Fotos: Bislang dachte man, dass solche Ausrutscher ewig im Internet bleiben. Doch eine neue Studie kommt zu dem Ergebnis, dass das Netz größere Gedächtnislücken hat als bisher angenommen.

Wenn jemand Karriere machen möchte, braucht er eine weiße Weste. Darauf achten nicht nur Imageberater für Politiker, Wirtschaftsbosse und Prominente: Mittlerweile gibt es professionelle Agenturen, die peinliches Material über eine Person aus dem Internet löschen lassen. Immer wieder wurde auch Konzepte für einen digitalen Radiergummi sowie für selbstzerstörende Daten vorgelegt oder ein Recht auf Vergessen im Internet gefordert. Doch anscheinend sind nach mehreren Jahren schon viele Daten von alleine verschwunden.

Pro Jahr gehen ungefähr 11 Prozent aller Daten im Netz verloren

Im Rahmen der Konferenz "Theory and Practice of Digital Libraries", die diese Woche auf Zypern stattfand, stellten die Informatiker Hany M. SalahEldeen und Michael L. Nelson von der Old Dominion University, Department of Computer Science in Norfolk/Virginia eine neue Studie vor. Das Papier trägt den Titel Losing My Revolution und den Untertitel "How Many Resources Shared on Social Media Have Been Lost?". Es handelt davon, dass Online-Quellen wesentlich schneller ins digitale Nirvana verschwinden als bisher angenommen.

Als Ausgangspunkt dienten etwa 11 000 Links, die zu besonderen Ereignissen in den Jahren 2009 bis 2012 über Twitter verbreitet wurden. Darunter waren zum Beispiel der Tod von Michael Jackson, die Verleihung des Friedensnobelpreises an den US-amerikanischen Präsidenten Barack Obama, die ersten Aufstände in der arabischen Welt sowie die Verbreitung des Schweinegrippevirus H1N1 und die Wahlen im Iran. Diese Links wurden in 476 Millionen Tweets von ungefähr 17 Million Nutzern gepostet. Die Informatiker gehen davon aus, dass die ausgewählten Themen zusammengenommen rund 20 bis 30 Prozent aller Twitter-Posts in diesem Zeitraum ausgemacht haben. Das Ergebnis: Bereits nach einem Jahr waren rund 11 Prozent der Quellen nicht mehr aufzufinden, nach 2,5 Jahren waren bereits 27 Prozent der Quellen verschwunden.

Die Arbeit von Web-Archiven betrachten die Forscher ebenfalls kritisch. Nach einem Jahr hatten diese erst 20 Prozent des Materials archiviert, nach 2,5 Jahren immer noch weniger als die Hälfte - nämlich 41 Prozent. Die Analysten kommen zu dem Schluss, dass darum pro Jahr ungefähr 11 Prozent aller im Internet gespeicherten Daten verloren gehen, danach sind es dann 0,02 Prozent pro Tag.

Mehr zum Thema veröffentlichte Daten im Internet