[Kurz] Wohin mit alten Websites?

Es ist auch eine nette Art, ein digitales Archiv für Websites “Cyber Friedhof” zu nennen.

In der zunehmend digitalisierten Welt ist der Cyber Friedhof ein Archiv für offizielle Dokumente der US-Regierung, die nicht mehr auf Papier gedruckt wurden. Betrieben wird der Cyber Cemetry durch die University of North Texas und das U.S. Goverment Printing Office.

Associated Press schreibt sehr ausführlich dazu.

Quelle:
Where Do Dead Govt Websites Go? To The Cyber Cemetery via LISNews

Nestor-Handbuch Version 2.0 ist online

nestor-Handbuch:
Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
Version 2.0 – Juni 2009
Herausgegeben von: Heike Neuroth, Achim Oßwald, Regine Scheffel, Stefan Strathmann, Mathias Jehn

Deckblatt Nestor-Handbuch Version 2.0

Neben den aktualisierten Beiträgen gibt es auch eine ganze Reihe von neuen Artikeln. Besonders hervorzuheben sind hier:

11 Speichersysteme mit Langzeitarchivierungsanspruch
11.1 Einführung
Heike Neuroth
11.2 Repository Systeme – Archivsoftware zum Herunterladen
Andreas Aschenbrenner
11.3 Speichersysteme mit Langzeitarchivierungsanspruch
Karsten Huth, Kathrin Schroeder, Natascha Schumann

und

18 Praxisbeispiele
18.1 Einführung
Regine Scheffel
18.2 Langzeitarchivierung von elektronischen Publikationen durch die Deutsche Nationalbibliothek
Maren Brodersen, Sabine Schrimpf
18.3 Langzeitarchivierung eines digitalen Bildarchivs – Projekt zum Aufbau eines Langzeitarchivs für hochaufgelöste digitale Bilddateien des Staatsgalerie Stuttgart am BSZ
Werner Schweibenz, Stefan Wolf
18.4 ARNE – Archivierung von Netzressourcen des Deutschen Bundestages
Angela Ullmann

[Update]Das Buch steht kostenfrei zum Download bereit.[/Update]
Das Handbuch steht unter einer Creative Commonson Lizenz 3.0: BY-NC-SA.
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung Version 2.0, Juni 2009 können Sie auch für 24,90 € in gedruckter Form erwerben.

Bitkom-Leitfaden zur Pflichtablieferung von Netzpublikationen

Bitkom, der Deutschen Industrie- und Handelskammertag (DIHK) und die Deutsche Nationalbibliothek (DNB) haben sich über einen Leitfaden zum Umgang mit der Verordnung über die Pflichtablieferung von Netzpublikationen an die Nationalbibliothek verständigt.

Oktober 2008 wurde die Pflichtablieferung von Netzpublikationen im Rahmen der “Verordnung über die Pflichtablieferung von Medienwerken an die Deutsche Nationalbibliothek” (PflaV) festgeschrieben. Es sollen nunmehr nicht nur “körperliche Medienwerke” (Printmedien, Datenträger), sondern auch “unkörperliche Medienwerke” (Online-Medien) dauerhaft gesammelt und archiviert werden.

Das Gesetz über die Deutsche Nationalbibliothek (DNBG) und auch die PflaV lassen viele Fragen offen.

Welche Webpublikationen werden erfasst? Sind betroffene Online-Autoren verpflichtet, selbst relevante Publikationen einzureichen? In welcher Form müssen zu erfassende Netzpublikationen bei der Deutschen Nationalbibliothek abgeliefert werden? Und wird man bestraft, wenn man der Pflichtablieferung nicht nachkommt?

§ 3 Abs. 3 DNBG bezeichnet ohne genauere Unterteilung als Medienwerke in unkörperlicher Form “alle Darstellungen in öffentlichen Netzen. Recht schnell nach Inkrafttreten der PflaV wies die DNB darauf hin, dass nicht alle Blogger, Foren- oder private Websitebetreiber aktiv an die Nationalbibliothek herantreten müssen oder zu den Betroffenen zählen. Aber Unklarheiten blieben dennoch bestehen.

Der nun veröffentlichte Leitfaden (öffnet sofort) von Bitkom und DIHKsoll den potentiell Betroffenen helfen, die Auswirkungen auf ihre Angebote einschätzen und Missverständnisse im Vorfeld ausräumen zu können.

Wichtig ist aus Sicht von BITKOM und DIHK, dass derzeit kein Homepage-Inhaber selbst aktiv werden muss.

Die Webanbieter müssen nicht befürchten, dass sie ohne Aufforderung durch die Deutsche Nationalbibliothek zur Abliegerung verpflichtet sind und dass sie so auch nicht mit einem Bußgeld- oder Ordnungswidrigkeitsverfahren rechnen müssen.

Die DNB setzt vor allem auf eine automatische Sammlung der Inhalte durch Harvesting. Sie kann daher aus technischen Gründe nicht jede digitale Veröffentlichungsform im Internet sammeln, sondern nur solche, die “vergleichbar mit entsprechenden körperlichen Werken” und frei zugänglich sind. Eingeschränkt zugängliche Online-Werke unterliegen der Abgabepflicht, wenn durch ein entsprechendes Entgelt – wie bei E-Journals üblich – jeder Zugang erhalten kann. Die DNB erarbeitet Kriterien zu den von einer Ablieferungspflicht betroffenen Publikationen, um für eine mittel- und langfristige Sicherheit bei den Betroffenen zu sorgen.

Der Leitfaden, der von der Bitkom zur Verfügung gestellt wird, wird ständig aktuell gehalten und entsprechenden Veränderungen angepasst. Hilfreich ist auch die Zusammenstellung der Frequently Asked Questions der DNB

Auf Länderebene ist der Entwicklungsstand, sowohl was die gesetzlichen Regelungen zur Pflichtablieferung von Netzpublikationen als auch die technische Seite angeht, von Bundesland zu Bundesland derzeit noch sehr heterogen.

Leitfaden

Hinweise zur Pflichtablieferungsverordnung (öffnet sofort) – Bitkom

Quelle

Leitfaden zur Verordnung über die Pflichtablieferung von Netzpublikationen veröffentlicht via heise online
Pflichtablieferung von Web-Inhalten an den Staat – bitkom
Information zum derzeitigen Stand der Pflichtablieferung von Netzpublikationen an die Deutsche Nationalbibliothek 28.01.2009 des Sozialdienst katholischer Frauen

Österreichs alte Websites

Zwanzig Jahre WWW, in dem zunehmend unsere Kultur, unser Wissen und unsere Welt abgebildet wird. Es ist verteilt auf zig Milliarden Webseiten, wobei ich es erstauntlich finde, dass die durchschnittliche Lebenszeit einer Seite zwischen 44 und 75 Tagen sein soll. Oder ist sie danach einfach nicht mehr auffindbar.

Webseiten werden seit 1996 duch das gemeinnützige Projekt Internet Archive :engl: in San Francisco gesammelt. Man versucht dort diese digitalen Informationen langfristig zu archivieren, damit sie auch einer künftigen Online-Generation zur Verfügung stehen. Inzwischen sind dort über 85 Milliarden Webseiten erfasst.

Damit auch die “digitalen Schätze” der Alpenrepublik künftig nicht verlorengehen, kümmert sich ab heuer darum der heimische Sammelhort alles gedruckten Wissens: die Österreichische Nationalbibliothek (ÖNB).

Die ÖNB wird das “österreichische” World Wide Web archivieren, d.h. die derzeit rund 800.000 Websites mit einer .at -Endung. Außerdem gehören zum Sammelauftrag auch Adressen mit Endungen wie .eu , .org oder .net , wenn sie einen eindeutigen Österreich-Bezug haben.

Es sollen nicht nur offizielle Websites sondern auch private Seiten wie Blogs oder Online-Fotoalben erfasst werden.

“Wir können nicht wissen, was unsere Nachfolger einmal interessieren wird”, sagt die Leiterin der Abteilung “Digitale Bibliothek” in der ÖNB, Bettina Kann. Auch ein Urlaubsbild von Bibione aus dem Jahr 2009 könne etwa eines Tages Aufschluss über den Tourismus des Ortes geben.

Man hat sich hier für eine Crawler entschieden, der automatisiert Daten sammeln soll. Der erste Lauf soll im Herbst stattfinden. Unbekannt ist das Datenvolumen, das entsprechende Probläufe (2008 zur Fußball-Europameisterschaft und bei der Nationalratswahl) brachten keine signifikanten Maßstäbe. Das Datenvolumen soll nach 5 Jharen etwa 80 Terabyte umfassen. Speicherort der Daten ist dabei nicht die Nationalbibliothek sondern das Bundesrechnungszentrum. Die Kosten werden auf etwa 4 Millionen Euro jährlich geschätzt.

Die Öffentlichkeit soll ab Ende des Jahres auf das Archiv zugreifen. Allerdings sol dies nur an Terminals der ÖNB u. anderer berechtigter Bibliotheken möglich sein.

Quelle:
Wo Österreichs alte Webseiten weiterleben in Der Standard.at, 14.03.2009, S. 22

[Kurz] DRM und LoC – eine Frage der Langzeitarchivierung

The Section 108 Study Group Report :engl: : An Independent Report sponsored by the United States Copyright Office and the National Digital Information Infrastructure and Preservation Program of the Library of Congress Executive Summery:engl:

Study Group Issues Report Recommending Changes in Copyright Law to Reflect Digital Technologies:engl: News der LoC, vom 31.03.2008

Anderson, Nate: Library of Congress: DRM a serious obstacle to archiving:engl: in ars technica

Plieninger, Jügen: DRM verhindert sinnvolle Archivierung via netbib

Blake Library of Congress: DRM a serious obstacle to archiving:engl: via LISnews

Nestor-Handbuch zu Langzeitarchivierung…

…ist in einer ersten Ausgabe (Version 0.1, März 2007) erschienen:

Einzelne, von verschiedenen Experten erstellte Fachaufsätze gestatten einen Einblick in die diversen Themengebiete der Langzeitarchivierung: von technischen und rechtlichen Aspekten bis hin zur Definition von Rahmenbedingungen.

Gut die Hälfte der Beiträge ist allerdings noch “grau”, das heißt in Bearbeitung.

via BSZ

2008: Start der Sammlung von Netzpublikationen

Das Börsenblatt online berichtet, dass die Deutsche Nationalbibliothek ihrem 2006 gesetzlich beschlossenen Auftrag zur Sammlung von Netzpublikationen ab 2008 nachkommen will. Begonnen wird mit Monographien ausgewählter Partner. Gerade aus Sicht der Verleger scheinen viele Aspekt allerdings noch unklar.

Auf der gestrigen Informationsveranstaltung, die der Verleger-Ausschuss des Börsenvereins und der DNB gemeinsam ausrichteten, standen deshalb noch einmal Fakten und Diskussionen im Mittelpunkt. Fazit: die Verlage wünschen sich endlich eindeutige Entscheidungen seitens der DNB.

Die DNB möchte den Verlagen ihre Bedingungen jedoch nicht diktieren, sondern mit ihnen zusammen Lösungen finden.

Quelle:
Lutze, Doreen: DNB startet 2008 Sammlung von Netzpublikationen via Maikatze liest

DNB startet 2008 Sammlung von Netzpublikationen

Ab 2008 soll es nun ernst werden mit dem 2006 gesetzlich beschlossenen Auftrag der Deutschen Nationalbibliothek zur Sammlung von Netzpublikationen. Zunächst soll – in einer ersten Testphase mit ausgewählten Partnern – mit Monographien begonnen werden. Allerdings sind vor allem auf Verlegerseite noch viele – nicht nur technische – Aspekte unklar. Auf der gestrigen Informationsveranstaltung, die der Verleger-Ausschuss des Börsenvereins und der DNB gemeinsam ausrichteten, standen deshalb noch einmal Fakten und Diskussionen im Mittelpunkt. Fazit: die Verlage wünschen sich endlich eindeutige Entscheidungen seitens der DNB.

Den Verlagen nur etwas zu diktieren, liegt der DNB jedoch fern, wie Schwens immer wieder durchblicken ließ. Die DNB wolle einen gemeinsamen Nenner finden, agiere nach dem Motto: minimaler Aufwand bei maximaler Wirkung.

via börsenblatt online

Proprietäre Dateiformate sind ein Problem

Dateiformate, die in proprietären Systemen verwendet werden, müssen auf Dauer rückwärtskompatibel sein, will man die Daten auch noch Jahre später lesen können. Das verursacht einen immer größeren Entwicklungsaufwand bei neuen Versionen. Für eine Langzeitarchivierung ist dies jedoch tödlich.

BBC schreibt dazu:

Digital information could potentially be stored without loss of quality for a very long time to come.
But without knowledge about the encoding, our documents will become a meaningless series of ones and zeroes to future generations, just like cave paintings are too often meaningless bits of colour on stone to us.

Deshalb hat Microsoft:engl: vor kurzem den britischen National Archives:engl: angeboten, bei der Migration älterer proprietärer Dateiformate in aktuelle behilflich zu sein – und sich ein Eigentor geschossen.

Was für eine nette Geste. Allerdings muss man auch mal hinterfragen, wer für dieses Schlamassel verantwortlich ist.
Georg Greve und Joachim Jakobs von der Free Software Foundation Europe:engl: weisen mit vollem Recht darauf hin, dass Microsoft mit seiner Politik der Hauptverursacher des Problems ist. Eine Benutzung von offenen Formaten wie “.odf” hätte das Problem in diesem Ausmaß gar nicht erst entstehen lassen.

Da stellt sich natürlich schon die Frage:

Why did and does Microsoft refuse to participate in the existing standardisation effort?

Quellen:
Microsoft in der Dateiformat-Falle auf Maikatze liest…
Microsoft in der Dateiformat-Falle newsticker.de
Questions for Microsoft on open formats:engl: BBC News

1 2 3