Volltextrecherche im Internet Archive mit Open Library

Open Library ist “ein Projekt zur kollaborativen Erstellung einer auf einer bibliographischen Datenbank basierenden Online-Bibliothek. Selbsterklärtes Ziel der Open Library ist es, eine eigene Webseite für jedes bislang veröffentlichte Buch zu schaffen. In vielen Fällen wird dabei über den bibliographischen Nachweis hinaus auch der Zugang zum Digitalisat des jeweiligen Buchtitels mit hinterlegtem Volltext ermöglicht.” (Wikipedia: Open Library)

Als Teilprojekt des Internet Archive eignet sich Open Library dabei auch für die Suche in den dort enthaltenen Beständen. Unter der Rubrik “Digitale Medien” kann nun auch über den Karlsruher Virtuellen Katalog (KVK) im Internet Archive gesucht werden (Klaus Graf in Archivalia).

In einem früheren Beitrag habe ich bereits vorgestellt, wie mit dem Site:-Operator per Google-Suche auf die Volltexte im Internet Archive zugegriffen werden kann. Wikisource liefert hier eine gut durchdachte Variante:

site:archive.org/stream/ filetype:txt *
(Das Sternchen * im Eingabefeld muss dann nur 
durch den gewünschten Suchbegriff ersetzt 
und die Suche gestartet werden.)

Klaus Graf macht in Archivalia auf die Volltextsuche der Open Library aufmerksam. Diese möchte ich anhand des Suchbegriffs “Allmende” vorstellen und lasse nach diesem suchen. Es erscheint eine Trefferliste mit der Kurzfassung der bibliographischen Angaben jedes gefundenen Werkes:

AllmendeA

 

 

 

 

 

 

 

 

 

Im folgenden verwende ich “Beiträge zur kenntnis der allmendverfassung” von “Ahron Eliasberg” als Beispiel. Mit einem Mausklick auf den Namen des Werkes oder Autors gelangt man zu den jeweiligen Datensätzen der Open Library. Unter den bibliographischen Angaben der Suchtreffer werden ausgewählte Fundstellen mit dem hervorgehobenen Suchbegriff angezeigt. Zwar erscheint über der Liste die Anzahl aller ermittelten Treffer, aber leider keine Anzahl der Treffer innerhalb eines bestimmten Werkes. Die hier angezeigten Fundstellen sind nicht vollständig, erst die Funktion “snippets in situ” zeigt die einzelnen Treffer im Originalkontext:

AllmendeB

 

 

 

 

 

 

 

 

“beitrgezurkennt00eliagoog” ist der Identifier des Items im Internet Archive, mit dem die Links zu den Metadaten und in diesem Fall zum Volltext gebildet werden:

https://archive.org/details/beitrgezurkennt00eliagoog

Der “Read”-Button mit dem Buchsymbol führt direkt zum Online-Reader des Internet Archive. Auf der Leiste zum Blättern erscheinen nun Lesezeichen für die Fundstellen im geöffneten Volltext:

AllmendeC

 

 

 

 

 

 

 

 

 

 

Mit den Lesezeichen lassen sich nicht nur die einzelnen Seiten mit den Fundstellen gezielt aufrufen, sondern sie ermöglichen eine Vorschau auf die jeweilige Seite, die aber nicht vollständig ist.

Blättert man durch die Seiten im Volltext, werden die gefundenen Wörter farbig unterlegt angezeigt. Durch die hier vorgestellten Funktionen ist diese Suche zur Orientierung überaus praktisch, doch nach wie vor gilt Klaus Grafs Kommentar:

Jedes beim Internet Archive hochgeladene Buch erhält eine OCR, die bei Frakturschriften nach wie vor unbrauchbar ist und bei Antiquaschriften in der Regel auch nicht besonders gut. Dieser E-Text wird häufig von der Google-Websuche erfasst.

Für dieses Problem gibt es in Wikisource ein paar Suchtipps. Nach einigen Probeläufen halte ich die Suche mit dem Site:-Operator von Google nach wie vor für ergiebiger.

Recherche im Internet Archive

Das Internet Archive orientiert sich an der Vision, die Gesamtheit des menschlichen Wissens allen verfügbar zu machen. Schon jetzt hat diese Vision zu bemerkenswerten Resultaten geführt. Losgelöst von der kreativen Energie, zu der diese Vision beflügelt, bleibt besonders zu klären, welcher Wissensbegriff diesem utopischen Entwurf unterliegt.

Persönlich bin ich ein großer Fan dieses Projektes und stöbere gerne ausgiebig in den digitalen Beständen. Besonders gefällt mir dabei, dass neben der Erstellung und Pflege digitaler Bestände mit der Eröffnung der physischen Sektion ebenfalls Sorge für die Erhaltung des gedruckten Buches als Kulturgut getragen wird.

Nun möchte ich kurz skizzieren, wie ich Google für die Recherche in den Beständen des Internet Archive nutze. Damit meine ich besonders die Volltext-Recherche. Google erlaubt es, die Suche auf einzelne Internetseiten zu begrenzen. Suchen möchte ich nach dem Zitat von Walter Benjamin über die Kartothek eines Wissenschaftlers, gebe also bei Google ein:

kartothek site:archive.org

“Kartothek” ist hier mein Stichwort, “site:archive.org” begrenzt die Suche auf die entsprechende Internetseite. Nun erscheint eine Trefferliste, bei der die gelisteten Fundstellen mit “Full text of” beginnen. Dies sind natürlich die Fundstellen in den Volltexten. Ich klicke mit der Maus auf “Full text of “Einbahnstraße” – Internet Archive”, weil ich weiß, dass “Einbahnstraße” ein berühmtes Werk von Benjamin ist.

Mit dem Link gelange ich zum Volltext des Textes und kann mit meinem Browser innerhalb des Textes nach dem Stichwort “Kartothek” suchen: Vier Treffer werden angezeigt, und die Suchfunktion meines Browsers bringt mich zum gesuchten Zitat und seinem Kontext, durch die Zeichenerkennung etwas entstellt:

(Und beute scbon ist das Buch, wie die aktuelle wissen-
scbaftlicbe Produktionsweise lehrt, eine veraltete Vermitt-
lung zwischen zwei verscbiedenen Kartothekssystemen.
Denn alles Wesentlicbe findet sich im Zettelkasten des
Forscbers, der’s verfaBte, und der Gelebrte, der darin
studiert, assimiliert es seiner eigenen Kartothek.)

Die Überschrift des Textes heißt hier: “YEREIDIQTEH BUCHERREVISOR”. Etwas weiter oben im Volltext findet sich die Seitenangabe: 26. Ganz oben über dem Volltext findet sich die Überschrift “Full text of “Einbahnstraße”” mit dem Link zum Archiveintrag. Nun kann man auf der linken Seite “Read Online” wählen und im Reader zur Seite 26 Blättern. Die Seitenzahl bringt mich in die Nähe des Textes, wenige Seiten später treffe ich – durch die Überschrift – auf die gesuchte Stelle. Nun habe ich die bibliographischen Angaben zum gesuchten Zitat sowie einen direkten Link für Belege in digitalen Publikationen:

http://archive.org/stream/Einbahnstrae/BenjaminEinbahnstrae#page/n25/mode/2up

Hier ist die doppelseitige Ansicht ausgewählt.

Mit Hilfe von Google lassen sich so viele Treffer ermitteln, besonders was die Suche nach unselbständigen Publikationen oder besonderen Stichworten (Ortsnamen, veraltete Ausdrücke) betrifft. Aber aufgrund der Qualität der Scans und der Volltexte sollten die Suchabfragen stark variiert werden.

Die Möglichkeit direkter Links zu digitalisierten Quellen stellt einen bisher kaum gehobenen Schatz dar. Klaus Graf nutzt diese Möglichkeit direkter Online-Belege – hier ein Beispiel – in dem von ihm administrierten Gemeinschafts-Blog Archivalia.

Digitale Straßenbibliotheken Teil I: Das Projekt Ingeborg als die ultimative virtuelle Stadtbibliothek Klagenfurt

Der textKaiser-Blog aus Österreich brachte auf den Punkt, was gesagt werden muss:

“Und während Politiker noch immer über Gründe nachdenken, wie man eine Stadtbibliothek “wegargumentieren” könnte, hat sie das digitale Zeitalter bereits längst überholt. Es braucht nicht viel um Statements zu setzen und selbst aktiv zu werden. Nur ein bisschen Kreativität und den Willen dazu.”

Erstaunlicherweise findet sich im Pressespiegel auf der Projektwebseite kein einziger Artikel aus Deutschland, dagegen sind sogar Meldungen über das Projekt aus Argentinien, USA, Taiwan, Italien, Frankreich und Russland sehr gut vertreten. Georg Schröder aus Essen berichtete als einer der wenigen Deutschen in seinem Blog padlive.com darüber und stellte am Ende die Frage, ob er die Stadt Essen ansprechen solle? Bitte Herr Schrörder sprechen Sie die finanziell klamme Stadt Essen an, die einen Neubau ihres Fußballstadions mitfinanzierte und stattdessen Zweigstellen schließt bzw. zusammenlegt.

Das Projekt, das hier vorgestellt wird, ist nach Ingeborg Bachmann benannt, der berühmtesten Tochter von Klagenfurt. An über 100 Stellen befinden sich in der Stadt gelbe Sticker (wie unten abgebildet). Ziel ist es Newcomer zu fördern, indem deren Musik und schrifstellerische Kostproben kostenfrei an unterschiedlichen Stellen in Klagenfurt und Umgebungverfügbar gemacht werden.

Die Idee des Projekts Ingeborg stammt von Georg Holzer & Bruno Hautzenberger. Die Idee entstand bei kühlen Bieren im Jazzkeller Kamot. Dabei existierte der Wunsch etwas mit der NFC-Funktechnik zu machen. Darüber hinaus sind auch andere Helfer, Unterstützer und Mitarbeiter zu nennen, welche nun engagiert an pingeb.org mitarbeiten: (Kerstin Rosenzopf, Iris Wedenig, Verena Artinger oder Daniel Gollner).
Im folgenden Video erklärt Georg Holzer das Projekt und vergleicht es mit einer digitalen Stadtbibliothek. Er plädiert für eine freiere Zugänglichmachung von digitalen Inhalten, als das bislang der Fall ist. Hinzu kommt die Tatsache, dass die Hauptstadt von Kärnten, die einzige mitteleuropäische Stadt ohne eigene Stadtbibliothek ist.

Der Ingeborg-Bachmann-Wettbewerb ist ja so etwas wie das kulturelle Aushängeschild der Stadt. Junge, zumeist unbekannte Autoren erhalten drei Tage die Möglichkeit ihre Texte Experten und einem breiten Fachpublikum zu präsentieren, was auch im Fernsehen (3Sat) übertragen wird. Am Ende wählt eine Fach-Jury die Preisträger aus. Dieser Preis zählt mit zu den wichtigsten literarischen Auszeichnungen im deutschsprachigen Raum. Autoren wie Peter Glaser, Wolfgang Hilbig, Peter Wawerzinek, Emine Sevgi Özdamar oder Franzobel erhielten diesen Preis und wurden so einem breiteren Publikum bekannt. Eben dieser Preis und dessen Außenwirkung war auch der Entstehungsgrund für das von Holzer & Hautzenberger entwickelte Projekt Ingeborg. Mitte Juli gab es bereits 70 QR-Codes verteilt über die ganze Stadt. Inzwischen sind es schon über 100.

Mitmachen können nur Autoren oder Musiker aus dem Raum Klagenfurt. Die Promotion durch das Projekt pingeb.org kostet den Jungkünstlern keinen Cent. Ziel ist es Spannung auf einem geografisch eingeschränkten Raum zu erzeugen. Weiterlesen

Wales: Ausleihrückgang bei Büchern

Zwei seperate Studien zeigen, das die Ausleihzahlen bei Büchern in dem Maße fallen, wie Studenten und Personal sich dem Computer zuwenden. Bibliotheken reagieren auf die neuen Bedürfnisse der Nutzer, die flexiblere Lernmethoden fordern.

Die Zahl der ausgeliehenen Bücher an der Swansea University hat sich in den letzten fünf Jahren von einer Million Bücher auf 400.000 reduziert. Hingegen wurden zwischen August 2005 und Julie 2006 600.000 Volltexte elektronischer Zeitschriften heruntergeladen, was mit dem Rückgang bei den Büchern korrespondiert.

Von 980 Studenten

  • besuchten 8% die Bibliothek mehrmals am Tag;
  • 25% nutzten das Universitätsnetzwerk mehrmals am Tag;
  • 13% gingen zumindest einmal am Tag in die Bibliothek;
  • 17% nutzten einmal am Tag die Bibliothek nur, um Zugang zum Netzwerk zu erhalten.

Quellen:
Carver, Blake: Borrowing University books falls as students turn to internet:engl: via LISNews.org
Wightwick, Abbie: Borrowing uni books falls as students turn to internet:engl: auf icWales.co.uk

Open Access-Publishing im Kommen

Der Trend für Open Access-Publishing-Angebote geht nach oben.
Der Verlag BioMed Central Ltd. (author-pays-Modell) hält sich an die in den sogenannten BBB-Deklarationen von Bethesda:engl:, Budapest:engl: und Berlin:engl: artikulierten Forderungen zum uneingeschränkten und unentgeltlichen Zugang zu den Ergebnissen der öffentlich finanzierten Forschung.
Für dieses Jahr sind vom Verlag sieben weitere Journale in den Fachdisziplinen Physik, Mathematik und Informatik angekündigt worden. Im Web-Portal PhysMath Central:engl: können ab diesem Monat in drei neuen Zeitschriftenreihen “PMC Physics A” (für die Fachgebiete Elementarteilchen-, Hochenergie- und Kernphysik, Kosmologie, Gravitation), “PMC Physics B” (Atom- und Molekularphysik, Optik, Quantenphysik, Halbleiter und Supraleitung) und “PMC Physics C” (Biophysik, Plasmen und Fluide, Komplexe Systeme und Statistische Mechanik) erste Beiträge eingereicht werden. Andere Zeitschriften sollen später folgen.
Die Kosten (authors fee) für Workflow, Archivierung und Peer Review hat der Verlag bis jetzt nicht bekannt gegeben.

Authors publishing with PhysMath Central retain the copyright to their work, licensing it under the Creative Commons Attribution License:engl: . This license allows articles to be freely downloaded from the PhysMath Central website, and also allows articles to be re-used and re-distributed without restriction, as long as the original work is correctly cited.

Gegen eine Gebühr schalten auch etablierte Wissenschaftsverlage den Link zum elektronischen Volltext des betreffenden Artikels frei.

Die Marktführer Elsevier, Springer und Wiley verlangen dafür von den Autoren eine Einmalzahlung von 3.000 US-Dollar (2.320 Euro).

Zahlreiche Forschungsorganisationen wie DFG, Max-Planck-Gesellschaft, National Science Foundation (USA) haben in ihren Förderrichtlinien bereits verankert, dass die Finanzierung der Veröffentlichungskosten aus den Projektmitteln getätigt werden können.

Quelle:
Open-Access-Publishing expandiert via heise online (mit Linkliste zu älteren Artikeln zum Thema OA)