Meilenstein: Volltextsuche in den Digitalisierten Beständen
13. Januar 2022
von KW — abgelegt in: Aktuelles,E-Medien — 7.994 Aufrufe
Von den digitalisierten Beständen der Stabi sind mittlerweile ca. 75 Prozent mit einem Volltext erschlossen – diesen Fundus an zusätzlichen Suchmöglichkeiten in wichtigen historischen Quellen stellen wir Ihnen im Webangebot der “Digitalisierten Bestände” mit der neuen Option “im Volltext” unterhalb des Suchschlitzes zur Verfügung.
In den Suchtreffern erhalten Sie kurze Textvorschauen über die Fundstellen. Diese Textsnippets heben die gefundenen Begriffe kursiv hervor. Wenn Sie einen Treffer anklicken, gelangen Sie sofort zu der Seite, in der Ihre Suchbegriffe auftauchen. Sie werden Ihnen farblich hervogehoben – dazu ggf. den Scan mit dem Mausrad vergrößern. Den Fließtext des kompletten Volltextes für die ganze Seite holen Sie sich über dieses Icon neben den Scan.
In der ausführlichen Recherchehilfe, die Sie über das Fragezeichen erreichen, erfahren Sie, wie Sie mehr aus der Volltextsuche herausholen. Dort werden Ihnen zahlreiche einfache und komplexe Suchoperatoren vorgestellt, mit denen Sie unsere Millionen von Buchseiten nach Ihren Bedürfnissen durchsuchen können. Eingängige Beispiele zeigen Ihnen dabei, wie die Suchoperatoren in der Praxis eingesetzt werden würden.
Sie haben die Möglichkeit den Gesamtbestand zu durchsuchen oder sich gezielt auf einzelne Kollektionen zu beschränken. Bitte beachten Sie aber, dass nicht jede Kollektion zwangsläufig mit Volltexten erschlossen ist. Handschriften und handschriftliche Nachlässe, Karten, Ansichten und anderes Bildmaterial haben in der Regel keine Volltexte.
Die Vorteile der Volltextsuche können Sie übrigens auch jetzt in durchsuchbaren PDFs nutzen, die Sie sich herunterladen können. Wir haben über mehrere Wochen alle PDF-Dateien neu generiert und die vorhandenen Volltexte integriert. Nutzen Sie einfach die Suchfunktion ihres PDF-Readers und navigieren Sie so bequem zu der Fundstelle. Sie können übrigens die Textpassagen auch markieren und direkt in Ihr Dokument kopieren.
Bei den gedruckten Materialien arbeiten wir kontinuierlich im Hintergrund an der Ergänzung um weitere Volltexte. Für handschriftliche Materialien sammeln wir in einem Projekt mit der Universität Hamburg Erfahrungen mit passenden Spezialwerkzeugen für handschriftliche Überlieferung am Beispiel des umfangreichen und bedeutenden Nachlasses von Richard Dehmel.
Einordnung der Qualität der Volltexte
Es liegt leider in der Natur der Sache, dass die Ergebnisse der Volltexterkennung so vielseitig sind, wie die Bücher, die gescannt wurden. Obwohl bereits seit Jahrzehnten an diesem Thema gearbeitet wird, ist es auch weiterhin nicht möglich perfekte Ergebnisse zu erzielen. Schon die Digitalisierung vom Säurefraß geschädigter Bücher ist aufwendig und kompromissbehaftet. Und Wasserschäden, enge Bindungen, welliges Papier und Fehldrucke erschweren dies zusätzlich. Nicht nur muss die automatische Texterkennung OCR solche Schäden mit abfangen, sie muss darüber hinaus unterschiedliche Schrifttypen, Sprachen oder auch Formatierungen, wie sie in den Jahrhunderten des Buchdrucks verwendet wurden, mitberücksichtigen können.
Neugierig geworden? Probieren Sie es aus!
Um unsere Volltextsuche nutzen zu können, braucht es nur einen zusätzlichen Klick. Legen Sie den Schalter von Metadaten auf Volltext um und durchsuchen Sie Millionen von Seiten zeitgleich!
Gratuliere zum Meilenstein!
Ich bin seit 1960 regelmäßiger Nutzer der SUB und immer wieder begeistert, wie – ausgehend vom alten Zettelkatalog in den großen Katalogkästen im Lichthof des Altbaus – sich nach und nach die Zugriffsmöglichkeiten zu den Beständen der SUB immer weiter verbessert haben.
Eine Probesuche zum Bildhauer “Denoth” ergab eben in der Volltextsuche im Handumdrehen 22 Treffer in 19 Dokumenten – davon einige mir sogar neue Fundstellen. Sehr begrüßenswert ist auch die Aufnahme der jüngeren “Personal- und Vorlesungsverzeichnisse” der Universität Hamburg in diese Volltextsuche, hoffentlich kommen die älteren Jahrgänge auch bald dazu.
Ich wünsche dem ganzen Digitalisierungsteam weiter viel Erfolg bei seiner Arbeit! Sie lohnt sich!
Jörg Beleites
[…] https://blog.sub.uni-hamburg.de/?p=32483 […]
Vielen Dank für Ihre Arbeit!!! Gerade wenn man weiß, dass es ein paar Fundstellen (aber eben nur ein paar kleine) in historischen Zeitungen/ZF gibt, ist es extrem zeitaufwändig, alles Ausgabe für Ausgabe durchzublättern; und dann muss man auch aufpassen während dieser ermüdenden Arbeit die entscheidenen Textstellen nicht zu übersehen. Ein Extradankeschön dafür, dass OCR im heruntergeladenen Dokument verbleibt. EINEN WUNSCH habe ich dennoch: Bitte auch die Möglichkeit geben, nur die eine Seite als pdf herunterladen zu dürfen. Fand aktuell gerade, was ich suchte. Das ist eine Seite von 395. Muss mir das gesamte Dokument herunterladen (Zeit!) und dann entscheiden, ob ich damit meine Festplatte zumülle oder mit Extraaufwand die eine Seite abspeichere und den Rest shreddere, temp lösche usw. Also: Einzelseite-pdf das wäre ein kleines Sahnehäubchen mit praktischem Nutzen und viell. nicht gar so großem Programmieraufwand bei Ihnen.
Alles Gute Ihrem Team für 2023!
Vielen Dank für Ihre Rückmeldung! Die Verbesserung der Downloadangebote am Digitalisat gehört zu unseren nächsten Aktivitäten für das “Hamburger Kulturgut Digital” – inklusive des Einzelseiten-PDF.