{"id":36365,"date":"2023-08-31T15:58:39","date_gmt":"2023-08-31T13:58:39","guid":{"rendered":"https:\/\/blog.sub.uni-hamburg.de\/?p=36365"},"modified":"2023-11-09T01:10:56","modified_gmt":"2023-11-09T00:10:56","slug":"ocr4all-open-source-texterkennung-von-der-massenprozessierung-von-drucken-bis-zur-hochqualitativen-transkription-von-handschriften-8-11","status":"publish","type":"post","link":"https:\/\/blog.sub.uni-hamburg.de\/?p=36365","title":{"rendered":"OCR4all &#8211; Open-Source Texterkennung von der Massenprozessierung von Drucken bis zur hochqualitativen Transkription von Handschriften (8.11.)"},"content":{"rendered":"<p><strong>Mittwoch, 8. November 2023, 17 &#8211; 18:30 Uhr<br \/>\nReferent: <a href=\"https:\/\/www.uni-wuerzburg.de\/zpd\/zentrum\/team\/reul-christian\/\">Christian Reul<\/a><br \/>\nVortrag via <a href=\"https:\/\/uni-hamburg.zoom.us\/j\/64044597534?pwd=TFRXMWJVTnRicUYzZjZkWFJmeEZVZz09#success\">Zoom<\/a>.<\/strong><\/p>\n<p><a href=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr.jpg\"><img loading=\"lazy\" decoding=\"async\" data-attachment-id=\"36482\" data-permalink=\"https:\/\/blog.sub.uni-hamburg.de\/?attachment_id=36482\" data-orig-file=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr.jpg\" data-orig-size=\"1191,1684\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"2023-11-08_vortrag-gr\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-724x1024.jpg\" src=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-212x300.jpg\" alt=\"OCR4all - Open-Source Texterkennung von der Massenprozessierung von Drucken bis zur hochqualitativen Transkription von Handschriften\" title=\"OCR4all - Open-Source Texterkennung von der Massenprozessierung von Drucken bis zur hochqualitativen Transkription von Handschriften\" width=\"212\" height=\"300\" class=\"alignright size-medium wp-image-36482\" srcset=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-212x300.jpg 212w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-724x1024.jpg 724w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-106x150.jpg 106w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-768x1086.jpg 768w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-1086x1536.jpg 1086w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr.jpg 1191w\" sizes=\"auto, (max-width: 212px) 100vw, 212px\" \/><\/a> Ein zentraler Aspekt der Arbeit von geistes- und kultur- und humanwissenschaftlichen Forscher:innen ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen h\u00e4ufig lediglich als Scans vor, was ihre Verwendbarkeit stark einschr\u00e4nkt, da automatische Erschlie\u00dfungsans\u00e4tze wie die Volltextsuche oder Verfahren der quantitativen Analyse nicht einsetzbar sind. Hierzu muss aus den Digitalisaten zun\u00e4chst sog. maschinenverarbeitbarer Volltext extrahiert werden, wobei Methoden der automatischen Texterkennung von Drucken (Optical Character Recognition, OCR) oder Handschriften (Handwritten Text Recognition, HTR) eine immer gr\u00f6\u00dfere Rolle spielen. Gerade sehr alte Drucke und Handschriften stellen dabei aus verschiedensten Gr\u00fcnden h\u00e4ufig noch eine gro\u00dfe Herausforderung dar. Erfreulicherweise gab es in den letzten Jahren gro\u00dfe Fortschritte im Bereich der historischen OCR\/HTR, die einige hochperformanteTools hervorgebracht haben.<br \/>\n<!--more--><\/p>\n<p>Das am Zentrum f\u00fcr Philologie und Digitalit\u00e4t (ZPD) der Universit\u00e4t W\u00fcrzburg entwickelte frei verf\u00fcgbare Open Source Werkzeug OCR4all hat zum Ziel, auch technisch weniger versierten Nutzer:innen die M\u00f6glichkeit zu geben, anspruchsvolle Drucke und Handschriften selbstst\u00e4ndig und in h\u00f6chster Qualit\u00e4t zu erschlie\u00dfen. OCR4all kapselt den gesamten Texterkennungsworkflow und alle daf\u00fcr ben\u00f6tigten Tools in einer einzigen Anwendung, die leicht installiert und \u00fcber eine komfortable grafische Nutzeroberfl\u00e4che bedient werden kann.<\/p>\n<p>Der Vortrag erl\u00e4utert die Grundlagen der automatischen Texterkennung und stellt OCR4all und dessen Funktionsweise im Rahmen einer Live-Demo vor. Au\u00dferdem wird die Anwendbarkeit und Performanz auf unterschiedlichen Material demonstriert und ein \u00dcberblick \u00fcber aktuelle Arbeiten sowie ein Ausblick auf zuk\u00fcnftige Entwicklungen gegeben.<\/p>\n<p>Eine Veranstaltung im Rahmen der Veranstaltungsreihe \u201e<a href=\"https:\/\/blog.sub.uni-hamburg.de\/?tag=dh-veranstaltung\">Digital Humanities \u2013 Wie geht das?<\/a>\u201c des Referats f\u00fcr Digitale Forschungsdienste.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mittwoch, 8. November 2023, 17 &#8211; 18:30 Uhr Referent: Christian Reul Vortrag via Zoom. Ein zentraler Aspekt der Arbeit von geistes- und kultur- und humanwissenschaftlichen Forscher:innen ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen h\u00e4ufig lediglich als Scans vor, was ihre Verwendbarkeit stark einschr\u00e4nkt, da automatische Erschlie\u00dfungsans\u00e4tze wie [&hellip;]<\/p>\n","protected":false},"author":19,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"jetpack_post_was_ever_published":false},"categories":[9],"tags":[170],"class_list":["post-36365","post","type-post","status-publish","format-standard","hentry","category-ausstellungen","tag-dh-veranstaltung"],"views":2985,"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p7hfNR-9sx","jetpack-related-posts":[{"id":36367,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=36367","url_meta":{"origin":36365,"position":0},"title":"Workshop: OCR4all &#8211; Open-Source Texterkennung (vor-)moderner Drucke und Handschriften (13.11.)","author":"Markus Trapp","date":"28-08-23","format":false,"excerpt":"Mo., 13.11.2023, 9-17 Uhr Im 17. Stock im B\u00fccherturm der Stabi. Referent: Florian Langhanki (JMU) OCR (Optical Character Recognition) und HTR (Handwritten Text Recognition) stellen in den Geistes- und Kulturwissenschaften nach wie vor eine Herausforderung dar. OCR4all bietet allen Nutzer:innen eine frei verf\u00fcgbare und einfach zu bedienende M\u00f6glichkeit, eigene OCR-Workflows\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"Workshop: OCR4all - Open-Source Texterkennung (vor-)moderner Drucke und Handschriften","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":6246,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=6246","url_meta":{"origin":36365,"position":1},"title":"Faszination Handschrift: 2000 Jahre Manuskriptkulturen in Asien, Afrika und Europa (18.11.11 &#8211; 8.1.12)","author":"Markus Trapp","date":"31-10-11","format":false,"excerpt":"Die Erfindung der Schrift und des Schreibens geh\u00f6rt zu den folgenschwersten Neuerungen der Menschheitsgeschichte. Schriftlichkeit war jedoch die l\u00e4ngste Zeit Handschriftlichkeit, und selbst die vergleichsweise junge Verbreitung des Typendrucks ging keineswegs mit einem radikalen Bruch einher. W\u00e4hrend im Abendland die Schriftkultur vor ca. 2500 Jahren begann, haben andere Kulturen eine\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"Thail\u00e4ndisches Leporello-Manuskript (1874)","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2011\/10\/manu-2011.jpg?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2011\/10\/manu-2011.jpg?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2011\/10\/manu-2011.jpg?resize=525%2C300&ssl=1 1.5x"},"classes":[]},{"id":1745,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=1745","url_meta":{"origin":36365,"position":2},"title":"Handschriften- und Textforschung heute. Eine Konferenz zur \u00dcberlieferung der griechischen Literatur (21.4.-22.4.)","author":"BP","date":"08-04-10","format":false,"excerpt":"Die dreit\u00e4gige Konferenz, deren erste beide Tagessitzungen in den R\u00e4umen der Staats- und Universit\u00e4tsbibliothek stattfinden, besch\u00e4ftigt sich mit fachwissenschaftlichen Fragen aus dem Kontext der handschriftlichen \u00dcberlieferung griechischer Literatur. Neben Schwerpunkten auf antiken Texten und der Buchproduktion in Byzanz reicht das Spektrum bis zur Rezeption in und nach der Renaissance. Der\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2010\/04\/teuchos_logo.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":4798,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=4798","url_meta":{"origin":36365,"position":3},"title":"Exponat des Monats Mai \u2013 Hans Henny Jahnn: Fluss ohne Ufer (18.5.)","author":"Markus Trapp","date":"02-05-11","format":false,"excerpt":"Hans Henny Jahnns (1894-1959) gro\u00dfer Roman \"Fluss ohne Ufer\" erschien zwischen 1949 und 1961. Die in der Werkausgabe 1986 erschienene Neuausgabe des Romans legt zwar den Erstdruck zum Gro\u00dfteil zugrunde, bezieht jedoch erstmals auch die im Nachlass des Autors vorhandene hand- und maschinenschriftliche \u00dcberlieferung mit ein. Nun ist es 2010\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"Hans Henny Jahnn: Fluss ohne Ufer","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2011\/04\/NHHJ-Aa-76-p-61.jpg?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2011\/04\/NHHJ-Aa-76-p-61.jpg?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2011\/04\/NHHJ-Aa-76-p-61.jpg?resize=525%2C300&ssl=1 1.5x"},"classes":[]},{"id":12655,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=12655","url_meta":{"origin":36365,"position":4},"title":"Griechische Handschriften in norddeutschen Sammlungen (25.9.-1.12.)","author":"Markus Trapp","date":"11-09-13","format":false,"excerpt":"Ausstellung: Von Homer bis Aristoteles: Griechische Handschriften in norddeutschen Sammlungen Anl\u00e4sslich des internationalen Kolloquiums \u201eGriechische Handschriften: gestern, heute und morgen\u201c bietet die Staats- und Universit\u00e4tsbibliothek einen Blick in ihre Sammlung griechischer Handschriften und auf Exponate aus norddeutschen Bibliotheken. In der Ausstellung werden mehr als 50 Handschriften, Papyri und annotierte Fr\u00fchdrucke\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2013\/09\/Griech-Hsn-detail.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":15797,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=15797","url_meta":{"origin":36365,"position":5},"title":"Tora \u2013 Talmud \u2013 Siddur. Hebr\u00e4ische Handschriften der Staatsbibliothek (18.9.-26.10.)","author":"Markus Trapp","date":"01-09-14","format":false,"excerpt":"Erstmals wird in einer Ausstellung die umfangreiche und bedeutende Sammlung hebr\u00e4ischer Handschriften in Hamburg der \u00d6ffentlichkeit vorgestellt. Mit ungef\u00e4hr 550 Manuskripten geh\u00f6rt sie zu den gro\u00dfen Sammlungen weltweit. Dieser Reichtum verdankt sich der Sammelleidenschaft gro\u00dfer Gelehrter wie Conrad von Uffenbach, Christian Theophil Unger, Joachim Morgenweg und vor allem des Hamburger\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2014\/09\/hebraica-fuehrung.jpg?resize=350%2C200&ssl=1","width":350,"height":200,"srcset":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2014\/09\/hebraica-fuehrung.jpg?resize=350%2C200&ssl=1 1x, https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2014\/09\/hebraica-fuehrung.jpg?resize=525%2C300&ssl=1 1.5x"},"classes":[]}],"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts\/36365","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/users\/19"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=36365"}],"version-history":[{"count":4,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts\/36365\/revisions"}],"predecessor-version":[{"id":36485,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts\/36365\/revisions\/36485"}],"wp:attachment":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=36365"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=36365"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=36365"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}