{"id":36367,"date":"2023-08-28T16:32:23","date_gmt":"2023-08-28T14:32:23","guid":{"rendered":"https:\/\/blog.sub.uni-hamburg.de\/?p=36367"},"modified":"2023-08-28T16:32:23","modified_gmt":"2023-08-28T14:32:23","slug":"workshop-ocr4all-open-source-texterkennung-vor-moderner-drucke-und-handschriften-13-11","status":"publish","type":"post","link":"https:\/\/blog.sub.uni-hamburg.de\/?p=36367","title":{"rendered":"Workshop: OCR4all &#8211; Open-Source Texterkennung (vor-)moderner Drucke und Handschriften (13.11.)"},"content":{"rendered":"<p><a href=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all-gr.jpg\"><img loading=\"lazy\" decoding=\"async\" data-attachment-id=\"36445\" data-permalink=\"https:\/\/blog.sub.uni-hamburg.de\/?attachment_id=36445\" data-orig-file=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all.jpg\" data-orig-size=\"250,354\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"dh-ws-ocr4all\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all.jpg\" src=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all.jpg\" alt=\"Workshop: OCR4all - Open-Source Texterkennung (vor-)moderner Drucke und Handschriften\" title=\"Workshop: OCR4all - Open-Source Texterkennung (vor-)moderner Drucke und Handschriften\" width=\"250\" height=\"354\" class=\"alignleft size-full wp-image-36445\" srcset=\"https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all.jpg 250w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all-212x300.jpg 212w, https:\/\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/dh-ws-ocr4all-106x150.jpg 106w\" sizes=\"auto, (max-width: 250px) 100vw, 250px\" \/><\/a> <strong>Mo., 13.11.2023, 9-17 Uhr<br \/>\nIm 17. Stock im B\u00fccherturm der Stabi.<\/p>\n<p>Referent: <a href=\"https:\/\/www.uni-wuerzburg.de\/zpd\/zentrum\/team\/langhanki-florian\/\">Florian Langhanki<\/a> (JMU)<\/strong><\/p>\n<p>OCR (Optical Character Recognition) und HTR (Handwritten Text Recognition) stellen in den Geistes- und Kulturwissenschaften nach wie vor eine Herausforderung dar. OCR4all bietet allen Nutzer:innen eine frei verf\u00fcgbare und einfach zu bedienende M\u00f6glichkeit, eigene OCR-Workflows durchzuf\u00fchren. Dieser Workshop wird die allgemeinen Grundlagen und Konzepte von OCR vorstellen sowie in die Software OCR4all einf\u00fchren.<\/p>\n<ul>\n<li>Welchen Daten und Dateitypen sind f\u00fcr OCR erforderlich?<\/li>\n<li>Wie ver\u00e4ndert sich je nach Ausgangsmaterial die Anwendung des in OCR4all integrierten OCR- bzw. HTR-Workflows und mit welchem (manuellen) Aufwand ist zu rechnen?<\/li>\n<li>Wie stark l\u00e4sst sich der Workflow in Abh\u00e4ngigkeit des vorliegenden Materials automatisieren?<\/li>\n<li> Was sind OCR-Modelle und wie k\u00f6nnen eigene Texterkennungsmodelle trainiert werden?<\/li>\n<li>Welche Erkennungsgenauigkeiten sind zu erwarten?<\/li>\n<li>Welcher Aufwand ist mit Blick auf die sp\u00e4tere Verwendung der produzierten Texte \u00fcberhaupt sinnvoll?<\/li>\n<\/ul>\n<p><!--more--><\/p>\n<p>Diese und weitere Fragen werden im Rahmen des Workshops behandelt und erl\u00e4utert, sodass am Ende des Tages alle Teilnehmer:innen in der Lage sein werden, selbstst\u00e4ndig komplexe OCR-Projekte zu bearbeiten.<\/p>\n<p>Es kann sowohl auf eigens mitgebrachtem Material gearbeitet werden sowie auf zur Verf\u00fcgung gestellten Beispieltexten. Es ist keinerlei Vorwissen erforderlich und f\u00fcr Teilnehmer:innen aller Wissensst\u00e4nde geeignet!<\/p>\n<p>Die Teilnehmer:innenzahl ist beschr\u00e4nkt auf 15, daher wird um Anmeldung an <a href=\"mailto:forschungsdienste@sub.uni-hamburg.de\">forschungsdienste@sub.uni-hamburg.de<\/a> gebeten.<\/p>\n<p>Eine Veranstaltung im Rahmen der Veranstaltungsreihe \u201e<a href=\"https:\/\/blog.sub.uni-hamburg.de\/?tag=dh-veranstaltung\">Digital Humanities \u2013 Wie geht das?<\/a>\u201c des Referats f\u00fcr Digitale Forschungsdienste.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mo., 13.11.2023, 9-17 Uhr Im 17. Stock im B\u00fccherturm der Stabi. Referent: Florian Langhanki (JMU) OCR (Optical Character Recognition) und HTR (Handwritten Text Recognition) stellen in den Geistes- und Kulturwissenschaften nach wie vor eine Herausforderung dar. OCR4all bietet allen Nutzer:innen eine frei verf\u00fcgbare und einfach zu bedienende M\u00f6glichkeit, eigene OCR-Workflows durchzuf\u00fchren. Dieser Workshop wird die [&hellip;]<\/p>\n","protected":false},"author":19,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[9],"tags":[170],"class_list":["post-36367","post","type-post","status-publish","format-standard","hentry","category-ausstellungen","tag-dh-veranstaltung"],"views":2830,"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p7hfNR-9sz","jetpack-related-posts":[{"id":36365,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=36365","url_meta":{"origin":36367,"position":0},"title":"OCR4all &#8211; Open-Source Texterkennung von der Massenprozessierung von Drucken bis zur hochqualitativen Transkription von Handschriften (8.11.)","author":"Markus Trapp","date":"31-08-23","format":false,"excerpt":"Mittwoch, 8. November 2023, 17 - 18:30 Uhr Referent: Christian Reul Vortrag via Zoom. Ein zentraler Aspekt der Arbeit von geistes- und kultur- und humanwissenschaftlichen Forscher:innen ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen h\u00e4ufig lediglich als Scans vor, was ihre Verwendbarkeit stark\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"OCR4all - Open-Source Texterkennung von der Massenprozessierung von Drucken bis zur hochqualitativen Transkription von Handschriften","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/08\/2023-11-08_vortrag-gr-212x300.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":38946,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=38946","url_meta":{"origin":36367,"position":1},"title":"Call for Submissions: Day of OCR","author":"Jonas Mueller-Laackman","date":"22-10-24","format":false,"excerpt":"We are pleased to announce that the State- and University Library Hamburg Carl von Ossietzky and the University of Hamburg will be hosting a half-day workshop on ATR (Automated Text Recognition, OCR\/HTR) at the DH Lab @ Philturm on 22 January 2025 with up to 6 presentations on current ATR-related\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"Manuskript","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2024\/10\/Bildschirmfoto-2024-10-23-um-07.38.09-220x300.png?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":36103,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=36103","url_meta":{"origin":36367,"position":2},"title":"Named Entity Recognition f\u00fcr Geisteswissenschaftler:innen mit Stanford CoreNLP (7.8.)","author":"Markus Trapp","date":"13-06-23","format":false,"excerpt":"Montag, 7.8.2023, 09:45 - 17:00 Uhr Workshop im 17. Stock des B\u00fccherturms Referentin: Marie Fl\u00fch (Universit\u00e4t Hamburg) Wie k\u00f6nnen wiederkehrende Einheiten, wie Personennamen oder Titel literarischer Werke in gro\u00dfen Textkorpora automatisch ausfindig und annotiert werden? Wie kann eine erste inhaltliche Erschlie\u00dfung literarischer Texte digital umgesetzt werden und auf welche Art\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2023\/06\/2023-08-07-Workshop.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":7283,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=7283","url_meta":{"origin":36367,"position":3},"title":"Ein Portal f\u00fcr Europas Zeitungen \u2013 Hamburg ist dabei","author":"KW","date":"27-02-12","format":false,"excerpt":"Eine Gruppe von 17 europ\u00e4ischen Partner-Institutionen hat sich zusammengetan zum Projekt \u201eEurop\u00e4ische Zeitungen\u201c und wird in den n\u00e4chsten drei Jahren mehr als 18 Millionen Zeitungsseiten in die EUROPEANA einbringen. Das Projekt \u201eEurop\u00e4ische Zeitungen\u201c (gef\u00f6rdert vom Competitiveness and Innovation Framework Programme CIP 2007-2013 der Europ\u00e4ischen Union) zielt auf die Zusammenfassung und\u2026","rel":"","context":"In &quot;Aktuelles&quot;","block_context":{"text":"Aktuelles","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=1"},"img":{"alt_text":"Titelseite einer Ausgabe d. Hamburger Nachrichten vom 4.1.1797","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2012\/02\/0008_1-252x300.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":41795,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=41795","url_meta":{"origin":36367,"position":4},"title":"Gesellschaft der Freunde: ATR \/ OCR \/ HTR \u2013 Automatische Texterkennungsprogramme (4.2.)","author":"Markus Trapp","date":"13-01-26","format":false,"excerpt":"Mittwoch, 4.2., 16 bis 17.30 Uhr, Treffpunkt: DH-Lab im Philosophenturm, Raum C2003. Hintergrundgespr\u00e4ch zu automatischen Texterkennungsprogrammen mit Jonas M\u00fcller-Laackman und Michael Kubina (Mitarbeiter der SUB). Wie funktionieren sie, welche Werkzeuge kommen zur Anwendung und welchen Mehrwert f\u00fcr Forschung und Bibliotheken bieten sie? Im Anschluss an die Pr\u00e4sentation k\u00f6nnen die Teilnehmenden\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2015\/02\/GDF-300x200.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]},{"id":41986,"url":"https:\/\/blog.sub.uni-hamburg.de\/?p=41986","url_meta":{"origin":36367,"position":5},"title":"Gesellschaft der Freunde: ATR \/ OCR \/ HTR \u2013 Automatische Texterkennungsprogramme (9.3.)","author":"Markus Trapp","date":"26-02-26","format":false,"excerpt":"Montag, 9. M\u00e4rz 2026, 14-15:30 Uhr im Konferenzraum der Stabi (2. Etage) Hintergrundgespr\u00e4ch zu automatischen Texterkennungsprogrammen mit Jonas M\u00fcller-Laackman und Michael Kubina (Mitarbeiter der SUB). Wie funktionieren sie, welche Werkzeuge kommen zur Anwendung und welchen Mehrwert f\u00fcr Forschung und Bibliotheken bieten sie? Im Anschluss an die Pr\u00e4sentation k\u00f6nnen die Teilnehmenden\u2026","rel":"","context":"In &quot;Ausstellungen und Veranstaltungen&quot;","block_context":{"text":"Ausstellungen und Veranstaltungen","link":"https:\/\/blog.sub.uni-hamburg.de\/?cat=9"},"img":{"alt_text":"","src":"https:\/\/i0.wp.com\/blog.sub.uni-hamburg.de\/wp-content\/uploads\/2015\/02\/GDF-300x200.jpg?resize=350%2C200&ssl=1","width":350,"height":200},"classes":[]}],"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts\/36367","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/users\/19"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=36367"}],"version-history":[{"count":4,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts\/36367\/revisions"}],"predecessor-version":[{"id":36449,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=\/wp\/v2\/posts\/36367\/revisions\/36449"}],"wp:attachment":[{"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=36367"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=36367"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.sub.uni-hamburg.de\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=36367"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}