Hauptseite

Aus Transkribus Wiki
Wechseln zu: Navigation, Suche
Transkribus Expert Interface
Transkribus Website

Diese Seite enthält die deutschsprachige Benutzeranleitung für die Transkribus-Plattform.

Transkribus ist als eine umfassende Plattform zur Erkennung und Transkription historischer Dokumente konzipiert und besteht aus drei wesentlichen Modulen:

Transkribus hat sich zum Ziel gesetzt, alle jene zu unterstützten, die mit der Transkription historischer, gedruckter oder handschriftlicher Dokumente befasst sind.

Vornehmlich denken wir dabei an GeisteswissenschaftlerInnen, Institutionen wie Archive und Bibliotheken und auch an interessierte Laien wie FamilienforscherInnen und OrtschronistInnen. Unser Angebot richtet sich auch an InformatikerInnen auf der Suche nach herausfordernden Aufgabenstellungen.

Transkribus stellt eine Reihe von Werkzeugen für die automatisierte Erfassung von Dokumenten zur Verfügung, darunter eine computergestützte Handschriftenerkennung (HTR), Bilderkennung (Layout Analysis) und Strukturerkennung (Document Understanding). Als speziellen Service ist auch die OCR Software ABBYY FineReader 11 enthalten, mit der Frakturdokumente eingelesen werden können.

Transkribus befindet sich in Entwicklung, wir erwarten aber, dass wir bis Ende 2015 eine erste Betaversion der Öffentlichkeit anbieten können. .

Die Plattform ist für alle Benutzer frei zugänglich und wird von der Universität Innsbruck bzw. der Gruppe "Digitalisierung und Elektronische Archivierung (DEA)" betrieben. Die Europäische Union unterstützt den Betrieb der Plattform durch Mittel des Forschungsprogramms 7 (FP7 Project tranScriptorium) sowie des Horizon 2020 Programms. Das Modul für die Erkennung historischer Handschriften wurde von der Technischen Universität Valencia, bzw. der Gruppe zur Mustererkennung und Sprachtechnologie (PRHLT) entwickelt.



Transkribus - Grundkonzepte

Transkribus ist ein freies Programm: Nachdem Sie sich registriert haben, können Sie das Programm herunterladen, entpacken, starten und beliebig verwenden. Transkribus ist allerdings kein Open Source Projekt. Interessierte Personen oder Institutione sind dennoch herzlich eingeladen, sich mit uns in Verbindung zu setzen, wenn Sie zur Verbesserung des Programms beitragen möchten.

Transkribus bietet einen "geschützten" Bereich: Die von Ihnen hochgeladenen Dokumente stehen nur Ihnen zur Verfügung, bzw. von Ihnen authorisierten Personen, die ebenfalls in Transkribus registriert sein müssen. Allerdings ist Transkribus auch so konzipiert, dass Teamarbeit erleichtert und gefördert wird.

Keine Transkription ohne vorhergehende Segmentierung: Damit eine HTR (Handschriftenerkennung) stattfinden kann, müssen die Dokumente vorher in Textblöcke (Text Regions) und Grundlinien (Baselines) bzw. Zeilen (Line Regions) unterteilt werden. Das kann teils automatisch, teils manuell geschehen. Auch die manuelle Transkription kann nur gestartet werden, wenn eine derartige Segmentierung vorhanden ist.

Transkribus muss trainiert werden: Im Gegensatz zur OCR (Optical Character Recognition) muss die HTR im jetzigen Stadium immer auf die Dokumente trainiert werden, die erkannt werden sollen. Als Daumenregel gilt: 50 Seiten eines Dokuments sollten als Trainingsdaten vorliegen, damit dann die restlichen Seiten eines Dokuments oder einer Sammlung automatisiert erkannt werden können.

Transkribus integriert Dienste, die nicht am lokalen Computer laufen: Die Erkennung handschriftlicher Dokumente ist ein sehr rechenaufwändiger Prozess. Deshalb läuft die Software auf sehr leistungsstarken Maschinen der Universität Innsbruck. Mit dem Expertenprogramm kann die Verarbeitung gestartet und kontrolliert werden.

Transkribus benötigt Futter: Je mehr Dokumente in der Plattform verarbeitet werden, desto mehr Trainingsdaten liegen für das Programm vor. Nur dadurch kann mittel- und langfristig das große Ziel erreicht werden, dass alle gängigen Schriften mit zufriedenstellender Genauigkeit erkannt werden können.

Transkribus ist mehr als eine Software zur automatisierten Erkennung: Die Plattform ist so konzipiert, dass auch noch andere Nutzungsformen vorgesehen sind. Dazu gehört insbesondere die Möglichkeit mit Transkribus auch Digitale Editionen historischer Dokumente erstellen zu können.

Transkribus liest auch gedruckte Dokumente: Das Programm enthält auch eine OCR-Funktion zur Erkennung gedruckter Texte in gotischen Lettern.

Transkribus ist Teil eines virtuellen Cloudsystems: Die hochgeladenen Dokumente werden auf einem zentralen Server der Universität Innsbruck gespeichert. Auch Transkribus selbst läuft auf diesem Server, weil das Programm hohe Rechenleistungen verlangt, die lokale Computer nicht leisten können. Zudem kannn nur durch eine zentrale Abwicklung der Operationen, das Programm stetig weiter trainiert und verbessert werden.

Verschiedene Anleitungen und Handreichungen

Hier finden Sie verschiedene Dokumente und Anleitungen, die Sie darin unterstützen sollen, sich autonom mit der Nutzung des Programms (Installieren, Segmentieren, Transkribieren) vertraut zu machen.

Beispieldokumente

Erste Versuche mit einem lokalen Dokument

Laden Sie folgende Dateien ZIP Datei oder die dazugehörigen PDF Dateien auf Ihren Computer. Die Dateien wurden automatisch in Transkribus erzeugt. Die ZIP Datei enthält drei Dokumente, jedes Dokument in einem eigenen Verzeichnis.

  • HTR_Reichsgericht: Eine Seite einer Gerichtsentscheidung aus Deutschland. Der Text kommt direkt von der HTR und enthält einige Fehler. PDF Datei
  • George Forrest Herbarium Specimens: Eine Seite aus der Herbariensammlung des Naturkundemuseums in Edinburgh. Dort wurde ein kleiner Test mit Transkribus durchgeführt, auch diese Seite wurde mit dem HTR Modell automatisch erzeugt. PDF Datei.
  • Briefwechsel_Goethe_Schiller_1794-1795: Diese zwei Seiten wurden manuell transkribiert und werden als Grundlage für das Training der HTR verwendet werden. Damit soll dann die Schrift von Friedrich Schiller und Johann Wolfgang von Goethe auch für den Computer lesbar sein. PDF Dokument

Öffnen Sie die Verzeichnisse lokal in Transkribus. Probieren Sie nun die Grundfunktionen des Programms aus: Auf diese Weise werden Sie rasch die Grundlagen verstehen, etwa wie Bild und Text miteinander verknüpft sind, wie man die Segmentierung verändern kann oder welche Formate exportiert werden können. Öffnen Sie die PDF-Dateien, wenn Sie sich einen Eindruck von den Ergebnissen der manuellen Transkription verschaffen möchten.

Wenn Sie ein wenig Erfahrung im Umgang mit Transkribus haben, dann loggen Sie sich in die Transkribus Plattform mit Ihrer Benutzerkennung ein, gehen zur Transkribus Cloud Collection und können nun auch die Tools ausprobieren, die nur über die Cloud Dienste zugänglich sind.

Transkribus Website

Die Transkribus Cloud Collection ausprobieren

In der Transkribus Cloud Sammlung finden sich weitere Beispieldokumente, mit denen man die wesentlichen Funktionen der Plattform spielerisch entdecken kann.

Document ID1927: HTR Reichsgericht

  • Das Dokument wurde zu Beginn des 20. Jahrhunderts verfasst und stellt eine Entscheidung des Reichsgerichts in Deutschland dar. Der Schrifttyp ist Kurrent. Es handelt sich um eine Reinschrift, die von Berufsschreibern verfasst wurde. Die Linien sind sehr gerade und es sind keine Anmerkungen oder Ausbesserungen enthalten. Dies ist für die Layoutanalyse besonders wichtig.
  • Das HTR Modell wurde mit 88 Seiten trainiert, es wurden keine zusätzlichen Sprachdaten hinzugefügt, was ohne Zweifel die Erkennungsquote noch erhöhen würde.
  • In beiden Dokumenten kann mit dem Vorschlagseditor gearbeitet werden. Entweder direkt mit CATTI oder mit HTR-Suggestions. Beides ist ein Versuch, die Verbesserung des vom Computer gelieferten Volltextes zu vereinfachen. Wir sind für Rückmeldungen dankbar.
  • Da in diesem Cloudsystem natürlich auch andere BenutzerInnen an diesem Dokument "üben" können, ist es sehr wahrscheinlich, dass Sie auf eine "zerstörte" Version stoßen werden. Öffnen Sie daher unter "Versions Tab" (Versionen) die zweitälteste, von HTR erstellte Version, damit Sie auf das ursprünglich bearbeitete Dokument zugreifen können.

Hinweis: Benutzen Sie für dieses HTR-Dokument nicht den ABBY FineReader. Dieser ist nur für gedruckte, nicht aber für handschriftliche Texte gedacht.

  • Wenn Sie die computergestützte Transkription ausführen möchten, aktivieren Sie die HTR-Vorschläge (CATTI) bzw. benutzen Sie die HTR-Version. So aktivieren Sie die Hilfestellungen der HTR-Funktion.


So können Sie HTR ausprobieren:

(1) Klicken Sie auf "Region detection", dann auf "Line and Baseline detection"

(2) Klicken Sie auf "HTR-Training".

(3) Starten Sie den HTR-Prozess (dies kann einige Minuten dauern!)

Nun können Sie auf die Ergebnisse zugreifen.

Hinweis: Möglichweise kann der CATTI-Server einige Probleme verursachen, dies sollte in den Folgeversionen aber behoben worden sein.


Document ID558: OCR Sample Document - Gothic letter

  • Dieses Dokument hat 12 Seiten und enthält gedruckte Seiten aus mehreren Jahrhunderten. Hier geht es nicht um die Handschriftenerkennung, sondern um die OCR (Optical Character Recognition). Gezeigt werden soll, dass eine kommerzielle Software, hier ABBYY FineReader SDK 11, bereits recht gute Ergebnisse erzielt. Was man ebenfalls sofort lernt, ist der Zusammenhang zwischen Bild und Text, d. h. die zugrundeliegende Segmentierung, die auch bei der HTR eine grundlegende Rolle spielt.
  • Das Beispiel zeigt auch wie "gute Scans" aussehen sollten: Gerade Zeilen, ausgeschnittener Satzspiegel (keine schwarzen Ränder), 300-400 ppi und - falls möglich - 24 bit Farbtiefe. Eine gute Bildqualität ist für jede nachfolgende Verarbeitung von entscheidender Bedeutung.

WICHTIG: Benutzen Sie in diesem Fall die "Word based"-Funktion im Texteditor!

Trainieren Sie die HTR-Funktion für das Lesen von Handschriften

Voraussetzungen

  • Sie haben eine Sammlung von möglichst vieler Einzelseiten (mindestens einige Hundert), egal ob handgeschrieben oder gedruckt.
  • Sie gedenken, die Seiten sowieso zu transkribieren, oder Sie möchten innerhalb des Textes nach bestimmten Begriffen suchen können (ohne vorhergehende Transkription).
  • Sie haben bereits einen Test mit ca. 5 bis 10 Seiten durchgeführt und das Ergebnis der automatischen Line/Baseline-Segmentierung ist zufriedenstellend verlaufen.
    • Bitte wenden Sie sich an uns, wenn sie einen solchen Test durchführen möchten. Wir helfen Ihnen gerne!
  • Hinweis: Das HTR_sample-Dokument in der Transkribus-Cloud wurde anhand eben dieser Anleitung erstellt.

Grundlegende Vorgehensweise

  • Laden Sie ihre Scans auf den Server. Benutzen Sie dazu die FTP-Upload-Funktion von Transkribus, um den ganzen Vorgang zu beschleunigen.
    • Gehen Sie dazu links auf den Tab "Documents" und klicken Sie weiter unten auf das Ordnersymbol.
  • Unterteilen Sie jede Seite entweder händisch oder automatisch in "Textregions" (Textfelder). Eine Einteilung mittels Rechtecke ist dabei in den meisten Fällen ausreichend.
    • Die notwendigen Schaltflächen dafür finden Sie oben in der Mitte, über den Abbildungen. (ca 1 - 2 min)
  • Unterteilen Sie alle Textregions in "Lines/Baselines", d. h. fügen Sie jeweils Grundlinien und Zeilenmarkierungen ein. Dies schafft Transkribus in den allermeisten Fäälen automatisch (30 Sek.)
    • Kontrollieren und korrigieren Sie gegebenendfalls die von Transkribus gesetzten Baselines (ca. 1-5 min). Die Lineregions müssen nicht korrigiert werden!
  • Transkribieren Sie den Text Zeile für Zeile (z. B. 30 min)
    • Verfahren Sie So mit mindestens 50 Seiten bzw. 2000 Zeilen (bei ca. 40 Zeilen pro Seite). Je mehr transkribierter text zur Verfügung steht, desto höher ist später die Genauigkeit.

Trainieren der Texterkennungsfuktion

  • Sobald Sie ca. 50 Seiten transkribiert haben, können Sie uns kontaktieren, damit wir die HTR-Software mit ihren Referenzdaten "füttern" und trainieren können. Je nach der Größe der Dokumente kann dieser Vorgang mehrere Stunden dauern.
  • Jetzt können Sie Ihr jeweiliges HTR-Modell zur Texterkennung bei weiteren Scans anwenden (rechts unter dem Tab "Tools"). Allerdings müssen alle Seiten bereits in textregions und Lines/baselines unterteilt sein, damit die Texterkennung funktionieren kann.
    • TIPP: Segmentieren Sie bereits im Vorhinein mehrere (oder am besten alle) Seiten. So kann die Software alle Scans auf einmal transkribieren und Sie müssen nicht jede Seite einzeln aufrufen bzw. aktivieren.

Korrektur- und Suchfunktion

  • Benutzen Sie den Texteditor in Transkribus, wenn Sie die automatisch erstellte Transkription bearbeiten möchten. Alternativ können Sie auch die Funktionen CATTI (Computer Assisted Text Transkription) oder "HTR suggestions" verwenden. Beide Funktionen sollten Ihre Korrekturarbeiten reduzieren.
  • Wenn Sie innerhalb des gesamten Textes nach bestimmten Wörtern suchen möchten, müssen Sie das Dokument als PDF oder RTF zuerst herunterladen.

HINWEIS: Die Universität Valencia arbeitet zur Zeit an einer eigenen Benutzeroberfläche mit Index- und Suchfunktionen, um die Suche in den automatisch automatisch erstellten Dokumenten zu erleichtern. Eine erste Protoversion befinden sich auf der Transcriptorium Website.

Steigerung der HTR-Genauigkeit

  • Das Allerwichtigste sind qualitativ hochwertige Scans für HTR und OCR. Mehr dazu im folgenden Kapitel.
  • Sollten Sie zusätzliche Transkriptionen des Textes haben (z. B. andere Transkriptionen, etwa aus dem Internet), vergleichen Sie sie mit Ihrer Transkription. Leiten Sie diese Transkription dann bitte an uns weiter, damit wir Sie in Ihr HTR-Modell integrieren können.

Statistik und Auswertung Unter "Tools" haben Sie die Möglichkeit, die Ergebnisse und die Genauigkeit des durchgeführten OCR- bzw. HTR-Vorganges zu messen, indem das Programm je eine Fehlerquote auf Wort- bzw. Zeichenebene ermittelt. Vergleichen Sie nun das Ergebnis mit einer Referenzseite Ihrer Wahl (z. B. einer Seite, die das von Ihnen erwartete Ergebnis zeigt).


Installation

Unterstützte Betriebssysteme

  • Transkribus wurde in JAVA geschrieben. Das Programm funktioniert daher sowohl in Windows, IOS (Apple, Mac) und Linux.
  • Transkribus benötigt mindestens JAVA 8. Dies dürfte aber bei den meisten Computern bereits automatisch der Fall sein.

Entpacken der ZIP-Datei

  • Im Downloadordner ihres Computers finden Sie am Ende des Downloadvorganges eine ZIP-Datei.
  • Entpacken Sie zuerst die gesamte ZIP-Datei, bevor Sie auf eine der Ausführungsdateien klicken.

Starten Sie Das Programm mit Hilfe einer Programmdatei: .exe, .command, .sh

  • Starten Sie Transkribus von Ihrer Benutzeroberfläche aus mit einem Doppelklick. Wählen Sie dazu folgende Datei:
    • Windows: Transkribus.bat or use Transkribus.exe
    • Mac OS - Apple: Transkribus.command
    • Linux: Transkribus.sh

Hinweise zur Installation bei Windows

  • Wenn Sie an diesem Computer keine "Administratorrechte" besitzen, wird bei der Installation ein Warnhinweis erscheinen, z. B. "Ihr Computer ist durch Windows geschützt", oder Ähnliches.
  • Bestätigen Sie nicht, sondern klicken Sie auf "zusätzliche Informationen". Nun können Sie bestätigen, dass es sich um verstrauenswürdige und ungefährliche Dateien handelt und dass Sie Transkribus auf Ihrem Computer isntallieren möchten.

Hinweise zur Installation auf einem Mac

  • Möglicherweise lässt sich das Programm nicht gleich starten, weil sie vom System als unbekannte bzw. nicht vertrauenswürdige Systemdatei identifiziert wurde.
  • Klicken Sie in diesem Fall einmal rechts auf die Programmdatei und wählen Sie "öffnen".
  • Hinweis: Rechtsklick auf einem Mac-Touchpad ist ein Klick mit zwei Fingern gleichzeitig

Starten von Transkribus über die Befehlszeile

  • Das Transkribus-Programm befindet sich in der zentralen "jar-Datei" (transkribus-<version>.jar)
  • Schreiben Sie daher in die Befehlszeile: java -jar Transkribus-<version>.jar
  • HINWEIS: Zum Starten des Programms muss JAVA 7 bereits im gesamten System installiert sein. Alternativ können Sie auch eine JRE-datei in den Programmordner hineinkopieren.
  • HINWEIS: Bei Mac oder Linux lassen sich die Skripts höchstwahrscheinlich nur über die Befehlszeile starten (alle Versionen vor 0.6.8)
    • Mac console basics
    • Wechseln Sie nun in den Programmordner mittels "cd"-Befehlen (change directory)
    • chmod +x Transkribus.command (oder bei Linux: chmod +x Transkribus.sh); erfolgreich getestet unter OpenSUSE 42.2
  • Weiters finden Sie noch einige andere Dateien im heruntergeladenen Transkribus-Packet:
    • config.properties = dient der Veränderung des Erscheinungsbildes und der Benutzeroberfläche.
    • virtualKeyboards.xml = dient der Festlegung virtueller Tastaturelemente.
    • logback.xml = dient der Veränderung der Protokolldateien (nur für erfahrene BenutzerInnen geeignet!)
  • Im Unterordner 'libs' befinden sich alle notwendigen Verzeichnisse für folgende Betriebssysteme:
    • Windows 32/64 bit
    • Linux 32/64 bit
    • OSX 64 bit

Einstellen eines Proxy Servers

  • Sobald das Programm gestartet ist, klicken Sie auf den Home Menü Knopf in der linken oberen Ecke und wählen Sie "Proxy settings...". Im folgenden Dialog können Sie den Proxy Host, Port, Benutzernamen (optional) und das Passwort (optional) einstellen. Dies ist die empfohlene Methode einen Proxy Server mit Transkribus zu verwenden.
  • Alternativ kann auch das Startskript (z.B. Transkribus.bat für Windows, Transkribus.sh für Linux) angepasst werden, so dass es die Proxy Einstellungen enthält. Hierfür den enthaltenen Aufruf wie folgt ändern:
   java -Dhttps.proxyHost=<proxyserver>
        -Dhttps.proxyPort=<proxyPort>
        -Dhttps.proxyUser=<user name for proxy>   
        -Dhttps.proxyPassword=<password for proxy>
        -jar Transkribus-0.7.0.jar

Dieser Vorgang muss allerdings bei jeder Aktualisierung von Transkribus wiederholt werden.

Problembehandlung

Ich kann mich nur über die Internetseite auf den Server zugreifen, nicht aber über Transkribus

  • Dieses Problem tritt bei einigen Versionen von JAVA 7 auf (z. B. JAVA 7u25). Überprüfen Sie Ihre aktuell installierte JAVA-Version, indem Sie in "java-version" in Ihre Befehlszeile schreiben, und aktualisieren Sie gegebenenfalls JAVA auf ihrem Computer.

Das Einloggen wird von der Firewall blockiert

  • Manche Internetprovider oder Informatikabteilungen (v. a. von Universitäten) blockieren den SSL port 443 und/oder unbekannte Programmdateien durch die Firewall. Sollte das der Fall sein, setzen Sie sich bitte mit den dafür zuständiges Stellen in Verbindung.

Norton Antivirus identifiziert die ZIP-Datei als potenzielle Gefahr und verhindert das Auspacken

  • Das ist lediglich ein falscher Alarm, der immer dann auftritt, wenn Norton auf unbekannte Software trifft (WS. Reputation.1). Mit dieser Anleitung können Sie die ZIP-Datei aus der Quarantäne holen und bearbeiten. [1]

Update: Programmversionen wie 0.6.5 oder ältere können nicht aktualisiert werden (eine sehr lange Fehlermeldung)

  • Klicken Sie auf "Home" (oben in der linken Ecke), dann "Install a specific version". Wählen Sie nun die neueste Version aus "Releases" und setzen Sie ein Häkchen bei "Download complete package". Dann klicken Sie auf "update" oder "replace". Auf diese Weise wird das vollständige Paket heruntergeladen und das Update sollte funktionieren.

Falsche bzw. veraltete JAVA-Version bei MAC (Nach dem Öffnen der command-Datei meldet Transkribus, dass eine falsche bzw. veraltete JAVA-Version (1.6.0.65) anstatt 1.7 installiert sei)

  • In den allermeisten Fällen ist sowieso bereits die aktuellste Version von JAVA RE (1.8.0.66) installiert.
  • Allerdings verwendet die Befehlszeile, mit der die "Transkribus.command"-Datei aktiviert wird, automatisch immer JAVA 1.6.0.65. Überprüfen Sie die Defaultversion (die bei Ihnen voreingestellte Version), indem Sie den Terminal öffnen und "java-version" eingeben.
  • Um das Problem zu lösen, können Sie hier die aktuellste jdk-Version von Java als ein .tar.gz package herunterladen:
   http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
  • Entpacken Sie die Datei anschließend im Transkribusordner.
  • Die Transkribus.command-Datei wird dann automatisch nach neuen JAVA-Versionen in den Unterordnern suchen.
  • Alternativ können Sie mittels Befehlszeile JAVA 8 zu ihrer voreingestellten Defaultversion machen, indem Sie dieser Anleitung folgen:
   http://myshittycode.com/2014/03/17/mac-os-x-setting-default-java-version/


Transkribus startet nicht bei (Fedora) Linux - Es erscheint die Fehlermeldung "MOZILLA_FIVE_HOME not set" (= MOZILLA_FIVE_HOME ist nicht eignerichtet/installiert)

  • Vermutlich ist das Package "libwebkitgtk" nicht installiert. Bei Fedora können Sie es mit dem Befehl "dnf" über die Befehlszeile installieren (bei älteren Fedora-Versionen "yum" eingeben, statt "dnf")
   sudo dnf install webkitgtk

Transkribus-Benutzerhandbuch

Hier finden Sie eine detailierte Benutzeranleitung für das Transkribus Expert-Programm, das sie von der Homepage herunterladen und auf Ihrem Computer installieren können.


Transkribus-Online (Internetseite)

Auf der Homepage von Transkribus können Sie

  • sich einen Überblick verschaffen und grundlegende Informationen zum Programm finden
  • sich auf der Transkribus-Plattform registrieren
  • Ihre Benutzerdaten ändern bzw. Ihr Profil bearbeiten sowie Ihr Passwort ändern
  • das Transkribus Expert-Programm herunterladen.


Bei Transkribus registrieren

Um das Programm nutzen zu können, müssen Sie sich auf der Transkribus-Homepage registrieren (http://transkribus.eu/).

  • Bei der Erstanmeldung werden Ihr Name und Ihre Mailadresse verlangt, zudem müssen Sie unseren Nutzungsbedingungen zustimmen. Dabei wird auch Ihre IP-Adresse abgebfragt und gespeichert.
  • Gemäß österreichischem Datenschutzgesetz werden ihre Daten geschützt und nur zur Verbesserung unserer Dienstleistungen bzw. zur Unterstützung von Forschungen in Informatik und Geisteswissenschaften verwendet.
  • Wenn Sie Ihren Transkribus-Zugang löschen möchten, schreiben Sie bitte an email@transkribus.eu.


Transkribus Expert-Programm herunterladen

  • Nachdem Sie sich bei Transkribus registriert haben, sind Sie berechtigt, das Programm herunterzuladen. Es läuft mit allen gängigen Betriebssystemen (Windows, Mac (Apple), Linux).
  • Entpacken Sie zuerst das Zip-file, um das Programm starten zu können.
    • Hier erhalten Sie alle für die Installation notwendigen Informationen.
  • Für die Zukunft ist die Einrichtung einer Digitalen Bibliothek auf der Transkribus-Homepage geplant:
    • Dort können dann NutzerInnen ihre Transkribus Cloud-Dokumente bearbeiten und sie mit anderen NutzerInnen oder der Öffentlichkeit teilen bzw. die veröffentlichten Dokumente anderer NutzerInnen lesen.


Transkribus Cloud-Dienste

Die Transkribus-Cloud läuft über das System des Zentralen Informatikdienstes (ZID) der Universität Innsbruck. Dazu gehören virtuelle Server mit dem Kernprogramm und den verschiedenen Zusatzanwendungen, eine Datenbank, Server zur Zwischenlagerung von Daten bzw. für Sicherungskopien, sowie ein Hochleistungsrechner.


Bild-Dateien bzw. Scans

  • Sie können in Transkribus natürlich mit lokal gespeicherten Daten bzw. offline arbeiten. Um alle Möglichkeiten des Programmes optimal nutzen zu können, müssen sich die zu bearbeitenden Dokumente bereits in Cloud befinden. Daher ist es durchaus sinnvoll, die Dateien auf den Server zu laden.
  • Die hochgeladenen Dateien werden dann im FileImageStore der Universität Innsbruck gespeichert und bearbeitet.
    • Folgende Formate können hochgeladen werden: JPG, PNG, TIFF, JP2.(Hinweis: GIF und RAW (Bilder von Digitalkameras) werden von Transkribus nicht unterstützt!)
    • Die Bilddateien werden in der Originalauflösung gespeichert. Für die Bearbeitung wird jedoch automatisch jeweils eine komprimierte Version und eine Miniaturansicht (Thumbnail) generiert
    • Die Dateien werden zwar für die Verarbeitung umbenannt, der ursprüngliche Dateiname wird jedoch in den Metadaten gespeichert.
    • Die Dateien erhalten einen einhatlichen Dateienpfad (file address).


PAGE Files

Wir verwenden das Dateienformat "PAGE XML" als Masterformat. Es wurde von der University of Salford entwickelt.


REST Interfaces

Die meisten Transkribus-Funktionen werden mittels RESTful interface. Interessierte können das gesamte REST Interface nutzen.


Laufende Transkriptionsprojekte

Viele kleinere und größere Archive sind auf die Mithilfe von Freiwilligen angewiesen, um ihre Bestände weiter aufbereiten zu können. Das Transkribusprogramm kann hier umfangreiche Unterstützung bieten und die Zusamenarbeit von freiwilligen Mitarbeitern und Archiven erleichtern sowie die Ergebnisse besser sammeln und sichtbar machen.

Interessierte Archive oder Institutionen, die sich dem OpenAccess-Gedanken verpflichtet fühlen und mit ihren Beständen neue Wege gehen bzw. mehr Menschen erreichen möchten, sind dazu eingeladen, ebenfalls solche Wege einzuschlagen.

Eine aktuelle Liste der laufenden Projekte finden Sie hier: Transkriptionsprojekte

Fragen und Antworten

Wenn Sie Fragen oder Probleme haben, können Sie diese auf der Fragen und Antworten Seite an andere NutzerInnen bzw. direkt an die Entwickler von Traskribus stellen. Schon beantwortete Fragen helfen wiederum NeueinsteigerInnen oder BenutzerInnen mit ähnlichen Problemen schnell und einfach weiter.


Weiterentwicklung des Wikis

Helfen Sie uns und anderen NutzerInnen, indem Sie an der Verbesserung und Weiterentwicklung dieses Transkribus-Wikis mitwirken!


Danksagung

Diese Arbeit wird durch die Europäische Kommission im Rahmen der Projekte tranScriptorium (2013-2015) sowie READ (2015-2019) unterstützt.


Ganz besonderer Dank gilt auch den vielen NutzerInnen, die mit ihren Feedbacks per Email oder Fehlerreport zur stetigen Weiterentwicklung von Transkribus beitragen. Auch wenn es oft nicht möglich ist, alle Vorschläge und Hinweise sofort umzusetzen, versuchen wir dennoch, sie Schritt für Schritt zu realisieren!