Achtergrond
Dit artikel beschrijft een technisch experiment met het maken van automatische transcripties van handgeschreven teksten. Daarvoor is Loghi gebruikt, open source software ontwikkeld door het Huygens Instituut, gebaseerd op kunstmatige neurale netwerken. De uitdaging was om deze software op mijn eigen laptop aan de praat te krijgen. Niet alleen om transcripties te maken met behulp van een bestaand model, maar ook om zelf een bestaand model aanvullend te trainen om een specifiek handschrift beter te kunnen herkennen.

Loghi werkt het best onder Linux. Daarvoor zijn er twee mogelijkheden. De eerste optie is om een Linux-distributie op een aparte partitie op een laptop of pc te installeren. De tweede is om onder Windows gebruik te maken van het Windows Subsystem for Linux (WSL). De ontwikkelaars van de Loghi-software raden die tweede optie af. Dat is terecht, gezien mijn eigen ervaringen. Tekstherkenning o.b.v. een bestaand model lukt wel met WSL, maar het trainen van een eigen aangepast model loopt na enkele rondes vast.
Op een oude laptop was al Ubuntu geïnstalleerd. Daarom heb ik die vooral gebruikt voor mijn experimenten. Helaas heeft deze laptop geen afzonderlijke grafische kaart, terwijl ook het geheugen beperkt is. Daardoor duurt zowel herkenning als training nogal lang. Omdat de oude laptop niet meer voor andere doelen nodig wordt gebruikt was dat voor dit experiment geen probleem.
Lees verder “Automatische transcripties van proclamaties Achtkarspelen”





