
Umfassende Dokumentenkonvertierung mit „Doc to XML“
Ein langjähriger Kunde aus dem öffentlichen Sektor musste die Migration von Tausenden von Dokumenten in ein strukturiertes XML-basiertes System skalieren. Durch den Einsatz von „Doc to XML“, einem der rAIse-Tools von Etteplan, konnte der Kunde den Konvertierungsaufwand um etwa 80 % reduzieren, einen langsamen, manuellen Prozess in einen skalierbaren Workflow umwandeln und Fortschritte bei der Umsetzung einer langfristigen Digitalisierungsstrategie erzielen.
Das Projekt in der Übersicht
Herausforderung
Die Migration von Tausenden von Dokumenten aus Word und PDF in strukturiertes XML war aufgrund der manuellen Konvertierungsarbeiten zeitaufwendig und nur schwer skalierbar. Die fragmentierte Dokumentlandschaft erschwerte zudem die effiziente Suche, Pflege und Aktualisierung der Inhalte.
Lösungen und Dienstleistungen
„Doc to XML“ ermöglichte die automatisierte Dokumentkonvertierung, indem Word- und PDF-Dateien in strukturiertes XML umgewandelt wurden. Dies schuf eine einheitliche Grundlage für die Verwaltung von Inhalten und ermöglichte eine effizientere Bearbeitung großer Dokumentmengen.
Mehrwert
Mithilfe von „Doc to XML“ konnte der Kunde den Aufwand für die Dokumentkonvertierung um etwa 80 % reduzieren und so einen manuellen Engpass in einen skalierbaren Prozess verwandeln. Aufgaben, die zuvor Wochen in Anspruch nahmen, wurden nun innerhalb weniger Tage erledigt, sodass umfangreiche Migrationsarbeiten innerhalb des geplanten Zeitrahmens voranschreiten konnten.
Tausende von Dokumenten, aber keine skalierbare Möglichkeit, diese zu verwalten
Der Kunde war für die Pflege einer umfangreichen Infrastrukturdokumentation verantwortlich, die größtenteils in Word- und PDF-Formaten auf verschiedenen Systemen gespeichert war. Der Inhalt selbst war zwar wertvoll, doch das Format erschwerte eine effiziente Suche, Pflege und Aktualisierung. Das Ziel bestand darin, die Dokumentation zu zentralisieren und die Benutzerfreundlichkeit zu verbessern, doch der Umfang der Aufgabe machte eine Umsetzung mit manuellen Methoden schwierig. Die Umwandlung der Dokumente in XML erforderte das Kopieren von Inhalten, den Neuaufbau der Struktur und die Sicherstellung der Konsistenz Element für Element. Selbst die Verarbeitung kleiner Dokumentensätze konnte Wochen dauern, was eine groß angelegte Migration innerhalb eines realistischen Zeitrahmens erschwerte.
Ersetzen der manuellen Neugestaltung durch strukturierte Automatisierung
Zur Unterstützung der Migrationsarbeiten wurde „Doc to XML“ eingesetzt, um die Dokumentkonvertierung zu automatisieren.
Das Tool nutzt KI-gestützte Verarbeitung, um Word- und PDF-Dokumente in strukturiertes XML zu konvertieren, wobei Inhalte automatisch identifiziert und in Themenbereiche wie Aufgaben, Konzepte und Referenzen modularisiert werden. Anstatt Inhalte Element für Element manuell zu kopieren und neu aufzubauen, schafft die Konvertierung eine strukturierte Grundlage, die verfeinert und validiert werden kann.
Praktische Überlegungen für eine effiziente Konvertierung
Das Projekt hat zudem wichtige praktische Aspekte bei der Arbeit mit automatisierter Konvertierung aufgezeigt. Die Qualität des Ausgangsmaterials spielt eine Rolle für das Ergebnis, da Dokumente, die nicht ordnungsgemäß strukturiert sind, unter Umständen bereinigt werden müssen, um optimale Ergebnisse zu erzielen. So sind beispielsweise Listen, die in Word optisch korrekt erscheinen, möglicherweise nicht ordnungsgemäß als strukturierte Listen definiert, sodass vor der Konvertierung eine manuelle Korrektur erforderlich ist.
Wenn die Konvertierung nicht mehr der Engpass ist
Die Auswirkungen waren unmittelbar und erheblich. Aufgaben, die zuvor schätzungsweise 3–4 Wochen in Anspruch nahmen, wurden in etwa drei Tagen erledigt, wodurch sich der Aufwand für die Dokumentkonvertierung auf etwa ein Fünftel der ursprünglichen Arbeitslast reduzierte. Noch wichtiger war, dass aus einem langsamen, manuellen Engpass ein skalierbarer Prozess wurde, der große Dokumentmengen bewältigen kann. Dies verbesserte auch die Reaktionsfähigkeit, da Aktualisierungen, die zuvor lange Vorlaufzeiten erforderten, nun viel schneller bereitgestellt werden konnten.
Einen langfristigen Migrationsplan realisierbar machen
Das Ziel des Kunden ist es, die gesamte Dokumentation bis 2030 in das XML-Format zu migrieren. Ohne Automatisierung wäre dies innerhalb des vorgegebenen Zeitrahmens nicht machbar gewesen. Mit „Doc to XML“ ist der Migrationsaufwand in großem Maßstab bewältigbar geworden, sodass Inhalte systematisch konvertiert und in einem zentralen Dokumentationsportal veröffentlicht werden können. Je mehr Inhalte strukturiert und zentralisiert werden, desto effektiver können Nutzer Informationen suchen und filtern, anstatt sich durch einzelne PDF-Dateien zu arbeiten. Die Umstellung der Dokumentation auf XML ermöglicht zudem die weitere Nutzung der Inhalte über verschiedene Kanäle und Formate hinweg.
Vom manuellen Aufwand zur skalierbaren Fähigkeit
Durch den Ersatz der manuellen Dokumentkonvertierung durch einen strukturierten und automatisierten Ansatz hat Etteplan einen zeitaufwändigen Engpass in eine skalierbare Fähigkeit verwandelt. Was zuvor in großem Maßstab schwer zu planen und durchzuführen war, ist nun ein wiederholbarer und effizienter Prozess, der laufende Dokumentationsaktualisierungen und umfangreiche Migrationsarbeiten unterstützt.




