Fortsätt till innehåll

Storskalig och skalbar migrering av dokument med Doc to XML

En återkommande kund inom offentlig sektor stod inför utmaningen att migrera tusentals dokument till ett strukturerat XML-baserat system. Genom att använda Etteplans rAIse-verktyg Doc to XML reducerades konverteringsinsatsen med omkring 80 procent. Resultatet blev ett skifte från ett tidskrävande manuellt arbete till ett skalbart och effektivt arbetsflöde, och ett viktigt steg framåt i kundens långsiktiga digitaliseringsstrategi.

Projektet i korthet

  • Utmaning

    En befintlig kund inom offentlig sektor behövde migrera tusentals dokument från Word och PDF till ett strukturerat XML-format. Den manuella konverteringen var tidskrävande och svår att skala. Samtidigt gjorde en fragmenterad dokumentmiljö innehållet svårt att hantera, söka i och uppdatera.

  • Lösning

    Med hjälp av Doc to XML automatiserades dokumentkonverteringen. Word- och PDF-filer omvandlades till strukturerad XML, vilket skapade en enhetlig grund för innehållshantering och gjorde det möjligt att bearbeta stora dokumentvolymer mer effektivt.

  • Affärsvärde

    Konverteringsarbetet minskade med cirka 80 procent. En tidigare manuell flaskhals ersattes av ett skalbart arbetsflöde. Arbetsmoment som tidigare tog veckor kunde nu genomföras på några dagar, vilket möjliggjorde storskalig migrering enligt planerade tidsramar.

Tusentals dokument, men inget skalbart sätt att hantera dem

Kunden förvaltade stora mängder dokumentation kopplad till infrastruktur, spridd över flera system och huvudsakligen lagrad i Word- och PDF-format. Trots att innehållet hade högt värde begränsade formaten möjligheterna till effektiv sökning, underhåll och uppdatering. Ambitionen var att samla dokumentationen och göra den mer användbar, men den manuella insatsen som krävdes gjorde uppgiften svår att skala.

XML-konvertering innebar ett omfattande arbete med att flytta innehåll, bygga om strukturer och säkerställa konsekvens i varje detalj. Processen var tidskrävande redan för mindre dokumentmängder, och vid större volymer blev tidsåtgången snabbt ohanterlig.

Från manuellt arbete till strukturerad automation

Som stöd i migreringen användes Doc to XML för att effektivisera konverteringsarbetet.

Verktyget använder AI-baserad bearbetning för att omvandla Word- och PDF-dokument till strukturerad XML. Innehållet identifieras och delas automatiskt upp i modulära delar, till exempel uppgifter, begrepp och referenser. I stället för att kopiera och bygga om innehållet element för element skapas en strukturerad grund som kan vidareutvecklas och valideras.

Praktiska aspekter att ta hänsyn till

Projektet visade att automatiserad konvertering till XML är beroende av källdokumentens strukturella kvalitet. Dokument med bristande eller inkonsekvent struktur kan kräva kompletterande justeringar för att uppnå optimalt resultat. Exempelvis förekom listor som var visuellt korrekt formaterade i Word men som saknade korrekt semantisk struktur. Dessa krävde manuell korrigering före konvertering.

Från flaskhals till skalbar process

Resultatet märktes direkt. Arbete som tidigare tog tre till fyra veckor genomfördes nu på omkring tre dagar, vilket minskade konverteringsarbetet till cirka 20 procent av den tidigare arbetsinsatsen. Det som tidigare bromsade migreringsarbetet blev i stället en skalbar process för hantering av stora dokumentmängder. Den ökade effektiviteten förbättrade även leveransförmågan, eftersom uppdateringar som tidigare krävde långa ledtider nu kunde levereras avsevärt snabbare.

Migrering i praktiken

Kundens ambition är att ha all dokumentation i XML-format till 2030. Utan automatisering hade detta inte varit realistiskt inom den tillgängliga tidsramen. Med Doc to XML har migreringsarbetet blivit hanterbart i stor skala och gjort det möjligt att systematiskt konvertera och publicera innehåll i en central portal. En gemensam och strukturerad informationsbas förbättrar både sökbarhet och användarupplevelse. Samtidigt skapar XML-formatet förutsättningar för att använda innehållet vidare i olika kanaler och format

Från manuell hantering till ett skalbart arbetssätt

Genom att ersätta manuell dokumentkonvertering med ett strukturerat och automatiserat arbetssätt omvandlade Etteplan en tidskrävande flaskhals till en skalbar kapacitet. Det som tidigare var svårt att planera och genomföra i större skala är nu en repeterbar och effektiv process som stödjer både löpande dokumentationsuppdateringar och storskaligt migreringsarbete.

Relaterade referenscase

Etteplan rAIse – industriell AI

Tekniskt innehåll hanteras mer effektivt med Doc to XML och Content Reuse Analyzer 

Etteplan rAIse – industriell AI

Omvandling av Valmets re­serv­dels­proces­sen med AI

Etteplan rAIse – industriell AI

Datautvinning och in­for­ma­tions­han­te­ring AI-lösning ger besparingar till Kuopion Energia 

Etteplan rAIse – industriell AI

Generativa AI-lösningar maximerar nyttan av standarder