Da zur Lösung ein bestimmtes Tool benötigt wird, das nur für Windows vorhanden ist, gehe ich in der beschriebenen Vorgehensweise davon aus, dass ein Windows benutzt wird. Unter Linux müsste sich das Problem ähnlich beheben lassen, setzt dann aber ein entsprechendes Tool voraus.
 
Nach mehreren Versuchen erwies sich der folgende Weg als reproduzierbar, praktisch und schnell, um das Problem zu lösen
-  Entpacken der docx-Datei - 
-  docx ist eigentlich ein  Zip-Container- , also eine Datei, die mehrere Dateien und Verzeichnisse in komprimierter Form enthält 
-  Dieser Container muss entpackt werden. Dazu wird die Dateiendung von - docxin- zipumbenannt. Eine entsprechende Warnmeldung von Windows kann dabei mit OK quittiert werden.
 
-  Anschließend wird die Zip-Datei entpackt 
 
-  Öffnen der Datei  - word/document.xml-  in  notepad++
- 
-  Innerhalb des neuen Ordners mit den Daten aus der Zip-Datei gibt es einen Unterordner - word
 
-  Darin befindet sich die Datei - document.xml
 
-  Diese muss mit  notepad++-  geöffnet werden.  notepad++-  gibt es auch als sogenannte  PortableApp-  und muss dann nicht installiert werden. 
-  Bevor die Datei bearbeitet werden kann, muss in notepad++ das PlugIn XML-Tools installiert werden: - 
- 
-  Dort das Plugin XML Tools suchen und installieren 
-  Nun die Datei - word/document.xmlin notepad++ öffnen
 
-  Sie wird nun in zwei Zeilen angezeigt 
-  Daher Plugins → XML Tools → Pretty print (XML only - with line breaks) auswählen 
 
 
-  Zur fehlerhaften Stelle springen - 
-  Über Search → Go to… zur in der Fehlermeldung genannten Position springen: Offset auswählen und die Column-Nummer eingeben (im Beispiel 205742) 
-  In der Nähe oder genau an dieser Position findet sich ein XML-Tag, der in der Fehlermeldung genannt wird - im Beispiel w:cstheme 
-  Die Zeile mit diesem Eintrag löschen 
-  Speichern 
-  Kommt nun eine Fehlermeldung - XML Parsing error at line 1234... - 
dann klicken Sie auf OK
 
-  notepad++ hat den Cursor direkt in die entsprechende Zeile gesetzt 
-  Löschen Sie auch diese Zeile 
-  Speichern 
-  Wiederholt sich die Fehlermeldung, dann gehen Sie die letzten Schritte erneut durch - so lange, bis keine Fehlermeldung mehr erscheint. 
-  Beenden Sie notepad++ 
 
-  Datei packen und in Textverarbeitung öffnen - 
-  Markieren Sie nun alle Dateien und Verzeichnisse, die aus der Zip-Datei entpackt wurden und packen Sie diese wieder in eine Zip-File (z.B. über Kontextmenue 7-Zip → Hinzufügen zu „xxx.zip“) 
-  Benennen Sie diese Datei nun um und ändern Sie die Dateiendung von zip in docx 
-  Öffnen Sie diese Datei in einer Textverarbeitung 
 
Die Datei sollte sich nun problemlos öffnen lassen.
Genereller Tipp:
Nutzen Sie - um solche Probleme zukünftig zu vermeiden - nicht docx als Dateiformat, wenn Sie nicht nur mit Word arbeiten.
Nutzen Sie dann das OpenDocument-Format odt.
Dies lässt sich in Word und LibreOffice problemlos verwenden.
 
Ähnliche Themen im blog:
office,  xml
zurück