Da zur Lösung ein bestimmtes Tool benötigt wird, das nur für Windows vorhanden ist, gehe ich in der beschriebenen Vorgehensweise davon aus, dass ein Windows benutzt wird. Unter Linux müsste sich das Problem ähnlich beheben lassen, setzt dann aber ein entsprechendes Tool voraus.
Nach mehreren Versuchen erwies sich der folgende Weg als reproduzierbar, praktisch und schnell, um das Problem zu lösen
Entpacken der docx-Datei
docx ist eigentlich ein
Zip-Container, also eine Datei, die mehrere Dateien und Verzeichnisse in komprimierter Form enthält
Dieser Container muss entpackt werden. Dazu wird die Dateiendung von docx
in zip
umbenannt. Eine entsprechende Warnmeldung von Windows kann dabei mit OK quittiert werden.
Anschließend wird die Zip-Datei entpackt
Öffnen der Datei
word/document.xml
in
notepad++
Innerhalb des neuen Ordners mit den Daten aus der Zip-Datei gibt es einen Unterordner word
Darin befindet sich die Datei document.xml
Diese muss mit
notepad++ geöffnet werden.
notepad++ gibt es auch als sogenannte
PortableApp und muss dann nicht installiert werden.
Bevor die Datei bearbeitet werden kann, muss in notepad++ das PlugIn XML-Tools installiert werden:
-
Dort das Plugin XML Tools suchen und installieren
Nun die Datei word/document.xml
in notepad++ öffnen
Sie wird nun in zwei Zeilen angezeigt
Daher Plugins → XML Tools → Pretty print (XML only - with line breaks) auswählen
Zur fehlerhaften Stelle springen
Über Search → Go to… zur in der Fehlermeldung genannten Position springen: Offset auswählen und die Column-Nummer eingeben (im Beispiel 205742)
In der Nähe oder genau an dieser Position findet sich ein XML-Tag, der in der Fehlermeldung genannt wird - im Beispiel w:cstheme
Die Zeile mit diesem Eintrag löschen
Speichern
Kommt nun eine Fehlermeldung
XML Parsing error at line 1234...
dann klicken Sie auf OK
notepad++ hat den Cursor direkt in die entsprechende Zeile gesetzt
Löschen Sie auch diese Zeile
Speichern
Wiederholt sich die Fehlermeldung, dann gehen Sie die letzten Schritte erneut durch - so lange, bis keine Fehlermeldung mehr erscheint.
Beenden Sie notepad++
Datei packen und in Textverarbeitung öffnen
Markieren Sie nun alle Dateien und Verzeichnisse, die aus der Zip-Datei entpackt wurden und packen Sie diese wieder in eine Zip-File (z.B. über Kontextmenue 7-Zip → Hinzufügen zu „xxx.zip“)
Benennen Sie diese Datei nun um und ändern Sie die Dateiendung von zip in docx
Öffnen Sie diese Datei in einer Textverarbeitung
Die Datei sollte sich nun problemlos öffnen lassen.
Genereller Tipp:
Nutzen Sie - um solche Probleme zukünftig zu vermeiden - nicht docx als Dateiformat, wenn Sie nicht nur mit Word arbeiten.
Nutzen Sie dann das OpenDocument-Format odt.
Dies lässt sich in Word und LibreOffice problemlos verwenden.
Ähnliche Themen im blog:
office, xml
zurück