Laden...

Inhalt aus docx mit OpenXML als RTF-Text auslesen

Erstellt von Jörg vor 8 Jahren Letzter Beitrag vor 8 Jahren 1.542 Views
J
Jörg Themenstarter:in
152 Beiträge seit 2009
vor 8 Jahren
Inhalt aus docx mit OpenXML als RTF-Text auslesen

Hallo,

mit folgendem Code lese ich den Inhalt eines Word-Dokument (docx) aus:


using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(fileName, true))
{     
     foreach (OpenXmlElement e in wordDoc.MainDocumentPart.Document.Body.ChildElements)
     {
          Console.WriteLine(e.InnerText);
     }
}

InnerText gibt mir unformatierten Text aus.
Als Alternative gibt es noch InnerXml.

Ich würde den Text jedoch gerne RTF-Formatiert auslesen.
Gibt es hier eine Möglichkeit?

T
2.224 Beiträge seit 2008
vor 8 Jahren

Da docx ein XML Format ist, müsstest du den Content entweder selbst ins RTF Format umwandeln oder schauen ob du mit deinem Reader dies machen kannst.
Aber aktuell würde ich mal vermuten, dass du den Text selbst umwandeln musst.

T-Virus

Developer, Developer, Developer, Developer....

99 little bugs in the code, 99 little bugs. Take one down, patch it around, 117 little bugs in the code.