Encoding unbekannter encoding type
ich habe eine Datei (GAEP d.83) und lese den Text mit einem StreamReader aus:
TEXTDATEI:
T1Bei Anlieferung ist „uáerste Rcksichtnahme auf Mitarbeiter, Besucher 000032
T1und insbesondere Schler (Grundschler) zu nehmen. Anlieferungen sind 000033
T1w„hrend der Pausenzeiten nicht gestattet. Ausnahmereglungen fr 000034
T1Anlieferungen w„hrend der Pausenzeiten sind nicht gestattet. 000035
ich habe von UTF8, UTF16, utf-16BE und ASCI alle probiert,
habe aber immer die Umlaute falsch oder als Symbole,
r\nBei Anlieferung ist ?u?erste R?cksichtnahme auf Mitarbeiter, Besucher \r\nund insbesondere Sch?ler (Grundsch?ler) zu nehmen. Anlieferungen sind \r\nw?hrend der Pausenzeiten nicht gestattet. Ausnahmereglungen f?r \r\nAnlieferungen w?hrend der Pausenzeiten sind nicht gestattet.
richtig angezeigt bekomme ich es im MS Office Word,
wo ich anfangs die Codierung MS-DOS auswähle.
Wie bekomme ich das mit dem StreamReader hin?
Es gibt keinerlei Möglichkeit sicher ein Encoding zu identifizieren.
Im Endeffekt musst probieren; weit verbreitet ist auf Windows eben UTF-8 und windows-1252.
Ansonsten eben weiter probieren.
PS: laut Google verwendet MS-DOS die Encoding ID 850.
- performance is a feature -
Microsoft MVP - @Website - @AzureStuttgart - github.com/BenjaminAbt - Sustainable Code
Tausendmal Danke!!
using (StreamReader sr = new StreamReader(path, System.Text.Encoding.GetEncoding(850)))
Habe die 850 einfach nicht gefunden
Habe die 850 einfach nicht gefunden
Also wenn ich nach msdos encoding google, ist das 850er Encoding der erste Treffer 😉
- performance is a feature -
Microsoft MVP - @Website - @AzureStuttgart - github.com/BenjaminAbt - Sustainable Code