c# – 将字符串的字符编码从windows-1252转换为utf-8

我已将Word文档(docx)转换为html,转换的html具有 Windows-1252作为其字符编码.在.Net中,这个1252字符编码,所有的特殊字符都显示为’ ‘.这个html正在Rad编辑器中显示,如果html是Utf-8格式的,它将正确显示.

我尝试了以下代码,但没有静脉

Encoding wind1252 = Encoding.GetEncoding(1252);  
Encoding utf8 = Encoding.UTF8;  
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);  
byte[] utf8Bytes = Encoding.Convert(wind1252,utf8,wind1252Bytes);  
char[] utf8Chars = new char[utf8.GetCharCount(utf8Bytes,utf8Bytes.Length)];   
utf8.GetChars(utf8Bytes,utf8Bytes.Length,utf8Chars,0);  
string utf8String = new string(utf8Chars);

关于如何将html转换成UTF-8的任何建议?

解决方法

这应该做到:
Encoding wind1252 = Encoding.GetEncoding(1252);
Encoding utf8 = Encoding.UTF8;  
byte[] wind1252Bytes = wind1252.GetBytes(strHtml);
byte[] utf8Bytes = Encoding.Convert(wind1252,wind1252Bytes);
string utf8String = Encoding.UTF8.GetString(utf8Bytes);

相关文章

在项目中使用SharpZipLib压缩文件夹的时候,遇到如果目录较深,则压缩包中的文件夹同样比较深的问题。比...
项目需要,几十万张照片需要计算出每个照片的特征值(调用C++编写的DLL)。 业务流程:选择照片...
var array = new byte[4]; var i = Encoding.UTF8.GetBytes(100.ToString("x2"));//...
其实很简单,因为Combox的Item是一个K/V的object,那么就可以把它的items转换成IEnumerable<Dic...
把.net4.6安装包打包进安装程序。 关键脚本如下: 头部引用字符串对比库 !include "WordFunc....
项目需求(Winform)可以批量打印某个模板,经过百度和摸索,使用iTextSharp+ZXing.NetʿreeSp...