c# – 计算特殊的UTF-8字符

前端之家收集整理的这篇文章主要介绍了c# – 计算特殊的UTF-8字符前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在寻找一种方法来计算由多个角色组成的特殊角色,但在网上找不到解决方案!

对于例如我想数字串“வாழைப்பழம”.它实际上由6个泰米尔字符组成,但在这种情况下,当我们使用常规方法查找长度时,它的9个字符.我想知道泰米尔是唯一会导致此问题的编码,如果有解决方案的话.我目前正在尝试在C#中找到解决方案.

提前谢谢=)

解决方法

使用 StringInfo.LengthInTextElements
var text = "வாழைப்பழம";
Console.WriteLine(text.Length);                               // 9
Console.WriteLine(new StringInfo(text).LengthInTextElements); // 6

有关此行为的说明可以在String.Length的文档中找到:

The Length property returns the number of Char objects in this instance,not the number of Unicode characters. The reason is that a Unicode character might be represented by more than one Char. Use the System.Globalization.StringInfo class to work with each Unicode character instead of each Char.

原文链接:https://www.f2er.com/csharp/97265.html

猜你在找的C#相关文章