&#x54C8是什么编码?Html实体

1 问题的提出

IOS使用XMPPFramework实现即时通讯时,需要加入群组,加入群组的packet如下:

<presence to="&#x54C8;&#x54C8;&#x54C8;@conference.testgroupaapplication/18210731996">
    <x xmlns="http://jabber.org/protocol/muc"/>
</presence>

2 怎么转换成可读的文字?

eval("'"+"&#x54C8;&#x54C8;&#x54C8;".replace(/&#x(.*?);/g,"\\u$1")+"'")
准换结果如下:
发现了什么?这个函数就是把前面的&#x换成了\\u,\\u54C8是什么?Unicode编码啊!

注意:这只是参考中的其中一种方法。

3 这究竟是什么?

Html字符实体:Html中的预留字符必须被转换为字符实体。如小于号为”<”。字符实体的格式如下:

// 格式1:实体名称(相对于实体编码,更加方便记忆,但并非所有浏览器都兼容),如小于号&lt;
&entity_name;

// 格式2:实体编码,如小于号&#60;
&#entity_number;
PS:这好像就是转义字符啊!

Html4.0.1支持 ISO 8859-1 (Latin-1) 字符集。所以其中包含汉字,这些汉字也都有对应的实体编码。

参考

  1. nodejs 爬虫遇到形如;安卓端的编码如何转换为中文?
  2. w3cschool-字符实体
  3. w3cschool-ISO 8859-1 符号实体

猜你喜欢

转载自blog.csdn.net/u012383839/article/details/79627637
今日推荐