如何将 unicode 字节序列转换为 XML 实体?
我希望能够在我的网站上显示片假名中的 tsu (ツ)
字符,而不是笑脸。
我已经找到了字节序列,即 \343\203\204
,但我不知道如何将其表示为 XML 实体,以便我可以在 HTML 页面中显示它。
I want to be able to display the tsu (ツ)
character from Katakana instead of smiley faces on my website.
I already found the byte sequence, which is \343\203\204
, but I don't know how to represent this as a XML entity, so that I can display it in a HTML page.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
如果您的 XML 到 HTML 转换堆栈(以及提供 HTML 页面的 Web 服务器)正确支持 unicode,那么它应该像将 unicode 代码点编写为实体一样简单 (
&x30c4;
)。如果他们不……好吧,祝你好运ツIf your XML-to-HTML-transformation stack (and the web server delivering the HTML pages) supports unicode properly, it should be as simple as writing the unicode code point as an entity (
&x30c4;
). If they don't ... well, good luck ツ您始终可以使用字符引用
ツ
(基于十六进制的 Unicode 编号),与文档编码无关。通过符号
\343\203\204
您可能指的是三个字节的八进制表示,它们构成了字符的 UTF-8 编码表示。如果 XML 文档的编码是 UTF-8(默认值),那么由这些字节组成的数据就可以包含在 XML 文档中。如何执行此操作取决于用于创建 XML 文件的程序。这些注意事项也适用于 HTML,无论是否采用 XHTML 格式。实际上,如果您打算在网页上使用该字符,可能会出现字体问题,因为大多数字体不包含该字符。因此,在 CSS 中提出合适的字体建议是一个好主意。更多信息:http://www.cs.tut.fi/~jkorpela/ html/characters.html
You can always use the character reference
ツ
(based on the Unicode number in hexadecimal), independently of document encoding.By notation
\343\203\204
you probably mean the octal presentation of three bytes, which constitute the UTF-8 encoded representation of the character. The data consisting of those bytes can be included as such into the XML document, if its encoding is UTF-8 (the default). How you do that depends on the program used to create the XML file.These considerations also apply to HTML, whether in XHTML format or not. In practice, if you intend to use the character on a web page, there can be font problems, because most fonts do not contain it. Making a suitable font suggestion in CSS is thus a good idea. More info: http://www.cs.tut.fi/~jkorpela/html/characters.html