WTX(websphere conversion Extender)如何知道字符是 ASCII 还是 UNICODE?
ASCII 是 8 位值。 Unicode 可以是 8 位、16 位或 32 位值。如果我将子类定义为字符,WTX 如何知道它是 8 位字符还是 16 位字符?
ASCII is 8-bit value. Unicode may be 8 or 16 or 32 bit value. If I define subclass as character how does WTX know whether it is 8 or 16 bit character?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
将项目的子类设置为字符只是解决方案的一半。您还必须设置语言(默认为“西方”),更重要的是,设置字符集。如果您选择 UTF-8(-16、-32),解析器能够识别多字节字符并正确读取它们(当然,假设正在解析的文档是用类型树的编码进行编码的)。
Setting an item's subclass to character is only one half of the solution. You also have to set the language (defaults to "Western") and, more important, the character set. If you choose UTF-8 (-16, -32), the parser is capable of recognizing multi-byte characters and will read them properly (given that the document being parsed is encoded in the type tree's encoding, of course).