当前位置：文江博客话题详情

ASCII Unicode Java

在Java中，字符的int值应该称为它的ASCII值还是Unicode值

发布于 2025-01-02 13:29:38 字数 183 浏览 1 评论 0原文

我正在开发一个仅处理大写字母的 Java 程序。在某些处理过程中，我使用这些大写字母的字符的 int 值。我知道大写字母的值在 Unicode 和 ASCII 中是相同的，但是当引用这些 int 值时，我应该说它们是 Unicode 值还是 ASCII 值？我只是想确保我在语言方面使用了正确的术语。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

假装不在乎 2025-01-09 13:29:38

它应该被称为Unicode代码单元。 Java char 是一个 16 位 Unicode 代码单元，而不是 32 位 Unicode 代码点（最初认为 Unicode 是 16 位）。无论值是什么，它总是占用 16 位。 ASCII 是 7 位（如果考虑 0 填充/错误检查位，则为 8 位）。因此，即使实际值相同，该术语也不完全适用。

回复收藏 0 原文

绅士风度i 2025-01-09 13:29:38

如果字符仅是 ASCII，您可以将它们称为 ASCII。否则，您应该使用术语 Unicode，正如您所说，它是 ASCII 的适当超集。请记住，即使您将它们称为为 ASCII，但如果您将它们发送到需要真实（基于八位字节的）的内容，则可能需要更改编码 ) ASCII。

如果您的软件仅处理 ASCII 范围内的代码点（见下文，这通常不是一个好主意），那么（对用户或在文档中）说“ASCII 值”比“Unicode 值”要容易得多。 ASCII 范围”:-)

如果您只处理 ASCII 范围内的大写字母，那么在处理大写字母的上下文中将您的值称为 Unicode 代码点实际上是误导。

如今，任何新软件在编写时都应考虑到 Unicode，并且包括大写字母不限于 ASCII 范围这一事实。

例如，有一大块希腊字符靠近具有大写和小写属性的 ASCII 范围。 SpecialCasing.txt 文件显示了这些属性，并且有还有关于该主题的常见问题解答。

回复收藏 0 原文

横笛休吹塞上声 2025-01-09 13:29:38

根据 Unicode 词汇表，数字代码的正确且正确的术语是其 代码点。例如：

DIGIT ONE 的代码点为 31₁₆ (49₁₀)，通常写作 U+0031。
POUND SIGN 的代码点是 U+00A3
LATIN SMALL LETTER I with DIAERESIS 的代码点是 U+00EF。
希腊小写字母 MU 的代码点是 U+03BC。
上面带有点的拉丁文小写字母 F 的代码点是 U+1E1F。
REPLACMENT CHARACTER 的代码点是 U+FFFD。
MUSICAL SYMBOL DOUBLE FLAT 的代码点是 U+1D12B。
数学斜体大写字母 R 的代码点是 U+1D445。
EXTRATERRESTRIAL ALIEN 的代码点是 U+1F47D。
U+100002 是 Supplementary_Private_Use_Area_B 块中分配的代码点。
代码点 U+0041 的分配名称是拉丁大写字母 A。
代码点 U+1F47E 的分配名称是ALIEN MONSTER。
代码点 U+0FFE 未分配，因此没有名称。

等等。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

微信用户

文章 0 评论 0

小情绪

文章 0 评论 0

追我者格杀勿论

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

笨死的猪

文章 0 评论 0

彭明超

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文