BufferedWriter#write(int) javadoc 查询

发布于 2024-09-18 07:57:13 字数 709 浏览 16 评论 0原文

Javadoc 对此表示：

仅写入整数 oneChar 的低两个字节。

这对写入已转换为 int 的非 utf8 编码字符有何影响（如果有）？

更新：

相关代码从套接字接收数据并将其写入文件。（在接收和写入之间会发生很多事情，所以我不能只使用使用 BufferedReader#readLine() 获得的字符串）。我使用的是 Writer#write(char[]) 但这意味着我每次都必须创建一个新的 char 数组。为了避免每次创建数组，我有一个用 -1 填充的 char 数组（转换为 char）。

然后我使用 TextUtils#getChars 来填充它，必要时扩展数组。为了进行写入，我循环遍历数组，写入 Writer 直到 char[i] == (char) -1 == true。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

凉城已无爱 2024-09-25 07:57:13

在内部，write(int) 只会将其参数转换为 char，因此 write(i) 相当于 write((char ）i）。

现在在Java中，char内部只是一个整数类型，范围是0-65535（即16位）。强制转换 int -> char 是“缩小原始转换”（Java语言规范，5.1.3），并且 int 是有符号整数，因此：

有符号的缩小转换
简单地将整数转换为整数类型 T
丢弃除第 n 个最低阶之外的所有阶
位，其中 n 是位数
用于表示类型T。另外
可能会导致信息丢失
关于数字的大小
值，这可能会导致符号
结果值不同于
输入值的符号。

这就是为什么 Javadoc 说只写入低两个字节。

现在，这对字符的含义取决于您想要如何解释 int 值。 Java 中的 char 表示 UTF-16 中的 Unicode 代码点，即 char 表示的 16 位数字被解释为 Unicode 代码点的编号。因此，如果您的每个 int 值都是 16 位代码点的数字，那就没问题（实际上，这只适用于 BMP 中的字符；如果您在补充平面中使用字符，则每个 Unicode 代码点都将被编码分成两个 char）。如果是其他内容（包括超过 16 位的代码点、负数或完全其他内容），您将得到垃圾。