当前位置：文江博客话题详情

为什么 ASCII 和 ISO-8859-1 编码没有成为历史？

发布于 2024-09-16 14:47:04 字数 380 浏览 6 评论 0原文

在我看来，如果 UTF-8 是唯一随处使用的编码，那么代码问题就会少很多：

甚至不需要考虑编码问题。
混合 1-2 字节字符流没有问题，因为所有内容都使用 2 个字节。
浏览器不需要等待标记指定编码才能执行任何操作。 StackOverflow 甚至没有元标记，导致浏览器首先下载整个页面，从而减慢页面渲染速度。
您永远不会在旧网页上看到? 和其他随机符号（例如代替Microsoft Word 的特殊[阅读：可怕] 引号）。
UTF-8 可以表示更多的字符。
其他的我暂时想不起来。

那么为什么劣质编码没有被从太空中消灭掉呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

太阳哥哥 2024-09-23 14:47:04

甚至不需要考虑编码问题。

真的。除了仍然采用旧 ASCII 格式的所有数据之外。

混合 1-2 字节字符流没有问题，因为所有内容都使用 2 个字节。

不正确。 UTF-8 是可变长度的，从 1 到 6 个字节左右。

浏览器无需等待指定编码的标记即可执行任何操作。 StackOverflow 甚至没有元标记，导致浏览器首先下载整个页面，从而减慢页面渲染速度。

浏览器通常不会等待整个页面，而是根据页面数据的第一部分进行猜测。

你永远不会看到？以及旧网页上的其他随机符号（例如，代替 Microsoft Word 的特殊[读：可怕] 引号）。

除了所有那些使用其他非 UTF-8 编码的其他旧网页（非英语世界相当大）。

UTF-8 可以表示更多字符。

真的。您的数据验证问题也变得更加困难。

回复收藏 0 原文

豆芽 2024-09-23 14:47:04

为什么 EBCDIC、Baudot 和 Morse 仍未从轨道上发射核武器？为什么马鞭制造商在戈特利布·戴姆勒运出他的第一辆汽车后第二天没有关门？

让一项技术成为历史需要非零时间。

回复收藏 0 原文

人心善变 2024-09-23 14:47:04

混合 1-2 字节没有问题
字符流，因为
一切都使用 2 个字节。

根本不是真的。 UTF-8 是一种混合宽度的 1、2、3 和 4 字节编码。您可能一直在考虑 UTF-16，但即便如此，4 字节字符也已经有一段时间了。如果您想要“简单”的固定宽度编码，则需要 UTF-32。

你永远不会看到？以及其他随机的
旧网页上的符号

即使使用 UTF-8 网页，您仍然可能没有支持每个 Unicode 字符的字体，因此这仍然是一个问题。

可以表示更多的字符
UTF-8。

有时这是一个缺点。拥有更多的字符意味着需要更多的位来对字符进行编码。并跟踪哪些是字母、数字等。并存储用于显示这些字符的字体。并处理其他与 Unicode 相关的复杂性，例如标准化。

对于具有千兆字节 RAM 的现代计算机来说，这可能不是问题，但不要指望您的 TI-83 很快就会支持 Unicode。

但是，如果您确实需要这些额外的字符，那么使用 UTF-8 比使用无数不同的 8 位字符编码（加上一些非自编码）要容易得多。 -同步东亚多字节编码）。

那么为什么没有劣质编码呢
被太空中的核武器袭击过吗？

在很大程度上，这是因为“劣等”编程语言尚未从太空中消失。许多代码仍然是用 C 和 C++（甚至 COBOL！）等早于 Unicode 的语言编写的，但仍然没有很好的支持。

我非常希望我们能够摆脱这样的情况：一些库使用以 UTF-8 编码的基于 char 的字符串，而其他库则认为 char 是为了遗留编码和 Unicode 应始终使用 wchar_t，然后您必须处理 wchar_t 是 UTF-16 还是 UTF-32（或两者都不是）。

回复收藏 0 原文

且行且努力 2024-09-23 14:47:04

我不认为 UTF-8 使用“2 位”，而是可变长度。此外，许多操作系统级别的代码分别是 UTF-16 和 UTF-32，这意味着可以在 ASCII 或 ISO-8859-1 之间选择拉丁编码。

回复收藏 0 原文

岁月蹉跎了容颜 2024-09-23 14:47:04

好吧，你的问题有点抱怨“为什么世界如此糟糕”。正是因为如此。使用 UTF-8 以外的其他编码编写的页面来自操作系统对 UTF-8 的支持很差以及 UTF-8 尚未成为事实上的标准的时代。

只要有人不更改这些页面，这些页面就会保留其原始编码，这在许多情况下不太可能发生。他们中的许多人不再得到任何人的支持。

互联网上也有很多非 unicode 编码的文档，格式多种多样。有人可以转换它们，但如上所述，需要付出很大的努力。

因此，对非 unicode 的支持也必须保留。

在当前时代，请遵守这样的规则：当有人使用非 unicode 编码时，小猫就会死亡。

回复收藏 0 原文

~没有更多了~

关于作者

可遇━不可求

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

为什么 ASCII 和 ISO-8859-1 编码没有成为历史？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

淡笑忘祈一世凡恋

我们的影子

素年丶

南笙

18215568913

qq_xk7Ean

友情链接

为什么 ASCII 和 ISO-8859-1 编码没有成为历史？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

淡笑忘祈一世凡恋

我们的影子

素年丶

南笙

18215568913

qq_xk7Ean

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。