当前位置：文江博客话题详情

UTF-8 与 Visual Studio 2008 中包含欧洲字符的 HTML 和 JavaScript 的代码页 1252

发布于 2024-07-23 10:47:14 字数 594 浏览 9 评论 0 原文

我一直在开发一个解析器，它将JavaScript作为输入并创建该JavaScript的压缩版本作为输出。

我最初发现解析器在尝试读取输入 JavaScript 时失败。我相信这与Visual Studio 2008默认将其文件保存为UTF-8有关。这样做时，VS 在 UTF-8 文件的开头包含几个隐藏字符。

作为解决方法，我使用 Visual Studio 将文件另存为代码页 1252。这样做之后，我的解析器能够读取输入的 JavaScript。

请注意，我需要使用包含重音符号的特殊欧洲字符。

所以，我的问题是：

我应该使用代码页 1252 还是 UTF-8？
为什么 Visual Studio 默认将文件保存为 UTF-8？
如果我选择将文件保存为 1252 会导致问题吗？
在我看来，Eclipse 默认将文件保存为代码页 1252。听起来对吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

谈场末日恋爱 2024-07-30 10:47:14

UTF-8 是一个更好的选择，因为它确实支持所有已知字符，而使用 1252 时，您可能最终会得到需要从中丢失的字符（即使是欧洲语言）。

显然，VS2008 使用字节顺序标记保存 UTF-8 - 应该可以将其关闭，或者让解析器识别它，或者在两者之间删除 BOM。

回复收藏 0 原文

梦初启 2024-07-30 10:47:14

utf-8 在文件开头有字节顺序标记 (BOM) 签名，一些编辑器和显然库不理解... http://en.wikipedia.org/wiki/Byte-order_mark

如果您可以绕过它，那么 UTF-8 无论如何都是当今的首选。尝试在将 JS 代码提供给该解析器之前剥离 BOM 的第一个字节，或者在 IDE 中找到一个选项，如果它不能写入

1252 不会导致此问题，并且您不会遇到问题，但您会以过时的格式输出您的网络，我今天不会这样做，过去网络上有很多编码混乱的情况，不同语言的 iso 与 win 代码页......

回复收藏 0 原文

花想c 2024-07-30 10:47:14

使用 UTF-8。 1252 并不覆盖整个欧洲，因此在某些国家（中欧）您应该使用 1250，或更正确地说 - iso 8859-2。所以唯一真正的选择是UTF-8。

回复收藏 0 原文

她说她爱他 2024-07-30 10:47:14

使用1252会出现问题吗？

取决于您的应用程序需要工作的国家/地区

从我的想法来看，1252（或 ISO 8859-1）将在

荷兰
冰岛
西班牙
哦
，
英国德国瑞士奥地利意大利法国
维基
百科
有

更全面的列表：
http://en.wikipedia.org/wiki/ISO/IEC_8859-1

因此，如果您的应用程序仅在上述国家/语言中使用，您可以使用 CP 1252。

回复收藏 0 原文

删除会话 2024-07-30 10:47:14

BOM 位于文件的开头。
恕我直言，你应该使用 utf8，它是当今最新的。

回复收藏 0 原文

~没有更多了~

关于作者

执手闯天涯

暂无简介

0 文章

0 评论

483 人气

关注发私信

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

UTF-8 与 Visual Studio 2008 中包含欧洲字符的 HTML 和 JavaScript 的代码页 1252

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签