UFT-8 还是 utf-8 ?结束标记处有或没有空格? TAB 还是空格?

发布于 2024-10-05 05:42:02 字数 339 浏览 2 评论 0原文

我想知道:

  1. 我应该使用 utf-8 大写还是小写,为什么或者在什么情况下我需要大写?

  2. 为了节省空间而删除元素的结尾空格是否错误?

    
    

    
    

    考虑到我有 200MB 到 1GB 大小的大文件

  3. 如果我想节省空间,我应该使用 TAB 还是 SPACE 吗?

I was wondering about:

  1. Should I use utf-8 upper or lower case and why or for what cases I need it in upper case ?

  2. Is it wrong to remove the ending space of an element to save space ?

    <myElement myAttribute="0" />
    

    to

    <myElement myAttribute="0"/>
    

    That is considering I have Huge files from 200MB to 1GB size

  3. Should I use TAB or SPACE if I wanted to save space ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

护你周全 2024-10-12 05:42:02
  1. 哪个上下文?
  2. 不,您无法删除该空白。至少如果您想满足 XML 1.0 规范则不需要。
  3. 一个空格字符和一个制表符各正好需要一个字节。四个空格字符需要 4 个字节,但一个制表符和制表符大小为 4 的编辑器仍需要 1 个字节。现在由你决定。
  1. Which context?
  2. No, you can't remove that whitespace. At least not if you want to fulfill the XML 1.0 specification.
  3. One space character and one tab character need exactly one byte each. Four space characters need 4 bytes but one tab character and an editor with tabsize 4 still needs one byte. Now it's your decision.
风流物 2024-10-12 05:42:02

<强>1。我应该使用 utf-8 大写还是小写?为什么或在什么情况下我需要大写?

我假设您指的是 XML 声明:

<?xml version="1.0" encoding="UTF-8"?>

IANA 字符集 页面顶部附近有这样的说明:

字符集名称最多可以有 40 个字符,取自
US-ASCII 的可打印字符。不过并没有什么区别
大小写字母的使用之间。

因此,我得出结论,encoding="UTF-8"encoding="utf-8" 在 XML 声明中是等效的。

<强>2。删除元素的结尾空格以节省空间是错误的吗?

<myElement myAttribute="0" />

<myElement myAttribute="0"/>

<myElement myAttribute></myElement>

这些表达式中的每一个都代表一个没有内容的元素。它们在语义上都是等效的。在第一个表达式中,/> 前面的空格字符并不重要。 (尽管您经常会看到为样式而添加的空格字符。)

<强>3。如果我想节省空间,应该使用 TAB 还是 SPACE?

在UTF-8编码(还有ASCII)中,TABSPACE各占一个字节。因此,如果您使用多个 SPACE 字符进行缩进,则将每组 SPACE 字符替换为单个 TAB 字符将节省存储空间(或减少网络传输中 XML 文档的大小)。

1. Should I use utf-8 upper or lower case and why or for what cases I need it in upper case ?

I presume you are referring to the XML declaration:

<?xml version="1.0" encoding="UTF-8"?>

he IANA Character Sets page says this near the top:

The character set names may be up to 40 characters taken from the
printable characters of US-ASCII. However, no distinction is made
between use of upper and lower case letters.

Therefore, I conclude that encoding="UTF-8" and encoding="utf-8" are equivalent in the XML declaration.

2. Is it wrong to remove the ending space of an element to save space?

<myElement myAttribute="0" />

<myElement myAttribute="0"/>

<myElement myAttribute></myElement>

Each of these expressions represents an element that has no content. They are all semantically equivalent. In the first expression the space character that precedes /> is not significant. (Although frequently you'll see that space character added for style.)

3. Should I use TAB or SPACE if I wanted to save space ?

In the UTF-8 encoding (as well as ASCII), TAB and SPACE each occupy one byte. So, if you are using multiple SPACE characters to indent, replacing each group of SPACE characters with a single TAB character would save storage space (or reduce the size of the XML document in a network transmission).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文