当前位置：文江博客话题详情

NULL compiler-construction language-agnostic language-design

null 的目的是什么？

发布于 2024-07-14 12:40:46 字数 190 浏览 8 评论 0原文

我在编译器课程中，我们的任务是从头开始创建我们自己的语言。目前我们的困境是是否包含“null”类型。 null 提供什么目的？我们团队中的一些人认为这并不是绝对必要的，而另一些人则支持 null，只是因为它可以提供额外的灵活性。

您有什么想法，特别是支持或反对 null 的想法吗？您是否曾经创建过需要 null 的功能？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（25）

缺⑴份安定 2024-07-21 12:40:47

例如，考虑 C 和 Java 的例子。在 C 中，约定空指针是数值零。当然，这实际上只是一个约定：该语言没有任何内容将该值视为任何特殊的东西。然而，在 Java 中，null 是一个独特的概念，您可以检测到并知道，是的，这实际上是一个错误的引用，我不应该尝试打开那扇门看看另一扇门上有什么边。

即便如此，我对空值的厌恶几乎超过了其他任何东西。

基于评论的澄清：我讨厌事实上的空指针值零，比我讨厌null更糟糕。

每当我看到 null 赋值时，我都会想，“哦，太好了，有人刚刚在代码中埋了地雷。有一天，我们将沿着相关的执行路径走下去，然后轰隆！”空指针异常！”

我希望有人指定一个有用的默认值或 NullObject，让我知道“此参数尚未设置为任何有用的值”。秃头零值本身就是等待发生的麻烦。

也就是说，它仍然比原始的零游荡要好。

回复收藏 0 原文

从﹋此江山别 2024-07-21 12:40:47

该决定取决于编程语言的目标。

您为谁设计编程语言？您是否为熟悉 C 派生语言的人设计它？如果是这样，那么您可能应该添加对 null 的支持。

总的来说，我想说你应该避免违背人们的期望，除非它有特定的目的。

以 C# 中的 switch-block 为例。 C# 中的所有 case 标签在每个分支中都必须有一个显式的控制流表达式。也就是说，它们都必须以“break”语句或显式的 goto 结尾。这意味着虽然这段代码是合法的：

switch(x)
{
    case 1:
    case 2:
        foo;
        break;
}

这段代码不合法：

switch (x)
{
    case 1:
        foo();
    case 2:
        bar();
        break;
}

为了创建从情况 1 到情况 2 的“失败”，有必要插入一个 goto，如下所示：

switch (x)
{
    case 1:
        foo();
        goto case 2;
    case 2:
        bar();
        break;
}

这可能会违反正在学习 C# 的 C++ 程序员的期望。然而，添加该限制是有目的的。它消除了出现一整类常见 C++ 错误的可能性。它稍微增加了语言的学习曲线，但结果对程序员来说是净收益。

如果您的目标是设计一种针对 C++ 程序员的语言，那么删除 null 可能会违反他们的期望。这会造成混乱，并使你的语言更难学。那么关键问题是“他们得到什么好处”？或者，“这会造成什么损害”。

如果你只是想设计一种可以在一个学期的课程中实现的“超小语言”，那么故事就不同了。在这种情况下，您的目标不是构建一种针对特定人群的有用语言。相反，它只是学习如何创建编译器。在这种情况下，拥有更小的语言是一个很大的好处，因此值得消除 null。

因此，回顾一下，我想说您应该：

确定创建该语言的目标。该语言是为谁设计的，他们的需求是什么。
根据什么可以帮助目标用户以最佳方式实现他们的目标来做出决定。

通常这将使所需的结果变得非常清晰。

当然，如果你没有明确阐明你的设计目标，或者你不能就它们是什么达成一致，那么你仍然会争论。然而，在这种情况下，无论如何，你都注定要失败。

That decision depends on the objective of the programing language.

Who are you designing the programing language for? Are you designing it for people who are familiar with c-derived languages? If so, then you should probably add support for null.

In general, I would say that you should avoid violating people's expectations unless it serves a particular purpose.

Take switch-blocks in C# as an example. All case labels in C# must have an explicit control-flow expression in every branch. That is they must all end with either a "break" statement or an explicit goto. That means that while this code is legal:

switch(x)
{
    case 1:
    case 2:
        foo;
        break;
}

That this code would not be legal:

switch (x)
{
    case 1:
        foo();
    case 2:
        bar();
        break;
}

In order to create a "fall through" from case 1 to case 2, it's necessary to insert a goto, like this:

switch (x)
{
    case 1:
        foo();
        goto case 2;
    case 2:
        bar();
        break;
}

This is arguably something that would violate the expectations of C++ programmers who are leaning C#. However, adding that restriction serves a purpose. It eliminates the possibility of an entire class of common C++ bugs. It adds to the learning curve of the language slightly, but the result is a net benefit to the programmer.

If your goal is to design a language targeted at C++ programmers, then removing null would probably violate their expectations. That will cause confusion, and make your language more difficult to learn. The key question is then, "what benefit do they get"? Or, alternatively, "what detriment does this cause".

If you are simply trying to design a "super small language" that can be implemented in the course of a single semester, then the story is different. In that case your objective isn't to be build a useful language targeted at a particular segment of the population. Instead, it's just to learn how to create a compiler. In that scenario, having a smaller language is a big benefit, and so it's worth eliminating null.

So, to recap, I would say that you should:

Identify your goals in creating the language. Who is the language designed for, and what are their needs.
Make the decision based on what helps the target users meet their goals in the best way.

Usually this will make the desired result pretty clear.

Of course, if you don't explicitly articulate your design goals, or you can't agree on what they are, then you are still going to argue. In that case, however, you are pretty much doomed anyways.

回复收藏 0 原文

她比我温柔 2024-07-21 12:40:47

另一种看待 null 的方式是，它是一个性能问题。如果您有一个包含其他复杂对象等的复杂对象，那么允许所有属性最初变为 null 比创建某种没有任何用处且很快就会被替换的空对象会更有效。

这只是我以前看不到提到的一种观点。

回复收藏 0 原文

美男兮 2024-07-21 12:40:47

null 有何用途？

我相信这里有两个 null 概念在起作用。

第一个（逻辑指示符为空）是传统的程序语言机制，它提供程序逻辑中未初始化内存引用的运行时指示。

第二个（空值）是一个基本数据值，可在逻辑表达式中使用，以检测逻辑空指示符（前面的定义）并在程序代码中做出逻辑决策。

您有什么想法，特别是支持或反对 null 吗？

虽然空值多年来一直是许多程序员的祸根和许多应用程序错误的根源，但空值概念仍然有效。如果您和您的团队创建的语言使用的内存引用可能由于未初始化而可能被误用，那么您可能需要一种机制来检测这种可能性。创建替代方案始终是一种选择，但 null 是一种广为人知的替代方案。

最重要的是，这一切都取决于您的语言的目标：

目标编程受众
鲁棒性
性能
等...

如果鲁棒性和程序正确性在您的优先级列表中很高，并且您允许编程内存引用，那么您将需要考虑 null。

BB

回复收藏 0 原文

鹊巢 2024-07-21 12:40:47

如果您正在创建静态类型语言，我想 null 可能会给您的编译器增加很多复杂性。

如果您正在创建动态类型语言，NULL 会非常方便，因为它只是另一种“类型”，没有任何变化。

回复收藏 0 原文

岁吢 2024-07-21 12:40:47

Null 是一个占位符，意味着不能为该变量分配任何值（对于静态类型语言附加“正确类型”）。

这里存在认知失调。我在其他地方听说人类无法理解否定，因为他们必须假设一个值，然后想象它的不适合性。

回复收藏 0 原文

很糊涂小朋友 2024-07-21 12:40:47

我对您的团队的建议是：提出一些需要用您的语言编写的示例程序，并看看如果您遗漏 null 和包含它，它们会是什么样子。

回复收藏 0 原文

挽清梦 2024-07-21 12:40:47

使用空对象模式！

如果您的语言是面向对象的，请让它具有一个仅存在一个单例实例的 UndefinedValue 类。然后在任何使用 null 的地方都使用此实例。这样做的优点是您的 null 将响应诸如 #toString 和 #equals 之类的消息。您永远不会像 Java 中那样遇到空指针异常。（当然，这要求您的语言是动态类型的）。

回复收藏 0 原文

旧竹 2024-07-21 12:40:47

Null 为那些尚未完全考虑其程序所需的逻辑和域的程序员提供了一种简单的出路，或者使用基本上没有明确且商定的定义的值的未来维护影响。

乍一看似乎很明显，它一定意味着“没有价值”，但实际上意味着什么取决于上下文。例如，如果 LastName === null，这是否意味着该人没有姓氏，或者我们不知道他们的姓氏是什么，或者尚未输入系统？ null 是否等于自身？在 SQL 中则不然。在许多语言中都是如此。但是如果我们不知道 personA.lastName 或 personB.lastName 的值，我们怎么知道 personA.lastName === personB.lastName，嗯？如果结果是假的，或者…… 无效的？

这取决于你在做什么，这就是为什么拥有某种系统范围的值是危险和愚蠢的，它可以用于任何看起来像“无”的情况，因为你的程序的其他部分和不能真正依赖外部库或模块来正确解释“null”的含义。

你最好清楚地定义lastName可能值的DOMAIN，以及每个可能值的实际含义，而不是依赖于一些模糊的系统范围的null概念，这可能与你正在做的事情有任何相关性，也可能没有任何相关性，取决于您使用的语言以及您想要执行的操作。当您开始操作数据时，一个值实际上可能以完全错误的方式运行。

回复收藏 0 原文

↘紸啶 2024-07-21 12:40:47

Null 对于对象就像 0 对于数字一样。

回复收藏 0 原文

很酷又爱笑 2024-07-21 12:40:46

空：十亿美元的错误。托尼·霍尔：

我称之为我的十亿美元错误。
这是零的发明
参考文献是1965年。当时，我
设计第一个综合类型
对象中的引用系统
面向语言（ALGOL W）。我的目标
是为了确保所有使用
参考文献应该绝对安全，
自动执行检查
由编译器。但我无法抗拒
放入 null 的诱惑
参考，只是因为它是如此
易于实施。这导致了
无数的错误、漏洞、
和系统崩溃，这有
可能造成了十亿美元的损失
过去四十年的痛苦和伤害
年。近年来，一些
程序分析器如 PREfix 和
微软的PREfast已经习惯了
检查参考文献，如果出现则发出警告
它们存在非空的风险。
最近的编程语言，例如
Spec# 引入了声明
非空引用。这是
解决方案，我在 1965 年拒绝了。

回复收藏 0 原文

暖心男生 2024-07-21 12:40:46

null 是一个哨兵值，它不是整数，不是字符串，也不是布尔值 - 实际上不是任何东西，除了要保存的东西并且是“不存在”值。不要将其视为或期望它是 0、空字符串或空列表。这些都是有效值，并且在许多情况下都可以是真正有效的值 - null 的想法意味着那里没有值。

也许这有点像函数抛出异常而不是返回值。只不过它不是制造并返回具有特殊含义的普通值，而是返回已经具有特殊含义的特殊值。如果一种语言期望您使用 null，那么您就不能真正忽略它。

回复收藏 0 原文

因为看清所以看轻 2024-07-21 12:40:46

哦不，我感觉哲学专业从我身上冒出来了……

NULL的概念来自于集合论中空集的概念。几乎每个人都同意空集不等于零。几十年来，数学家和哲学家一直在争论集合论的价值。

在编程语言中，我认为理解不引用内存中任何内容的对象引用非常有帮助。谷歌一下集合论，你会发现集合论学家使用的形式符号系统（符号）和我们在许多计算机语言中使用的符号之间的相似之处。

问候，
山姆

回复收藏 0 原文

喜你已久 2024-07-21 12:40:46

你问什么是空？

好吧，

没什么。

回复收藏 0 原文

友欢 2024-07-21 12:40:46

我通常在 C/C++ 方面将“null”视为“内存地址 0”。它不是严格需要的，但如果它不存在，那么人们只会使用其他东西（如果 myNumber == -1，或者如果 myString == ""）。

我所知道的是，我想不出我在编码中哪一天没有输入“null”这个词，所以我认为这非常重要。

在 .NET 世界中，MS 最近为 int、long 等添加了可以为空的类型，而这些类型以前从未为空，所以我猜他们认为这也非常重要。

如果我要设计一种语言，我会保留它。但是我也不会避免使用没有 null 的语言。也需要一点时间来适应。

回复收藏 0 原文

当爱已成负担 2024-07-21 12:40:46

零的概念不是严格必要的，就像零概念不是严格必要的一样。

回复收藏 0 原文

最美不过初阳 2024-07-21 12:40:46

我认为在整个语言设计的背景之外讨论 null 没有什么帮助。第一个困惑点：null 类型是空的，还是包含单个可区分的值（通常称为“nil”）？完全空的类型并不是很有用——尽管 C 使用空返回类型 void 来标记仅为了副作用而执行的过程，但许多其他语言使用单例类型（通常是空元组））以此目的。

我发现 nil 值在动态类型语言中使用最有效。在 Smalltalk 中，当您需要值但没有任何信息时使用该值。在 Lua 中，它的使用更加有效：nil 值是 Lua 表中唯一不能作为键或值的值。在Lua中，nil也被用作缺失参数或结果的值。

总的来说，我想说 nil value 在动态类型设置中很有用，但在静态类型设置中，null type 仅用于讨论函数（或为产生副作用而执行的过程或方法）。

不惜一切代价，避免在 C 和 Java 中使用 NULL 指针。这些是指针和对象的实现中固有的产物，在设计良好的语言中，它们不应该被允许。无论如何，要为您的用户提供一种方法来扩展具有空值的现有类型，但要让他们有目的地明确地执行此操作，不要意外地强制每种类型都有一个类型。（作为显式使用的一个示例，我最近在 Haskell 中实现了 Bentley 和 Sedgewick 的三元搜索树，并且我需要使用一个表示“不是字符”的附加值来扩展字符类型。为此，Haskell 提供了 Maybe< /code> 类型。）

最后，如果您正在编写编译器，最好记住该语言中最容易编译的部分以及导致最少错误的部分是不存在的部分:-)

回复收藏 0 原文

平安喜乐 2024-07-21 12:40:46

有一种方法来指示当前未指向任何东西的引用或指针似乎很有用，无论您将其称为 null、nil、None 等。如果没有其他原因让人们知道他们何时即将倒下离开链表的末尾。

回复收藏 0 原文

分开我的手 2024-07-21 12:40:46

在C中NULL是(void*(0))，所以它是一个带有值(?)的类型。但这不适用于 C++ 模板，因此 C++ 将 NULL 设为 0，删除了类型并变成了纯值。

然而，人们发现拥有特定的 NULL 类型会更好，因此他们（C++ 委员会）决定 NULL 将再次成为一种类型（在 C++0x 中）。

此外，除了 C++ 之外，几乎所有语言都将 NULL 作为类型，或者与 0 不同的等效唯一值（它可能等于或不等于，但不是同一个值）。

所以现在连 C++ 都会使用 NULL 作为类型，基本上结束了对这个问题的讨论，因为现在每个人（几乎）都会有一个 NULL 类型

编辑： 想想 Haskell 的也许是 NULL 类型的另一种解决方案，但它并不容易掌握或实施。

回复收藏 0 原文

水水月牙 2024-07-21 12:40:46

null 的一个实际例子是当您提出是/否问题但没有得到答复时。您不想默认为“否”，因为在答案非常重要的情况下知道问题没有得到回答可能很重要。

回复收藏 0 原文

还给你自由 2024-07-21 12:40:46

空不是一个错误。
Null 意味着“我还不知道”

对于基元，你实际上并不需要 null （我不得不说，字符串（在 .NET 中）不应该得到它，恕我直言），

但对于复合实体来说，它肯定有其用途。

回复收藏 0 原文

梦年海沫深 2024-07-21 12:40:46

您可以将任何类型视为带有操作集合的集合。在很多情况下，使用一个不是“正常”值的值是很方便的；例如，考虑“EOF”值。对于 C 的 getline()。您可以通过以下几种方式之一来处理该问题：您可以在集合之外拥有 NULL 值，您可以将特定值区分为 null（在 C 中，((void *)0) 可以达到此目的) 或者你可以有一种创建新类型的方法，这样对于类型 T，你可以创建一个类型 T' =def { T ∪ NULL }< /em>，这就是 Haskell 的做法（“也许”类型）。

哪一个更好有利于许多有趣的争论。

回复收藏 0 原文

温折酒 2024-07-21 12:40:46

Null 仅在变量未赋值的情况下才有用。如果每个变量都有值，则不需要空值。

回复收藏 0 原文

树深时见影 2024-07-21 12:40:46

Null 是一个哨兵值。它的值不可能是真实数据，而是提供有关正在使用的变量的元数据。

分配给指针的 Null 表示该指针未初始化。这使您能够通过检测空值指针的取消引用来检测未初始化指针的滥用。如果您将指针的值保留为等于内存中发生的任何值，那么您将获得非常不规则的程序行为，这将更加难以调试。

此外，C 风格的可变长度字符串中的空字符用于标记字符串的结尾。

以这些方式使用 null，特别是对于指针值，已经变得非常流行，以至于该隐喻已被导入到其他系统中，即使“null”标记值的实现方式完全不同并且与数字 0 无关。

回复收藏 0 原文

笑咖 2024-07-21 12:40:46

Null 不是问题——每个人对 null 的处理和解释都不同，这才是问题所在。

我喜欢空。如果没有 null，则 null 只会被替换为其他方式，让代码表示“我不知道，老兄！” （有些人会写“我不知道，伙计！”，或者“我不知道，老豆子！”等等，所以，我们会再次遇到完全相同的问题）。

我概括一下，我知道。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

峩卟喜欢

文章 0 评论 0

一向肩并

文章 0 评论 0

潜伏

文章 0 评论 0

dongyinghao

文章 0 评论 0

百变从容

文章 0 评论 0

沧笙踏歌

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文