当前位置：文江博客话题详情

什么是本体（数据库？）？

发布于 2024-08-26 11:16:03 字数 356 浏览 5 评论 0原文

我刚刚阅读这篇文章，它提到一些组织有一个本体论（？）他们的数据库（？）层，并且这样做的决定是错误的。问题是我以前没有听说过这个，所以我不明白为什么它不好。

所以我尝试在谷歌上搜索数据库和本体，并找到了很多 2006 年的 pdf 文件，其中充满了难以理解的内容（在我看来）。我读了其中一些，但目前仍然完全不知道他们在说什么。

我目前的印象是，这是2006年的一些疯狂时尚，一些学者试图向我们兜售，但由于他们的想法的措辞而惨遭失败。但我仍然很好奇是否有人真正知道这到底是怎么回事。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

作死小能手 2024-09-02 11:16:03

卡鲁塞尔已经提供了维基百科的定义：

“正式代表
知识由一组概念组成
一个域以及它们之间的关系
这些概念”。

为了实现这样的表示，已经开发了几种语言。目前最受关注的可能是网络本体语言（OWL）。

在传统的关系数据库中，概念可以使用表格来存储，但系统不包含任何关于概念含义以及它们与每个概念之间的关系的信息其他本体确实提供了存储此类信息的方法，这也意味着可以构建相当高级和智能的查询语言。 ="http://www.w3.org/TR/rdf-sparql-query/" rel="noreferrer">SPARQL 是专门为此目的而开发的

，我曾与 OWL 合作。本体论，但这是相当学术研究的一部分，我不知道这项技术目前是否在实践中得到了广泛应用，但我确信潜力是存在的。

更新：示例

关于本体的“含义”和推理的示例：假设您在本体中定义了一个类 Pizza 和一个类 Vegetarian Pizza，它是一个 披萨没有属于肉类类的成分。如果您现在创建的Pizza实例恰好没有任何肉类成分，系统可以自动推断您的披萨也是Vegetarian Pizza，即使您没有明确指定。

回复收藏 0 原文

无人问我粥可暖 2024-09-02 11:16:03

本体是一种模式（模型），描述域中的类型（可能还有一些个体）、类型和个体之间可能存在的关系，以及个体和属性组合方式的约束。

一种类比是 UML 类图 - 但本体具有形式语义，因此可以被机器解释，而不仅仅是供人类使用的图。

示例：

类：项目、人员、项目经理。 ProjectManager 是 Person 的子类（显然）。人员和项目是脱节的

关系：工作、管理。 Manages是works的子属性

约束：人们在项目上工作，而不是相反。只有项目经理才能管理项目。

这个简单的例子支持机器推理，例如，如果X管理Y，那么我们可以推断Y是一个项目，而X是一个项目经理，因此是一个人。

回复收藏 0 原文

依靠 2024-09-02 11:16:03

人工智能人们在某种程度上认为，如果我们想要构建一个系统，能够以某种方式认为我们应该让系统以某种方式了解我们对世界的了解。换句话说，他们希望通过生成一个数据库，将我们自己对这个词的理解强加给计算机，该数据库几乎包含我们所知道的概念和实体的信息和简明定义。这些数据库是用不同的算法建立的，但毕竟不是很精确。你最好看看一个被称为最好的数据库之一，叫做 CYC。
http://sw.openencyc.org/
检查框中的几个字，看看您会得到什么回报。
最好的祝愿

回复收藏 0 原文

極樂鬼 2024-09-02 11:16:03

曾几何时，我把这样的问题作为一项任务分配给一个优秀的开发人员来回答，因为我的上级相信本体论。但没有得到任何尖锐的答复，我的上司在一段时间后被解雇了。我还是很好奇。

我目前的理解是，这是自然语言中的单词（或“实体”）以不同的关系相互连接的想法。然后我们将这个想法推广到任何数据库实体。基本上，我们最终没有得到任何有趣的东西，也没有有用的查询语言。

我可能错了。

回复收藏 0 原文

虐人心 2024-09-02 11:16:03

维基百科怎么样？

本体是一种形式化的表示
知识由一组概念组成
域内和关系
这些概念之间

请参阅“领域本体”和此和该了解更多详细信息。

回复收藏 0 原文

余生共白头 2024-09-02 11:16:03

上面的一些评论似乎有点不屑一顾。
我在实际产品中使用了本体数据库，这是解决问题的唯一方法。本体可用于创建一个数据库，该数据库可以比关系数据库之类的数据库更好地涵盖现实世界的复杂性。 “信息”多于“数据”。当关系复杂且信息集庞大且不完整时，它尤其有用。
良好的本体数据库中的查询机制特别简洁 - 它智能地使用模式/本体（例如任何类层次结构）来返回否则找不到的答案。

回复收藏 0 原文

唠甜嗑 2024-09-02 11:16:03

本体论来自生物科学，这个词代表了一个非常简单的想法，但它是用其他不太常用的词来定义的。

通过领域内的一组概念以及这些概念之间的关系对知识的正式表示

知识的表示，或“模型”
领域，或“主题”
一组概念，或“领域中的事物”
概念之间的一组关系

因此，用计算机科学术语来说，它是一个图，其中节点对应于同一主题的所有部分，并用主题相关数据进行注释，并通过关系注释边连接到其他节点。

由于它是一个不太适合关系数据库的模型，如果您打算存储本体，您可能需要使用图形数据库，或者流行的关系数据库图形存储技术之一。

本体论没有在所有方面超越关系数据库的主要原因是因为关系数据库提供了一种简单的（尽管不太灵活）连接两个项目的方法，即外键。虽然这个键不允许使用大量注释来描述关系，但它确实限制了数据结构化方法的数量，防止人们创建各种关系（值得庆幸的是，这意味着限制浪费关系的数量）。

例如，在基于本体的“家谱”数据库中，

域是一个家谱，
模型是家谱中的个体及其关系。
概念是家庭中的人。
这些关系将是表示“母亲”、“父亲”、“麻烦”、“姐妹”等的边。

请注意，现在是棘手的部分。你有“妈妈”和“爸爸”，但是“父母”呢？如果省略“parent”，您的查找逻辑会更复杂，所以让我们添加一个新的关系“parent”，这意味着一个人的“母亲”现在有两个链接，“mother”和“parent”（就像父亲一样）。

“祖父母”呢？同样，从逻辑上讲，这样做会将一些信息排除在数据库之外，但存储这些信息会增加维护数据库的开销。

“叔叔”、“阿姨”、“岳父”、“岳父”等都添加了一种新的关系，本体背后的力量在于你不受你想要的关系类型的限制添加；然而，困难在于了解哪些关系直接影响解决方案（如果不直接存储关系，通常会缺乏性能，因为您需要进行多个数据库查找才能找到“组合关系”）。

Coming from the Biological Sciences, Ontology is a word that represents a really easy idea, but is defined with other less-commonly used words.

a formal representation of the knowledge by a set of concepts within a domain and the relationships between those concepts

A representation of knowledge, or a "model"
A domain, or "a topic"
A set of concepts, or "things in the domain"
A set of relationships between concepts

So, in computer science terms, it's a graph, where the nodes correspond to things which are all part of the same topic, are annotated with topic-related data, and are connected to other nodes with relationship annotated edges.

As it is a model that doesn't fit into relational databases well, if you intend to store an Ontology you might want to use a graph database, or one of the popular relational database graph storage techniques.

The primary reason Ontologizes haven't overtaken relational databasees in all aspects is because relational databases provide a simple, even if less flexible, means of connecting two items, the foreign-key. While this key doesn't permit a lot of annotation to describe the relationship, it does limit the number of approaches to data structuring, preventing people from creating every kind of relationship (which thankfully means limiting the number of wasteful relationships).

For example, in a "family tree" database based on Ontologies

The domain is one family's tree
The model is the individuals and their relationships within the family tree.
The concepts are the people in the family.
The relationships would be the edges indicating "mother", "father", "bother", "sister", etc.

Note that now comes the tricky part. You have "mother" and "father", but what about "parent"? If you omit "parent" your lookup logic is more complex, so let's include a new relationshiop "parent", which means a "mother" of a person now has two links, "mother" and "parent" (as does the father).

What about "grandparent"? Again, doing it logically leaves some of the information out of the database, but storing it increases the overhead of maintaining the database.

"uncle", "aunt", "in-law", "father-in-law", etc. all add in one new relationship, and the power behind Ontologies is that you are not constrained as to the kinds of relationships you wish to add; however, the difficulties lie in knowing which relationships directly impact the solution (and the general lack of performance if you don't store the relationships directly, as you need to do multiple database lookups to find a "composed relationship").

回复收藏 0 原文