使用什么数据存储模型来存储维基百科中的文章
维基百科中的文章经过编辑。它们可以增长/收缩/更新等。下面使用什么文件系统/数据库存储布局等来支持它。在数据库课程中,我读过一些关于可变长度记录的内容,但这似乎更多的是小字符串,而不是整个文档。就像在文件系统中一样,文件可以增长/收缩等,我认为它是通过将块链接在一起来完成的。每次,我们更新一个文件,而不是整个文件被重写。也许这里会做类似的事情。
我正在寻找特定的名称、术语,甚至可能是 mysql 中的模式是如何定义的。 (我认为维基百科使用mysql)。
下面是一些关于维基百科架构的文章的链接,但我无法回答我的问题:
http://dom.as/uc/workbook2007.pdf
谢谢,
Articles in wikipedia get edited. They can grow/shrink/updated etc. What file system/database storage layout etc is used underneath to support it. In database course, I had read a bit on variable length record, but that seemed like more for small strings and not for whole document. Like in file system, files can grow/shrink etc, and I think its done by chaining blocks together. each time, we update a file, not the whole file is rewritten. Perhaps something similar would be done here.
I am looking for specific names,terminologies, may be even how the schema in mysql is defined. (I think wikipedia uses mysql).
Below are links to some writeup on wikipedia architecture, but I am not being able to answer my question from these:
http://dom.as/uc/workbook2007.pdf
Thanks,
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
请参阅:
http://www.mediawiki.org/wiki/Manual:Database_layout
See:
http://www.mediawiki.org/wiki/Manual:Database_layout