当前位置：文江博客话题详情

如何决定使用哪种NoSQL技术？

发布于 2024-09-19 20:58:41 字数 1884 浏览 11 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

野味少女 2024-09-26 20:58:41

MongoDB

可扩展性： 高度可用且一致，但在关系和许多分布式写入方面表现不佳。它的主要好处是存储和索引无模式文档。文档大小上限为 4mb，索引仅对有限的深度有意义。请参阅http://www.paperplanes.de/2010/2/25/notes_on_mongodb。 html

最适合： 深度有限的树结构

用例： 多样化类型层次结构、生物系统学、图书馆目录

Neo4j

可扩展性： 高度可用，但不是分布式的。强大的遍历框架，可实现节点空间的高速遍历。仅限于数十亿个节点/关系的图表。请参阅http://highscalability.com/neo4j-graph-database-kicks-buttox

最适合： 具有无限深度和循环加权连接的深度图

用例： 社交网络、拓扑分析、语义 Web 数据、推理

HBase

可扩展性：可靠、一致的存储（PB 级及以上）。支持具有有限的稀疏属性集的大量对象。与 Hadoop 协同工作以执行大型数据处理作业。 http://www.ibm.com/developerworks/opensource/library /os-hbase/index.html

最适合：有向、非循环图

用例：日志分析、语义网络数据、机器学习

回复收藏 0 原文

意犹 2024-09-26 20:58:41

我知道这似乎是一个奇怪的地方，但是 Heroku 最近对他们的 noSQL 产品很着迷，并且对许多当前项目有一个很好的概述。它绝不是 Slideshare 印刷机，但它将帮助您开始比较过程：

http://blog.heroku.com/archives/2010/7/20/nosql/?utm_medium=email&utm_source= EmailBlast&utm_content=619506254&utm_campaign=HerokuSeptemberNewsletter-VersionB&utm_term=NoSQLHerokuandYou

回复收藏 0 原文

心如狂蝶 2024-09-26 20:58:41

查看一下 NoSQL 数据库的概览比较：

http://kkovacs.eu /cassandra-vs-mongodb-vs-couchdb-vs-redis

回复收藏 0 原文

高冷爸爸 2024-09-26 20:58:41

MongoDB：

MongoDB 是文档数据库，与关系数据库不同。该文档存储半结构化数据，如 JSON 对象（无架构）

主要特征：

架构可以随着应用程序的发展而改变
完全索引
负载平衡和负载均衡。数据分片
数据复制
一致性与一致性CAP 理论中的分区（一致性-可用性-分区）

何时使用：

实时分析
高速日志记录
半结构化数据管理

何时不使用：

具有强 ACID 属性（原子性、一致性、隔离性和持久性）的高度事务性应用程序。在此用例中，RDBMS 是首选。
操作涉及关系 - 外键等的数据集

HBASE：

HBase 是一个开源、非关系型、分布式列族数据库

主要特性：

它提供了一种存储大量稀疏数据的容错方式（在大量空或不重要数据中捕获的少量信息，例如查找 50 个最大的数据）一组 20 亿条记录中的项，或者查找代表小于 0.1% 的巨大集合的非零项）
支持每行不同的变量模式
可以作为 MapReduce 作业的输入和输出
压缩、内存中操作，以及每列上的布隆过滤器（一种数据结构，旨在快速且高效地告诉您某个元素是否存在于集合中）
5.在CAP上实现CP

何时使用HBase：

如果您正在按键加载数据、按键（或范围）搜索数据、按键提供数据、查询数据按键按行
存储不太符合架构（变量架构）的数据

何时不使用 HBase：

对于关系分析
全表扫描
要聚合的数据，按行而不是列进行分析

Neo4j：

Neo4j 是使用属性图数据模型的图形数据库（数据存储为图形和节点以及与属性的关系）

主要功能：

支持完整的 ACID（原子性、一致性、隔离性和持久性）规则
使用 Apache Lucence
Schema 免费、自下而上的数据模型设计
支持索引由于可用于图形的紧凑存储和内存缓存，实现了高可扩展性

<强>何时使用：

主数据管理
网络和 IT 运营
实时建议
欺诈检测
社交网络（如 Facebook）

何时不使用：

批量查询/扫描
如果您的应用程序需要分区和扫描数据分片

在这篇文章中查看各种 NoSQL 技术的比较

来源：

Wiki、幻灯片共享、Cloudera,教程点,Neo4j

MongoDB:

MongoDB is document database unlike Relational database. The document stores semi structured data like JSON object ( schema free)

Key features:

Schema can change over evolution of application
Full indexing
Load balancing & Data sharding
Data replication
Consistency & Partitioning in CAP theory ( Consistency-Availability-Partitioning)

When to use:

Real time analytics
High speed logging
Semi structured data management

When not to use:

Highly transactional applications with strong ACID properties ( Atomicity, Consistency, Isolation & Durability). RDBMS is preferred in this use case.
Operating on data sets involving relations - foreign keys etc

HBASE:

HBase is an open source, non-relational, distributed column family database

Key features:

It provides a fault-tolerant way of storing large quantities of sparse data (small amounts of information caught within a large collection of empty or unimportant data, such as finding the 50 largest items in a group of 2 billion records, or finding the non-zero items representing less than 0.1% of a huge collection)
Supports variable schema where each row is different
Can serve as the input and output for MapReduce job
Compression, in-memory operation, and Bloom filters on a per-column (A data structure designed to tell you, rapidly and memory-efficiently, whether an element is present in a set)
5.Achieve CP on CAP

When to use HBase:

If you’re loading data by key, searching data by key (or range), serving data by key, querying data by key
Storing data by row that doesn’t conform well to a schema (variable schema)

When not to use HBase:

For relational analytics
Full table scans
Data to be aggregated, analyzed by rows instead of columns

Neo4j:

Neo4j is graph database using Property Graph Data Model (Data is stored as a graph and nodes & relationships with properties)

Key features:

Supports full ACID(Atomicity, Consistency, Isolation and Durability) rules
Supports Indexes by using Apache Lucence
Schema free, bottom-up data model design
High scalability has been achieved due to compact storage and memory caching available for graphs

When to use: