51数据库术语你需要知道

很多人都在谈论数据的指数增长,我们很快就会得到比我们知道要做的更多的数据。然而,没有那么多人在谈论数据库这方面-但他们应该!随着数据的增长,数据库需要能够跟上。这就是为什么不仅要了解如何分析不断增长的数据量,还要了解如何拥有能够处理数据的数据库,这一点变得越来越重要。这就是为什么Dzone编辑团队聚集了一个由51个数据库术语组成的列表,您需要知道是否要在这种数据溢出的情况下保持运行。(顺便说一句,如果你对此感兴趣,你也可能对我们的大数据词汇表!)

A

酸(原子性、稠度、隔离性、耐久性)一个术语,指数据库事务的模型属性,传统上用于SQL数据库。

骨料一组域对象,可以作为一个单元来处理。在大型分布式系统上存储数据的理想单元。

阿帕奇卡桑德拉:一个开放源码的分布式数据库系统,它可以跨服务器存储和管理大数据,也可以成为大型数据库的读取量大的数据库。商务智能系统。

阿帕奇·卢塞尼一个开源文本检索库,通常用于全文搜索、实现搜索引擎和实现推荐系统.

阿帕奇火花一个开放源码的并行处理框架,用于处理大规模的数据分析应用程序、实时分析和数据处理工作负载.

B

基础(基本可用性、软状态、最终一致性)一个术语,指数据库事务的模型属性,特别是用于需要管理非结构化数据的NoSQL数据库。

B树:一种数据结构,其中所有终端节点与基的距离相同,所有非终端节点在n到2n个子树或指针之间。它是针对读取和写入大量数据块或执行大部分读取的系统而优化的。

C

云原生数据库一个建立在云计算交付模型之上并运行的数据库。

复杂事件处理*为分析和规划目的从多个流收集数据的组织过程。

一致性数据库事务的四个主要属性之一,意味着如果事务失败,数据将返回到其原始状态,或者如果没有失败,则创建新的数据状态。

D

数据库聚类将两个或多个服务器和实例连接到数据库,通常是为了容错、负载平衡和并行处理。

数据谱系有关数据来源、更改方式和移动位置的信息;可用于解决数据库中的验证和调试问题。

数据管理组织如何处理存储、处理和分析数据集的完整生命周期。

数据挖掘在大量数据中发现模式并将这些信息转换为可以理解的格式的过程。

数据库管理系统一套管理最终用户和数据库之间数据的软件和工具。

数据仓库:一组单独的计算机,它们一起工作,似乎是一个单一的系统。这需要访问中央数据库、每台计算机上的多个数据库副本或每台计算机上的数据库分区。

分布式关系数据库*包含对象(如表)的数据库,这些对象是不同但相互关联的系统的一部分。

分布式系统:一组单独的计算机,它们一起工作,看起来像一个单一的系统。这需要访问中央数据库、每台计算机上的多个数据库副本或每台计算机上的数据库分区。

文档存储一种数据库,它从文件而不是定义的表格中聚合数据,并用于以可搜索的形式显示文件数据。

迪纳摩数据库:一个来自AWS的NoSQL数据库服务,它具有较低的延迟时间,可以轻松地存储和检索大数据,并提供大量的通信量。

E

弹性搜索一个基于Java的搜索引擎构建在ApacheLucene下,它搜索和索引几乎实时的文件,并自动对JSON文档进行索引。

最终一致性*符合基本模型的数据库将包含随着时间推移变得一致的数据的想法。

F

容错*系统对硬件或软件故障作出反应的能力,而不影响其他系统。

G

图库一种数据库类型,用于处理具有大量关系的实体,如社交图、标记系统或任何链接丰富的域;它还经常用于路由和定位服务。

H

HadoopApacheSoftwareFoundation框架是专门为高可伸缩性、数据密集型和分布式计算而开发的.它主要用于批量处理大型数据集,非常有效。

高可用性(HA)*指即使在组件发生故障后,计算机系统中仍可持续获得资源。这可以通过冗余硬件、软件解决方案和其他特定策略来实现。

混合事务/分析处理:一种被称为“打破事务处理和分析之间的墙”的应用程序体系结构,它支持实时决策。

I

内存中作为一个通用的行业术语,它描述了将数据加载到RAM或闪存中而不是硬盘或固态驱动器的数据管理工具。

J

加入:SQL中的一个子句,它使用每个表共有的值组合关系数据库中一个或多个表中的列。

日志记录:指数据库中所有数据更新的同时、实时日志记录。生成的日志作为审计跟踪,可用于在原始数据损坏或删除时重建数据库。

JPA(Java持久性API):Java规范,用于访问、管理和持久化Java对象/类和关系数据库之间的数据。

K

键值存储一种以简单的键值对存储数据的数据库类型。它们用于处理大量小的、连续的和潜在的易失性读写。

L

雷电存储器-映射数据库(Lmdb)一个B树数据库,它完全是事务性的,符合ACID的,体积小,并且使用MVCC.

日志结构合并(LSM)树一种数据结构,它使用通常组织成层次的不可变段或运行来写入和编辑数据。有几种策略,但第一层通常包含最新和活跃的数据。

M

地图推理一种由Google创建的编程模型,用于在多个集群上进行高可伸缩性和分发,以便进行数据处理。

多版本并发控制(Mvcc)一种处理机器同时读写数据库的情况的方法。

N

非第一范式查询语言(N1QL)它由Couchbase开发,为面向文档的分布式数据库提供了通用的查询语言和基于JSON的数据模型.

NewSQL*关系数据库系统的速记描述符,它提供与NoSQL系统相同的水平可伸缩性和性能。

NoSQL一种数据库系统,它集成了在传统SQL之外进行查询的其他方法,并且不使用标准的关系结构。

O

对象-关系映射器(ORM)提供数据库抽象层的工具,用于使用面向对象的编程语言而不是数据库的查询语言在不兼容的类型系统之间转换数据。

P

平行性操作系统能够有效合作解决问题的状态。

持久力:指的是一个程序的信息,它的寿命超过了创建它的进程,这意味着它不会在关闭或清除RAM的过程中被擦除。数据库提供持久性。

多标记持久性*指一个组织对不同类型的数据使用几种不同的数据存储技术。

R

关系数据库在表、记录和列中构造相互关联的数据集的数据库。

复制*用于数据共享的术语,以确保冗余资源之间的一致性。

S

可伸缩性*数据库或其他系统能够承担更多的资源和能力,并将多个实体连接起来,以提高效率,

图式*单个数据库独特数据结构的术语。

切分也称为“水平分区”,切分是指将数据库分割成几个部分,通常是为了提高应用程序的速度和可靠性。

强一致性一个数据库概念,指无法提交违反数据库数据有效性规则的事务。

结构化查询语言(SQL)一种用于管理和操作数据的编程语言;主要用于关系数据库。

W

宽栏商店*这些数据库也被称为“BigTable存储”,因为它们与Google早期的BigTable数据库有关,它们将数据存储在可以容纳大量动态列的记录中。列名和记录键没有固定。


猜你喜欢

转载自blog.51cto.com/14009535/2300719