Azure数据类型

Azure 提供了许多数据平台技术,以便满足常见数据类型的需求。 值得注意的两大类数据:结构化数据和非结构化数据。

结构化数据

在 Microsoft SQL Server、Azure SQL 数据库和 Azure SQL 数据仓库等关系数据库系统中,数据结构是在设计时定义的。 数据结构以表的形式设计。 这意味着它是在将任何信息加载到系统之前设计的。 数据结构包括关系模型、表结构、列宽和数据类型。

关系系统对数据需求的变化反应很慢,因为每次数据需求发生变化时,结构数据库都需要发生变化。 当添加新列时,可能需要对所有现有记录进行批量更新,以填充整个表中的新列。

关系系统通常使用查询语言,如 Transact SQL (T-SQL)。

非结构化数据

非结构化数据的示例包括二进制、音频和图像文件。 非结构化数据存储在非关系系统中,通常称为非结构化系统或 NoSQL 系统。 在非关系系统中,数据结构不是在设计时定义的,数据通常以原始格式加载。 仅在读取数据时定义数据结构。 由于定义点存在差异,可以灵活地为不同的输出使用相同的源数据。 非关系系统还可以支持半结构化数据,例如 JSON 文件格式。

开放源代码环境提供四种类型的 NoSQL 数据库:

  1. 键值存储:在表结构中存储键值对数据。
  2. 文档数据库:存储标有元数据的文档以帮助文档搜索。
  3. 图形数据库:使用顶点和边缘组成的结构来查找数据点之间的关系。
  4. 列数据库:基于列而不是行存储数据。 可以在查询的运行时定义列,从而允许以执行方式返回的数据的灵活性。

现在我们已经回顾了数据类型,让我们看看有助于存储、处理和查询这些数据类型的通用数据平台技术。

半结构化数据

半结构化数据的组织条理性与结构化数据相比要弱,且由于字段并不完全符合表、行和列的结构,不会以关系格式存储。 半结构化数据包含突显数据的组织和层次结构的标记,例如键/值对。 半结构化数据也称为非关系数据或 NoSQL 数据。 此样式的数据的表达式和结构由序列化语言定义。

对于软件开发人员来说,数据序列化语言非常重要,因为它们可用于将存储在内存中的数据写入文件,并发送到另一个系统进行分析和读取。 发送方和接收方无需知道有关另一个系统的详细信息,只要使用同样的序列化语言,这两个系统便可以理解数据。

参见原文:

浏览结构化和非结构化数据 - Learn | Microsoft Docs

对数据进行分类 - Learn | Microsoft Docs

猜你喜欢

转载自blog.csdn.net/figosoar/article/details/120260138