数据采集—数据库基础及采集

数据库基础及采集

数据库概述

简介

管理各项信息工作的过程中产生或需要大量数据,数据库系统更有效存储、和管理日益重要的信息

各种概念

Data:数据,是数据库中存储的基本对象,是描述事物的符号记录

Database:数据库,是长期存储在计算机内、有组织的、可共享的大量数据的集合

DBMS:数据库管理系统,是用户与操作系统之间的一层数据管理软件,主要用于对数据的管理和维护。

DBS:数据库系统,计算机系统引入数据库后的系统

数据模型:用来抽象、表示、和处理现实世界中的数据和信息的工具,是对现实世界的模拟,是数据库系统的核心和基础。

概念模型:按用户的观点来对数据和信息建模,主要用于数据库设计

逻辑模型:按计算机系统的观点对数据建模,用于DBMS实现

物理模型:对数据最底层的抽象,描述数据在系统内部的表示方式和存取方式,在磁盘或磁带上的存储方式和存取方式。

实体和属性客观存在并可相互区别的事物称为实体。实体所具有的某一特性称为属性。

ER图:实体关系图,描述现实世界的事物及其相互关系

关系模式:由一组关系组成,每个关系的数据结构是一张规范化的二维表。

型/值:型是对某一类数据的结构和属性的说明,值是型的一个具体赋值,是型的实例

数据库模式:描述数据库中全体数据的逻辑结构和特征

数据操作

sql语言的种类

DML:用来插入、修改和删除数据库中的数据(insert into、delete、update

DDL:用来建立数据库、建立表(create、show、alter table、drop

DQL:用来对数据库中的数据进行查询(select

DCL:用来控制数据库组件的存取许可、存取权限

创建索引

概述

索引可以理解为数据的目录,可以大大提高查询速度,改善数据库的性能。

作用

  1. 加快数据的检索
  2. 加快表与表之间的连接
  3. 使用order by和group by时,更大减少查询时间

种类

  1. 普通索引
  2. 唯一索引
  3. 全文索引
  4. 多列索引

sql语句

create [约束条件] index indexname on tablename(colname/col1,col2)

数据库数据采集

logstash+mysql

mysql准备

在test数据库中创建表,随意添加数据

logstash配置

在logstash的bin目录下,放入mysql-connector-java-5.1.25.jar包。

在logstash的config目录下创建mysql.conf,并添加配置信息。

启动logstash

在logstash的bin目录下,执行logstash -f …/config/logstash.conf启动logstash。

之后logstash会按照配置的执行频率,执行脚本。

おすすめ

転載: blog.csdn.net/rfdjds/article/details/121688515