最全BAT数据库面试89题:mysql、大数据、redis

数据库 mysql面试题目:

  1. MySQL InnoDB、Mysaim的特点?
  2. 乐观锁和悲观锁的区别??
  3. 行锁和表锁的区别?
  4. 数据库隔离级别是什么?有什么作用?
  5. MySQL主备同步的基本原理。
  6. 如何优化数据库性能(索引、分库分表、批量操作、分页算法、升级硬盘SSD、业务优化、主从部署)
  7. SQL什么情况下不会使用索引(不包含,不等于,函数)
  8. 一般在什么字段上建索引(过滤数据最多的字段)
  9. MySQL,B+索引实现,行锁实现,SQL优化
  10. 如何解决高并发减库存问题
  11. 数据库事务的几种粒度

数据库 题目:

  1. 事务四大特性(ACID)
  2. 数据库隔离级别,每个级别会引发什么问题,mysql默认是哪个级别
  3. MYSQL的两种存储引擎区别(事务、锁级别等等),各自的适用场景
  4. 数据库的优化(从sql语句优化和索引两个部分回答)
  5. 索引有B+索引和hash索引,各自的区别
  6. B+索引数据结构,和B树的区别
  7. 索引的分类(主键索引、唯一索引),最左前缀原则,哪些情况索引会失效
  8. 聚集索引和非聚集索引区别。
  9. 有哪些锁(乐观锁悲观锁),select时怎么加排它锁
  10. 关系型数据库和非关系型数据库区别
  11. MVCC机制

数据库实战

  1. 数据库三范式,根据秒杀场景设计数据表
  2. 数据库的主从复制
  3. 死锁怎么解决
  4. mysql并发情况下怎么解决(通过事务、隔离级别、锁)

Redis

  1. redis数据结构有哪些
  2. redis队列应用场景
  3. redis和Memcached(支持数据持久化)
  4. Redis,RDB和AOF,如何做高可用、集群

大数据:

  1. mapreduce过程
  2. hbase和传统数据库的区别
  3. hbase读数据过程
  4. hbase master和regionserver的交互
  5. hbase的ha,zookeeper在其中的作用,master宕机的时候,哪些能正常工作,读写数据?region分裂?
  6. 数据倾斜
  7. mysql索引,哪些索引?实现原理?哪些存储引擎支持B树索引,哪些支持hash索引?
  8. 为啥mysql索引要用B+树而MongoDB用B树?
  9. Mysql查询优化?
  10. 主键和唯一索引的区别
  11. 事务的隔离机制,mysql默认是哪一级
  12. MyISAM和InnoDB存储引擎的区别
  13. mysql查询优化,慢查询怎么去定位?
  14. mysql中的各种锁,乐观锁,悲观锁(排他锁,共享锁);行锁,表锁是怎么实现的?
  15. mapreduce支持哪些join,map端?reduce端?semi join?semi join你可以通过什么算法去优化?
  16. mapreduce实现二次排序
  17. 用mapreduce实现两表join
  18. 用mapreduce实现一个存储kv数据的文件,对里面的v进行全量排序
  19. zookeeper实现原理,zab协议以及原子广播协议
  20. paxos协议,multi-paxos,zab,raft各种分布式协议内容,使用场景
  21. hadoop namenode的ha,主备切换实现原理,日志同步原理,QJM中用到的分布式一致性算法(就是paxos算法)
  22. spark运行架构
  23. spark运行原理,从提交一个jar到最后返回结果,整个过程
  24. spark的stage划分是怎么实现的?拓扑排序?怎么实现?还有什么算法实现?
  25. spark rpc,spark2.0为啥舍弃了akka,而用netty?
  26. spark的各种shuffle,与mapreduce的对比
  27. spark的各种ha,master的ha,worker的ha,executor的ha,driver的ha,task的ha,在容错的时候对集群或是task有什么影响?
  28. spark的内存管理机制,spark1.6前后对比分析
  29. spark2.0做出了哪些优化?tungsten引擎?cpu与内存两个方面分别说明
  30. spark rdd、dataframe、dataset区别
  31. callable runnable 区别
  32. synchronized与lock区别
  33. 类加载机制
  34. gc算法
  35. spark数据倾斜
  36. spark shuffle
  37. spark 内存管理
  38. 各种排序算法,时间复杂度,空间复杂度,spark和hadoop中shuffle中各个阶段用到的排序算法把这几种排序算法的使用场景表现得淋漓尽致啊。

常见数据库面试题目和答案:

1、触发器的作用?

触发器是一中特殊的存储过程,主要是通过事件来触发而被执行的。它可以强化约束,来维护数据的完整性和一致性,可以跟踪数据库内的操作从而不允许未经许可的更新和变化。可以联级运算。如,某表上的触发器上包含对另一个表的数据操作,而该操作又会导致该表触发器被触发。

2、什么是存储过程?用什么来调用?

存储过程是一个预编译的SQL语句,优点是允许模块化的设计,就是说只需创建一次,以后在该程序中就可以调用多次。如果某次操作需要执行多次SQL,使用存储过程比单纯SQL语句执行要快。 调用: 1)可以用一个命令对象来调用存储过程。 2)可以供外部程序调用,比如:java程序。

3、存储过程的优缺点?

优点: 1)存储过程是预编译过的,执行效率高。 2)存储过程的代码直接存放于数据库中,通过存储过程名直接调用,减少网络通讯。 3)安全性高,执行存储过程需要有一定权限的用户。 4)存储过程可以重复使用,可减少数据库开发人员的工作量。 缺点:移植性差

4、存储过程与函数的区别

存储过程函数用于在数据库中完成特定的操作或者任务(如插入、删除等)用于特定的数据(如选择)程序头部声明用procedure程序头部声明用function程序头部声明时不需描述返回类型程序头部声明时要描述返回类型,而且PL/SQL块中至少要包括一个有效的return语句可以使用in/out/in out 三种模式的参数可以使用in/out/in out 三种模式的参数可作为一个独立的PL/SQL语句来执行不能独立执行,必须作为表达式的一部分调用可以通过out/in out 返回零个或多个值通过return语句返回一个值,且改值要与声明部分一致,也可以是通过out类型的参数带出的变量SQL语句(DML 或SELECT)中不可调用存储过程SQL语句(DML 或SELECT)中可以调用函数

5、索引的作用?和它的优点缺点是什么?

索引就一种特殊的查询表,数据库的搜索可以利用它加速对数据的检索。它很类似与现实生活中书的目录,不需要查询整本书内容就可以找到想要的数据。索引可以是唯一的,创建索引允许指定单个列或者是多个列。缺点是它减慢了数据录入的速度,同时也增加了数据库的尺寸大小。

6、什么样的字段适合建索引

唯一、不为空、经常被查询的字段

7、索引类型有哪些?

逻辑上:

Single column 单行索引

Concatenated 多行索引

Unique 唯一索引

NonUnique 非唯一索引

Function-based 函数索引

Domain 域索引 物理上:

Partitioned 分区索引

NonPartitioned 非分区索引

B-tree :

Normal 正常型B树

Rever Key 反转型B树 Bitmap 位图索引

8、什么是事务?什么是锁?

事务就是被绑定在一起作为一个逻辑工作单元的SQL语句分组,如果任何一个语句操作失败那么整个操作就被失败,以后操作就会回滚到操作前状态,或者是上有个节点。为了确保要么执行,要么不执行,就可以使用事务。要将有组语句作为事务考虑,就需要通过ACID测试,即原子性,一致性,隔离性和持久性。 锁:在所以的DBMS中,锁是实现事务的关键,锁可以保证事务的完整性和并发性。与现实生活中锁一样,它可以使某些数据的拥有者,在某段时间内不能使用某些数据或数据结构。当然锁还分级别的。

9、什么叫视图?游标是什么?

视图:是一种虚拟的表,具有和物理表相同的功能。可以对视图进行增,改,查,操作,试图通常是有一个表或者多个表的行或列的子集。对视图的修改会影响基本表。它使得我们获取数据更容易,相比多表查询。 游标:是对查询出来的结果集作为一个单元来有效的处理。游标可以定在该单元中的特定行,从结果集的当前行检索一行或多行。可以对结果集当前行做修改。一般不使用游标,但是需要逐条处理数据的时候,游标显得十分重要。

10、视图的优缺点

优点: 1)对数据库的访问,因为视图可以有选择性的选取数据库里的一部分。 2 )用户通过简单的查询可以从复杂查询中得到结果。 3 )维护数据的独立性,试图可从多个表检索数据。 4 )对于相同的数据可产生不同的视图。 缺点: 性能:查询视图时,必须把视图的查询转化成对基本表的查询,如果这个视图是由一个复杂的多表查询所定义,那么,那么就无法更改数据

11、列举几种表连接方式,有什么区别?

内连接、自连接、外连接(左、右、全)、交叉连接 内连接:只有两个元素表相匹配的才能在结果集中显示。 外连接: 左外连接:左边为驱动表,驱动表的数据全部显示,匹配表的不匹配的不会显示。 右外连接:右边为驱动表,驱动表的数据全部显示,匹配表的不匹配的不会显示。 全外连接:连接的表中不匹配的数据全部会显示出来。 交叉连接: 笛卡尔效应,显示的结果是链接表数的乘积。

12、主键和外键的区别?

主键在本表中是唯一的、不可唯空的,外键可以重复可以唯空;外键和另一张表的主键关联,不能创建对应表中不存在的外键。

13、在数据库中查询语句速度很慢,如何优化?

1.建索引 2.减少表之间的关联 3.优化sql,尽量让sql很快定位数据,不要让sql做全表查询,应该走索引,把数据 量大的表排在前面 4.简化查询字段,没用的字段不要,已经对返回结果的控制,尽量返回少量数据 5.尽量用PreparedStatement来查询,不要用Statement

14、数据库三范式是什么?

第一范式:列不可再分 第二范式:行可以唯一区分,主键约束 第三范式:表的非主属性不能依赖与其他表的非主属性 外键约束 且三大范式是一级一级依赖的,第二范式建立在第一范式上,第三范式建立第一第二范式上

15、union和union all有什么不同?

UNION在进行表链接后会筛选掉重复的记录,所以在表链接后会对所产生的结果集进行排序运算,删除重复的记录再返回结果。实际大部分应用中是不会产生重复的记录,最常见的是过程表与历史表UNION。 UNION ALL只是简单的将两个结果合并后就返回。这样,如果返回的两个结果集中有重复的数据,那么返回的结果集就会包含重复的数据了。 从效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复的数据的话,那么就使用UNION ALL。

16、Varchar2和varchar有什么区别?

Char的长度是固定的,而varchar2的长度是可以变化的,比如,存储字符串“abc”对于char(20),表示你存储的字符将占20个字节,包含17个空,而同样的varchar2(20)只占了3个字节,20只是最大值,当你存储的字符小于20时,按实际长度存储。 char的效率要被varchar2的效率高。 目前varchar是varchar2的同义词,工业标准的varchar类型可以存储空字符串,但是oracle不能这样做,尽管它保留以后这样做的权利。Oracle自己开发了一个数据类型varchar2,这个类型不是一个标准的varchar,他将在数据库中varchar列可以存储空字符串的特性改为存储null值,如果你想有向后兼容的能力,oracle建议使用varchar2而不是varchar

17、Oracle和Mysql的区别?

1)库函数不同。 2)Oracle是用表空间来管理的,Mysql不是。 3)显示当前所有的表、用户、改变连接用户、显示当前连接用户、执行外部脚本的语句的不同。 4)分页查询时候时候,mysql用limit oracle用rownum

猜你喜欢

转载自blog.csdn.net/weixin_42034166/article/details/84060764