数据结构第一课

1. 前言
2. 数据结构前言
3. 算法效率
- 3.1 算法的复杂度
- 3.2 复杂度在面试中的考察
4. 时间复杂度
5. 空间复杂度
6. 常见复杂度对比
7. 总结

1. 前言

在我们学习完C语言的所有内容后,现在就可以开始我们的数据结构的学习,如果有读者也想走C/C++研发方向,可以跟着我一起往后学.本篇文章将收于专栏数据结构学习分享,会持续更新内容.

2. 数据结构前言

2.1 什么是数据结构和算法?

数据结构(Data Structure)是计算机存储、组织数据的方式，指相互之间存在一种或多种特定关系的数据元素的集合。

算法(Algorithm):就是定义良好的计算过程，他取一个或一组的值为输入，并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤，用来将输入数据转化成输出结果。

2.2 数据结构和算法的重要性

当前校园招聘笔试一般采用Online Judge形式(简称OJ题)，一般都是20-30道选择题，3-4道编程题,其中数据结构和算法所占的比例我们可以参考一下腾讯2017校招开发工程师笔试试卷.还有我们在通过笔试后进入面试阶段,HR也常常会向我们提一些比较有专业性的问题比如:

你了解队列和栈吗？

怎么用两个栈实现一个队列。

判断两个链表是否相交。

学习STL具体是怎么开展的？

红黑树的原理、时间复杂度等；

Hashmap相关；

哈希表和快速排序思想

这些都是属于我们的数据结构的问题

2.3 如何学好数据结构和算法?

我的建议是死磕代码,磕成这样就好了[狗头]

在这里插入图片描述
当然这虽然是夸张了,但是死磕代码是真的!

再一个,在我们关于单链表Oj题的分享中(单链表oj题分享)就已经强调过,这一部分必须要画图,画图分析也是很重要的

2.4 一些文章和书籍

关于数据结构更多的了解,这里我给大家推荐一篇文章数据结构与算法对于程序员的重要性, 数据结构学习得差不多了，推荐大家都去把《剑指offer》和《程序员代码面试指南》上的题做一遍

3. 算法效率

我们如何衡量一个算法的好坏?是代码越少算法越好吗?比如对于以下斐波那契数列:

long long Fib(int N)
{
    
    
 if(N < 3)
 return 1;
 return Fib(N-1) + Fib(N-2);
}

这段代码十分简洁,但是我们在学习C语言的时候知道,用递归求斐波那契数列是不明智的选择,因为它的计算量非常大,所以算法的好坏与代码量是不相关的:

3.1 算法的复杂度

算法在编写成可执行程序后，运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好坏，一般是从时间和空间两个维度来衡量的，即时间复杂度和空间复杂度。

时间复杂度主要衡量一个算法的运行快慢，而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期，计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展，计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。

3.2 复杂度在面试中的考察

我们在做OJ题时经常会遇见这种时间和空间的限制:

在这里插入图片描述不仅仅在笔试阶段我们会遇见这种问题,在面试的时候也经常会被问到

4. 时间复杂度

4.1 时间复杂度概念

时间复杂度的定义：在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。一个算法执行所耗费的时间，从理论上说，是不能算出来的，只有你把你的程序放在机器上跑起来，才能知道。但是我们需要每个算法都上机测试吗？是可以都上机测试，但是这很麻烦，所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例，算法中的基本操作的执行次数，为算法的时间复杂度。

其实我们只需要找到某条基本语句与问题规模N之间的数学表达式，就是算出了该算法的时间复杂度

比如下面这段代码:

// 请计算一下Func1中++count语句总共执行了多少次？
void Func1(int N)
{
    
    
int count = 0;
for (int i = 0; i < N ; ++ i)
{
    
    
 for (int j = 0; j < N ; ++ j)
 {
    
    
 ++count;
 }
}
 
for (int k = 0; k < 2 * N ; ++ k)
{
    
    
 ++count;
}
int M = 10;
while (M--)
{
    
    
 ++count;
}
printf("%d\n", count);
}

Func1执行的次数:F(N)=N²+2*N+10

N=10,F(N)=130
N=100,F(N)=10210
…

4.2 大O的渐近表示法

实际中我们计算时间复杂度时我们其实并不一定要计算精确的执行次数，***而只需要知道大概执行次数，那么这里我们使用大O的渐进表示法。***我们之前看见时间复杂度为O(1)就是用这种方法表示的

大O符号（Big O notation）：是用于描述函数渐进行为的数学符号。
推导大O阶方法：

用常数1取代运行时间中的所有加法常数。

在修改后的运行次数函数中，只保留最高阶项

如果最高阶项存在且不是1，则去除与这个项目相乘的常数。得到的结果就是大O阶。(如2*n²实际上就是n²)

使用我们的大O表示法化简上面代码的时间复杂度就为:O(N²)

通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项，简洁明了的表示出了执行次数.另外有些算法的时间复杂度存在最好、平均和最坏情况：

最坏情况：任意输入规模的最大运行次数(上界)
平均情况：任意输入规模的期望运行次数
最好情况：任意输入规模的最小运行次数(下界)

例如：在一个长度为N数组中搜索一个数据x

最好情况：1次找到

最坏情况：N次找到

平均情况：N/2次找到

在实际中一般情况关注的是算法的最坏运行情况，所以数组中搜索数据时间复杂度为O(N)

4.3 判断时间复杂度的实例

4.31 实例1

// 计算Func2的时间复杂度？
void Func2(int N)
{
    
    
 int count = 0;
 for (int k = 0; k < 2 * N ; ++ k)
 {
    
    
    ++count;
 }
 int M = 10;
 while (M--)
 {
    
    
    ++count;
 }
 printf("%d\n", count);
}

运行次数为:2*n+10,时间复杂度为:O(N).

4.32 实例2

// 计算Func3的时间复杂度？
void Func3(int N, int M)
{
    
    
 int count = 0;
 for (int k = 0; k < M; ++ k)
 {
    
    
   ++count;
 }
 for (int k = 0; k < N ; ++ k)
 {
    
    
   ++count;
 }
 printf("%d\n", count);
}

运行次数为:N+M,时间复杂度为:O(N+M)

4.33 实例3

// 计算Func4的时间复杂度？
void Func4(int N)
{
    
    
 int count = 0;
 for (int k = 0; k < 100; ++ k)
 {
    
    
 ++count;
 }
 printf("%d\n", count);
}

运行次数为100,是常数次,时间复杂度:O(1).

4.34 实例4(冒泡排序)

// 计算BubbleSort的时间复杂度？
void BubbleSort(int* a, int n)
{
    
    
 assert(a);
 for (size_t end = n; end > 0; --end)
 {
    
    
 int exchange = 0;
 for (size_t i = 1; i < end; ++i)
 {
    
    
 if (a[i-1] > a[i])
 {
    
    
 Swap(&a[i-1], &a[i]);
 exchange = 1;
 }
 }
 if (exchange == 0)
 break;
 }
}

运行次数为:(n-1)+(n-2)+(n-3)+…+1,就等于(n²-n)/2次.时间复杂度为O(N²)

4.35 实例5(二分查找)

// 计算BinarySearch的时间复杂度？
int BinarySearch(int* a, int n, int x)
{
    
    
 assert(a);
 int begin = 0;
 int end = n-1;
 while (begin < end)
 {
    
    
 int mid = begin + ((end-begin)>>1);
 if (a[mid] < x)
 begin = mid+1;
 else if (a[mid] > x)
 end = mid;
 else
 return mid;
 }
 return -1;
}

我们通过画图的方式来看看它的最坏情况要运行多少次:

在这里插入图片描述

得到时间复杂度为O(log₂N),所以我们说二分查找的效率是很高的,哪怕我们是想在14亿中国人中通过二分查找找到一个人,最坏的情况都只需要31次就能找到.

5. 空间复杂度

5.1 空间复杂度定义

空间复杂度也是一个数学表达式，是对一个算法在运行过程中临时占用存储空间大小的量度

空间复杂度不是程序占用了多少bytes的空间，因为这个也没太大意义，所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似，也使用大O渐进表示法。

注意：函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了，因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

5.2 判断空间复杂度实例

5.21 实例1(冒泡排序)

// 计算BubbleSort的空间复杂度？
void BubbleSort(int* a, int n)
{
    
    
 assert(a);
 for (size_t end = n; end > 0; --end)
 {
    
    
    int exchange = 0;
    for (size_t i = 1; i < end; ++i)
    {
    
    
       if (a[i-1] > a[i])
      {
    
    
         Swap(&a[i-1], &a[i]);
         exchange = 1;
      }
    }
   if (exchange == 0)
   break;
 }
}

实例1使用了常数个额外空间，所以空间复杂度为 O(1)

5.22 实例2(非递归求法的斐波那契)

// 计算Fibonacci的空间复杂度？
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
    
    
 if(n==0)
 return NULL;
 
 long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
 fibArray[0] = 0;
 fibArray[1] = 1;
 for (int i = 2; i <= n ; ++i)
 {
    
    
  fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
 }
 return fibArray;
}

实例2动态开辟了N个空间，空间复杂度为 O(N)

5.23 实例3(递归)

// 计算阶乘递归Fac的空间复杂度？
long long Fac(size_t N)
{
    
    
 if(N == 0)
 {
    
    
   return 1;
 }
 return Fac(N-1)*N;
}

递归调用了N次，开辟了N个栈帧(开辟了N次空间)，每个栈帧使用了常数个空间。空间复杂度为O(N)

6. 常见复杂度对比

运行次数	复杂度	分类
5201314	O(1)	常数阶
3n+2	O(N)	线性阶
3n²+4n+5	O(N²)	平方阶
8log₂(n)+4	O(log₂N)	对数阶
10n+6nlog₂(n)+22	*O(Nlog₂N)**	NlogN阶
2ⁿ+8	O(2^N)	指数阶

7. 总结

本章是数据结构的开头,我们介绍并熟悉了时间复杂度和空间复杂度的大O渐近表示法,为后面的算法题打个基础.接下来的内容我将为大家介绍常见的数据存储模式:顺序表,单链表,双链表,栈,队列,二叉树等等,敬请期待!.

数据结构学习分享之复杂度讲解