数据结构与算法(一):基础数据结构(算法概念、数组、链表、栈、队列)

算法概念、数组、链表、栈、队列

判断一个数是否是2的N次方?

N & (N-1) == 0  (N > 0)

算题:

算法

算法概念

算法代表: 高效率和低存储 内存占用小、CPU占用小、运算速度快

算法的高效率与低存储:内存 + CPU

评价算法的两个指标

  • 时间复杂度: 运行一个程序所花费的时间 O()
  • 空间复杂度: 运行程序所需要的内存 OOM

时间复杂度 O(1,logn,n,nlogn,n^2,n^x)

  • 常数:O(1) 1 表示是常数,所有能确定的数字我们都用O(1),O(10000)=>O(1)
  • 对数: O(logn), O(nlogn)
  • 线性: O(N) n一定是未知的; 如果n是已知的O(1)
  • 线性对数: O(nlogn)
  • 平方: O(n^2)
  • N次方: O(n^n)

如何找时间复杂度

  • 有循坏的地方
  • 有网络请求的地方 (RPC、远程调用、分布式、数据库)

测试时间打印log

在这里插入图片描述

O(1) > O(logn) > O(n) > O(nlogn) > O(n^2) > O(n^n)

越接近O(1)时间复杂度越低

常数:O(1)

int a = 1; // 1次O(1)
for(int i = 0; i < 3; i++) {
    
     //这里运行4次
  a = a + 1; //这里运行3次
}

对数: O(logn), O(nlogn)

//对数 2^x=n  x就是我们运行的次数 => 对数 x=log2(n) = log2n = 计算机忽略常数 => logn => O(logn)
int n = Integer.MAX_VALUE;
int i = 1;

//O(logn)
while (i <= n) {
    
    
    i = i * 2;
}

//O(nlogn)
for (int j = 0; j < n; j++) {
    
    
    while (i <= n) {
    
    
        i = i * 3;
    }
}

线性: O(N)

//线性: O(N) n一定是未知的; 如果n是已知的O(1)
for (i = 0; i < n; i++) {
    
    
    a = a + 1;
}

平方: O(n^2)

for (i = 0; i < n; i++) {
    
    
    for (int j = 0; j < n; j++) {
    
    
        a = a + 1; // O(n^2)  n*(n+1)/2 => O(n^2) = 1+2+3+4+..+n=n*(n+1)/2
    }
}

调优

列表排序 冒泡排序 < 快速排序 归并排序 堆排序

经典:链表、排序算法、二叉树、红黑树、B-Tree、B+Tree

进阶:数论、图论

数据结构

数组

思考题:

  • 问题1:给你一个文件包含全国14亿人口年龄数据(0~180),让你统计每一个年龄有多少人?
    限定机器单台2G + 2G内存,不得使用现成的容器,比如map等

int age[] = new int[180];
a[0]++; // 0表示0岁

利用数组下标,也可以利用下标随机定位到数组中的某一个数据

  • 问题2:为什么数值的下标是从0开始的,数组的特点是一段连续的内存地址

int arr[] = new int[5];

申请到内存地址例如是:10001,10002,10003,10004,10005

保存数据:a[0] => 10001 ===> 10001 + 0
保存数据:a[1] => 10002 ===> 10001 + 1
保存数据:a[2] => 10003 ===> 10001 + 2
保存数据:a[3] => 10004 ===> 10001 + 3
保存数据:a[4] => 10005 ===> 10001 + 4
  • 问题3:二维数组的内存地址是怎么样的?
1 2 3
4 5 6  =>  1 2 3 4 5 6 => i*n + j (i是一维数组的长度、j是在列的位置) => 4 => 1*3 + 0 = 3

ArrayList 和 数组 如何选择

  • ArrayList是JDK封装好的,不需要管扩容
  • 数组删除添加慢O(n),修改获取快O(1)
  • 随机访问
  • 下标

如何选择?

  • 如果不知道数据大小选择ArrayList
  • 如果知道数据的大小而且又非常关注性能选择数组;需要注意越界(头和尾)

Java 内存分为堆内存和栈内存

堆内存:存放new对象和数组
栈内存:引用变量

堆和栈都是用来存数据的地方

堆栈区别:

  • 栈的速度更快
  • 栈的内存数据可以共享,主要存一些基本数据类型 int a = 3; 在栈中创建变量a, 然后给a赋值,先不会创建一个3而是先在栈中找有没有3
String s1 = "ja";
String s2 = "va";
String s3 = "java";
String s4 = s1 + s2; // java 里面重装了+, 其实调用了 stringBuild, 会new对象
System.out.println(s3 == s4); //false
System.out.println(s3.equals(s4)); //true

链表

思考题:

  1. 如何设计一个LRU缓存淘汰算法(链表)
  2. 约瑟夫问题(循环链表):N个人围成一圈,从第一个开始报数,第M个将被淘汰,最后剩下一个人,其余人都将被杀掉。例如N=6,M=5,被杀掉的顺序是5,4,6,2,3,1

链表特点

  • 不需要连续的内存空间
  • 有指针引用
  • 常见链表结构:单链表、双链表、循环链表

单链表 LinkList

查询 O(n)
插入删除 O(1)

双链表

B+树 Mysql 叶子节点就是双向链表
跳表和Mysql B+树很像

循环链表

循环链表是一种特殊的单链表,他和单链表唯一区别是尾结点
单链表的尾结点是空地址
循环链表的尾结点是头节点

链表和数组对比

查询

数组

  • O(1)

链表

  • O(n)

插入/删除

数组插入

  • 尾部O(1)
  • 头部O(n)

链表插入

  • 头部O(1)
  • 尾部O(1)
  • 中间O(1*2)

重要区别:

  1. 数组简单易用,在实现上使用的是连续的内存空间,可以借助CPU的缓存机制,预读数组中的数据,所以访问效率更高。
  2. 链表在内存中并不是连续存储,所以对CPU缓存不友好,没办法有效预读。
  3. 数组的缺点是大小固定,一经声明就要占用整块连续内存空间。如果声明的数组过大,系统可能没有足够的连续内存空间分配给它,
    导致“内存不足(out ofmemory)”。如果声明的数组过小,则可能出现不够用的情况。
  4. 动态扩容:数组需再申请一个更大的内存空间,把原数组拷贝进去,非常费时。链表本身没有大小的限制,天然地支持动态扩容。

栈—后进先出–LILO

思考题:

  1. 如何设计一个括号匹配的功能?栈
  2. 如何设计一个浏览器前进和后退功能?(两个栈一个前进、一个后退)
  3. 如何实现四则数字运算公式比如 3+2*5-3 ?(两个栈一个数字、一个符号)
  4. 代码函数调用顺序

栈特点

栈是一个限定仅在表尾插入和删除操作的线性表,被称为栈顶、另一端为栈底

向一个栈插入新元素称为进栈、入栈、压栈
删除元素称为出栈、退栈

栈其实是一种特殊的链表或数组,数组链表暴露太多接口,容易出错

public class KuoHaoStack {
    
    
    public static boolean isOk(String s) {
    
    
        MyStack<Character> brackets = new ArrayStack<>(20);
        char c[] = s.toCharArray();
        Character top = null;
        for (char x : c) {
    
    
            switch (x) {
    
    
                case '{':
                case '(':
                case '[':
                    brackets.push(x);
                    break;
                case '}':
                    top = brackets.pop();
                    if (top == null) return false;
                    if('{' == top) {
    
    
                        break;
                    } else {
    
    
                        return false;
                    }
                case ')':
                    top = brackets.pop();
                    if (top == null) return false;
                    if('(' == top) {
    
    
                        break;
                    } else {
    
    
                        return false;
                    }
                case ']':
                    top = brackets.pop();
                    if (top == null) return false;
                    if('[' == top) {
    
    
                        break;
                    } else {
    
    
                        return false;
                    }
                default:
                    break;
            }
        }
        return brackets.isEmpty();
    }

    public static void main(String[] args) {
    
    
        Scanner scanner = new Scanner(System.in);
        while (scanner.hasNext()) {
    
    
            System.out.println("S的输出结果:" + isOk(scanner.next()));
        }
    }
}

队列–先进先出–FIFO

思考题

  • 线程池里面当任务满时,此时又来一个新任务,线程池是如何处理的?具体有哪些策略?这些策略又是如何实现的呢?
  1. 排队:阻塞队列。有空闲的时候再拿,不就是那个take和put,如果是在公平的情况下,那肯定就是先进先出。这就是今天讲的队列。这时候我们就有两种方式,一个是无限的排队队列。(链表,千万别用。LinkedBlockingQueue,JDK的),还有一种就是有界(用数组来实现的),只处理我们开的空间大小,多了的继续抛出去。Integer.MAX=?2^32-1=21亿多,但是注意的是这个队列大小,别搞小了。就不够,大了就浪费。在一些小型系统,你知道数据请求量是不大的,可以用。
  2. 丢弃:不处理了,直接抛出去。

队列是一种特殊的线性表,特殊之处在于它只允许在表的前端进行删除操作,在表的后端进行插入操作

队列分类

  1. 顺序(单向)队列:(Queue) 只能在一端插入数据,另一端删除数据
    在这里插入图片描述
  2. 循环(双向)队列(Deque):每一端都可以进行插入数据和删除数据操作
    判断是否已满
  • 方式一:添加size
  • 方式二:(tail+1)%n == head

在这里插入图片描述

public class CircleArrayQueue<Item> {
    
    

    private Item data[];
    private int head = 0;
    private int tail = 0;
    private int n = 0; //数组最大空间
    private int size; //当前队列已存个数

    public CircleArrayQueue(int cap) {
    
    
        data = (Item[]) new Object[cap];
        n = cap;
    }

    public void push(Item item) {
    
    
        if ((tail + 1)%n == head) return; //关键点

        data[tail] = item;
        tail = (tail + 1) % n; //关键点
    }

    public Item pop() {
    
    
        if (isEmpty()) return null;

        Item item = data[head];
        head = (head + 1) % n;
        return item;
    }

    public boolean isEmpty() {
    
    
        return head == tail;
    }
}

猜你喜欢

转载自blog.csdn.net/menxu_work/article/details/129048556