本文全文参考 https://www.bilibili.com/video
Java集合框架概述
1.1 集合与数组存储数据概述:
- 集合、数组都是对多个数据进行存储操作的结构,简称Java容器。
- 说明:此时的存储,主要指的是内存层面的存储,不涉及到持久化的存储(.txt,.jpg,.avi,数据库中)
1.2 数组存储的特点:
- 一旦初始化以后,其长度就确定了。
- 数组一旦定义好,其元素的类型也就确定了。我们也就只能操作指定类型的数据了。
- 比如:String[] arr;int[] arr1;Object[] arr2;
1.3 数组存储的弊端:
- 一旦初始化以后,其长度就不可修改。
- 数组中提供的方法非常限,对于添加、删除、插入数据等操作,非常不便,同时效率不高。
- 获取数组中实际元素的个数的需求,数组没有现成的属性或方法可用
- 数组存储数据的特点:有序、可重复。对于无序、不可重复的需求,不能满足。
1.4 集合存储的优点:
- 解决数组存储数据方面的弊端。
1.5 集合体系
Collection接口方法
import org.junit.Test;
import java.time.LocalDateTime;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Iterator;
import java.util.List;
public class CollectionTest {
public static void main(String[] args) {
Collection coll = new ArrayList();
// add(E e)
coll.add("aa");
coll.add("bb");
coll.add(123);
coll.add(LocalDateTime.now());
// size()
System.out.println(coll.size()); // 4
//addAll()
Collection coll1 = new ArrayList();
coll1.add(456);
coll1.add("cc");
coll.addAll(coll1);
System.out.println(coll); // [aa, bb, 123, 2020-03-25T16:22:37.923, 456, cc]
// isEmpty()
boolean empty = coll.isEmpty();
System.out.println(empty); // false
// contanis():集合是否包含指定元素(调用对象的equls()方法进行比较)
System.out.println(coll.contains("aa")); // true
// containsAll(Collection<?> c) 返回 true如果这个集合包含指定集合的所有元素。
System.out.println(coll.containsAll(coll1)); // true
// remove(Object o) 从这个集合中移除指定元素的一个实例,如果它是存在的(调用equls()方法查询)。
System.out.println(coll.remove(123)); //true
System.out.println(coll); // [aa, bb, 2020-03-25T16:39:25.709, 456, cc]
// removeAll(Collection<?> c)
coll.removeAll(coll1);
System.out.println(coll); // [aa, bb, 2020-03-25T16:40:07.682]
// clear():从这个集合中移除所有元素
coll.clear();
System.out.println(coll.isEmpty()); // true
}
@Test
public void test01(){
Collection coll = new ArrayList();
// add(E e)
coll.add("aa");
coll.add("bb");
coll.add(123);
coll.add(LocalDateTime.now());
Collection coll1 = new ArrayList();
coll1.add(456);
coll1.add("cc");
coll.addAll(coll1);
// retainAll(Collection<?> c) 仅保留包含在指定集合中的这个集合中的元素(可选操作)。
boolean b = coll.retainAll(coll1); // true
System.out.println(coll); // [456, cc]
// equals(Object o) 将指定的对象与此集合进行比较,以进行相等性。
Collection coll2 = new ArrayList();
coll2.addAll(coll);
boolean equals = coll.equals(coll2);
System.out.println(equals); // true
// hashCode() 返回此集合的哈希代码值。
System.out.println(coll.hashCode()); // 18265
// 集合--》数组 toArray() 返回包含此集合中所有元素的数组。
Object[] array = coll.toArray();
System.out.println(Arrays.toString(array)); // [456, cc]
// 数组--》集合 Arrays.asList()
List<String> asList = Arrays.asList(new String[]{"zz", "xx", "cc"});
List ints = Arrays.asList(new int[]{123, 456});
System.out.println(ints); // [[I@606d8acf]
List ints1 = Arrays.asList(new Integer[]{123, 456});
System.out.println(ints1); // [123, 456]
// iterator() 返回此集合中的元素的迭代器。
Iterator iterator = coll.iterator();
while (iterator.hasNext()) {
System.out.println(iterator.next());
}
}
}
Iterator迭代器接口
3.1 遍历Collection的两种方式:
- ① 使用迭代器Iterator
- ② foreach循环(或增强for循环)
3.2 java.utils包下定义的迭代器接口:Iterator
3.2.1 说明
- Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素。
- GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元素,而又不需暴露该对象的内部细节。迭代器模式,就是为容器而生。
3.2.2 作用
- 遍历集合Collectiton元素
3.2.3 如何获取实例
- coll.iterator()返回一个迭代器实例
3.2.4 遍历的代码实现
Iterator iterator = coll.iterator();
//hasNext():判断是否还下一个元素
while(iterator.hasNext()){
//next():①指针下移 ②将下移以后集合位置上的元素返回
System.out.println(iterator.next());
}
3.3 remove()的使用
@Test
public void test02(){
Collection coll = new ArrayList();
// add(E e)
coll.add("aa");
coll.add("bb");
coll.add(123);
coll.add(LocalDateTime.now());
// remove()
Iterator iterator = coll.iterator();
while (iterator.hasNext()){
Object o = iterator.next();
if ("aa".equals(o)){
iterator.remove();
}
}
iterator = coll.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
}
3.4 JDK5.0新特性–增强for循环,用于遍历集合、数组
//for(ElementType element: arrayName){};
//内部仍然调用了迭代器Iterator
for (Object o : coll) {
System.out.println(o);
}
Collection子接口一:List
4.1存储的数据特点
- 存储有序的、可重复的数据。
4.2 常用方法&全部方法
- 增:add(Object obj)
- 删:remove(int index) / remove(Object obj)
- 改:set(int index, Object ele)
- 查:get(int index)
- 插:add(int index, Object ele)
- 长度:size()
- 遍历:① Iterator迭代器方式
- ② 增强for循环
- ③ 普通的循环
4.3 常用实现类
- |----Collection接口:单列集合,用来存储一个一个的对象
- |----List接口:存储序的、可重复的数据。 -->“动态”数组,替换原的数组
- |----ArrayList:作为List接口的主要实现类;**线程不安全的,效率高;底层使用Object[] elementData存储
- |----LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
|----Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
4.4 源码分析(难点)
4.4.1 ArrayList的源码分析
- JDK 7情况下
ArrayList list = new ArrayList(); 底层创建了长度是10的Object[]数组elementData
list.add(123); elementData[0] = new Integer(123);
...
list.add(11); 如果此次的添加导致底层elementData数组容量不够,则扩容。
默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。
结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)
- JDK 8中 ArrayList 的变化
ArrayList list = new ArrayList(); 底层Object[] elementData初始化为{}.并没创建长度为10的数组
list.add(123); 第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
...
后续的添加和扩容操作与jdk 7 无异。
小结:JDK7 中的 ArrayList 的对象的创建类似于单例的饿汉式,而JDK8 中类似于懒汉式。
4.4.2 LinkedList的源码分析
LinkedList list = new LinkedList(); 内部声明了Node类型的first和last属性,默认值为null
list.add(123); 将123封装到Node中,创建了Node对象。
其中,Node定义为:体现了LinkedList的双向链表的说法
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
4.4 常用方法
@Test
public void test03(){
ArrayList list = new ArrayList();
list.add(123);
list.add(456);
list.add("AA");
list.add(LocalDate.now());
list.add(123);
System.out.println(list); // [123, 456, AA, 2020-03-26, 123]
// 插入 add(int index, E element)
list.add(1,789);
System.out.println(list); // [123, 789, 456, AA, 2020-03-26, 123]
List<Integer> list1 = Arrays.asList(6, 6, 6);
// list.add(list1);
// System.out.println(list.size()); // 7
// System.out.println(list); // [123, 789, 456, AA, 2020-03-26, 123, [6, 6, 6]]
list.addAll(list1);
System.out.println(list.size()); // 9
System.out.println(list); // [123, 789, 456, AA, 2020-03-26, 123, 6, 6, 6]
// indexOf(Object o) 返回此列表中指定元素的第一个出现的索引,或-如果此列表不包含元素,或- 1。
System.out.println(list.indexOf(456)); // 1
}
面试题
List list = new ArrayList();
list.add(1);
list.add(2);
list.add(3);
list.remove(2); // 考察:remove()里面传入整形是删除对应位置的元素
//list.remove(new Integer(2)); // 考察:remove()里面传入对象是删除和对象相同值的元素
System.out.println(list); // [1, 2]
Collection子接口二:Set
5.1 常用实现类
- |----Collection接口:单列集合,用来存储一个一个的对象
- |----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
- |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
- |----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
- |----TreeSet:可以照添加对象的指定属性,进行排序。
- |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
- |----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
5.2 存储的数据特点:无序的、不可重复的元素
- 以HashSet为例说明:
- 无序性:不等于随机性。存储的数据在底层数组中并非照数组索引的顺序添加,而是根据数据的哈希值决定的。
- 不可重复性:保证添加的元素照equals()判断时,不能返回true.即:相同的元素只能添加一个。
5.3 元素添加过程:(以HashSet为例)
- 我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断
数组此位置上是否已经元:- 如果此位置上没其他元素,则元素a添加成功。 —>情况1
- 如果此位置上其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
- 如果hash值不相同,则元素a添加成功。—>情况2
- 如果hash值相同,进而需要调用元素a所在类的equals()方法:
- equals()返回true,元素a添加失败
- equals()返回false,则元素a添加成功。—>情况3
对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。
jdk 7 :元素a放到数组中,指向原来的元素。
jdk 8 :原来的元素在数组中,指向元素a
7上8下
package hjl.study;
public class User {
private String name;
private int age;
public User() {
}
public User(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "User{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
@Override
public boolean equals(Object o) {
System.out.println("User equals()。。。。。。。。");
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
User user = (User) o;
if (age != user.age) return false;
return name != null ? name.equals(user.name) : user.name == null;
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}
}
@Test
public void test01(){
Set set = new HashSet();
set.add(123);
set.add(456);
set.add("AA");
set.add("DD");
set.add(new User("zhangsan",12));
set.add(new User("zhangsan",12));
Iterator iterator = set.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next());
}
}
User equals()。。。。。。。。
AA
DD
User{name='zhangsan', age=12}
456
123
5.4 常用方法
- Set接口中没有额外定义新的方法,使用的都是Collection中声明的方法。
5.5 存储对象所在类的要求
- 1.向Set中添加的数据,其所在的类一定要重写hashCode()和equals()方法
- 2.重写的hashCode()和equals()方法尽可能保持一致性(相等的对象必须具有相等的哈希值)
5.6 LinkedHashSet
- LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
5.6 TreeSet的使用
- TreeSet:可以照添加对象的指定属性,进行排序。
- 1.向TreeSet中添加的数据,要求是相同类的对象。
- 2.添加对象的类必须要实现Comparable接口或Comparator接口
- 3.两种排序中,比较两个对象是否相同的标准是compareTo()或compare()返回0,不再是equals()
- 4.删改查操作都是根据compareTo()或compare()来比较
https://www.cnblogs.com/yangecnu/p/Introduce-Red-Black-Tree.html
自然排序
package hjl.study;
public class User implements Comparable<User> {
private String name;
private int age;
public User() {
}
public User(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public String toString() {
return "User{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
@Override
public boolean equals(Object o) {
System.out.println("User equals()。。。。。。。。");
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
User user = (User) o;
if (age != user.age) return false;
return name != null ? name.equals(user.name) : user.name == null;
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}
// 先按照姓名从小到大,再按照年龄从小到大
@Override
public int compareTo(User o) {
if (o!= null) {
int i = this.name.compareTo(o.name);
if (i != 0){
return i;
}else {
return Integer.compare(this.age,o.age);
}
} else {
throw new RuntimeException("输入的类型不匹配!");
}
}
}
@Test
public void test01(){
TreeSet treeSet = new TreeSet();
// 举例一:
// treeSet.add(123);
// treeSet.add(456);
// treeSet.add(99);
// treeSet.add(59);
// treeSet.add(333);
// 举例二:
treeSet.add(new User("Tom",12));
treeSet.add(new User("Jim",33));
treeSet.add(new User("Jack",22));
treeSet.add(new User("Jack",32));
treeSet.add(new User("Mike",67));
Iterator iterator = treeSet.iterator();
while (iterator.hasNext()){
System.out.println(iterator.next()+" ");
}
}
User{name='Jack', age=22}
User{name='Jack', age=32}
User{name='Jim', age=33}
User{name='Mike', age=67}
User{name='Tom', age=12}
定制排序
@Test
public void test02() {
TreeSet treeSet = new TreeSet<User>(new Comparator<User>() {
@Override
public int compare(User o1, User o2) {
if (o1!=null || o2!=null) {
int i = o1.getName().compareTo(o2.getName());
if (i != 0){
return o1.getName().compareTo(o2.getName());
} else {
return Integer.compare(o1.getAge(),o2.getAge());
}
} else {
throw new RuntimeException("输入的类型不匹配!");
}
}
});
treeSet.add(new User("Tom", 12));
treeSet.add(new User("Jim", 33));
treeSet.add(new User("Jack", 22));
treeSet.add(new User("Jack", 32));
treeSet.add(new User("Mike", 67));
Iterator iterator = treeSet.iterator();
while (iterator.hasNext()) {
System.out.println(iterator.next() + " ");
}
}
User{name='Jack', age=22}
User{name='Jack', age=32}
User{name='Jim', age=33}
User{name='Mike', age=67}
User{name='Tom', age=12}
面试题
@Test
public void test03(){
HashSet set = new HashSet();
Person p1 = new Person(1001,"AA");
Person p2 = new Person(1001,"BB");
set.add(p1);
set.add(p2);
System.out.println(set);
// [Person(age=1001, name=BB), Person(age=1001, name=AA)]
p1.setName("CC");
set.remove(p1);
// remove()方法会先比较hashCode()---》与p1相同,再比较equals()---》与p1不同,所以p1没有被删除
System.out.println(set);
// [Person(age=1001, name=BB), Person(age=1001, name=CC)]
set.add(new Person(1001,"CC"));
// p1还是保持原来的hashCode值,所以此处能添加成功
System.out.println(set);
// [Person(age=1001, name=BB), Person(age=1001, name=CC), Person(age=1001, name=CC)]
set.add(new Person(1001,"AA"));
// 先比较hashCode()---》与p1相同,再比较equals()---》与p1不同,添加成功
System.out.println(set);
// [Person(age=1001, name=BB), Person(age=1001, name=CC), Person(age=1001, name=CC), Person(age=1001, name=AA)]
}
Map接口
6.1常用实现类结构
- |----Map:双列数据,存储key-value对的数据 —类似于高中的函数:y = f(x)
- |----HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null的key和value
- |----LinkedHashMap:保证在遍历map元素时,可以照添加的顺序实现遍历。
- 原因:在原的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap。
- |----TreeMap:保证照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序
底层使用红黑树 |----Hashtable:作为古老的实现类;线程安全的,效率低;不能存储null的key和value|----Properties:常用来处理配置文件。key和value都是String类型
- |----HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null的key和value
HashMap的底层:jdk7及之前 --> 数组+链表, jdk 8 --> 数组+链表+红黑树
扫描二维码关注公众号,回复: 10669479 查看本文章
6.2 存储结构的理解
- Map中的key:无序的、不可重复的,使用Set存储所的key —> key所在的类要重写equals()和hashCode() (以HashMap为例)
- Map中的value:无序的、可重复的,使用Collection存储所的value —>value所在的类要重写equals()
- 一个键值对:key-value构成了一个Entry对象。
- Map中的entry:无序的、不可重复的,使用Set存储所的entry
6.3 内存结构说明(难点)
6.3.1 HashMap在jdk7中实现原理
HashMap map = new HashMap()
- 在实例化以后,底层创建了长度是16的一维数组Entry[] table。
- 可能已经执行过多次put…
map.put(key1,value1);
- 首先,调用key1所在类的hashCode()计算key1哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置。
- 如果此位置上的数据为空,此时的key1-value1添加成功。 ----情况1
- 如果此位置上的数据不为空,(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据的哈希值:
- 如果key1的哈希值与已经存在的数据的哈希值都不相同,此时key1-value1添加成功。----情况2
- 如果key1的哈希值和已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:调用key1所在类的equals(key2)方法,比较:
- 如果equals()返回false:此时key1-value1添加成功。----情况3
- 如果equals()返回true:使用value1替换value2。
补充:关于情况2和情况3:此时key1-value1和原来的数据以链表的方式存储。类似 set的储存原理,7上8下
- 在不断的添加过程中,会涉及到扩容问题,当超出临界值(且要存放的位置非空)时,扩容。默认的扩容方式:扩容为原来容量的2倍,并将原的数据复制过来。
6.3.2 HashMap在jdk8中相较于jdk7在底层实现方面的不同
- 1.new HashMap():底层没创建一个长度为16的数组
- 2.jdk 8底层的数组是:Node[],而非Entry[]
- 3.首次调用put()方法时,底层创建长度为16的数组
- 4.jdk7底层结构:数组+链表。jdk8中底层结构:数组+链表+红黑树。
- 形成链表时,七上八下(jdk7:新的元素指向旧的元素。jdk8:旧的元素指向新的元素)
- 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时,此时此索引位置上的所数据改为使用红黑树存储。
面试题
- 谈谈你对HashMap中put/set方法的认识?如果了解谈谈HashMap的扩容机制?默认大小是多少?什么是加载因子(或填充比)?什么是吞吐临界值(或阈值、threshold)?
- DEFAULT_INITIAL_CAPACITY : HashMap的默认容量,16
- DEFAULT_LOAD_FACTOR:HashMap的默认加载因子,0.75
- threshold:扩容的临界值,=容量填充因子,160.75=12
- TREEIFY_THRESHOLD:Bucket中链表长度大于该默认值,转化为红黑树,8
- MIN_TREEIFY_CAPACITY:桶中的Node被树化时最小的hash表容量,64
6.3.3 LinkedHashMap的底层实现原理(了解)
- LinkedHashMap 是 HashMap 的子类
- 在HashMap存储结构的基础上,使用了一对双向链表来记录添加元素的顺序
- 与LinkedHashSet类似,LinkedHashMap 可以维护 Map 的迭代 顺序:迭代顺序与 Key-Value 对的插入顺序一致
6.4 常用方法
6.5 Map的遍历
@Test
public void test01(){
Map map = new HashMap();
map.put("AA",123);
map.put("CC",1234);
map.put("GG",456);
map.put("JJ",543);
// 遍历所有的key集:keySet()
Set set = map.keySet();
Iterator iterator = set.iterator();
while (iterator.hasNext()){
System.out.print(iterator.next()+" ");
// AA CC GG JJ
}
// 遍历所有的value集:values()
Collection values = map.values();
Iterator iterator1 = values.iterator();
while (iterator1.hasNext()){
System.out.print(iterator1.next()+" ");
// 123 1234 456 543
}
// 遍历所有的key-value:entrySet()
// 方式一:
Set entrySet = map.entrySet();
Iterator iterator2 = entrySet.iterator();
while (iterator2.hasNext()) {
Object next = iterator2.next();
Map.Entry entry = (Map.Entry) next;
System.out.println(entry.getKey()+"--->"+entry.getValue());
//AA--->123
//CC--->1234
//GG--->456
//JJ--->543
}
// 方式二:
Set set1 = map.keySet();
Iterator iterator3 = set.iterator();
while (iterator3.hasNext()){
Object next = iterator3.next();
Object value = map.get(next);
System.out.println(next+"--->"+value);
//AA--->123
//CC--->1234
//GG--->456
//JJ--->543
}
}
6.6 TreeMap的使用
向TreeMap中添加key-value,要求key必须是由同一个类创建的对象
6.7 Hashtable的使用(了解,已过时)
6.8 Properties的使用
Collections工具类
7.1 作用
- Collections 是一个操作 Set、List 和 Map 等集合的工具类
- Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作, 还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
面试题
- 面试题:Collection 和 Collections的区别?
- Collection 是 Set和List的父接口
- Collections是操作 Set、List 和 Map 等集合的工具类