list介绍

list 是一个支持在常数范围内，任意位置进行插入删除的序列式容器，且这个容器可以前后双向迭代。我们可以把 list 理解为双向循环链表的结构。

于其他结构的容器相比，list在任意位置进行插入和函数的效率要高很多；而list 的缺点也很明显，它在随机访问容器当中的数据的时候，它只能从已知位置开始线性寻找，这样寻找相比于其他容器来说有时间上的消耗；而且在存储方面，因为是一个结点一个结点分开存储，所以会多开空间来存储各个结点之间的关系，在存储消耗上也更高。

list 的使用

构造函数

构造函数（ (constructor)）	接口说明
list (size_type n, const value_type& val = value_type())	构造的list中包含n个值为val的元素
list()	构造空的list
list (const list& x)	拷贝构造函数
list (InputIterator first, InputIterator last)	用[first, last)区间中的元素构造list

list 的构造函数和 string ，vector是类似的，具体可以看以下博客：

C++ string类迭代器范围for_c++string迭代器_chihiro1122的博客-CSDN博客

迭代器

list 的迭代器不再像是 string 和 vector 当中使用 原生指针 来简单实现，而是使用类和对象来进行包装，这样可以让指针不能实现list 当中的 ++ 等等操作，用运算符重载函数来实现（具体迭代器的实现请看 list 的模拟实现）。

函数声明	接口说明
begin + end	返回第一个元素的迭代器+返回最后一个元素下一个位置的迭代器
rbegin + rend	返回第一个元素的reverse_iterator,即end位置，返回最后一个元素下一个位置的 reverse_iterator,即begin位置

注意：

因为 list 的存储结构和 string 之类的存储结构不一样，string 存储结构是一块连续的区间，所以，对于string类的迭代器就支持类似 str.begin() + 5 ，这样的操作；但是因为 list 是不连续的空间，对于 "+" 这个操作符的代价就比 string要高，所以在list 的迭代器当中就没有实现 operator+ 这个函数！！
迭代器的使用，不能用 " < " 的形式来判断迭代器的区间！！因为 list 的各个结点的存储空间不连续，如果直接用 " < " 来比较，比较的是指针存储的地址大小，这样会出大问题，对于迭代器的使用一般是这样的 :

list<int> L( 10 , 1 );
list::iterator it = L.begin();

while(it != L.end())
{
    cout << *it << " ";
    ++it;
}
cout << endl;

其他基本操作

在STL 当中，这些函数基本使用都差不多，集体可以参照之前介绍 string 和 vector 的博客：

C++ string类迭代器范围for_c++string迭代器_chihiro1122的博客-CSDN博客

C++ string类-2_chihiro1122的博客-CSDN博客

C++ - 初识vector类迭代器失效_chihiro1122的博客-CSDN博客

list capacity

函数声明	接口说明
empty	检测list是否为空，是返回true，否则返回false
size	返回list中有效节点的个数

list element access

函数声明	接口说明
front	返回list的第一个节点中值的引用
back	返回list的最后一个节点中值的引用

list modifiers

函数声明	接口说明
push_front	在list首元素前插入值为val的元素
pop_front	删除list中第一个元素
push_back	在list尾部插入值为val的元素
pop_back	删除list中最后一个元素
insert	在list position 位置中插入值为val的元素
erase	删除list position位置的元素
swap	交换两个list中的元素
clear	清空list中的有效元素

list 当中的迭代器失效

list 当中的insert（）函数就没有迭代器失效了，因为之前在vector 当中出现的 insert（）函数迭代器失效，是因为vector 是一段连续的空间，需要扩容操作，而扩容就会导致迭代器失效；但是list 当中的每一次插入数据都是要开辟新空间，并不会影响到list 当中已经存在了的元素。

但是，对于删除的函数来说，比如 erase（）函数，还是会存储迭代器失效的问题：

int array[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 0 };
list<int> l(array, array+sizeof(array)/sizeof(array[0]));
auto it = l.begin();
while (it != l.end())
{
// erase()函数执行后，it所指向的节点已被删除，因此it无效，在下一次使用it时，必须先给
其赋值
l.erase(it);
++it;

如上述例子，就是外部的迭代器失效问题，当it 指向的空间被删除之后，it指向空间也就被释放，那么在while语句当中的 ++it 这个重载运算符函数就找不到下一个了。

改正;

while (it != l.end())
{
l.erase(it++); // it = l.erase(it);
}

STL当中的迭代器认识

我们先来看下面三个函数的不同迭代器类型：

上述有三种迭代器类型：

InputIterator：单向迭代器，只能用 ++ 的操作。
BidirectionalIterator：双向迭代器，可以用 ++ / -- 两个操作。
RandomAccessIterator：随机迭代器，可以用 ++ / -- / + / - 四个操作。

不同的容器类型，对于迭代器的使用就有要求：

比如，单链表就只能用单向迭代器，双向和随机都不能用，那么对于库当中的双向和随机迭代器实现的函数，单链表也不能使用。

但是这三个迭代器是向上兼容的，就是说随机是双向的一种特殊情况，所以，使用随机迭代器的容器就可以使用双向迭代器的函数；同样，双向是单向的一种特殊情况，双向的，可以使用单向的。

list的模拟实现

大致框架

#pragma once

namespace My_List
{
	template<class T>
	struct List_Node  // 结点指针结构体
	{
·············
	};

    template<class T>
	struct List_iterator // 非const 迭代器
	{
··········
    };

    template<class T>
	class List         // List 类
	{
············
        private:
		Node* _head;

	};
}

结点的结构体定义

在官方的List源代码当中，List容器的结点定义就是定义在同一命名空间下的一个结构体当中，因为在C++ 当中结构体已经升级为了类，所以在结构体当中也可以定义构造函数。

所以，因为结点当中有数值域，和指针域，我们就把这个结构体当做是一个构造结点的函数来实现，效果也是一样的，只不过使用的时候，使用new的方式来开空间和定义：

	template<class T>
	struct List_Node
	{
		List_Node<T>* _next;
		List_Node<T>* _prev;
		T _val;

		// List_Node 的构造函数
		List_Node(const T& val = T())
			:_next(nullptr),
			_prev(nullptr),
			_val(val)
		{}
	};

当然，为了数值域的复用性，使用模版来对数值域的类型进行模版化。

构造函数和析构函数

无参数的构造函数

		List()
		{
			_head = new Node;
			_head->_next = _head;
			_head->_prev = _head;
		}

因为List的底层是带头循环双向链表，所以没有结点的链接方式如上，只有一个头结点。

析构函数

		~List()
		{
			clear();
			delete _head;
			_head = nullptr;
		}

这里可以直接复用clear（）函数。

增删查改

push_back（）：

		void push_back(const T& x)
		{
			Node* tail = _head->_prev;
			Node* newNode = new Node(x);

			_head->_prev = newNode;
			tail->_next = newNode;

			newNode->_prev = tail;
			newNode->_next = _head;

            // 实现insert（）函数之后
            // insert(end() , x);
		}

直接开空间然后修改链接关系即可。

insert（）函数：

这里的insert（）函数的当中传入的 pos 指针不用检查合法性，因为这里是带头结点循环的链表，在头结点的前面和后面删都是可以的。代码：

		iterator insert(iterator pos, const T& x)
		{
			Node* cur = pos._Node;
			Node* prev = cur->_prev;
			Node* newNode = new Node(x);

			prev->_next = newNode;
			newNode->_next = cur:

			cur->_prev = newNode;
			newNode->_prev = prev;

			return newNode;
		}

因为pos位置前插入元素之后，pos迭代器向后移动了以为，我们认为这样也属于迭代器失效，所以要返回新插入的元素的位置，防止外部迭代器失效。

erase（）函数

erase（）函数同样有迭代器失效的问题，所以亚需要返回新的迭代器：

		iterator erase(iterator pos)
		{
			assert(pos != end());

			Node* cur = pos._Node;
			Node* prev = cur->_prev;
			Node* next = cur->_next;

			prev->_next = next;
			next->_prev = prev;

			delete[] cur; // 这里会有 pos 迭代器失效的问题，所要要返回新的迭代器

			return next;
		}

push_front():

直接复用insert（）函数

		void push_front(const T& x)
		{
			insert(begin(), x);
		}

pop_back() 和 pop_front():

		void pop_back()
		{
			erase(--end());
		}

		void pop_front()
		{
			erase(begin());
		}

clear（）和 size（）：

		size_t size()
		{
			return _size;
		}

		void clear()
		{
			iterator it = begin();
			while (it != end())
			{
				it = erase(it);
			}
			_size = 0;
		}

赋值运算符重载函数和swap（）函数

		void swap(List<T>& L)
		{
			std::swap(_head, L._head);
			std::swap(_head, L._size);
		}

		List<T>& operator(List<T> L)
		{
			swap(L);
			return *this;
		}

上述原理参考文章：(1条消息) C++-string类的模拟实现_chihiro1122的博客-CSDN博客当中赋值操作符重载函数（比较大小标题下）的介绍。

其实上述的赋值重载运算符函数当中的模板类的类型名可以不用 List<T>,我们知道List<T>是类型名，List是类名，对于模版类，类型名不是 List，而是List<T>，但是如果是在类模板当中写，可以写类名也可以写类型名（下述写法也可以）：

List& operator=(List L)

迭代器（重点）

非const迭代器

在上述介绍List迭代器的时候也介绍了，List当中的迭代器不是原生指针，而是自定义类型，所以在定义的时候有些难度，但是这样的好处是和普通的原生指针迭代器一样，可以直接 ++ 后移，*解引用来访问元素，等等，因为自定义类型当中有运算符重载函数，这样就可以实现。

其实List的迭代器本质上还是一个指针，只不过这个指针现在指向的是一个结点空间，其中不仅仅有数据域，还有指针域，那么直接解引用是不能访问到数据域的，这时候就要重载 “ * ”（解引用）运算符，实现也很简单，直接返回结点的数据域即可：

		T& operator* ()
		{
			return _Node->_val;
		}

我们再思考，我们在使用迭代器的时候会使用哪一些运算符，如下所示：

	while (it != L.end())
	{
		cout << *it << " ";
		++it; // 因为只重载了 前置的++
	}
	cout << endl;

我们要对上述用到的运算都要进行重载，那么这个迭代器才能正常使用：

		List_iterator<T>& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const List_iterator<T>& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const List_iterator<T>& L)
		{
			return _Node == L._Node;
		}

最后是整个迭代器结构体的构建，上述也说过，C++把结构体升级为了类，那么就可以使用构造函数来构造这个迭代器对象。

首先，这个迭代器的成员其实就一个，就是某一个结点的指针，那么这个结构体的构造函数就只用对这一个对象进行初始化就行了，只需要在构造的时候传入这个结点的指针就可以：

		typedef List_Node<T> Node;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

那么整个非const的迭代器就实现了，如下所示：

	template<class T>
	struct List_iterator
	{
		typedef List_Node<T> Node;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

		T& operator* ()
		{
			return _Node->_val;
		}

		List_iterator<T>& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const List_iterator<T>& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const List_iterator<T>& L)
		{
			return _Node == L._Node;
		}
	};

然后，在类当中也需要给出 begin（）和end（）两个接口，begin（）指向头结点 _head 的后一个，end 指向 _head 就行了：

		typedef List_iterator<T> iterator; // 一定要是公有的，不然不能访问
		iterator begin()
		{
			//return _head->_next; // 可以这样写，只有一个参数的构造函数发生 隐式类型的转换
		    // 上下两种都是一样的
			return iterator(_head->_next);
		}

		// 返回值应该是引用，要不然 ！= 函数会出错 传值返回返回的不是 _head 是 _head 的一个拷贝 
       // 临时对象具有常性  ······· 1
		iterator end()
		{
			return _head; // 同样发生隐式类型的转换
			// 上下两种都可以
			//return iterator(_head);
		}

需要注意几个问题：

上述代码注释当中提到的返回值类型应该是引用的问题（1），其实不用这样做，上述的 begin（）和end（）函数是在 operator!= 函数和构造函数当中使用的，所以只需要把 operator!= 函数的参数修改为 const 即可，上述已经做出了更改。
My_List::List<int>::iterator it = L.begin(); 这里不是赋值，而是拷贝构造，因为L.begin() 是一个已经存在了的对象赋值给另一个对象需要调用拷贝构造函数，但是迭代器没有实现拷贝构造，这里的编译器自己实现的浅拷贝，这里的浅拷贝没有问题，因为我们这里需要的就是浅拷贝。
My_List::List<int>::iterator it = L.begin(); 这里的两个指针都指向一个对象，那么为什么编译器没有报错呢？这是因为迭代器类没有实现析构函数，编译器就会自己调用默认析构函数去释放迭代器指针空间，而迭代器指向的结点空间，并不需要迭代器类来进行释放，在List类的析构函数当中进行释放。

const迭代器

这里的const 迭代器针对的是 const 对象，如果是const 修饰的对象，是不用普通的迭代器的，因为从 const 对象 const 的迭代器（指针），返回给非 const迭代器构造函数的时候，从事const 变成了非const，造成了权限的放大。

所以还是需要单独实现const 迭代器，对于const 迭代器和普通的迭代器功能类似，只不过在 operator* 这个函数当中返回的不是非const 对象，而是 const 对象：

	template<class T>
	struct const_List_iterator
	{
		typedef List_Node<T> Node;
		Node* _Node;

		const_List_iterator(Node* node)
			:_Node(node)
		{}

		const T& operator* ()
		{
			return _Node->_val;
		}

		const_List_iterator<T>& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const const_List_iterator<T>& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const const_List_iterator<T>& L)
		{
			return _Node == L._Node;
		}
	};



		const_iterator begin() const
		{
			return _head->_next;
		}

		const_iterator end() const
		{
			return const_iterator(_head);
		}

这样做虽然能够实现const迭代器的效果，但是太冗余了，不太好。

所以这个时候我们有了多个模版参数的使用，如下所示，是普通迭代器类的模版：

	template<class T, class Ref>
	struct List_iterator
	{

······················

此时，在类当中的 typedef 哑鼓这样写：

		typedef List_iterator<T , T&> iterator; // 一定要是公有的，不然不能访问
		typedef List_iterator<T , const T&> const_iterator;

这样就可以在同一个类当中区分出 const类和非 const 类，那么之间对 opeartor* 函数的修改就可以是这样的了;

		Ref operator* ()
		{
			return _Node->_val;
		}

同样，在类当中不同的地方都要进行修改，完整代码如下所示：

template<class T, class Ref>
	struct List_iterator
	{
		typedef List_Node<T> Node;
		typedef List_iterator<T,Ref> selt;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

		Ref operator* ()
		{
			return _Node->_val;
		}

		selt& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		selt operator++ (int)
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const selt& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const selt& L)
		{
			return _Node == L._Node;
		}
	};
	template<class T>
	class List
	{
		typedef List_Node<T> Node;

	public:
		typedef List_iterator<T , T&> iterator; // 一定要是公有的，不然不能访问
		typedef List_iterator<T , const T&> const_iterator;

·········································

这样的话，看似是写了一个类，其实是写了两个类，但是代码的大小就节省了，这就是模版带来的好处。

在迭代器当中，还会使用到 " -> " 这个操作符，所以这个操作符也需要重载：

		T* operator-> ()
		{
			return &_Node->_val;
		}

但是，在使用的时候，下面这个场景就有些怪，如下所示：

struct A
	{
		A(int a1 = 0, int a2 = 0)
			:_a1(a1)
			, _a2(a2)
		{}

		int _a1;
		int _a2;
	};

	void test_list2()
	{
		list<A> lt;
		lt.push_back(A(1, 1));
		lt.push_back(A(2, 2));
		lt.push_back(A(3, 3));
		lt.push_back(A(4, 4));

		list<A>::iterator it = lt.begin();
		while (it != lt.end())
		{
			//cout << (*it)._a1 << " " << (*it)._a2 << endl;
			cout << it->_a1 << " " << it->_a2 << endl;

			++it;
		}
		cout << endl;
	}

上述的 cout 流当中的 it 用法其实应该这样写：

it ->-> _a2

上面才是正常写法，但是在 operator-> 函数的使用当中却直接 it -> _a2 这样使用了，这是因为运算符重载要求可读性，编译器在这个地方进行特殊处理，省略了一个 " -> " 。

而上述的 operator-> 这个函数如果是 const 的迭代器当中是实现的话，返回值应该是 const T*，所以这里，对迭代器类模版的参数再加上一个 ptr 来使用：

最终迭代器的代码：

	template<class T, class Ref , class ptr>
	struct List_iterator
	{
		typedef List_Node<T> Node;
		typedef List_iterator<T,Ref, ptr> selt;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

		Ref operator* ()
		{
			return _Node->_val;
		}

		selt& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		selt operator++ (int)
		{
			_Node = _Node->_next;
			return *this;
		}

		selt& operator-- ()
		{
			_Node = _Node->_prev;
			return *this;
		}

		selt operator-- (int)
		{
			_Node = _Node->_prev;
			return *this;
		}

		bool operator!= (const selt& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const selt& L)
		{
			return _Node == L._Node;
		}

		ptr operator-> ()
		{
			return &_Node->_val;
		}
	};

template<class T>
	class List
	{
		typedef List_Node<T> Node;

	public:
		typedef List_iterator<T , T& , T*> iterator; // 一定要是公有的，不然不能访问
		typedef List_iterator<T , const T& , const T*> const_iterator;

·······················································

list的反向迭代器

通过前面例子知道，反向迭代器的++就是正向迭代器的--，反向迭代器的--就是正向迭代器的++，因此反向迭代器的实现可以借助正向迭代器，即：反向迭代器内部可以包含一个正向迭代器，对正向迭代器的接口进行包装即可。

template<class Iterator>
class ReverseListIterator
{
	// 注意：此处typename的作用是明确告诉编译器，Ref是Iterator类中的类型，而不是静态成员变量
	// 否则编译器编译时就不知道Ref是Iterator中的类型还是静态成员变量
	// 因为静态成员变量也是按照 类名::静态成员变量名 的方式访问的
public:
	typedef typename Iterator::Ref Ref;
	typedef typename Iterator::Ptr Ptr;
	typedef ReverseListIterator<Iterator> Self;
public:
	//
	// 构造
	ReverseListIterator(Iterator it) : _it(it) {}
	//
	// 具有指针类似行为
	Ref operator*() {
		Iterator temp(_it);
		--temp;
		return *temp;
	}
	Ptr operator->() { return &(operator*()); }
	//
	// 迭代器支持移动
	Self& operator++() {
        --_it;
        return *this;
    }
    Self operator++(int) {
    	Self temp(*this);
    	--_it;
    	return temp;
    }
        Self& operator--() {
    	++_it;
    	return *this;
    }
    Self operator--(int)
    {
	    Self temp(*this);
	    ++_it;
	    return temp;
    }
//
// 迭代器支持比较
bool operator!=(const Self& l)const { return _it != l._it; }
bool operator==(const Self& l)const { return _it != l._it; }
Iterator _it;
};

list和vector 的比较

list 就是链表， vector 是顺序表，两者的结构不同，导致两者的使用场景不同，两者也是典型的连续空间存储和链式空间存储不同特性的表现，下表是对两者进行的简单比较：

	vector	list
底层结构	动态顺序表，是一段连续空间	带头结点的双向循环链表
随机访问	支持随机访问，访问某个元素效率O(1)	不支持随机访问，访问某个元素效率O(N)
插入和删除	任意位置插入和删除效率低，需要搬移元素，时间复杂度为O(N)，插入时有可能需要增容，增容：开辟新空间，拷贝元素，释放旧空间，导致效率更低	任意位置插入和删除效率高，不需要搬移元素，时间复杂度为 O(1)
空间利用率	底层为连续空间，不容易造成内存碎片，空间利用率高，缓存利用率高	底层节点动态开辟，小节点容易造成内存碎片，空间利用率低，缓存利用率低
迭代器	原生态指针	对原生态指针(节点指针)进行封装
迭代器失效	在插入元素时，要给所有的迭代器重新赋值，因为插入元素有可能会导致重新扩容，致使原来迭代器失效，删除时，当前迭代器需要重新赋值否则会失效	插入元素不会导致迭代器失效，删除元素时，只会导致当前迭代器失效，其他迭代器不受影响
使用场景	需要高效存储，支持随机访问，不关心插入删除效率	大量插入和删除操作，不关心随机访问

C++ - list介绍和 list的模拟实现

list介绍

list 的使用

构造函数

迭代器

其他基本操作

list capacity

list element access

list modifiers

list 当中的迭代器失效

STL当中的迭代器认识

list的模拟实现

大致框架

结点的结构体定义

构造函数和析构函数

无参数的构造函数

析构函数

增删查改

push_back（）：

insert（）函数：

erase（）函数

push_front():

pop_back() 和 pop_front():

clear（）和 size（）：

赋值运算符重载函数和swap（）函数

迭代器（重点）

非const迭代器

const迭代器

list的反向迭代器

list和vector 的比较

猜你喜欢

C++ - list介绍 和 list的模拟实现

list介绍

list 的使用

构造函数

迭代器

其他基本操作

list capacity

list element access

list modifiers

list 当中的迭代器失效

STL当中的迭代器认识

list的模拟实现

大致框架

结点的结构体定义

构造函数和析构函数

无参数的构造函数

析构函数

增删查改

push_back（）：

insert（）函数：

erase（）函数

push_front():

pop_back() 和 pop_front():

clear（ ）和 size（）：

赋值运算符重载函数和swap（）函数

迭代器（重点）

非const迭代器

const迭代器

list的反向迭代器

list和vector 的比较

猜你喜欢

C++ - list介绍和 list的模拟实现

clear（）和 size（）：