C++ - list介绍 和 list的模拟实现

list介绍

 list 是一个支持在常数范围内,任意位置进行插入删除的序列式容器,且这个容器可以前后双向迭代。我们可以把 list 理解为 双向循环链表的结构。

于其他结构的容器相比,list在 任意位置进行插入和函数的效率要高很多;而list 的缺点也很明显,它在随机访问容器当中的数据的时候,它只能从已知位置开始线性寻找,这样寻找相比于其他容器来说有时间上的消耗;而且在存储方面,因为是一个结点一个结点分开存储,所以会多开空间来存储各个结点之间的关系,在存储消耗上也更高。

 list 的使用

 构造函数

构造函数( (constructor)) 接口说明
list (size_type n, const value_type& val = value_type()) 构造的list中包含n个值为val的元素
list() 构造空的list
list (const list& x) 拷贝构造函数
list (InputIterator first, InputIterator last) 用[first, last)区间中的元素构造list

list 的构造函数和 string ,vector是类似的,具体可以看以下博客:

C++ string类 迭代器 范围for_c++string迭代器_chihiro1122的博客-CSDN博客

 迭代器

 list 的迭代器不再像是 string 和 vector 当中使用 原生指针 来简单实现,而是使用类和对象来进行包装,这样可以让 指针 不能实现list 当中的 ++ 等等操作,用运算符重载函数来实现(具体迭代器的实现请看 list 的模拟实现)。

函数声明 接口说明
begin +
end
返回第一个元素的迭代器+返回最后一个元素下一个位置的迭代器
rbegin +
rend
返回第一个元素的reverse_iterator,即end位置,返回最后一个元素下一个位置的
reverse_iterator,即begin位置

 注意

  • 因为 list 的存储结构和 string 之类的 存储结构不一样,string 存储结构是 一块连续的区间,所以,对于string类的迭代器就支持  类似   str.begin() + 5 ,这样的操作;但是因为 list 是不连续的空间,对于 "+" 这个操作符的代价就比 string要高,所以在list 的迭代器当中就没有实现 operator+ 这个函数!!
  • 迭代器的使用 ,不能用 " < " 的形式来判断迭代器的区间!!因为 list 的各个结点的存储空间不连续,如果直接用 " < " 来比较,比较的是指针存储的地址大小,这样会出大问题,对于迭代器的使用一般是 这样的 :
list<int> L( 10 , 1 );
list::iterator it = L.begin();

while(it != L.end())
{
    cout << *it << " ";
    ++it;
}
cout << endl;

 其他基本操作

 在STL 当中,这些函数基本使用都差不多,集体可以参照之前介绍 string 和 vector 的博客:

C++ string类 迭代器 范围for_c++string迭代器_chihiro1122的博客-CSDN博客

C++ string类-2_chihiro1122的博客-CSDN博客

C++ - 初识vector类 迭代器失效_chihiro1122的博客-CSDN博客

list capacity

函数声明 接口说明
empty 检测list是否为空,是返回true,否则返回false
size 返回list中有效节点的个数

list element access

函数声明 接口说明
front 返回list的第一个节点中值的引用
back 返回list的最后一个节点中值的引用

 list modifiers

函数声明 接口说明
push_front 在list首元素前插入值为val的元素
pop_front 删除list中第一个元素
push_back 在list尾部插入值为val的元素
pop_back 删除list中最后一个元素
insert 在list position 位置中插入值为val的元素
erase 删除list position位置的元素
swap 交换两个list中的元素
clear 清空list中的有效元素

list 当中的迭代器失效

 list 当中的insert()函数就没有迭代器失效了,因为之前在vector 当中出现的 insert()函数迭代器失效,是因为vector 是一段连续的空间,需要扩容操作,而扩容就会导致迭代器失效;但是list 当中的每一次插入数据都是要开辟新空间,并不会影响到list 当中已经存在了的元素。

但是,对于删除的函数来说,比如 erase()函数,还是会存储迭代器失效的问题:

int array[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 0 };
list<int> l(array, array+sizeof(array)/sizeof(array[0]));
auto it = l.begin();
while (it != l.end())
{
// erase()函数执行后,it所指向的节点已被删除,因此it无效,在下一次使用it时,必须先给
其赋值
l.erase(it);
++it;

如上述例子,就是外部的迭代器失效问题,当it 指向的空间被删除之后,it指向空间也就被释放,那么在while语句当中的  ++it 这个重载运算符函数就找不到下一个了。

改正;

while (it != l.end())
{
l.erase(it++); // it = l.erase(it);
}

 STL当中的迭代器认识

 我们先来看下面三个函数的不同迭代器类型:

 

 上述有三种迭代器类型:

  •  InputIterator:单向迭代器,只能用 ++ 的操作。
  •  BidirectionalIterator:双向迭代器,可以用 ++ / -- 两个操作。
  • RandomAccessIterator:随机迭代器,可以用      ++ / -- / + / -       四个操作。

 不同的容器类型,对于迭代器的使用就有要求:

 比如,单链表就只能用 单向迭代器,双向和随机都不能用,那么对于库当中的双向和随机迭代器实现的函数,单链表也不能使用。

但是这三个迭代器是向上兼容的,就是说 随机 是 双向的 一种特殊情况,所以,使用随机迭代器的容器就可以使用 双向迭代器的函数;同样,双向 是 单向的一种特殊情况,双向的,可以使用单向的。

 list的模拟实现

 大致框架

#pragma once

namespace My_List
{
	template<class T>
	struct List_Node  // 结点指针结构体
	{
·············
	};

    template<class T>
	struct List_iterator // 非const 迭代器
	{
··········
    };

    template<class T>
	class List         // List 类
	{
············
        private:
		Node* _head;

	};
}

 结点的结构体定义 

 在官方的List源代码当中,List容器的结点定义就是定义在 同一命名空间下的 一个结构体当中,因为在C++ 当中结构体已经升级为了类,所以在结构体当中也可以定义构造函数。

所以,因为结点当中有数值域,和指针域,我们就把这个结构体当做是一个构造结点的函数来实现,效果也是一样的,只不过使用的时候,使用new的方式来开空间和定义:

	template<class T>
	struct List_Node
	{
		List_Node<T>* _next;
		List_Node<T>* _prev;
		T _val;

		// List_Node 的构造函数
		List_Node(const T& val = T())
			:_next(nullptr),
			_prev(nullptr),
			_val(val)
		{}
	};

当然,为了数值域的复用性,使用模版来对数值域的类型进行模版化。

 构造函数和析构函数

 无参数的构造函数

		List()
		{
			_head = new Node;
			_head->_next = _head;
			_head->_prev = _head;
		}

因为List的底层是 带头循环双向链表,所以没有结点的链接方式如上,只有一个头结点。

 析构函数

		~List()
		{
			clear();
			delete _head;
			_head = nullptr;
		}

 这里可以直接复用clear()函数。

增删查改

 push_back():

		void push_back(const T& x)
		{
			Node* tail = _head->_prev;
			Node* newNode = new Node(x);

			_head->_prev = newNode;
			tail->_next = newNode;

			newNode->_prev = tail;
			newNode->_next = _head;

            // 实现insert()函数之后
            // insert(end() , x);
		}

直接开空间然后修改链接关系即可。

 insert()函数:

这里的insert()函数的当中传入的 pos 指针不用检查合法性,因为这里是带头结点循环的链表,在头结点的前面和后面删都是可以的。代码:

		iterator insert(iterator pos, const T& x)
		{
			Node* cur = pos._Node;
			Node* prev = cur->_prev;
			Node* newNode = new Node(x);

			prev->_next = newNode;
			newNode->_next = cur:

			cur->_prev = newNode;
			newNode->_prev = prev;

			return newNode;
		}

因为pos位置前插入元素之后,pos迭代器向后移动了以为,我们认为这样也属于迭代器失效,所以要返回新插入的元素的位置,防止外部迭代器失效。 

erase()函数

 erase()函数同样有迭代器失效的问题,所以亚需要返回新的迭代器:

		iterator erase(iterator pos)
		{
			assert(pos != end());

			Node* cur = pos._Node;
			Node* prev = cur->_prev;
			Node* next = cur->_next;

			prev->_next = next;
			next->_prev = prev;

			delete[] cur; // 这里会有 pos 迭代器失效的问题,所要要返回新的迭代器

			return next;
		}

 push_front():

 直接复用insert()函数

		void push_front(const T& x)
		{
			insert(begin(), x);
		}

 pop_back() 和 pop_front(): 

		void pop_back()
		{
			erase(--end());
		}

		void pop_front()
		{
			erase(begin());
		}

 clear( )和 size():

		size_t size()
		{
			return _size;
		}

		void clear()
		{
			iterator it = begin();
			while (it != end())
			{
				it = erase(it);
			}
			_size = 0;
		}

 赋值运算符重载函数和swap()函数

		void swap(List<T>& L)
		{
			std::swap(_head, L._head);
			std::swap(_head, L._size);
		}

		List<T>& operator(List<T> L)
		{
			swap(L);
			return *this;
		}

 上述原理参考文章:(1条消息) C++-string类的模拟实现_chihiro1122的博客-CSDN博客当中赋值操作符重载函数(比较大小标题下)的介绍。

其实上述的 赋值重载运算符函数当中的模板类的类型名可以不用 List<T>,我们知道List<T>是类型名,List是类名,对于模版类,类型名不是 List,而是List<T>,但是如果是在类模板当中写,可以写类名也可以写类型名(下述写法也可以):

List& operator=(List L)

迭代器(重点)

 非const迭代器

 在上述介绍List迭代器的时候也介绍了,List当中的迭代器不是原生指针,而是自定义类型,所以在定义的时候有些难度,但是这样的好处是和 普通的原生指针迭代器一样,可以直接 ++ 后移,*解引用来访问元素,等等,因为自定义类型当中有运算符重载函数,这样就可以实现。

 其实List的迭代器本质上还是一个指针,只不过这个指针现在指向的是一个结点空间,其中不仅仅有数据域,还有指针域,那么直接解引用是不能访问到数据域的,这时候就要重载 “ * ”(解引用)运算符,实现也很简单,直接返回结点的数据域即可:

		T& operator* ()
		{
			return _Node->_val;
		}

 我们再思考,我们在使用迭代器的时候会使用哪一些运算符,如下所示:
 

	while (it != L.end())
	{
		cout << *it << " ";
		++it; // 因为只重载了 前置的++
	}
	cout << endl;

 我们要对上述用到的运算都要进行重载,那么这个迭代器才能正常使用:

		List_iterator<T>& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const List_iterator<T>& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const List_iterator<T>& L)
		{
			return _Node == L._Node;
		}

 最后是整个 迭代器结构体的构建,上述也说过,C++把结构体升级为了类,那么就可以使用构造函数来构造这个 迭代器对象。

首先,这个迭代器的成员其实就一个,就是某一个结点的指针,那么这个结构体的构造函数就只用对这一个对象进行初始化就行了,只需要在构造的时候传入这个结点的指针就可以:
 

		typedef List_Node<T> Node;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

 那么整个非const的迭代器就实现了,如下所示:

	template<class T>
	struct List_iterator
	{
		typedef List_Node<T> Node;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

		T& operator* ()
		{
			return _Node->_val;
		}

		List_iterator<T>& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const List_iterator<T>& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const List_iterator<T>& L)
		{
			return _Node == L._Node;
		}
	};

 然后,在类当中也需要给出 begin()和end()两个接口,begin()指向头结点 _head 的后一个,end 指向 _head 就行了:

		typedef List_iterator<T> iterator; // 一定要是公有的,不然不能访问
		iterator begin()
		{
			//return _head->_next; // 可以这样写,只有一个参数的构造函数发生 隐式类型的转换
		    // 上下两种都是一样的
			return iterator(_head->_next);
		}

		// 返回值应该是引用,要不然 != 函数会出错 传值返回返回的不是 _head 是 _head 的一个拷贝 
       // 临时对象具有常性  ······· 1
		iterator end()
		{
			return _head; // 同样发生隐式类型的转换
			// 上下两种都可以
			//return iterator(_head);
		}

 需要注意几个问题: 

  •  上述代码注释当中提到的返回值类型应该是引用的问题(1),其实不用这样做,上述的 begin()和end()函数是在 operator!= 函数 和 构造函数当中使用的,所以只需要把 operator!= 函数的参数修改为 const 即可,上述已经做出了更改。
  • My_List::List<int>::iterator it = L.begin();     这里不是赋值,而是拷贝构造,因为L.begin() 是一个已经存在了的对象赋值给另一个对象需要调用拷贝构造函数,但是迭代器没有实现拷贝构造,这里的编译器自己实现的浅拷贝,这里的浅拷贝没有问题,因为我们这里需要的就是浅拷贝。
  • My_List::List<int>::iterator it = L.begin();     这里的两个指针都指向一个对象,那么为什么编译器没有报错呢?这是因为迭代器类没有实现析构函数,编译器就会自己调用默认析构函数去 释放迭代器指针空间,而迭代器指向的结点空间,并不需要迭代器类来进行释放,在List类的析构函数当中进行释放。

const迭代器

 这里的const 迭代器针对的是 const 对象,如果是const 修饰的对象,是不用普通的迭代器的,因为 从 const 对象 const 的迭代器(指针),返回给非 const迭代器构造函数的时候,从事const 变成了 非const,造成了权限的放大。

所以还是需要单独实现const 迭代器,对于const 迭代器和普通的迭代器功能类似,只不过在 operator* 这个函数当中返回的不是 非const 对象,而是 const 对象:

	template<class T>
	struct const_List_iterator
	{
		typedef List_Node<T> Node;
		Node* _Node;

		const_List_iterator(Node* node)
			:_Node(node)
		{}

		const T& operator* ()
		{
			return _Node->_val;
		}

		const_List_iterator<T>& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const const_List_iterator<T>& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const const_List_iterator<T>& L)
		{
			return _Node == L._Node;
		}
	};



		const_iterator begin() const
		{
			return _head->_next;
		}

		const_iterator end() const
		{
			return const_iterator(_head);
		}

这样做虽然能够实现const迭代器的效果,但是太冗余了,不太好。

所以这个时候我们有了多个模版参数的使用,如下所示,是 普通迭代器类的模版:
 

	template<class T, class Ref>
	struct List_iterator
	{

······················

此时,在类当中的 typedef 哑鼓这样写:
 

		typedef List_iterator<T , T&> iterator; // 一定要是公有的,不然不能访问
		typedef List_iterator<T , const T&> const_iterator;

这样就可以在同一个类当中区分出 const类和 非 const 类,那么之间对 opeartor* 函数的修改就可以是这样的了;

		Ref operator* ()
		{
			return _Node->_val;
		}

同样,在类当中不同的地方都要进行修改,完整代码如下所示 :

template<class T, class Ref>
	struct List_iterator
	{
		typedef List_Node<T> Node;
		typedef List_iterator<T,Ref> selt;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

		Ref operator* ()
		{
			return _Node->_val;
		}

		selt& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		selt operator++ (int)
		{
			_Node = _Node->_next;
			return *this;
		}

		bool operator!= (const selt& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const selt& L)
		{
			return _Node == L._Node;
		}
	};
	template<class T>
	class List
	{
		typedef List_Node<T> Node;

	public:
		typedef List_iterator<T , T&> iterator; // 一定要是公有的,不然不能访问
		typedef List_iterator<T , const T&> const_iterator;

·········································

这样的话,看似是写了一个类,其实是写了两个类,但是代码的大小就节省了,这就是模版带来的好处。

在迭代器当中,还会使用到 " -> " 这个操作符,所以这个操作符也需要重载:

		T* operator-> ()
		{
			return &_Node->_val;
		}

但是,在使用的时候,下面这个场景就有些怪,如下所示:

struct A
	{
		A(int a1 = 0, int a2 = 0)
			:_a1(a1)
			, _a2(a2)
		{}

		int _a1;
		int _a2;
	};

	void test_list2()
	{
		list<A> lt;
		lt.push_back(A(1, 1));
		lt.push_back(A(2, 2));
		lt.push_back(A(3, 3));
		lt.push_back(A(4, 4));

		list<A>::iterator it = lt.begin();
		while (it != lt.end())
		{
			//cout << (*it)._a1 << " " << (*it)._a2 << endl;
			cout << it->_a1 << " " << it->_a2 << endl;

			++it;
		}
		cout << endl;
	}

 上述的 cout 流当中的 it 用法其实应该这样写 :

it ->-> _a2

上面才是正常写法,但是在 operator-> 函数的使用当中却直接 it -> _a2 这样使用了,这是因为运算符重载要求可读性,编译器在这个地方进行特殊处理,省略了一个 " -> " 。

 而上述的 operator-> 这个函数如果是 const 的迭代器当中是实现的话,返回值应该是 const T*,所以这里,对迭代器类模版的参数再加上一个 ptr 来使用

最终迭代器的代码:

	template<class T, class Ref , class ptr>
	struct List_iterator
	{
		typedef List_Node<T> Node;
		typedef List_iterator<T,Ref, ptr> selt;
		Node* _Node;

		List_iterator(Node* node)
			:_Node(node)
		{}

		Ref operator* ()
		{
			return _Node->_val;
		}

		selt& operator++ ()
		{
			_Node = _Node->_next;
			return *this;
		}

		selt operator++ (int)
		{
			_Node = _Node->_next;
			return *this;
		}

		selt& operator-- ()
		{
			_Node = _Node->_prev;
			return *this;
		}

		selt operator-- (int)
		{
			_Node = _Node->_prev;
			return *this;
		}

		bool operator!= (const selt& L)
		{
			return _Node != L._Node;
		}

		bool operator== (const selt& L)
		{
			return _Node == L._Node;
		}

		ptr operator-> ()
		{
			return &_Node->_val;
		}
	};

template<class T>
	class List
	{
		typedef List_Node<T> Node;

	public:
		typedef List_iterator<T , T& , T*> iterator; // 一定要是公有的,不然不能访问
		typedef List_iterator<T , const T& , const T*> const_iterator;

·······················································

list的反向迭代器


通过前面例子知道,反向迭代器的++就是正向迭代器的--,反向迭代器的--就是正向迭代器的++,因此反向迭代器的实现可以借助正向迭代器,即:反向迭代器内部可以包含一个正向迭代器,对正向迭代器的接口进行包装即可。
 

template<class Iterator>
class ReverseListIterator
{
	// 注意:此处typename的作用是明确告诉编译器,Ref是Iterator类中的类型,而不是静态成员变量
	// 否则编译器编译时就不知道Ref是Iterator中的类型还是静态成员变量
	// 因为静态成员变量也是按照 类名::静态成员变量名 的方式访问的
public:
	typedef typename Iterator::Ref Ref;
	typedef typename Iterator::Ptr Ptr;
	typedef ReverseListIterator<Iterator> Self;
public:
	//
	// 构造
	ReverseListIterator(Iterator it) : _it(it) {}
	//
	// 具有指针类似行为
	Ref operator*() {
		Iterator temp(_it);
		--temp;
		return *temp;
	}
	Ptr operator->() { return &(operator*()); }
	//
	// 迭代器支持移动
	Self& operator++() {
        --_it;
        return *this;
    }
    Self operator++(int) {
    	Self temp(*this);
    	--_it;
    	return temp;
    }
        Self& operator--() {
    	++_it;
    	return *this;
    }
    Self operator--(int)
    {
	    Self temp(*this);
	    ++_it;
	    return temp;
    }
//
// 迭代器支持比较
bool operator!=(const Self& l)const { return _it != l._it; }
bool operator==(const Self& l)const { return _it != l._it; }
Iterator _it;
};

list和vector 的比较

 list 就是链表, vector 是顺序表,两者的结构不同,导致两者的使用场景不同,两者也是典型的连续空间存储和链式空间存储不同特性的表现,下表是对两者进行的简单比较:

vector         list
底 层 结 构 动态顺序表,是一段连续空间 带头结点的双向循环链表
随 机 访 问 支持随机访问,访问某个元素效率O(1) 不支持随机访问,访问某个元素
效率O(N)
插 入 和 删 除 任意位置插入和删除效率低,需要搬移元素,时间复杂
度为O(N),插入时有可能需要增容,增容:开辟新空
间,拷贝元素,释放旧空间,导致效率更低
任意位置插入和删除效率高,不
需要搬移元素,时间复杂度为
O(1)
空 间 利 用 率 底层为连续空间,不容易造成内存碎片,空间利用率
高,缓存利用率高
底层节点动态开辟,小节点容易
造成内存碎片,空间利用率低,
缓存利用率低
迭 代 器 原生态指针 对原生态指针(节点指针)进行封装
迭 代 器 失 效 在插入元素时,要给所有的迭代器重新赋值,因为插入
元素有可能会导致重新扩容,致使原来迭代器失效,删
除时,当前迭代器需要重新赋值否则会失效
插入元素不会导致迭代器失效,
删除元素时,只会导致当前迭代
器失效,其他迭代器不受影响
使 用 场 景 需要高效存储,支持随机访问,不关心插入删除效率 大量插入和删除操作,不关心随
机访问

猜你喜欢

转载自blog.csdn.net/chihiro1122/article/details/131899659