C++Vector类详解

目录

1.Vector介绍

2.Vector的常见使用

   2.1 vector构造函数

   2.2 vector iterator使用

   2.3 vector空间增长问题

   2.4 vector增删改查

   2.5 vector迭代器失效问题

3.Vector深度剖析及模拟实现

   3.1 模拟实现(可跳过)

   3.2 不使用memcpy剖析

扫描二维码关注公众号,回复: 15906101 查看本文章

1.Vector介绍

  1. vector是表示可变大小数组的序列容器。
  2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
  3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
  4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
  5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
  6. 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list 统一的迭代器和引用更好。

2.Vector的常见使用

   2.1 vector构造函数

(constructor)构造函数声明 接口说明
vector()  无参构造
vector (size_type n,const value_type&val=value_type()) 构造并初始化n个val
vector (const vector& x)
拷贝构造
vector (InputIterator fifirst, InputIterator last)
迭代器进行初始化构造

   2.2 vector iterator使用

逻辑位置示意图: 

iterator的使用 接口说明
begin+end
获取第一个数据位置的 iterator/const_iterator , 获取最后一个数据的下一个位置的iterator/const_iterator
rbegin+rend
获取最后一个数据位置的 reverse_iterator ,获取第一个数据前一个位置的reverse_iterator

 简单使用例子:

void test1()
	{
		vector<int> V;
		V.push_back(1);
		V.push_back(2);
		V.push_back(3);
		V.push_back(4);
		vector<int>::iterator it = V.begin();
		while (it != V.end())
		{
			cout << *it << ' ';
			++it;
		}
		cout << endl;
		//反向迭代器
		vector<int>::reverse_iterator rit = V.rbegin();
		while (rit != V.rend())
		{
			cout << *rit << ' ';
			++rit;
		}
		cout << endl;
	}

 

   2.3 vector空间增长问题

容量空间 接口说明
size 获取数据个数
capacity 获取容量大小
empty 判断是否为空
resize 改变vector的size
reserve 改变vector的capacity

测试vector的默认扩容机制:

void TestVectorExpand()
	{
		size_t sz;
		vector<int> v;
		sz = v.capacity();
		cout << "making v grow:\n";
		for (int i = 0; i < 100; ++i)
		{
			v.push_back(i);
			if (sz != v.capacity())
			{
				sz = v.capacity();
				cout << "capacity changed: " << sz << '\n';
			}
		}
	}

vs下运行:

gcc下运行: 

  •  capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
  • reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
  • resize在开空间的同时还会进行初始化,影响size。
	void test2()
	{
		vector<int> v;

		// set some initial content:
		for (int i = 1; i < 10; i++)
			v.push_back(i);

		v.resize(5);
		v.resize(8, 100);
		v.resize(12);
		cout << v.size() << endl;
		cout << "v contains:";
		for (size_t i = 0; i < v.size(); i++)
			cout << ' ' << v[i];
		cout << endl;
	}

 使用reserve提前设置好容量:

   2.4 vector增删改查

vector增删改查 接口说明
push_back 尾插
pop_back 尾删
find 查找(算法模块实现,不是vector成员接口)
insert 在pos前插入val
erase 删除pos位置数据
swap 交换两个vector数据空间
operator[ ] 像数组一样下标访问

 测试代码:

void test3()
	{
		vector<int> v{ 1,2,3,4 };//列表方式初始化,C++11新语法
		v.push_back(5);
		v.push_back(6);
		v.pop_back();
		for (size_t i = 0; i < v.size(); i++)
		{
			cout << v[i] << ' ';
		}
		cout << endl;
		vector<int>::iterator pos = find(v.begin(), v.end(), 3);
		if (pos != v.end())
		{
			v.insert(pos, 0);
		}
		pos = find(v.begin(), v.end(), 3);
		v.erase(pos);
		for (size_t i = 0; i < v.size(); i++)
		{
			cout << v[i] << ' ';
		}
		cout << endl;

	}

   2.5 vector迭代器失效问题

细心的朋友,可能已经发现我上面圈出来的重复find查找了一次,这是因为如果不再find给pos赋值,insert后不接受迭代器返回值继续erase会造成迭代器失效问题。 

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。

对于vector可能会导致其迭代器失效的有效的操作有:

  • 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。

        扩容后原来的pos已经失效,变为野指针。

        若不扩容insert后pos指向插入元素。

  • 指定位置元素的删除——erase
        erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是: 如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是没有元素的,那么pos就失效了。

习题:

下面程序的输出结果正确的是(    )

int main()

{

	int ar[] ={1,2,3,4,0,5,6,7,8,9};
	int n = sizeof(ar) / sizeof(int);
	vector<int> v(ar, ar+n);
	vector<int>::iterator it = v.begin();
	while(it != v.end())
	{
		if(*it != 0)
			cout<<*it;
		else
			v.erase(it);
		it++;
	}
	return 0;
}

A.程序运行崩溃

B.1 2 3 4 5 0 6 7 8 9

C.1 2 3 4 5 6 7 8 9

D.1 2 3 4 6 7 8 9

 答案:当迭代器的值为0时,此时会进行删除,删除后如果迭代器不重新赋值,会导致原来的迭代器失效,此时针对一个已经失效的迭代器在进行++,会导致程序崩溃。故答案为A

下面关于迭代器失效的描述哪个是错误的( )

A.vector的插入操作一定会导致迭代器失效

B.vector的插入操作有可能不会导致迭代器失效

C.vector的删除操作只会导致指向被删除元素及后面的迭代器失效

D.vector的删除操作只会导致指向被删除元素的迭代器失效

答案:vector的插入操作如果导致底层空间重新开辟,则迭代器就会失效。如果空间足够,那么迭代也算失效了,因为数据相对位置已经发生改变,他已经不是指向之前的位置了。

vector删除,当前元素肯定失效,后面元素会牵扯到移动数据,因此删除元素后面的迭代器也会失效。

故答案为BD 

迭代器失效解决办法: 在使用前,对迭代器 重新赋值 即可
修改上面例子代码示例如下:
        vector<int>::iterator pos = find(v.begin(), v.end(), 3);
		if (pos != v.end())
		{
			pos=v.insert(pos, 0);
            //pos当前指向0
		}
        //删除3
		++pos;
		v.erase(pos);

3.Vector深度剖析及模拟实现

   3.1 模拟实现(可跳过)

        私有成员变量:与上图保持一致

		iterator _start;
		iterator _finish;
		iterator _end_of_storage;

        构造函数:

         拷贝构造函数:(现代写法)

swap:

         赋值运算符重载:(现代写法)

         析构函数:

         迭代器:

         size和capacity:

        reserve:(为什么不使用memcpy在后面将解)

         resize:

         operator[ ]:

        insert:

         erase:

         push_back,pop_back():(复用insert,erase)

   3.2 不使用memcpy剖析

        memcpy是浅拷贝

1.memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。
2. 如果拷贝的是自定义类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

 假设一个vector<vector<int>>类型,实际内存分配:

 memcpy分配:(浅拷贝,释放2次空间,第二次为野指针造成内存泄漏)

 采取深拷贝(自己实现):


猜你喜欢

转载自blog.csdn.net/bang___bang_/article/details/130335401