vector中迭代器失效的问题及解决办法

目录

vector常用接口 

vector 迭代器失效问题 

vector中深浅拷贝问题 


vector的数据安排以及操作方式,与array非常相似。两者的唯一差别在于空间的运用的灵活性。array 是静态空间,一旦配置了就不能改变;要换个大(或小) 一点的房子,可以,一切琐细得由客户端自已来:首先配置一块新空间, 然后将元素从旧址一 一搬往新址,再把原来的空间释还给系统。vector是动态空间,随着元素的加入,它的内部机制会自行扩充空间以容纳新元素。因此,vector 的运用对于内存的合理利用与运用的灵活性有很大的帮助,我们再也不必因为害怕空间不足而一开始就要求一个大块头array了,我们可以安心使用vector,吃多少用多少。

vector定义

template<class T>
 class vector 

{

public:
        typedef T* iterator;
        typedef const T* const_iterator;

private:

        iterator _start ;  //表示目前使用空间的头
        iterator _finish;  //表示目前使用空间的尾
        iterator _end_of_storage;  //表示可用空间的尾

}

vector常用接口 

  • push_back( ) 成员函数在vector的末尾插入值,如果有必要会扩展vector的大小。
  • pop_back( ) 成员函数在vector的末尾删除值。
  • size( ) 函数显示vector的大小。
  • begin( ) 函数返回一个指向vector开头的迭代器。
  • end( ) 函数返回一个指向vector末尾的迭代器。
  • empty() 判断vector是否为空。
  • find() 查找。(注意这个是算法模块实现,不是vector的成员接口)
  • insert()  在position之前插入val
  • erase() 删除position位置的数据
  • swap() 交换两个vector的数据空间
  • operator[]  像数组一样使用下标访问

size 是当前 vector 容器真实占用的大小,也就是容器当前拥有多少个容器。

capacity 是指在发生 realloc 前能允许的最大元素数,即预分配的内存空间。

当然,这两个属性分别对应两个方法:resize() 和 reserve()

使用 resize() 容器内的对象内存空间是真正存在的。

使用 reserve() 仅仅只是修改了 capacity 的值,容器内的对象并没有真实的内存空间(空间是"野"的)。

capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。 具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。 reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。 resize在开空间的同时还会进行初始化,影响size。

此时切记使用 [] 操作符访问容器内的对象,很可能出现数组越界的问题。

vector 迭代器失效问题 

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。迭代器失效就是迭代器底层对应指针所指向的空间倍销毁了,导致使用了一块已经被释放了的空间。

迭代器失效分为两大类:

1.扩容导致野指针

我们发现push_back尾插4个后调用insert会出现随机值。问题就是扩容导致pos迭代器失效,原因在于pos没有更新,导致非法访问野指针。

当尾插4个数字后,再头插一个数字,发生扩容,根据reserve扩容机制,扩容地址改变,迭代器就会失效,insert中发生扩容,迭代器指向的空间被释放,迭代器本质上就是一个野指针。_ start和_ finish都会更新,但是这个插入的位置pos没有更新,此时pos依旧执行旧空间,再者reserve后会释放旧空间,此时的pos就是野指针,导致*pos = x就是对非法访问野指针。因为pos迭代器没有更新,所以后续挪动数据并没有实现,而插入数据是对释放的空间进行操作,同样没有意义。这也就是说不论你在哪个位置插入,都没有效果。

解决办法:

扩容后更新pos,解决pos失效的问题。

iterator insert(iterator pos, const T& val)
		{
			assert(pos >= _start);
			assert(pos <= _finish);
			//扩容地址改变,迭代器会失效
			//insert中发生扩容,it指向的空间被释放,it本质上就是一个野指针
			if (_finish == _end_of_storage)
			{
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 4 : capacity() * 2);

				//扩容后更新pos,解决pos失效的问题
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (pos >= end)
			{
				*(end + 1) = *end;
				--end;
			}
			*pos = val;
			++_finish;
			return pos;
		}

2.迭代器指向位置意义改变

比如要求删除vector中所有的偶数

 erase删除pos位置元素后,pos位置之后的元素会往前移动,没有导致底层空间的改变,理论上讲迭代器不会失效,但是如果pos位置刚好是最后一个元素,删完之后pos刚好是end的位置,而end的位置是没有有效元素的,那么pos就失效了。因此删除vector中任意位置元素时,均认为该位置上迭代器失效。我们应该在使用的时候注意,让迭代器指向有效的位置。

迭代器失效后,代码并不一定会崩溃,但是运行结果肯定不对,如果it不在begin和end范围内,肯定会崩溃。

vector中深浅拷贝问题 

拷贝构造函数

 memcpy是浅拷贝,当T是内置类型的时候这个拷贝函数没什么问题,当时当T是自定义类型的时候就会出现问题,比如T是string类型。

 

 如果此时我们使用的是memcpy函数进行拷贝构造的话,那么拷贝构造出来的vector中每个string的成员变量的值,将与被拷贝的vector中每个string的成员变量的值相同,即两个vector当中的每个对应的string成员都指向同一个字符串空间。

解决办法: 

_start[i] = _v[i] 本质是调用string类的赋值运算符重载函数进行深拷贝。 

扩容也需要注意浅拷贝的问题。

扩容时调用的memcpy是浅拷贝,就会导致先前存储的数据被memcpy后再delete就全删掉变成随机值了。vector调用析构函数析构掉原来的对象,每个对象又调用自身的析构函数,把指向的空间释放掉,然后就会出现随机值。

 我们析构旧空间的时候,析构的是对象数组,每个数组调用自身的析构函数,会析构数组的空间。我们用memcpy浅拷贝时,拷贝的临时对象和原来的对象指向同一块空间,所以旧空间被销毁后,我们扩容的新空间中的对象变成野指针,访问的数据都是随机值。我们用for循环调用vector的赋值运算符重载可以将旧空间的数据拷贝到新空间,这样析构旧空间就不会影响新空间。

猜你喜欢

转载自blog.csdn.net/m0_55752775/article/details/129406979
今日推荐