C++ vector中的迭代器失效问题

vector中的迭代器失效问题
在使用vector的成员函数时,有两个成员函数内部会出!](https://img-blog.csdnimg.cn/20181124093029161.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L01famlhbmppYW5qaWFv,size_16,color_FFFFFF,t_70)现迭代器失效的问题。分别是insert和erase而这两个成员函数迭代器失效的原因并不相同。
insert

在我们使用insert的接口时,不会遇到迭代器的失效问题的影响,因为在insert中已经处理过l。而此处所说的就是在insert实现过程中出现的迭代器失效问题。

insert(iterator pos,value_type value);
vector类中的insert函数,在所传迭代器位置的数前面插入一个数,返回值是所插入位置的迭代器。

现在我们对于该函数进行模拟实现,插入时有两种情况

  • 插入后长度不会超出当前容量
  • 插入后超出当前容量

对于第一种,在容量足够的情况下插入,进行正常的元素挪动和插入就行了。

对于第二种,当插入后的长度超出了容量的范围。此时我们就需要先进行扩容。

如何扩容?

  扩容时因为此时容量已不够用,我们需要重新开辟一块大于当前容量的空间。至于开辟多大的容量,这个我们可以自定义。只要能容纳所插入的值。在vs下每次扩容的大小是之前容量的1.5倍,而在linux g++下每次开辟的容量是之前容量的2倍。开辟新空间后,将原空间的内容拷贝至新空间即可,再将对象中的指针指向新空间,再释放原空间即可即可。此时应该注意,需要进行深拷贝,如果当vector中的元素为string vector时,如果进行是浅拷贝,在析构的时候会发生错误。

完成扩容后,此时却出现了一个问题,我们所传的迭代器位置是指向原空间的,而原空间的位置在我们进行扩容时已经释放了,那意味着原来的迭代器位置已经是一个野指针,此时原先的迭代器位置已将失效。

如何解决?

我们只需在扩容时,将原迭代器位置的偏移量记录下来,在新开辟的空间中找到原有的位置即可。

insert 的模拟实现

Iterator Insert(Iterator pos,T value)
    {
      assert(pos<=_finish);
      
      size_t offset=pos-_start;//增容更换空间后pos处的迭代器会失效,记录其偏移量

      if(_finish == _endofstorage)
      {
        size_t newCapacity = Capacity()==0?2:2*Capacity(); //防止第一次为空
        Reserve(newCapacity);
      }

      pos = begin() + offset;
      Iterator end =this->end();
      while(end != pos)
      {
        *end = *(end-1);
         end--;
      }

      *pos = value;
      _finish++;
      return pos;

    }

erase

在vector中erase 也会导致迭代器失效,不同于insert是在内部实现时会遇到的空间的更换造成迭代器失效,不会对于我们使用时造成影响,但erase会在使用时对我们造成一些影响。

iterator erase(iterator pos);
返回所删除的数的下一个数的迭代器
int arr[] = { 1, 2, 3, 4, 5, 6 };
	vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));


	vector<int>::iterator pos;
	
	 pos = nums.insert(nums.begin() + 1 , 9);

	 nums.erase(pos);
	 
	 *pos = 10;  //此处报错

当我们删除一个数后,再通过迭代器位置去访问时,就会报错
在这里插入图片描述

为甚麽会报错
当我们删除后将一个数删除后者个位置的迭代器也就被删除了,而我们如果再对删除的迭代器位置进行修该访问就会报错

	 pos=nums.erase(pos);
	//只要我们重新接收erase返回的迭代其位置,就可以了
	 *pos = 10;
	 
	 //此时不会报错

通过调试,我们会发现,pos的传入地址和传出的地址完全一样,并没有发生变化
在这里插入图片描述
在这里插入图片描述

为甚麽迭代器会失效
通过vs底层实现的,我们可以看到他返回的迭代器不仅仅是传入的位置,还进行了处理,可见vs在对迭代器进行了处理,以便于检查,只要迭代器被删除过后,就不能再使用,只能接受它返回的正确的迭代器。在这里插入图片描述

从以下的底层代码可以看到vs对迭代器进行的检查,在每次使用迭代器之前都对迭代器进行检查。
在这里插入图片描述
将同样的代码放在Linux下进行运行

int main()                          
  7 {                                   
  8   int arr[] = { 1, 2, 3, 4, 5, 6  };
  9     vector<int> nums(arr, arr + size
    of(arr) / sizeof(int));             
 10                                     
 11                                     
 12       vector<int>::iterator pos;    
 13                                     
 14          pos = nums.insert(nums.begi
    n() + 1 , 9);                       
 15                                     
 16            nums.erase(pos);         
 17                                     
 18              *pos = 10;             
 19                                     
 20              for(auto& e: nums)     
 21                cout<<e<<" ";        
 22              cout<<endl;            
 23                                     
 24                                     
 25   return 0;
[wens@localhost test2]$ ./test 
1 10 3 4 5 6 

在linux 下,代码正常运行并不会报错,结果正确。这是因为在linux下对于迭代器的检查并不严格,所以只要不超过迭代器的访问区间,Linux下一般不会报错。但是有时候我们必须要注意所得结果的正确性。

linux下的erase 的底层源码

template<typename _Tp, typename _Alloc>
133	    typename vector<_Tp, _Alloc>::iterator
134	    vector<_Tp, _Alloc>::
135	    erase(iterator __position)
136	    {
137	      if (__position + 1 != end())
138		_GLIBCXX_MOVE3(__position + 1, end(), __position);
139	      --this->_M_impl._M_finish;
140	      _Alloc_traits::destroy(this->_M_impl, this->_M_impl._M_finish);
141	      return __position;
(gdb) 
142	    }
//我们可以看到传入和传出的是一个position,而且也没有太多的检查

而在Linux的底层中在返回时并没有对迭代器进行处理,在进入时也并没有对于原迭代器进行检查,只是对于迭代器的范围进行了检查。所以在不同的平台下,检查的方式不一样,严格程度不一样所以可能得出的结果也不同。

我们再来看这样一份代码
int main()
{


	int arr[] = { 1, 2, 3, 4, 5, 6 };
	vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));

	vector<int>::iterator it = nums.begin();
	while (it != nums.end())
	{
		if (*it % 2 == 0)
			nums.erase(it);
		++it;
	}

	for (int i = 0; i<nums.size(); i++)
		cout << nums[i] << " ";
	return 0;
}

毫无疑问在vs地下会报错,在删完2后,对it进行++时就会报错。

但在linux下则会出现多种情况:

  • 当我们所给删除序列为 1 2 3 4 5 6

程序会报出段错误

[wens@localhost test_erase]$ ./test 
Segmentation fault (core dumped)

通过gdb调试我们可以看到
在我们删除2,4,之后,在进行6的删除的时候因为,超出了迭代器的访问位置而导致的段错误。

  • 当我们所给删除序列为 1 2 3 4 5
[wens@bogon test_erase]$ ./test
1 3 5 [wens@bogon test_erase]$

程序运行正常,且结果正确。

  • 当我们所给删除序列为 1 2 8 4 6 5
[wens@bogon test_erase]$ ./test
1 8 6 5 [wens@bogon test_erase]$ 

可以看到,在删除的时候,并没有将偶数项全部删除完,是是因为在删除过程中,会将后面的向前覆盖,而返会的位置是当前的位置,下一次++时会将该位置跳过去,所以会出现这种错误。

在给出的三种错误种,我们可以看到有时侯结果运行正确,有时候错误,有时候程序挂掉。所以我们不能在有些时候因为结构正确就认为程序也是正确的。

所以erase 在配合循环使用时要注意
下面为正确的些法

int main()
{


	int arr[] = { 1, 2, 3, 4, 5, 6 };
	vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));

	vector<int>::iterator it = nums.begin();
	while (it != nums.end())
	{
		if (*it % 2 == 0)
		    it=nums.erase(it);  //使用一个迭代器来对返回的迭代器进行接受 
		else 
		    ++it; //因为返回的还是原位置,所以进行判断的时候防止跳过
	}

	for (int i = 0; i<nums.size(); i++)
		cout << nums[i] << " ";
	return 0;
}
总结:以上所说即为vector中的迭代器失效问题,一种是因为空间更换后造成的迭代器失效,一种是因为删除后造成的迭代器失效。而在vs和linux下,因为对于底层的代码和检查机制与程度不同,所以运行得出的结果也不一样。所以,在对于erase进行使用时,要注意迭代器的位置方面的问题,防止因此引发的一些问题。

猜你喜欢

转载自blog.csdn.net/M_jianjianjiao/article/details/84424981