C++ vector中的迭代器失效问题

vector中的迭代器失效问题

在使用vector的成员函数时，有两个成员函数内部会出!](https://img-blog.csdnimg.cn/20181124093029161.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L01famlhbmppYW5qaWFv,size_16,color_FFFFFF,t_70)现迭代器失效的问题。分别是insert和erase而这两个成员函数迭代器失效的原因并不相同。

insert

在我们使用insert的接口时，不会遇到迭代器的失效问题的影响，因为在insert中已经处理过l。而此处所说的就是在insert实现过程中出现的迭代器失效问题。

insert(iterator pos,value_type value);
vector类中的insert函数，在所传迭代器位置的数前面插入一个数，返回值是所插入位置的迭代器。

现在我们对于该函数进行模拟实现，插入时有两种情况

插入后长度不会超出当前容量
插入后超出当前容量

对于第一种，在容量足够的情况下插入，进行正常的元素挪动和插入就行了。

对于第二种，当插入后的长度超出了容量的范围。此时我们就需要先进行扩容。

如何扩容？

  扩容时因为此时容量已不够用，我们需要重新开辟一块大于当前容量的空间。至于开辟多大的容量，这个我们可以自定义。只要能容纳所插入的值。在vs下每次扩容的大小是之前容量的1.5倍，而在linux g++下每次开辟的容量是之前容量的2倍。开辟新空间后，将原空间的内容拷贝至新空间即可，再将对象中的指针指向新空间，再释放原空间即可即可。此时应该注意，需要进行深拷贝，如果当vector中的元素为string vector时，如果进行是浅拷贝，在析构的时候会发生错误。

完成扩容后，此时却出现了一个问题，我们所传的迭代器位置是指向原空间的，而原空间的位置在我们进行扩容时已经释放了，那意味着原来的迭代器位置已经是一个野指针，此时原先的迭代器位置已将失效。

如何解决?

我们只需在扩容时，将原迭代器位置的偏移量记录下来，在新开辟的空间中找到原有的位置即可。

insert 的模拟实现

Iterator Insert(Iterator pos,T value)
    {
      assert(pos<=_finish);
      
      size_t offset=pos-_start;//增容更换空间后pos处的迭代器会失效，记录其偏移量

      if(_finish == _endofstorage)
      {
        size_t newCapacity = Capacity()==0?2:2*Capacity(); //防止第一次为空
        Reserve(newCapacity);
      }

      pos = begin() + offset;
      Iterator end =this->end();
      while(end != pos)
      {
        *end = *(end-1);
         end--;
      }

      *pos = value;
      _finish++;
      return pos;

    }

erase

在vector中erase 也会导致迭代器失效，不同于insert是在内部实现时会遇到的空间的更换造成迭代器失效，不会对于我们使用时造成影响，但erase会在使用时对我们造成一些影响。

iterator erase(iterator pos);
返回所删除的数的下一个数的迭代器

int arr[] = { 1, 2, 3, 4, 5, 6 };
	vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));


	vector<int>::iterator pos;
	
	 pos = nums.insert(nums.begin() + 1 , 9);

	 nums.erase(pos);
	 
	 *pos = 10;  //此处报错

当我们删除一个数后，再通过迭代器位置去访问时，就会报错
在这里插入图片描述

为甚麽会报错
当我们删除后将一个数删除后者个位置的迭代器也就被删除了，而我们如果再对删除的迭代器位置进行修该访问就会报错

	 pos=nums.erase(pos);
	//只要我们重新接收erase返回的迭代其位置，就可以了
	 *pos = 10;
	 
	 //此时不会报错

通过调试，我们会发现，pos的传入地址和传出的地址完全一样，并没有发生变化
在这里插入图片描述

为甚麽迭代器会失效
通过vs底层实现的，我们可以看到他返回的迭代器不仅仅是传入的位置，还进行了处理，可见vs在对迭代器进行了处理，以便于检查，只要迭代器被删除过后，就不能再使用，只能接受它返回的正确的迭代器。

从以下的底层代码可以看到vs对迭代器进行的检查，在每次使用迭代器之前都对迭代器进行检查。
在这里插入图片描述
将同样的代码放在Linux下进行运行

int main()                          
  7 {                                   
  8   int arr[] = { 1, 2, 3, 4, 5, 6  };
  9     vector<int> nums(arr, arr + size
    of(arr) / sizeof(int));             
 10                                     
 11                                     
 12       vector<int>::iterator pos;    
 13                                     
 14          pos = nums.insert(nums.begi
    n() + 1 , 9);                       
 15                                     
 16            nums.erase(pos);         
 17                                     
 18              *pos = 10;             
 19                                     
 20              for(auto& e: nums)     
 21                cout<<e<<" ";        
 22              cout<<endl;            
 23                                     
 24                                     
 25   return 0;

[wens@localhost test2]$ ./test 
1 10 3 4 5 6

在linux 下，代码正常运行并不会报错，结果正确。这是因为在linux下对于迭代器的检查并不严格，所以只要不超过迭代器的访问区间，Linux下一般不会报错。但是有时候我们必须要注意所得结果的正确性。

linux下的erase 的底层源码

template<typename _Tp, typename _Alloc>
133	    typename vector<_Tp, _Alloc>::iterator
134	    vector<_Tp, _Alloc>::
135	    erase(iterator __position)
136	    {
137	      if (__position + 1 != end())
138		_GLIBCXX_MOVE3(__position + 1, end(), __position);
139	      --this->_M_impl._M_finish;
140	      _Alloc_traits::destroy(this->_M_impl, this->_M_impl._M_finish);
141	      return __position;
(gdb) 
142	    }
//我们可以看到传入和传出的是一个position,而且也没有太多的检查

而在Linux的底层中在返回时并没有对迭代器进行处理，在进入时也并没有对于原迭代器进行检查，只是对于迭代器的范围进行了检查。所以在不同的平台下，检查的方式不一样，严格程度不一样所以可能得出的结果也不同。

我们再来看这样一份代码

int main()
{


	int arr[] = { 1, 2, 3, 4, 5, 6 };
	vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));

	vector<int>::iterator it = nums.begin();
	while (it != nums.end())
	{
		if (*it % 2 == 0)
			nums.erase(it);
		++it;
	}

	for (int i = 0; i<nums.size(); i++)
		cout << nums[i] << " ";
	return 0;
}

毫无疑问在vs地下会报错，在删完2后，对it进行++时就会报错。

但在linux下则会出现多种情况：

当我们所给删除序列为 1 2 3 4 5 6

程序会报出段错误

[wens@localhost test_erase]$ ./test 
Segmentation fault (core dumped)

通过gdb调试我们可以看到
在我们删除2，4，之后，在进行6的删除的时候因为，超出了迭代器的访问位置而导致的段错误。

当我们所给删除序列为 1 2 3 4 5

[wens@bogon test_erase]$ ./test
1 3 5 [wens@bogon test_erase]$

程序运行正常，且结果正确。

当我们所给删除序列为 1 2 8 4 6 5

[wens@bogon test_erase]$ ./test
1 8 6 5 [wens@bogon test_erase]$

可以看到，在删除的时候，并没有将偶数项全部删除完，是是因为在删除过程中，会将后面的向前覆盖，而返会的位置是当前的位置，下一次++时会将该位置跳过去，所以会出现这种错误。

在给出的三种错误种，我们可以看到有时侯结果运行正确，有时候错误，有时候程序挂掉。所以我们不能在有些时候因为结构正确就认为程序也是正确的。

所以erase 在配合循环使用时要注意
下面为正确的些法

int main()
{


	int arr[] = { 1, 2, 3, 4, 5, 6 };
	vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));

	vector<int>::iterator it = nums.begin();
	while (it != nums.end())
	{
		if (*it % 2 == 0)
		    it=nums.erase(it);  //使用一个迭代器来对返回的迭代器进行接受 
		else 
		    ++it; //因为返回的还是原位置，所以进行判断的时候防止跳过
	}

	for (int i = 0; i<nums.size(); i++)
		cout << nums[i] << " ";
	return 0;
}

总结：以上所说即为vector中的迭代器失效问题，一种是因为空间更换后造成的迭代器失效，一种是因为删除后造成的迭代器失效。而在vs和linux下，因为对于底层的代码和检查机制与程度不同，所以运行得出的结果也不一样。所以，在对于erase进行使用时，要注意迭代器的位置方面的问题，防止因此引发的一些问题。