vector中迭代器失效的问题及解决办法

vector的数据安排以及操作方式，与array非常相似。两者的唯一差别在于空间的运用的灵活性。array 是静态空间，一旦配置了就不能改变；要换个大(或小) 一点的房子，可以，一切琐细得由客户端自已来:首先配置一块新空间，然后将元素从旧址一一搬往新址，再把原来的空间释还给系统。vector是动态空间，随着元素的加入，它的内部机制会自行扩充空间以容纳新元素。因此，vector 的运用对于内存的合理利用与运用的灵活性有很大的帮助，我们再也不必因为害怕空间不足而一开始就要求一个大块头array了，我们可以安心使用vector,吃多少用多少。

vector定义

template<class T>
class vector

{

public:
       typedef T* iterator;
       typedef const T* const_iterator;

private:

        iterator _start ; //表示目前使用空间的头
        iterator _finish; //表示目前使用空间的尾
        iterator _end_of_storage; //表示可用空间的尾

}

vector常用接口

push_back( ) 成员函数在vector的末尾插入值，如果有必要会扩展vector的大小。
pop_back( ) 成员函数在vector的末尾删除值。
size( ) 函数显示vector的大小。
begin( ) 函数返回一个指向vector开头的迭代器。
end( ) 函数返回一个指向vector末尾的迭代器。
empty() 判断vector是否为空。
find() 查找。（注意这个是算法模块实现，不是vector的成员接口）
insert() 在position之前插入val
erase() 删除position位置的数据
swap() 交换两个vector的数据空间
operator[] 像数组一样使用下标访问

size 是当前 vector 容器真实占用的大小，也就是容器当前拥有多少个容器。

capacity 是指在发生 realloc 前能允许的最大元素数，即预分配的内存空间。

当然，这两个属性分别对应两个方法：resize() 和 reserve()。

使用 resize() 容器内的对象内存空间是真正存在的。

使用 reserve() 仅仅只是修改了 capacity 的值，容器内的对象并没有真实的内存空间(空间是"野"的)。

capacity的代码在vs和g++下分别运行会发现，vs下capacity是按1.5倍增长的，g++是按2倍增长的。具体增长多少是根据具体的需求定义的。vs是PJ版本STL，g++是SGI版本STL。 reserve只负责开辟空间，如果确定知道需要用多少空间，reserve可以缓解vector增容的代价缺陷问题。 resize在开空间的同时还会进行初始化，影响size。

此时切记使用 [] 操作符访问容器内的对象，很可能出现数组越界的问题。

vector 迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T* 。迭代器失效就是迭代器底层对应指针所指向的空间倍销毁了,导致使用了一块已经被释放了的空间。

迭代器失效分为两大类：

1.扩容导致野指针

我们发现push_back尾插4个后调用insert会出现随机值。问题就是扩容导致pos迭代器失效，原因在于pos没有更新，导致非法访问野指针。

当尾插4个数字后，再头插一个数字，发生扩容，根据reserve扩容机制，扩容地址改变，迭代器就会失效，insert中发生扩容，迭代器指向的空间被释放，迭代器本质上就是一个野指针。_ start和_ finish都会更新，但是这个插入的位置pos没有更新，此时pos依旧执行旧空间，再者reserve后会释放旧空间，此时的pos就是野指针，导致*pos = x就是对非法访问野指针。因为pos迭代器没有更新，所以后续挪动数据并没有实现，而插入数据是对释放的空间进行操作，同样没有意义。这也就是说不论你在哪个位置插入，都没有效果。

解决办法：

扩容后更新pos，解决pos失效的问题。

iterator insert(iterator pos, const T& val)
		{
			assert(pos >= _start);
			assert(pos <= _finish);
			//扩容地址改变，迭代器会失效
			//insert中发生扩容，it指向的空间被释放，it本质上就是一个野指针
			if (_finish == _end_of_storage)
			{
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 4 : capacity() * 2);

				//扩容后更新pos，解决pos失效的问题
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (pos >= end)
			{
				*(end + 1) = *end;
				--end;
			}
			*pos = val;
			++_finish;
			return pos;
		}

2.迭代器指向位置意义改变

比如要求删除vector中所有的偶数

erase删除pos位置元素后，pos位置之后的元素会往前移动，没有导致底层空间的改变，理论上讲迭代器不会失效，但是如果pos位置刚好是最后一个元素，删完之后pos刚好是end的位置，而end的位置是没有有效元素的，那么pos就失效了。因此删除vector中任意位置元素时，均认为该位置上迭代器失效。我们应该在使用的时候注意，让迭代器指向有效的位置。

迭代器失效后，代码并不一定会崩溃，但是运行结果肯定不对，如果it不在begin和end范围内，肯定会崩溃。

vector中深浅拷贝问题

拷贝构造函数

memcpy是浅拷贝，当T是内置类型的时候这个拷贝函数没什么问题，当时当T是自定义类型的时候就会出现问题，比如T是string类型。

如果此时我们使用的是memcpy函数进行拷贝构造的话，那么拷贝构造出来的vector中每个string的成员变量的值，将与被拷贝的vector中每个string的成员变量的值相同，即两个vector当中的每个对应的string成员都指向同一个字符串空间。

解决办法：

_start[i] = _v[i] 本质是调用string类的赋值运算符重载函数进行深拷贝。

扩容也需要注意浅拷贝的问题。

扩容时调用的memcpy是浅拷贝，就会导致先前存储的数据被memcpy后再delete就全删掉变成随机值了。vector调用析构函数析构掉原来的对象，每个对象又调用自身的析构函数，把指向的空间释放掉，然后就会出现随机值。

我们析构旧空间的时候，析构的是对象数组，每个数组调用自身的析构函数，会析构数组的空间。我们用memcpy浅拷贝时，拷贝的临时对象和原来的对象指向同一块空间，所以旧空间被销毁后，我们扩容的新空间中的对象变成野指针，访问的数据都是随机值。我们用for循环调用vector的赋值运算符重载可以将旧空间的数据拷贝到新空间，这样析构旧空间就不会影响新空间。