28 Smart Pointers(智能指针)

所谓的smart pointers,是“看起来、用起来、感觉起来像内置指针,但提供更多的机能”的一种对象。

smart pointers拥有以下各种指针行为的控制权:

  • 构造和析构(Construction and Destruction)

  • 复制和赋值(copying and Assignment)

  • 解引(Dereferencing)

Smart pointers由templates产生出来。由于它们像内置指针一样。所以必须有“强烈的类型性”(strong typed),用户可利用templateca那是表明其所指对象的类型。大部分看起来如下:

template<class T>
class SmartPtr
{
public:
	SmartPtr(T* realPtr = 0);
	SmartPtr(const SmartPtr& rhs);
	~SmartPtr();
	SmartPtr& operator = (const SmartPtr& rhs);
	T* operator->() const;
	T& operator*() const;
	
private:
	T* pointee;
};

这里的copy constructor和assignment operator都是public,如果你的smart pointer不允许复制或赋值可以声明为private,两个解引用操作符被声明为const,因为解引所指之物并不改变指针本身。此外,每个smart-pointer-to-T都内含一个dumb pointer-to-T,后者才是真正的主角。

进入smart pointer的实现细节之前,应该先看看clients如何使用smart pointers,考虑一个分布式系统,其中某些对象位于本地,有些位于远程,本地对象的访问通常比远程对象的访问简单且快速,因为远程对象访问可能需要remote procedure calls(RPC)或其他某种与不同机器的沟通的方法。

对于应用程序而言,如果本地对象和远程对象的处理方式不同,是件麻烦的事情。让所有对象都好像位于本地,应该是比较简单的做法。程序库可以提供smart pointers,实现此幻象:

template<class T>
class DBPtr
{
public:
	DBPtr(T* realPtr = 0);
	DBPtr(DataBaseId id);
	...
};							
		
class Tuple
{
public:
	...
	void displayEditDialog();		//呈现一个图形对话框,允许用户输入tuple
	bool isValid() const;
};

template<class T>
class LogEntry
{
public:
	LogEntry(const T& objectToBeModified);
	~LogEntry();
};		

void editTuple(DBPtr<Tuple>& pt)
{
	LogEntry<Tuple> entry(*pt);
	
	do
	{
		pt->displayEditDialog();
	}while(pt->isValid == flase);
}
	

editTuple所编辑的数据可能位于远程,但是editTuple撰写者并不需要操心这样的事情:智能指针类会对系统隐瞒此事,程序员关心的,所有数据(上述的tuple)除了声明形式之外,都应该像内置指针一样被使用。

  • Smart Pointers的构造、赋值、析构

考虑C++的标准程序库提供的auto_ptr template。auto_ptr对象是个smart pointer,用来指向诞生于heap内的对象,知道该auto_ptr被销毁为止。当销毁发生时,auto_ptr的destructor会删除其所指物。

auto_ptr template可能实现如下:

template<class T>
class auto_ptr
{
public:
	auto_ptr(T* ptr):pointee(ptr){}
	~auto_ptr(){delete pointee;}
	...
private:
	T* pointee;
};

在“同一对象只可被一个auto_ptr拥有”的前提下,上述做法可以有效运作。但一旦auto_ptr被复制或被赋值,会发生什么?

auto_ptr<TreeNode> ptn1(new TreeNode);
auto_ptr<TreeNode> ptn2 = ptn1;							

auto_ptr<TreeNode> ptn3;
ptn3 = ptn2;	

如果我们只是复制其内的dump pointer(浅拷贝),会导致两个auto_ptrs指向同一个对象,这会造成麻烦,因为每一个auto_ptr都会在被销毁时,删除其所指之物,这表示对象会被删除两次,其结果未定义。

另一种做法是以new操作符为其所指对象产生一个新副本,这保证我们不会有多个auto_ptr指向同一个对象(深拷贝),但是这可能会是新对象的但是(以及后来的析构)形成无法让人接受的性能冲击。此外,我们不一定能够确知产生什么样类型的对象,以为一个auto_ptr<T>不一定指向一个类型为T的对象,可能指向一个T的派生类对象。Virtual constructors可以协助解决这个问题,但是在一个像auto_ptr这么目标广泛地class内使用新技术,不合适。

如果我们禁止auto_ptr被复制和赋值,问题就解决了。但是auto_ptr采用一个更富弹性的解法:当auto_ptr被复制和赋值,其“对象”拥有权“会转移:

template<class T>
class auto_ptr
{
public:
	auto_ptr(auto_ptr<T>& rhs);
	auto_ptr<T>& operator = (auto_ptr<T>& rhs);
	...
};							
							
template<class>
auto_ptr<T>::auto_ptr(auto_ptr<T>& rhs)
{
	pointee = rhs.pointee; //将*pointee的拥有权转移至*this
	rhs.pointee = 0;		//rhs不再拥有任何东西
}

template<class>
auto_ptr<T>& auto_ptr<T>::operator = (auto_ptr<T>& rhs)
{
	if(this = &rhs)
		return *this;
	delete pointee;
	pointee = rhs.pointee;
	rhs.pointee = 0;
	return *this;
}

注意:assignment操作符在掌握一个新对象的拥有权之前,必须删除它所拥有的对象。如果没有这么做,该对象绝不会被删除。记住,只有auto_ptr对象才“拥有”它所指之对象。

由于auto_ptr的copy constructor被调用时,对象拥有权转移了,所以以by value方式传递auto_ptrs往往是个非常糟糕的注意(因此STL容易绝对不适合放置auto_ptrs)。下面是原因:

void printTreeNode(ostream& os,auto_ptr<TreeNode> p)
{
	os << *p;
}

int main()
{
	auto<TreeNode> ptn(new TreeNode);
	...
	printTreeNode(cout,ptn); //以by value方式传递auto_ptr
}

当printTreeNode的参与p被初始化,ptn所指对象的拥有权被转移至p。当printTreeNode结束,destructor会删除它指之物,所以printTreeNode被调用后,任何人使用ptn已经会导致未定义的行为。

所以一般使用auto_ptr,pass-by-refrence-to-const才是适当的途径。

  • 实现Dereferencing Operators(解引操作符)

现在把注意力放在smart pointers的核心:operator*和operator->函数身上,前者返回所指对象:

template<class T>
T& SmartPtr<T>::operator*() const
{
	perform "smart pointer" processing;
	return *pointee;
}

上述返回的是reference形式。这涉及到两个原因:1、pointee可能指向的派生类对象,如果返回对象,就会导致切割问题。2、reference效率更加高。

operator->和operator*差不多,但是检验operator->之前,会议此函数的一个不寻常的意义,再次考虑editTuple,其中用到一个smart pointer-to-tuple:

void editTuple(DBPtr<Tuple>& pt)
{
	LogEntry<Tuple> entry(*pt);
	do
	{
		pt->displayEditDialog();
	}while(pt->isValid == false)
}

其中的语句pt->displayEditDialog()会被编译器解释为(pt.operator->())->displayEditDialog();这意味着不论operator->返回什么,在该回传值身上施行->操作符都必须是合法的。因此operator->只可能返回两种东西:一个dumb pointer,或者一个smart pointer,大部分你会想要返回一个普通的dump pointer,于是你这样实现operator->:

template<class T>
T* SmartPtr<T>::operator->() const
{
	perform "smart pointer" processing;
	return pointee;
}
  • 测试Smart Pointers是否为NULL

上面讨论的函数,可以产生、销毁、复制、赋值、解引用smart pointers。但是有一件事我们没办法做,那就是判断它是否为null:

SmartPtr<TreeNode> ptn;
...
if(ptn == 0) ... //错误
if(ptn) ...		 //错误
if(!ptn) ...	 //错误

为我们smart pointer classes加上一个isNull函数很容易。但是不能解决“smart pointers 无法入dumb pointers那般自然的测试是否为null”这个枷锁。另一种做法是,提供一个类型转换操作符,允许上述动作得以通过编译,这类转换的传统目标是void*:

template<class T>
class SmartPtr
{
public:
	...
	operator void*(); //如果dumb ptr是null,返回零
					  //否则返回非零值
};

SmartPtr<TreeNode> ptn;
...
if(ptn == 0) ... //可以
if(ptn) ...		 //可以
if(!ptn) ...	 //可以

这类似iostream classes提供的一种转换功能,同时解释了为什么可以这么写代码:

ifstream inputFile("datafile.data");
if(inputFile) //测试inputFile是否成功开启

但是这类型转换有一个缺点,就是允许你把不同的smart pointers拿来做比较:

SmartPtr<Apple> pa;
SmartPtr<Orange> po;
...
if(pa == po)  //竟然可以过关

我们没有为SmartPtr撰写operator ==函数,但是由于两个smart pointers都可以被隐式转换为void*指针,针对语言内置指针,存在比较函数,所以可以通过编译。这种行为使得隐式转换函数非常危险。

有种差强人意的做法,允许你提供“测试nullness”的合理语法。而且能够将“以外引起不同类型的smart pointers相互比较“的机会降到最低,那就是重载”!操作符“,并在其调用者(某smart pointer)是null的情况下,返回true:

template<class T>
class SmartPtr
{
public:
	...
	bool operator!() const; //只有当smart ptr是null才返回true
	...
};

这使得clients可以这么写:

SmartPtr<TreeNode> ptn;
...
if(!ptn)
{
	...		
}else{
	...
}

但是你不能这么写:

if(ptn == 0) ... //错误
if(ptn) ... //错误

唯一的风险是这样:

SmartPtr<Apple> pa;
SmartPtr<Orange> po;
...
if(!pa == !po)	//这样写通过了。。

C++标准库中,“隐式转换为void*”已被“隐式转换为bool”取代,而operator bool总是返回operator!的相反值。

  • 将Smart Pointers转换为Dumb Pointers

例如你有些老旧函数并非smart pointers:

class Tuple{...};
void normalize(Tuple* pt); //用的是dumb pointer

如果你调用normalize并非指定一个smart pointer-to-Tuple给它,将是错误的:

DBPtr<Tuple> pt;
...
normalize(pt); //错误

因为目前没有办法可以将DBPtr<Tuple>转换成一个Tuple*。如果这样可以:

normalize(&*pt); //难看,但是合法

如果为smart pointer-to-T template加上一个隐式类型转换函数,便可转换为dumb pointer-to-T,先前的调用便可以成功:

Template<class T>
class DBPtr
{
public:
	...
	operator T*() const;  //新增的转换操作符
	...
};

DBPtr<Tuple> pt;
...
normalize(pt);			//现在成功了

上述函数一旦加入,nullness测试问题也一并解决了:

if(ptn == 0) ... //可以
if(ptn) ...		 //可以
if(!ptn) ...	 //可以

如果这样设计,clients得意轻易地直接对dumb pointers操作,那就与设计smart pointer目的相违背:

void procesTuple(DBPtr<Tuple>& pt)
{
	Tuple* rawTuplePtr = pt;	//将DBPtr<Tuple>转换为Tuple*
	use rawTuplePtr to modify the tuple;
}

通常,smart pointer所提供的灵巧行为应该是你的一个基础设计思维,所以“允许clients直接使用dumb pointers”往往导致灾难。例如,如果DBPtr实现出引用计数,那么“允许clients直接使用dumb pointers”机会肯定会导致簿记的错误,造成引用计数用的结构体崩溃。

你可以提供一个隐式转换操作符,可以将smart pointer转换其内部的dumb pointer,你的smart pointer还是无法完全取代dumb pointer,因为“从smart pointer 转换为dumb pointer”是用户定制的行为,而编译器禁止一次施行一个以上这类转换,例如:

class TupleAccessors
{
public:
	TupleAccessors(const Tuple* pt); 
	...
};

上述可发生隐式类型转换,将Tuple*转换为TupleAccessors,如下函数将两个TupleAccessors对象的内容合并在一起:

TupleAccessors merge(const TupleAccessors* tal,const TupleAccessors* ta2);

由于Tuple*可以被隐式转换成TupleAccessors,所以两个dumb pointers Tuple*作为自变量调用merge没问题,然而以两个smart pointers DBPtr<Tuple>调用,就会失败。

那是因为从DBPtr<Tuple>转换成TupleAccessors需要两个用户自定义转换(第一个从DBPtr<Tuple>转换成Tuple*,第二个将Tuple*转换成TupleAccessors),这是C++禁止的。

Smart pointers classes如果提供隐式转换为dumb pointer,便打开了潘多拉的盒子:

DBPtr<Tuple> pt = new Tuple;
...
delete pt;	

所以,不要提供对dumb pointer的隐式转换操作符,除非不得已。

  • Smart Pointers和“和继承有关的”类型转换

假设我们有一个public inheritance继承体系,构建出消费性音乐产品:

class MusicProduct
{
public:
	MusicProduct(const string& title);
	virtual void play() const = 0;
	virtual void displayTile() const = 0;
	...
};

class Cassette: public MusicProduct
{
public:
	Cassette(const string& title);
	virtual void play() const;
	virtual void displayTile() const;
	...
};

class CD: public MusicProduct
{
public:
	CD(const string& title);
	virtual void play() const;
	virtual void displayTile() const;
	...
};

更进一步假设有个函数,个它一个MusicProduct对象,它就显示标题并播放:

void displayAndPlay(const MusicProduct* pmp,int numTimes)
{
	for(int i = 0; i <= numTimes; ++i)
	{
		pmp->displayTile();
		pmp->play();
	}
}

我们可以这样使用函数:

Cassette* funMusic = new Cassette("Alapalooza");
CD* nightMareMusic = new CD("Disco Hits of the 70s");
displayAndPlay(funMusic);
displayAndPlay(nightMareMusic);

但是如果我们将dumb pointers以其smart pointers替换,就会错误。

void displayAndPlay(const SmartPtr<MusicProduct>& pmp,int numTimes);
SmartPtr<Cassette> funMusic(new Cassette("Alapalooza"));
SmartPtr<CD> nightMareMusic(new CD("Disco Hits of the 70s"));
displayAndPlay(funMusic);			//错误
displayAndPlay(nightMareMusic);		//错误

之所以无法通过编译,是因为没办法将Smart<CD>或Smart<Cassette>转换为SmartPtr<MusicProduct>。对于编译器来说,是3个各不相干的class。因为这些类没有继承关系,

我们可以用个方法来解决:令每一个smart pointer class有一个隐式转换的操作符,用来转换至smart pointer class。例如,在上述音乐产品中,我们可以将Cassette和CD的smart pointer classes加上一个SmartPtr<MusicProduct>操作符:

class SmartPtr<Cassette>
{
public:
	operator SmartPtr<MusicProduct>()			//新增的类型转换符
	{
		return SmartPtr<MusicProduct>(pointee);
	}
private:
	Cassette* pointee;
};


class SmartPtr<CD>
{
public:
	operator SmartPtr<MusicProduct>()			//新增的类型转换符
	{
		return SmartPtr<MusicProduct>(pointee);
	}
private:
	CD* pointee;
};

此做法有两个缺点:第一,你必须一一为每一个“SmartPtr class实例”加上上述式子,由于编译器禁止一次执行一个以上的”用户定制的类型转换函数“,所以无法将一个smart pointer-to-T转换为一个smart pointer-to-indirect-base-class-of-T。

有一个办法可以让编译器完成这些隐式类型转换,这个就是nonvirtual member function声明为template,你可以这样来产生smart pointer的转换函数:

template<class T>
class SmartPtr
{
public:
	SmartPtr(T* realPtr);
	T* operator->() const;
	T& operator*() const;
	
	template<class newType>					//template function用于
	operator SmartPtr<newType>()			//隐式类型操作符
	{
		return SmartPtr<newType>(pointee);
	}
};

我们回到CDs,Cassettes和和MusicProduct继承体系,稍早我们看到代码无法通过编译,因为没有任何途径可以让编译器将“指向CDs或Cassettes”的smart pointers转换为“指向MusicProduct”的smart pointers,现在使用修改版本的smart pointer class,令其member function template作为隐式类型转换符,上述便成功。将SmartPtr<Cassette>转换成SmartPtr<MusicProduct>,编译器产生这样的代码:

SmartPtr<Cassette>::operator SmartPtr<MusicProduct>
{
	return SmartPtr<MusicProduct>(pointee);
}

这里调用了SmartPtr<MusicProduct> constructor,并以pointee作为自变量。SmartPtr<MusicProduct> constructor期望一个MusicProduct*指针,但现在我们面对的是dumb pointer类型间的转换,所以很明显Cassette*可以被交给一个期望获得MusicProduct*的函数。

此法不仅只适合于集成体系的向上转换,对于指针类型之间的任何合法的隐式转换都能成功。如果你手上有个dumb pointer类型的T1*,另一个dumb pointer类型的T2*,只要你能够将T1*隐式转换为T2*,你便能够将smart pointer-to-T1隐式转换为smart pointer-to-T2。

假设我们扩充MusicProduct继承体系,加上一个新的CaSingle class,修改集成体系如下:

template<class T>
class SmartPtr{...}; //如上,其中包含指针对转换操作符而设计的
					 //的member function template
void displayAndPlay(const SmartPtr<MusicProduct> pmp,int howMany);
void displayAndPlay(const SmartPtr<Cassette> pmp,int howMany);

SmartPtr<CasSingle> dumbMusic(new CasSingle("AchyBreakyHeart"));
displayAndPlay(dumbMusic,1);   //错误

 上述错误的原因,displayAndPlay调用动作是一种模棱两可的行为,因为从SmartPtr<CasSingle>转换到Smart<Cassette>并不比转换至SmartPtr<MusicProduct>更好。

利用member templates来转换smart pointer有两个缺点:第一,目前支持member templates的编译器不多(现在应该并不存在这个问题了);第二,期间涵盖的技术并不简单,你不洗熟悉(1)函数调用的自变量匹配规则、(2)隐式类型转换函数、(3)template functions的暗自实例化、(4)member function templates技术。

我们真正想要的将“smart pointers classes”的行为在“与继承相关类型转换”能够和dumb pointers一样。答案很简单:不能够,smart pointers虽然smart,却不是pointer,我们所能做的最好情况就是使用member templates来产生转换函数,然后在其中出现模棱两可的时候使用转型动作。这并不完美,但是够好。

  • Smart Pointers 与 const

dumb pointers可以指定本身或者所指之物为const,但是smart pointers只能有一个地方放置const:只能施行于指针本身,不能用于所指的对象。

CD goodCD("Flood");

const CD* p;					 //所指之物为const
CD* const p = &goodCD;			 //指针为const
const CD* const p = &goodCD;	//两者都是const
const SmartPtr<CD> p = &goodCD;	//指针本身为const

矫正的我们可以方法,用smart pointer指向一个cons CD来:

SmartPtr<const CD>  p = &goodCD;	//所指之物为const

但是这里的办法有缺陷,如果使用dumb pointers,我们可以将non-const指针作为const指针的初值:

CD* pCD = new CD("Famous Movie Themes");
const CD* pConstCD = pCD;	//可以

但是放在smart pointers做相同的动作却不行。因为SmartPtr<CD>和SmartPtr<const CD>是完全不同的类型,如果你的编译器支持member templates你可以先前的所示技术,自动产生你所需要的隐式类型转换操作符。

类型转换如果涉及const,便是一条单行道:从non-const 转换成const是安全的,反之却不行。此外能够对const做的事情,也都可以对non-const指针进行。这些规则和public inheritance的规则很类似。实现smart pointers时我们可以利用这种性质,令一个smart pointer-to-T class公开继承自smart pointer-to-const-T class:

template<class T>
class SmartPtrToConst
{
public:
		... //一般都会有smart pointer member
		functions;
protected:
	union{
		const T* constPointee;	 //给SmartPtrToConst使用
		T* pointee;				 //给SmartPtr使用
	};
};

template<class T>
class SmartPtr:public SmartPtrToConst<T>
{
	...		//没有data members
}

 运用这样的设计,我们可以获得希望的行为:

SmartPtr<CD> pCD = new CD("Famous Movie Themes");
SmartPtrToConst<CD> pConstCD = pCD; //没问题

猜你喜欢

转载自blog.csdn.net/weixin_28712713/article/details/81973976