Eigen的SSE兼容,内存分配,和std容器的兼容理解

SSE支持128bit的多指令并行,但是有个要求是处理的对象必须要在内存地址以16byte整数倍的地方开始。不过这些细节Eigen在做并行化的时候会自己处理。

但是,如果把一些Eigen的结构放到std的容器里面,比如vector,map。这些容器会把一个一个的Eigen结构在内存里面连续排放。

可以想象,如果这些Eigen的结构本身不是16byte大小,一连续排放后,自然有很多对象就不是在16byte整数倍的地方开始了。

Eigen提供了两种方法来解决:

  • 使用特别的内存分配对象

    • std::map<int, Eigen::Vector4f, std::less<int>, Eigen::aligned_allocator<std::pair<const int, Eigen::Vector4f> > >

    • std::vector<Eigen::Vector4f,Eigen::aligned_allocator<Eigen::Vector4f> >

      • 针对vector的时候,还需要额外添加头文件#include<Eigen/StdVector>

  • 在对象定义的时候,使用特殊的宏

    • EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION(Matrix2d)

      • 注意必须在所有Eigen对象出现前使用这个宏

有这个问题的Eigen结构包括:

Eigen::Vector2d
Eigen::Vector4d
Eigen::Vector4f
Eigen::Matrix2d
Eigen::Matrix2f
Eigen::Matrix4d
Eigen::Matrix4f
Eigen::Affine3d
Eigen::Affine3f
Eigen::Quaterniond
Eigen::Quaternionf

另外如果上面提到的这些结构作为一个对象的成员,比如:

class Foo
{
  ...
  Eigen::Vector2d v;
  ...
};
...
Foo *foo = new Foo;

这个时候需要在类定义里面使用另外一个宏:

class Foo
{
  ...
  Eigen::Vector2d v;
  ...
public:
  EIGEN_MAKE_ALIGNED_OPERATOR_NEW
};
...
Foo *foo = new Foo;

原因分析:对象内部的内存分配是相对与对象的地址的。如果对象的地址不是16byte对齐的,里面的成员并不会知道这个信息,所以没有办法分配16byte对其的地址。解决办法就是强制让分配对象的时候,就给一个16byte对齐的地址。

EIGEN_MAKE_ALIGNED_OPERATOR_NEW会重载new函数。

猜你喜欢

转载自blog.csdn.net/ziliwangmoe/article/details/87563498
今日推荐