caffe数据同步

cpu_data()和mutable_cpu_data() 区别: 
mutable_cpu_data()多了一句head_ = HEAD_AT_CPU;是因为它返回的cpu_ptr_是可以被修改的,不像cpu_data()中返回(const void*)cpu_ptr_不可修改,这样,在下一次cpu或者gpu数据同步的时候,会知道这里的数据可能被修改过。
const void* SyncedMemory::cpu_data() {
  check_device();
  to_cpu();
  return (const void*)cpu_ptr_;
}

void* SyncedMemory::mutable_cpu_data() {
  check_device();
  to_cpu();
  head_ = HEAD_AT_CPU;
  return cpu_ptr_;
}
SyncedHead hand_ 数据状态,有四种状态: UNINITIALIZED(未初始化), HEAD_AT_CPU(最新数据在内存中), HEAD_AT_GPU(最新数据在内存中), SYNCED(内存显存数据已同步)
to_cpu()用来将显存数据同步到内存,to_gpu()用来将内存数据同步到显存
内存显存数据不同步时,并不会立马调用to_cpu()或者to_gpu()使数据同步,只改变数据状态 hand_。只有在获取数据的时候才会先去同步数据,再返回数据。
状态转换图如下:最先在这里看到这个图片https://blog.csdn.net/u010414386/article/details/52346192(作者写的很好啊,可惜后来没有更了)

// Assuming that data are on the CPU initially, and we have a blob.
//首先假设初始化时数据在cpu中(内存),此时状态为HEAD_AT_CPU
const Dtype* foo;
Dtype* bar;
foo = blob.gpu_data(); // data copied cpu->gpu.
//这时调用to_gpu()会将数据复制至gpu,因为之前状态是状态HEAD_AT_CPU,此时变为SYNCED
foo = blob.cpu_data(); // no data copied since both have up-to-date contents.
//这时调用to_cpu()因为之前状态是SYNCED,所以不会复制数据,状态不变
bar = blob.mutable_gpu_data(); // no data copied.
//这时调用to_gpu()因为之前状态是SYNCED,所以不会复制数据,但状态变为HEAD_AT_GPU
// ... some operations ...
bar = blob.mutable_gpu_data(); // no data copied when we are still on GPU.
//这时调用to_gpu()因为之前状态是HEAD_AT_GPU,所以不会复制数据,但状态仍为HEAD_AT_GPU
foo = blob.cpu_data(); // data copied gpu->cpu, since the gpu side has modified the data
//这时调用to_cpu()因为之前状态是HEAD_AT_GPU,所以会复制数据,状态改为SYNCED
foo = blob.gpu_data(); // no data copied since both have up-to-date contents
//这就跟前面类似了
bar = blob.mutable_cpu_data(); // still no data copied.
bar = blob.mutable_gpu_data(); // data copied cpu->gpu.
bar = blob.mutable_cpu_data(); // data copied gpu->cpu.


猜你喜欢

转载自blog.csdn.net/XLM11/article/details/80818882