摘要: 本贴从机器学习的角度来理解反射系数反演. 里面的数据都是瞎编的, 原理之类也是一知半解, 等地球科学专业人士来修改.
1. 问题的提出
反演是从观测数据推断实际数据的过程.
1.1 地层数据
图 1 展示了一个假设的地层信息.
1.2 观测数据
为了获得这个地层信息, 我们希望给这片区域打一个 CT. 于是在地面的一条直线上铺设了均匀 1000 个检波器, 在中间位置 Duang 地放了一炮. 以放炮时间为 0, 每个检波器在 1 s 内采集了 500 个数据, 每 2 ms 一个.
图 2 展示了一个观测数据. 它是使用正演模型, 从图 1 获得的. 也就是说, 放炮由计算机模拟.
1.3 问题描述
反射 是指波在不同界质分界面上改变传播方向, 又返回原来介质中的现象.
反射 系数是指反射波的振幅同入射波振幅之比.
从图 2 直接获得图 1 太困难, 我们将其分为多个步骤.
反射系数反演 是指获得 每个位置 (也等价于每个时间点) 的反射系数. 其中, 如果反射系数不为 0, 就表示在分界面, 否则不在.
问题定义
输入: 地震波矩阵 V ∈ [ − 1 , 1 ] 500 × 1000 \mathbf{V} \in [-1, 1]^{500 \times 1000} V∈[−1,1]500×1000, 各元素已经归一化.
输出: 反射系数矩阵 R ∈ [ − 1 , 1 ] 500 × 1000 \mathbf{R} \in [-1, 1]^{500 \times 1000} R∈[−1,1]500×1000,
2. 数据的特点
- 稀疏性.
地层数是很少, 通常在 20 层之内; 地层有一定间隔. - 连续性.
相邻道同一时间的反射系数是连续的.
3. 可能的方法
这里只讨论神经网络的方法. 为方便起见, 训练数据由模型生成, 这样我们就有标签.
3.1 针对单道的 CNN
单道数据比较简单.
3.1.1 数据生成
数据生成的注意事项:
- 考虑稀疏性, 控制层数和层的间隔. 图 3 不满足层间隔假设.
- 生成的噪音不应太大. 图 4 的噪音还可以. 如果噪音强得人都识别不出来了, 意义也不大.
3.1.2 模型训练
使用 CNN 模型时, 应充分利用稀疏性. 具体怎么弄我也不知道, 也不是我的事儿.
3.2 针对单炮的 CNN
3.1.1 数据生成
数据生成的注意事项:
- 考虑连续性.
未完待续