ocr中遇到的相关图像处理概念

  1. 仿射 affine 
    1. 平面内的内移,旋转,错切,缩放,变换后仍在一个平面
    2. 三个点
    3. 仿射变换:向量经过线性变换+平移
      1. \begin{bmatrix} x_1\\ y_1 \end{bmatrix}=\begin{bmatrix} \begin{matrix} a &b \end{matrix}\\ \begin{matrix} c &d \end{matrix}\\ \end{bmatrix} \begin{bmatrix} x_0\\ y_0\end{bmatrix} + \begin{bmatrix} b_x\\ b_y \end{bmatrix}
    4. 6个未知数,6个方程,1个点列2个方程,需要3个点坐标
  2. 投影 projective 
    1. 物体与投影面上的像之间的变换,变换前后不在一个平面
    2. 四个点
    3. \begin{bmatrix} x_1\\ y_1\\ 1 \end{bmatrix}=\begin{bmatrix} \begin{matrix} a &b &c \end{matrix}\\ \begin{matrix} d &e &f \end{matrix}\\ \begin{matrix} g &h &i \end{matrix} \end{bmatrix} \begin{bmatrix} x_0\\ y_0\\ z_0 \end{bmatrix} + \begin{bmatrix} b_x\\ b_y\\ b_z \end{bmatrix}
    4. 12个未知数,12个方程,1个点列3个方程,需要4个点坐标
  3. IOU
  4. 分类中的交叉熵
    1. \\ \sum -y_ilog(p_i) \\ log(1)=0 \\ log(0)=-infinite
  5. 字符串编辑距离(levenshtein距离)
    1. 计算两个字符串间的差异程度的字符串度量,可以认为是从字符串a修改到字符串b需要的单个字符编辑次数最小值
    2. eg:kitten --> sitting levenshtein=3
      1. k->s sitten
      2. e->i sittin
      3. _->g sitting
    3. 实现方法:动态规划
    4. https://blog.csdn.net/ls386239766/article/details/38961745
发布了45 篇原创文章 · 获赞 1 · 访问量 8579

猜你喜欢

转载自blog.csdn.net/qq_32110859/article/details/88028919