关于卷积各种等变性的数学描述

本文是论文General E(2)-Equivariant Steerable CNNs的知识补充,由于其中涉及了很多数学相关的知识,所以特此说明。

齐次空间与齐次坐标 Homogeneous Sapce and Homogeneous Coordination

∙ \bullet 齐次坐标 Homogeneous Coordination
\qquad

齐次坐标本质上是4D向量 ( x , y , z , w ) (x, y, z, w) (x,y,z,w), 在 w = 1 w=1 w=1处的三维空间定义为标准的3D空间,任何齐次坐标转化到标准3D空间坐标点为 ( x w , y w , z w ) (\frac{x}{w},\frac{y}{w},\frac{z}{w}) (wx,wy,wz),如果 w w w为0时 ( x , y , z , 0 ) (x,y,z,0) (x,y,z,0)表示的是标准3D空间的方向 ( x , y , z ) (x,y,z) (x,y,z)

\qquad

4D向量有4个分量,前3个是标准的 x , y 和 z x,y和z xyz分量,第4个是 w w w,有时称作齐次坐标

\qquad

想象在3D中 w = 1 w=1 w=1处的标准2D平面,实际的2D点 ( x , y ) (x, y) (x,y)用齐次坐标表示为 ( x , y , 1 ) (x, y, 1) (x,y,1),对于那些不在 w = 1 w=1 w=1平面上的点,则将它们投影到 w = 1 w=1 w=1平面上。所以齐次坐标$(x, y, w) 映射的实际 2 D 点为 映射的实际2D点为 映射的实际2D点为(x/w, y/w)$。

齐次坐标

从图片中可以看到 x 和 y x和y xy除以 w w w后,就是在平面上的投影坐标

给定一个2D点 ( x , y ) (x, y) (x,y),齐次空间中有无数多个点与之对应。所有点的形式都为 ( k x , k y , k ) (kx, ky, k) (kx,ky,k) k ≠ 0 k≠0 k=0

这些点构成一条穿过齐次原点的直线。

w = 0 w=0 w=0时,除法未定义,因此不存在实际的2D点。

然而,可以将2D齐次点 ( x , y , 0 ) (x, y, 0) (x,y,0)解释为"位于无穷远的点",它描述了一个方向而不是一个位置。

标准3D向量对应的4D齐次坐标中的向量表示为:

[ m 11 m 12 m 13 m 21 m 22 m 23 m 31 m 32 m 33 ] ⇒ [ m 11 m 12 m 13 0 m 21 m 22 m 23 0 m 31 m 32 m 33 0 0 0 0 1 ] \begin{bmatrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \\ \end{bmatrix} \Rightarrow \begin{bmatrix} m_{11} & m_{12} & m_{13} & 0 \\ m_{21} & m_{22} & m_{23} & 0\\ m_{31} & m_{32} & m_{33} & 0\\ 0 & 0 & 0 & 1 \\ \end{bmatrix} m11m21m31m12m22m32m13m23m33 m11m21m310m12m22m320m13m23m3300001

任意一个形如 [ x , y , z , 1 ] [x, y, z, 1] [x,y,z,1]的向量乘以上面形式的矩阵,其结果和标准的3x3情况相同,只是结果是用 w = 1 w=1 w=1的4D向量表示的:
[ x y z ] [ m 11 m 12 m 13 m 21 m 22 m 23 m 31 m 32 m 33 ] = [ x m 11 + y m 21 + z m 31 x m 12 + y m 22 + z m 32 x m 13 + y m 23 + z m 33 ] \begin{bmatrix} x & y & z \end{bmatrix} \begin{bmatrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \\ \end{bmatrix} = \begin{bmatrix} xm_{11} + ym_{21} + zm_{31} & xm_{12}+ym_{22}+zm_{32} & xm_{13} + ym_{23} + zm_{33} \end{bmatrix} [xyz] m11m21m31m12m22m32m13m23m33 =[xm11+ym21+zm31xm12+ym22+zm32xm13+ym23+zm33]

[ x y z 1 ] [ m 11 m 12 m 13 0 m 21 m 22 m 23 0 m 31 m 32 m 33 0 0 0 0 1 ] = [ x m 11 + y m 21 + z m 31 x m 12 + y m 22 + z m 32 x m 13 + y m 23 + z m 33 1 ] \begin{bmatrix} x & y & z &1 \end{bmatrix} \begin{bmatrix} m_{11} & m_{12} & m_{13} & 0\\ m_{21} & m_{22} & m_{23} & 0\\ m_{31} & m_{32} & m_{33} & 0\\ 0 & 0 & 0 & 1 \\ \end{bmatrix} = \begin{bmatrix} xm_{11} + ym_{21} + zm_{31} & xm_{12}+ym_ {22}+zm_{32} & xm_{13} + ym_{23} + zm_{33} & 1 \end{bmatrix} [xyz1] m11m21m310m12m22m320m13m23m3300001 =[xm11+ym21+zm31xm12+ym22+zm32xm13+ym23+zm331]

这里是有趣的部分,在4D中,仍然可以用矩阵乘法表达平移,这在3D中是不可能的
[ x y z 1 ] [ 1 0 0 0 0 1 0 0 0 0 1 0 Δ x Δ y Δ z 1 ] = [ x + Δ x y + Δ y z + Δ z 1 ] \begin{bmatrix} x & y & z & 1 \end{bmatrix} \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ \Delta x & \Delta y & \Delta z & 1 \\ \end{bmatrix} = \begin{bmatrix} x+\Delta x & y+\Delta y & z+\Delta z & 1 \end{bmatrix} [xyz1] 100Δx010Δy001Δz0001 =[x+Δxy+Δyz+Δz1]
Project Geometry Algebra

空间中向量 e 1 、 e 2 、 e 3 → G 3 或 G 3 , 0 , 0 e_1、e_2、e_3 \rightarrow G_3或G_{3,0,0} e1e2e3G3G3,0,0

空间中 e 0 、 e 1 、 e 2 、 e 3 → G 3 或者 G 3 , 0 , 1 e_0、e_1、e_2、e_3 \rightarrow G_3或者G_{3,0,1} e0e1e2e3G3或者G3,0,1

其中

  • e i ⋅ e i = 1 (当 i ≠ 0 时) e_i \cdot e_i =1 (当i≠0时) eiei=1(当i=0时) 单位向量积
  • e i ⋅ e i = 0 (当 i = 0 时) e_i \cdot e_i = 0 (当i=0时) eiei=0(当i=0时)

3代表:同向基做内积结果为1的基数量为3,有3个基向量构成的空间

0代表:同向基做内积结果为-1的基数量为0

1代表:同向基做内积结果为0的基的数量为1

e 0 e_0 e0:代表三维空间中的原点,所以内积才能为0

4D空间中表示3D点的方法:

  • 空间中一个点 ( x , y , z ) (x,y,z) (x,y,z)构成 p = e 0 + x e 1 + y e 2 + z e 3 p=e_0+xe_1+ye_2+ze_3 p=e0+xe1+ye2+ze3对应上了上面的4D空间中的平移
  • p ′ = α p = α e 0 + α x e 1 + α y e 2 + α z e 3 p'=\alpha p = \alpha e_0 + \alpha x e_1 + \alpha y e_2 + \alpha z e3 p=αp=αe0+αxe1+αye2+αze3

即可以表达为: p ′ = [ x y z 1 ] ⇔ p = [ α x α y α z α ] 即可以表达为: p'= \begin{bmatrix} x \\ y \\ z \\ 1 \\ \end{bmatrix} \Leftrightarrow p= \begin{bmatrix} \alpha x \\ \alpha y \\ \alpha z \\ \alpha \\ \end{bmatrix} 即可以表达为:p= xyz1 p= αxαyαzα
3D坐标表示4D
\qquad

如何旋转加平移?

变换的顺序是非常重要的。因为我们使用的是行向量,变换的顺序必须和矩阵乘法的顺序相吻合(从左到右),先旋转后平移。
旋转矩阵R

R = [ r 11 r 12 r 13 0 r 21 r 22 r 23 0 r 31 r 32 r 33 0 0 0 0 1 ] R= \begin{bmatrix} r_{11} & r_{12} & r_{13} & 0 \\ r_{21} & r_{22} & r_{23} & 0 \\ r_{31} & r_{32} & r_{33} & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} R= r11r21r310r12r22r320r13r23r3300001
平移矩阵T
T = [ 1 0 0 0 0 1 0 0 0 0 1 0 Δ x Δ y Δ z 1 ] T = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ \Delta x & \Delta y & \Delta z & 1\\ \end{bmatrix} T= 100Δx010Δy001Δz0001
将向量先旋转再平移,得到新的向量 v ′ v' v,且记变换矩阵 M = R × T M = R \times T M=R×T
M = T × T = [ r 11 r 12 r 13 0 r 21 r 22 r 23 0 r 31 r 32 r 33 0 0 0 0 1 ] × [ 1 0 0 0 0 1 0 0 0 0 1 0 Δ x Δ y Δ z 1 ] = [ r 11 r 12 r 13 0 r 21 r 22 r 23 0 r 31 r 32 r 33 0 Δ x Δ y Δ z 1 ] M = T \times T = \begin{bmatrix} r_{11} & r_{12} & r_{13} & 0 \\ r_{21} & r_{22} & r_{23} & 0 \\ r_{31} & r_{32} & r_{33} & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} \times \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ \Delta x & \Delta y & \Delta z & 1\\ \end{bmatrix} = \begin{bmatrix} r_{11} & r_{12} & r_{13} & 0 \\ r_{21} & r_{22} & r_{23} & 0 \\ r_{31} & r_{32} & r_{33} & 0 \\ \Delta x & \Delta y & \Delta z & 1\\ \end{bmatrix} M=T×T= r11r21r310r12r22r320r13r23r3300001 × 100Δx010Δy001Δz0001 = r11r21r31Δxr12r22r32Δyr13r23r33Δz0001
化简后为:
M = [ R 0 t 1 ] M = \begin{bmatrix} R & 0 \\ t & 1 \\ \end{bmatrix} M=[Rt01]
得到一般形式为:
[ x y z 0 ] = [ r 11 r 12 r 13 0 r 21 r 22 r 23 0 r 31 r 32 r 33 0 Δ x Δ y Δ z 1 ] = [ x r 11 + y r 21 + z r 31 x r 12 + y r 22 + z r 32 x r 13 + y r 23 + z r 33 0 ] \begin{bmatrix} x & y & z & 0 \end{bmatrix} = \begin{bmatrix} r_{11} & r_{12} & r_{13} & 0 \\ r_{21} & r_{22} & r_{23} & 0 \\ r_{31} & r_{32} & r_{33} & 0 \\ \Delta x & \Delta y & \Delta z & 1\\ \end{bmatrix} = \begin{bmatrix} xr_{11}+yr_{21}+zr_{31} & xr_{12}+yr_{22}+zr_{32} & xr_{13}+yr_{23}+zr_{33} & 0 \end{bmatrix} [xyz0]= r11r21r31Δxr12r22r32Δyr13r23r33Δz0001 =[xr11+yr21+zr31xr12+yr22+zr32xr13+yr23+zr330]

\qquad

规范等变 Gauge Equivariant

\qquad
在深度学习中,通常来说,等变性(equivariance)比不变性(invariance)更重要,因为我们无法根据不变特征判断其空间关系(比如人脸的眼睛、鼻子、嘴巴的空间关系)

  • 首先需要给定群等变(group equivarant)

规范等变

Φ ( T g x ) = T g ′ Φ ( x ) \varPhi(T_g x) = T^{'}_g\varPhi(x) Φ(Tgx)=TgΦ(x)
由公式可以看出,就是先Translation在Transform和先Transform再Translation是等效的,所以才叫群等变。

  • 对于一个对象来说,对称性指的是,在一次变换前后,对象不变。

\quad 如二维欧式空间的图像采样像素矩阵 Z 2 \mathbb{Z}^2 Z2,翻转后得到:

− Z 2 = { ( − n , − m ) ∣ ( n , m ) ∈ Z 2 } = Z 2 -\mathbb{Z}^2 =\{(-n, -m)|(n,m) \in \mathbb{Z}^2\} = \mathbb{Z}^2 Z2={(n,m)(n,m)Z2}=Z2

  • 有以下性质的变换的集合被称为对称群(symmetry group):

∘ \quad \circ 如果有两个对称变换(symmetry transformations) g 和 h g 和 h gh,将他们组合起来得到的结果 g h g h gh也是一个对称变换。

∘ \quad \circ 逆变换 g − 1 g^{-1} g1也是一个对称变换,即经过 g − 1 g g^{-1}g g1g后,恒等于原图。

\qquad

  • Group p 4 p4 p4 p 4 m p4m p4m

Group p 4 p4 p4(Translation and Rotation by 90 ° 90\degree 90°) 旋转 90 ° 90\degree 90°再平移

旋转

图上每个r就是旋转一个90°

\qquad
g ( r , u , v ) = [ cos ⁡ ( π r 2 ) − sin ⁡ ( π r 2 ) u sin ⁡ ( π r 2 ) cos ⁡ ( π r 2 ) v 0 0 1 ] g x ⋍ [ cos ⁡ ( π r 2 ) − sin ⁡ ( π r 2 ) u sin ⁡ ( π r 2 ) cos ⁡ ( π r 2 ) v 0 0 1 ] [ u ′ v ′ 1 ] g(r,u,v)= \begin{bmatrix} \cos{(\frac{\pi r}{2})} & -\sin{(\frac{\pi r}{2})} & u \\ \sin{(\frac{\pi r}{2})} & \cos{(\frac{\pi r}{2})} & v \\ 0 & 0 & 1 \end{bmatrix} \\ \qquad \\ gx \backsimeq \begin{bmatrix} \cos{(\frac{\pi r}{2})} & -\sin{(\frac{\pi r}{2})} & u \\ \sin{(\frac{\pi r}{2})} & \cos{(\frac{\pi r}{2})} & v \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} u' \\ v' \\ 1 \end{bmatrix} g(r,u,v)= cos(2πr)sin(2πr)0sin(2πr)cos(2πr)0uv1 gx cos(2πr)sin(2πr)0sin(2πr)cos(2πr)0uv1 uv1
g g g是上面Group Equivariant的变换 T g T_g Tg,由于是行向量,旋转矩阵在平移矩阵前面

\qquad

\qquad

  • Group p 4 m p4m p4m平移、镜像 m m m次、旋转 90 ° 90\degree 90°

平移旋转镜像

\qquad
g ( m , r , u , v ) = [ ( − 1 ) m cos ⁡ ( π r 2 ) ( − 1 ) m sin ⁡ ( π r 2 ) u sin ⁡ ( π r 2 ) cos ⁡ ( π r 2 ) v 0 0 1 ] g(m,r,u,v)= \begin{bmatrix} (-1)^{m} \cos{(\frac{\pi r}{2})} & (-1)^{m} \sin{(\frac{\pi r}{2})} & u \\ \sin{(\frac{\pi r}{2})} & \cos{(\frac{\pi r}{2})} & v \\ 0 & 0 & 1 \end{bmatrix} g(m,r,u,v)= (1)mcos(2πr)sin(2πr)0(1)msin(2πr)cos(2πr)0uv1
\qquad

\qquad

Functions on Group群上函数

\qquad

在CNN上,原图像 Z 2 \mathbb{Z}^2 Z2经过backbone得到K通道的Feature-map,其函数通常定义在一个有界域上(图形-矩形域)

\qquad
f : Z 2 → R K f: \mathbb{Z}^2 \rightarrow \mathbb{R}^K f:Z2RK
每一个像素坐标 ( p , q ) ∈ Z 2 (p,q) \in \mathbb{Z}^2 (p,q)Z2
对应函数f返回特征图上的一个K维特征向量 f ( p , q ) f(p,q) f(p,q)

\qquad

定义一种在特征图上的变化为 g g g

\qquad

∘ [ L g f ] ( x ) = [ f ∘ g − 1 ] ( x ) = f ( g x − 1 ) \circ \quad [L_gf]_{(x)}=[f \circ g^{-1}]_{(x)} = f(g^{-1}_x) [Lgf](x)=[fg1](x)=f(gx1)

\qquad

▶ \quad \blacktriangleright \quad L g L_g Lg表示对特征图进行 g g g变换

▶ \quad \blacktriangleright \quad 这个公式的意思就是:要得到进行 g g g变换后的特征图 L g f L_gf Lgf x x x位置处的值,我们需要到原特征图 f f f上的 g − 1 x g_{-1}x g1x位置上找值。

▶ \quad \blacktriangleright \quad 根据之前的定义, L g L_g Lg还需要满足 L g L h = L g h ∘ L_gL_h = L_{gh\circ} LgLh=Lgh

如果变换 g g g表示的是图像的平移(translation) t = ( u , v ) ∈ Z 2 t=(u,v) \in \mathbb{Z}^2 t=(u,v)Z2,那么 g x − 1 g^{-1}_x gx1就等于 x − t x-t xt

\qquad

CNN上的等变性

\qquad

在CNN的每一层 l l l上, f : Z 2 → R K l f:\mathbb{Z}^2 \rightarrow \mathbb{R}^{K^l} f:Z2RKl,用 K l + 1 K^{l+1} Kl+1个卷积核对特征进行卷积或者互相关:

▶ \blacktriangleright \quad 卷积:

[ f ∗ ψ i ] ( x ) = ∑ y ∈ Z 2 ∑ K l k = 1 f k ( y ) ψ k i ( x − y ) [f*\psi^{i}](x) = \sum_{y \in \mathbb{Z}^2} \sum_{K^l}^{k=1}f_k(y) \psi_k^i(x-y) [fψi](x)=yZ2Klk=1fk(y)ψki(xy)
▶ \blacktriangleright \quad 相关:
[ f ⋆ ψ i ] ( x ) = ∑ y ∈ Z 2 ∑ K l k = 1 f k ( y ) ψ k i ( y − x ) [f \star \psi^{i}](x) = \sum_{y \in \mathbb{Z}^2} \sum_{K^l}^{k=1}f_k(y) \psi_k^i(y-x) [fψi](x)=yZ2Klk=1fk(y)ψki(yx)
默认相关和卷积都是卷积

\qquad

t → y + t t \rightarrow y+t ty+t做替换,忽略特征图上最后求和的一步,我们可以证明“相关”对于平移具有等变性

\qquad
[ [ L t f ] ⋆ ψ ] ( x ) = ∑ y f ( y − t ) ψ ( y − x ) = ∑ y f ( y ) ψ ( y + t − x ) = ∑ y f ( y ) ψ ( y − ( x − t ) ) = [ L t [ f ⋆ ψ ] ] ( x ) \begin{array}{cl} [[L_tf]\star \psi](x) & = \sum_{y}f(y-t)\psi(y-x) \\ \qquad \\ & = \sum_{y}f(y)\psi(y+t-x) \\ \qquad \\ & = \sum_{y}f(y)\psi(y-(x-t)) \\ \qquad \\ &= [L_t[f \star \psi]](x) \\ \qquad \end{array} [[Ltf]ψ](x)=yf(yt)ψ(yx)=yf(y)ψ(y+tx)=yf(y)ψ(y(xt))=[Lt[fψ]](x)
结论:

  • correlation is an equivariant map for the translation group“相关”是平移群上的等变映射
  • correlation and translation commute“相关”和“卷积”同样具有平移等变性
  • 卷积对于平移具有等变性,但是对旋转不具有等变性

\qquad

半直积 Semi-direct Product

\qquad

群的半直积是用两个群生成一个群

  • G G G H H H为群, θ : H → A u t ( G ) \theta: H \rightarrow Aut(G) θ:HAut(G)为群同态。定义 G ⋊ θ H G \rtimes_{\theta} H GθH G G G H H H的笛卡尔积,且配有乘法如下:

\qquad
( g , h ) ( g ′ , h ′ ) = g ( h g ′ h − 1 ) h h ′ = ( g θ h ( g ′ ) , h h ′ ) (g,h)(g', h') = g(hg'h^{-1})hh' = (g\theta_h (g'),hh') (g,h)(g,h)=g(hgh1)hh=(gθh(g),hh)
\qquad

\qquad

  • G G G是圆周 T \mathbb{T} T上的连续函数构成的交换群, Z \mathbb{Z} Z的元素 m m m G G G上的共轭用(conjugate group action)由

( m − 1 f m ) ( e i t ) = f ( e i m t ) (m^{-1}fm)(e^{it}) = f(e^{imt}) (m1fm)(eit)=f(eimt)
\quad \quad \quad 给出,那么 G ⋊ H G \rtimes H GH的元素就由所有形式如 f ⋅ m f \cdot m fm的元素构成,并且计算法则为:
\qquad

f ⋅ m ⋅ g ⋅ n = ( f ⋅ m ⋅ g ⋅ m − 1 ) ⋅ m ⋅ n f \cdot m \cdot g \cdot n = (f \cdot m \cdot g \cdot m^{-1}) \cdot m \cdot n fmgn=(fmgm1)mn
\qquad
\qquad

  • 假如说有某一个群 K K K,它同时包含了 G 和 H G和H GH G ∩ H = 0 G \cap H=0 GH=0并且 G G G是正规子群(Gauge subgroup,我的理解就是正规等变的子群),那么 G 和 H G和H GH生成的群就是 G ⋊ H G \rtimes H GH

    \qquad

何为群同态

群同态

在群论中,给定两个群 ( G , ∗ ) 和 ( H , ⋅ ) (G,*)和(H,\cdot) (G,)(H,),从 ( G , ∗ ) 和 ( H , ⋅ ) (G,*)和(H,\cdot) (G,)(H,)的群同态是指映射 f : G → H f:G \rightarrow H f:GH使得对于所有G中的元素 u 和 v u和v uv对于下述等式成立:

\qquad

h ( u ∗ v ) = h ( u ) ⋅ h ( v ) h(u*v) = h(u)\cdot h(v) h(uv)=h(u)h(v)

\qquad

\qquad

直积,又称笛卡尔积(Cartesian product)

笛卡尔乘积是指在数学中,两个集合X和Y的笛卡尔积(Cartesian product),又称直积,表示为 X × Y X×Y X×Y,第一个对象是 X X X的成员而第二个对象是 Y Y Y的所有可能有序对的其中一个成员
直积
矩阵变化

  • 假设集合 A = { a , b } A=\{a, b\} A={ a,b},集合 B = { 0 , 1 , 2 } B=\{0, 1, 2\} B={ 0,1,2},则两个集合的笛卡尔积为 { ( a , 0 ) , ( a , 1 ) , ( a , 2 ) , ( b , 0 ) , ( b , 1 ) , ( b , 2 ) } \{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)\} {(a,0),(a,1),(a,2),(b,0),(b,1),(b,2)}

    \qquad
  • 如果A表示某学校学生的集合,B表示该学校所有课程的集合,则A与B的笛卡尔积表示所有可能的选课情况。

    \qquad
  • A表示所有声母的集合,B表示所有韵母的集合,那么A和B的笛卡尔积就为所有可能的汉字全拼。

    \qquad
  • A , B A,B A,B为集合,用 A A A中元素为第一元素, B B B中元素为第二元素构成有序对,所有这样的有序对组成的集合叫做 A 与 B A与B AB的笛卡尔积,记作 A × B A\times B A×B.

A × B = { ( x , y ) ∣ x ∈ A ∧ y ∈ B } 例如, A = a , b , B = 0 , 1 , 2 ,则 : A × B = { ( a , 0 ) , ( a , 1 ) , ( a , 2 ) , ( b , 0 ) , ( b , 1 ) , ( b , 2 ) } B × A = { ( 0 , a ) , ( 0 , b ) , ( 1 , a ) , ( 1 , b ) , ( 2 , a ) , ( 2 , b ) } \qquad \\ A×B=\{(x,y)|x∈A∧y∈B\} \\ \qquad \\ 例如,A={a,b}, B={0,1,2},则: \\ A×B=\{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)\} \\ B×A=\{(0, a), (0, b), (1, a), (1, b), (2, a), (2, b)\} \\ A×B={(x,y)xAyB}例如,A=a,b,B=0,1,2,则:A×B={(a,0),(a,1),(a,2),(b,0),(b,1),(b,2)}B×A={(0,a),(0,b),(1,a),(1,b),(2,a),(2,b)}

\qquad

基本的群表示

  • 群的正则表示,用于研究群的整体性质。

G G G是群,取 Σ = G \Sigma = G Σ=G
f : G → S ( G ) , f ( g ) a = g a , ∀ a ∈ G f:G\rightarrow S(G), \quad f(g)a=ga, \quad \forall a \in G f:GS(G),f(g)a=ga,aG
也就是说, f ( g ) f(g) f(g)是群 G G G上的置换,将 a a a置换为 g a ga ga,按照同态的定义,很容易证明,次映射是同态映射,从而 f f f给出 G G G的一个置换表示,叫做群 G G G的做正则表示,更进一步:
g ∈ K e r   f ⇔ g a = a , ∀ a ∈ G ⇔ g = 1 G g \in Ker\ f \quad \Leftrightarrow \quad ga = a, \quad \forall a \in G \quad \Leftrightarrow \quad g=1_G gKer fga=a,aGg=1G

  • Induced representation群的诱导表示,用于研究群的某一子群的性质。

H ⩽ G H \leqslant G HG, 取 Σ = { a H ∣ a ∈ G } \Sigma=\{aH|a\in G\} Σ={ aHaG},即 Σ \Sigma Σ G G G对于 H H H的全部陪集构成的集合,定义:
f H : G → S ( Σ ) , f H ( g ) ( a H ) = g a H f_H:G \rightarrow S(\Sigma), \quad f_H(g)(aH)=gaH fH:GS(Σ),fH(g)(aH)=gaH
这是 Σ \Sigma Σ上的置换,同样地, f H f_H fH是同态映射,从而 f H f_H fH给出 G G G的一个置换表示,叫做群 G G G对于子群 H H H的左诱导表示,那它是否是单同态呢?我们观察
g ∈ K e r   f H ⇔ g a H = a H , ∀ a i n G ⇔ a − 1 g a ∈ H , ∀ a ∈ G ⇔ g ∈ a H a − 1 , ∀ a ∈ G ⇔ g ∈ ∩ a ∈ G a H a − 1 g \in Ker \ f_H \quad \Leftrightarrow \quad gaH=aH, \forall a in G \quad \Leftrightarrow \quad a^{-1}ga \in H, \forall a \in G \quad \Leftrightarrow \quad g \in aHa^{-1}, \forall a \in G \quad \Leftrightarrow \quad g \in \cap_{a\in G}aHa^{-1} gKer fHgaH=aH,ainGa1gaH,aGgaHa1,aGgaGaHa1
因此, K e r   f H = ∩ a ∈ G a H a − 1 Ker\ f_H=\cap_{a \in G}aHa^{-1} Ker fH=aGaHa1 H H H所有共轭子群的交,因而, f H f_H fH不是单态。


  • Conjugate representation群的共轭表示,用于研究群的某一子集的性质。

A A A是群 G G G的任意子集。取 Σ = { a A a − 1 ∣ a ∈ G } \Sigma = \{aAa^{-1}|a \in G\} Σ={ aAa1aG}(即 A A A的全部共轭子集)。定义
f   :   G → S ( Σ ) , f ( g ) ( a A a − 1 )   =   g a A a − 1 g − 1   =   ( g a ) A ( g a ) − 1 f\ : \ G\rightarrow S(\Sigma), \quad f(g)(aAa^{-1}) \ = \ gaAa^{-1}g^{-1} \ = \ (ga)A(ga)^{-1} f : GS(Σ),f(g)(aAa1) = gaAa1g1 = (ga)A(ga)1
这是一个置换表示,叫做群 G G G对于子集 A A A的共轭表示,和之前一样:
g ∈ K e r   f ⇔ g a A a − 1 g − 1   =   a A a − 1 , ∀ a ∈ G ⇔ a − 1 g a ∈ N G ( A ) , ∀ a ∈ G ⇔ g ∈ a N G ( A ) a − 1 , ∀ a ∈ G \begin{array}{rcl} g \in Ker \ f & \Leftrightarrow & gaAa^{-1}g^{-1} \ = \ aAa^{-1}, & \forall a \in G \\ & \Leftrightarrow & a^{-1}ga \in N_G(A), &\forall a \in G \\ & \Leftrightarrow & g \in aN_G(A)a^{-1}, &\forall a \in G \end{array} gKer fgaAa1g1 = aAa1,a1gaNG(A),gaNG(A)a1,aGaGaG
从而 K e r   f = ∩ a ∈ G a N G ( A ) a − 1 Ker \ f = \cap_{a\in G}aN_G(A)a^{-1} Ker f=aGaNG(A)a1,即视为正规化子 N G ( A ) N_G(A) NG(A)的左右共轭子群的交

\qquad


总结

  1. 正则表示用于研究群的整体性质。
  2. 诱导表示用于研究群的某一子群的性质。
  3. 共轭表示用于研究群的某一子集的性质。

\qquad

\qquad

猜你喜欢

转载自blog.csdn.net/Soonki/article/details/131215553