2.19研究ノート

まあにモデル全体のトレーニングのトレーニングセットを介して、モデルを生成するために単独で使用することができる場合は1 VAE生成モデル、そしてそれは、その後、推定された生成プロセスを含んでいますか?Zがランダムに生成され、ランダムに生成されたデータの隠れたスペースはあなたに利用可能でしょうか?生成されたデータは意味がありますか?

最も簡単な方法は、通常のが発生するかどうかを確認するためのデータを生成mnist使用することです。

これは、次のコード生成の結果です:

 

 Zは、手書きデータ、以下の結果で学習するのではなく、ランダムサンプリングにより得られます。

 

 その結果は非常に一般的なああです。

私は、その紙が、私が見ていることをデータを使用して生成されると思います

 

これは、データセットを生成し、異なるパラメータを与えています。とにかく、これは長いモデルパラメータとして、それが生成できるようになります。だから、VAE、パラメータを持つモデルでは、あなたはランダムに生成され、まだできないのですか?しかし、実際には、画像やRNA-seqのは違うのですか?ああ、もちろんokですが、その後何も評価基準があります。はいああ。

ここではその後、ビルドプロセストレーニング、ランダムに生成されたzの後に良いモデルです。

 

 結果は以下の通りであります:

 

 2.集合A、BおよびCは、データを生成する場合は、すべてあなたが行うことができますか?BとCというようにあまりにも似て、あなたは一つだけを選ぶことができますので、?

それは同じを生成するかどうかを確認するために、異なるシードを使用して、二回発生し、実際のデータセットで同じスプラットを使用してみてください。

http://www.bioconductor.org/packages/release/bioc/vignettes/splatter/inst/doc/splatter.html

それは無駄ああだったら#私は,,考えていました。

> set.seed(1)
> sce <- mockSCE()
> sce

#我尝试使用同样的sce那么,生成的数据是一样一样的。
> c0[1:5,1:5]
      Cell1 Cell2 Cell3 Cell4 Cell5
Gene1    27    54   141    26   107
Gene2     1    25     0     1     0
Gene3   782   738   386   334   130
Gene4    58    16    21    86     6
Gene5    11    24    18    20    34
> c1[1:5,1:5]
      Cell1 Cell2 Cell3 Cell4 Cell5
Gene1    27    54   141    26   107
Gene2     1    25     0     1     0
Gene3   782   738   386   334   130
Gene4    58    16    21    86     6
Gene5    11    24    18    20    34

当我设置不同的seed时,设置seed为20,然后mock生成的数据集的参数有差异,但是差异不是特别大,

> c2[1:5,1:5]
          Cell_001 Cell_002 Cell_003 Cell_004 Cell_005
Gene_0001        0        5        7      276       50
Gene_0002       12        0        0        0        0
Gene_0003       97      292       58       64      541
Gene_0004        0        0        0      170       19
Gene_0005      105      123      174      565     1061
> c0[1:5,1:5]
      Cell1 Cell2 Cell3 Cell4 Cell5
Gene1    27    54   141    26   107
Gene2     1    25     0     1     0
Gene3   782   738   386   334   130
Gene4    58    16    21    86     6
Gene5    11    24    18    20    34

看来生成的数据还是有较大差异的,因为给的参数不同。

3.由1我想到,那么scvi这么复杂,它是怎么训练的呢?训练过程是怎样的?

 

 batch_size为128,然后epoch默认为400,每一次epoch都会完整地训练一次数据:

 

おすすめ

転載: www.cnblogs.com/BlueBlueSea/p/12334048.html