まあにモデル全体のトレーニングのトレーニングセットを介して、モデルを生成するために単独で使用することができる場合は1 VAE生成モデル、そしてそれは、その後、推定された生成プロセスを含んでいますか?Zがランダムに生成され、ランダムに生成されたデータの隠れたスペースはあなたに利用可能でしょうか?生成されたデータは意味がありますか?
最も簡単な方法は、通常のが発生するかどうかを確認するためのデータを生成mnist使用することです。
これは、次のコード生成の結果です:
Zは、手書きデータ、以下の結果で学習するのではなく、ランダムサンプリングにより得られます。
その結果は非常に一般的なああです。
私は、その紙が、私が見ていることをデータを使用して生成されると思います
これは、データセットを生成し、異なるパラメータを与えています。とにかく、これは長いモデルパラメータとして、それが生成できるようになります。だから、VAE、パラメータを持つモデルでは、あなたはランダムに生成され、まだできないのですか?しかし、実際には、画像やRNA-seqのは違うのですか?ああ、もちろんokですが、その後何も評価基準があります。はいああ。
ここではその後、ビルドプロセストレーニング、ランダムに生成されたzの後に良いモデルです。
結果は以下の通りであります:
2.集合A、BおよびCは、データを生成する場合は、すべてあなたが行うことができますか?BとCというようにあまりにも似て、あなたは一つだけを選ぶことができますので、?
それは同じを生成するかどうかを確認するために、異なるシードを使用して、二回発生し、実際のデータセットで同じスプラットを使用してみてください。
http://www.bioconductor.org/packages/release/bioc/vignettes/splatter/inst/doc/splatter.html
それは無駄ああだったら#私は,,考えていました。
> set.seed(1) > sce <- mockSCE() > sce #我尝试使用同样的sce那么,生成的数据是一样一样的。 > c0[1:5,1:5] Cell1 Cell2 Cell3 Cell4 Cell5 Gene1 27 54 141 26 107 Gene2 1 25 0 1 0 Gene3 782 738 386 334 130 Gene4 58 16 21 86 6 Gene5 11 24 18 20 34 > c1[1:5,1:5] Cell1 Cell2 Cell3 Cell4 Cell5 Gene1 27 54 141 26 107 Gene2 1 25 0 1 0 Gene3 782 738 386 334 130 Gene4 58 16 21 86 6 Gene5 11 24 18 20 34
当我设置不同的seed时,设置seed为20,然后mock生成的数据集的参数有差异,但是差异不是特别大,
> c2[1:5,1:5] Cell_001 Cell_002 Cell_003 Cell_004 Cell_005 Gene_0001 0 5 7 276 50 Gene_0002 12 0 0 0 0 Gene_0003 97 292 58 64 541 Gene_0004 0 0 0 170 19 Gene_0005 105 123 174 565 1061 > c0[1:5,1:5] Cell1 Cell2 Cell3 Cell4 Cell5 Gene1 27 54 141 26 107 Gene2 1 25 0 1 0 Gene3 782 738 386 334 130 Gene4 58 16 21 86 6 Gene5 11 24 18 20 34
看来生成的数据还是有较大差异的,因为给的参数不同。
3.由1我想到,那么scvi这么复杂,它是怎么训练的呢?训练过程是怎样的?
batch_size为128,然后epoch默认为400,每一次epoch都会完整地训练一次数据: