采用sklearn 自带的8*8的0~9数据进行实验测试。
经过试验测试,发现前面15个奇异值已经足够可以代表整个64维度的特征。
[567.0065665 542.25185421 504.63059421 426.11767607 353.33503235
325.82036394 305.2615743 281.16032764 269.06977678 257.82394749
226.31876461 221.5131726 198.32643774 195.69042567 177.97382911]
[0.14890594 0.13618771 0.11794594 0.08409979 0.05782415 0.0491691
0.04315987 0.03661372 0.03353248 0.03078806 0.0237234 0.02272663
0.01821785 0.01773679 0.01467061]
0.8353020343709757
已经达到83%,可以了。
下面将此结果用t-SNE展示效果,其实这个流形也有降维的功能,但前提是特征表示一定要好,不然也是白费。
0.8750658820268782
0.8942929119088475
效果都差不多,就这样吧,拜拜。有事没事找我玩啊。
补充:采用之前提取的inceptionV3 1视频与0视频进行尝试。
发现2048PCA2000后已经是99%,这样其实还可以再降低,甚至1000维度仍旧是99%,还可以再降低
500时 0.9736258
200,0.8861304
150,0.8448606
120, 0.80900913
80, 0.73717004
虽然t-SNE的结果并不理想,但PCA的结果是没什么太大的问题的。
其实我仍旧认为这并没有分开,原因是仅仅是图像的特征,并没有其他特征。
另外有相关问题可以加入QQ群讨论,不设微信群
QQ群:868373192
语音图像视频深度-学习群