人脸年龄性别预测——age & gender

这是个基本问题,用人脸预测年龄和性别从主观上看是可行的,如果说从声音上来分辨似乎也无不可。

如果有声音数据的话,分辨性别还是可以的,但年龄人脸还是关键,因为人的声音可以有假音,比如我的假唱。

【如果可以的话,当个花瓶也不错啊。哈哈】

鉴于我的昨天的问题,其实就是作者写的复杂化了,本来很简单的问题,结果搞了几个脚本,好几百行代码,读图,存图,再读图,你累不累啊??本应该一次读图就解决的问题。结果来个图像编码???其中的用意在于什么??

jpeg是训练的数据格式?png,jpg都不行???都不能用还是不能正确预测啊??

这个问题稍后我再细看,我先直接喂模型数据,这个是最直接的!!!

我要实现同样的功能不超过100行代码,能简化代码才是大佬,繁琐的复杂的都是为了屏蔽小白的做法。

【删繁就简三秋木,标新立异二月花】就要做到最简单,最方便,一目了然!!!

for a single image with only one face,why the batch is 12???R U kidding Me?ignore the guess prob at first

Running file ./frontal-face-2.jpg
Running multi-cropped image
image_batch = Tensor("stack_1:0", shape=(12, 227, 227, 3), dtype=float32, device=/device:CPU:0)
Guess @ 1 (48, 53), prob = 0.42
Guess @ 2 (25, 32), prob = 0.36

Could I say the result of the age prediction is bullshit ?Will not use the age model,SO let's see the gender model

If the gender model is not really good ,will say LAJI !!!

But just Okey,so only use the gender model.

Some codes are not compatible with MTCNN,will change .

1-查看12个batch到底是啥玩意,画出来。

感觉的确有点好高端啊,左右翻转,并且添加了不同剪切的照片[当然其中必然有resize],做最终的判断。

剪切的部分应该就是上下cut,寡人先忽略这个。

其中加了似乎有噪声。可能是避免其他背景的影响。

图片源于公开数据集:https://github.com/imagednn/rude-carnie 所用的数据

2-我仅仅用一个照片不能判断吗??have a try

先做单个图片的,再做文件夹的。

开始我还以为直接就吃12个图片仅仅给出一个结果,那不是,肯定是12个结果,从中选择了一个而已,这样的话可以批处理了。

单个图片多个人脸。

遇到了模型恢复问题,这是个 基本问题,我单独开一篇https://blog.csdn.net/SPESEG/article/details/103297879

【百变大魔王小明哥,端茶递水样样精通】

搞定,看个图片吧,大图【小人脸检测下的预测都有很大误差,这个似乎无法避免,如有好的解决方法不妨告诉我,多谢】

但是卧槽,为啥子出错了???请看我哥和小倩的合照

这个。。。。这。。。标错了??

我查查,类别顺序没错,作者的预测的没毛病,难道就是12的问题???还是仅仅标错了。

前者的话不至于差别这么大,如果仅仅是标反了的话,那么stylegan的结果就有点难以理解了。如下:

So should I use the 12-batch or encode/decode the image ???

According to the author's code, got 100% success of the prediction !!!

So need to modify the code I have.

仔细看了下序号对应,没有问题。

那就是图片编解码问题了???或者图片某种处理??crop?

我看看作者的意图是什么??pls ignore the prediction of the child's age, this is the model's problem.

这是我下午的工作内容。上个厕所。

我可以先试试6个的准确率如何,因为越少越少,计算速度快。

3-解码问题

卧槽,byte流,这几把不好整了。这或许就是第二次读图的原因了。这就有点复杂了,我想自己水平翻转下试试,再不行就加个上下或者对角翻转,各种翻转都用上。

这也是个基本问题,我另开一篇https://blog.csdn.net/SPESEG/article/details/103310565

下班,明天继续

今天是12月第一天,2019年12月1日,惊闻哥哥的恩师黎小田先生仙逝,我很难过,哥哥走了,哥哥的老师也走了,还有什么音乐陪伴我左右???推荐哥哥一首歌《不怕寂寞》,我记得有一场演唱会哥哥唱,黎小田先生钢琴伴奏,哥哥还躺在了上面[这个在基仔纪念哥哥演唱会上也有提到],如今我早已学会了这首歌,哥哥在哪里呢?不敢回首当年事,如今已是百年身。

看了下,tf读图的结果是小数-1~1之间的,这可能就是识别失败的原因。我实际测试一下:范围有大小,但有正负

>>> image_batch.min()
-1.1213884
>>> image_batch.max()
3.4474764

min=-2.69821,max=1.56011
min=-1.77689,max=3.20656
min=-3.37379,max=1.84279
min=-1.03419,max=3.15468
min=-1.03925,max=3.21948
min=-2.84769,max=1.56894

我比较好奇,这是怎么做到的这个范围,也不是-1~1,这就奇怪了。

cv2和PIL都是8位的,plt显示需要的是0~1的。emmm,我怎么转换一下,转换成-1~1之间吧

不不不,误入歧途了,不可如此,其实很简单的,应该是某种处理,不说了。我试试看看:

emm,我以为原来的dlib不会差劲到看不到很明显的人脸吧???我高估dlib了,如图下,就是用dlib

直接漏掉了一个人脸,,,,,,这还玩个啥子???所以我这个菜鸟都放弃了这个玩意。

经过我处理后的数据能够正确识别上个人脸中的14个,emm,就是漏掉的那个识别错误,难道dlib也发现奇怪了???

说不定加点上面的翻转啥的可以提高,也可能没作用,我试试哥哥和小倩吧:终于解决了这个问题,天不负我。

就这样吧。拜拜,下面我做的将是图像相似度,或者说是图像内容的分类识别,已经开始了。跟我一起开创新纪元吧。

复联3-无限战争

我 再也不会怕寂寞

寂寞已用一把锁

锁走真的我

另外有相关问题可以加入QQ群讨论,不设微信群

QQ群:868373192 

语音图像深度学习群

猜你喜欢

转载自blog.csdn.net/SPESEG/article/details/103292299