学爬虫的第一步,爬妹子!人脸检测 + 颜值检测的爬虫你见过吗?

4 人脸检测库

AipFace,由百度云 AI 开放平台提供,是一个可以进行人脸检测的 Python SDK。可以直接通过 HTTP 访问,免费使用。

文档中心--百度AI:ai.baidu.com。

5 检测过滤条件

  • 过滤所有未出现人脸图片(比如风景图、未露脸身材照等)
  • 过滤所有非女性(在抓取中,发现知乎男性图片基本是明星,故不考虑;存在 AipFace 性别识别不准的情况)
  • 过滤所有非真实人物,比如动漫人物 (AipFace Human 置信度小于 0.6)
  • 过滤所有颜值评分较低图片(AipFace beauty 属性小于 45,为了节省存储空间;再次声明,AipFace 评分无任何客观性)

8 代码

源码私信小编01即可获取

9 运行准备

  • 安装 Python 3,Download Python
  • 安装 requests、lxml、baidu-aip 库,都可以通过 pip 安装,一行命令
  • 申请百度云检测服务,免费。人脸识别-百度AI

要求登录,百度帐号可以直接使用(贴吧/网盘通用),没有只能注册

点击创建应用

随便填下

将 AppID ApiKek SecretKey 填写到 代码 中

  • (可选)配置自定义信息,如图片存储目录、颜值阈值、人脸置信度等
  • (可选)若请求知乎失败,返回如下。需更改 AUTHORIZATION,可从开发者工具中获取(如下图)
 
 
{
 
"error"
:
 
{
 
"message"
:
 
"ZERR_NO_AUTH_TOKEN"
,
 
"code"
:
 
100
,
 
"name"
:
 
"AuthenticationInvalidRequest"
 
}
}

Chrome 浏览器;找一个知乎链接点进去,打开开发者工具,查看 HTTP 请求 header;无需登录

进群:125240963  即可获取源码!

猜你喜欢

转载自blog.csdn.net/qq_42156420/article/details/80657759