使用place2创建场景识别的demo - 代码天地

使用place2创建场景识别的demo

其他 2019-03-25 08:51:00 阅读次数: 0

参考：https://github.com/CSAILVision/places365
论文：Learning Deep Features for Scene Recognition using Places Database

1.需要预先安装包：

numpy
pytorch
opencv-python
Pillow

2. 首先将places365的代码git到本地：

git clone https://github.com/CSAILVision/places365.git

程序包大约有1.37Mb左右。

cd palces365

运行demo程序：

python run_placesCNN_basic.py

程序run_placesCNN_basic.py中使用的架构（arch）是resnet18网络，因此代码段中会通过http请求自动下载与训练好的权重resnet18_places365.pth.tar以及标签目录categories_places365.txt文件，再通过http请求下载测试图片12.jpg,返回训练结果：

2018-05-18 20:01:26 (82.8 KB/s) - 已保存 “12.jpg” [63736/63736])

resnet18 prediction on 12.jpg
0.621 -> patio
0.296 -> restaurant_patio
0.021 -> porch
0.018 -> beer_garden
0.012 -> courtyard

识别结果为院子。
如果觉得上面的功能太简单，还可以运行下面的demo程序：

python run_placesCNN_unified.py

需要下载categories_places365.txt，IO_places365.txt，labels_sunattribute.txt，W_sceneattribute_wideresnet18.npy，wideresnet18_places365.pth.tar以及测试图片test.jpg当然程序会自动将这些文件下载好，直接输出结果：

è¿éåå¾çæè¿°

RESULT ON http://places.csail.mit.edu/demo/6.jpg
--TYPE OF ENVIRONMENT: indoor
--SCENE CATEGORIES:
0.511 -> food_court
0.085 -> fastfood_restaurant
0.083 -> cafeteria
0.040 -> dining_hall
0.021 -> flea_market/indoor
--SCENE ATTRIBUTES:
no horizon, enclosed area, man-made, socializing, indoor lighting, cloth, congregating, eating, working
Class activation map is saved as cam.jpg

可以看出来ResNet将图片识别成food_court饭厅，底下还有相关的场景属性描述（没有地平线，封闭空间，人造场景，社交等等）以及生成分类激活图片：

è¿éåå¾çæè¿°
实在是很神奇～

原文：https://blog.csdn.net/weixin_39449466/article/details/80369349

猜你喜欢

转载自blog.csdn.net/jinking01/article/details/88719573

使用place2创建场景识别的demo

【翻译】Visual Place Recognition_ A Survey视觉场景识别综述【四】

【翻译】Visual Place Recognition_ A Survey视觉场景识别综述【三】

【翻译】Visual Place Recognition_ A Survey视觉场景识别综述【二】

【翻译】Visual Place Recognition_ A Survey视觉场景识别综述【一】

移动端证件识别的应用场景

华为HiAI语音识别的集成与使用

【坑】关于使用 maven 创建 web 项目以后，el 表达式不被识别的解决方法

科大讯飞语音识别Demo创建

无法识别的标志“-Ot”(在“p2”中)

基于OpenCV的图像颜色与形状识别的原理2

基于android studio开发的 opencv关于android人脸识别的DEMO

java使用kafka创建demo

银行卡识别的实现方式及其应用场景

ACM MM 2023 | 上交提出RCLSTR：面向场景文本识别的关系对比学习

ramdisk使用32位系统不能识别的内存

手写文字识别的使用软件

使用电脑实现图片文字识别的方法

使用在线文字识别的小技巧有哪些？

使用讯飞语音识别的空指针错误

Android华为HiAI语音识别的集成与使用

百度OCR通用文字识别的使用

关于使用 AzureKinect 不识别的问题解决

pycharm使用案例——利用pytesseract进行图形识别的利用

虹软人脸识别demo使用教程

场景文本识别——基于图像序列识别的端到端可训练神经网络模型

语音识别的技术

语音识别的难点

面部识别的未来

未识别的网络

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)