I. Introducción:
Utilice el modelo YOLO_NAS_S para la detección de objetivos y guarde la imagen del sujeto predicha
Paquete de instalación:
pip install super_gradients
pip install omegaconf
pip install hydra-core
pip install boto3
pip install stringcase
pip install typing-extensions
pip install rapidfuzz
pip install Cython
pip install pycocotools
pip install onnx-simplifier
2. Pasos:
- Instale las bibliotecas y los marcos necesarios. Asegúrese de haber instalado OpenCV, PyTorch y torchvision
- Descargue el archivo de peso del modelo YOLO_NAS_S y cargue el modelo
- Realizar preprocesamiento de imágenes. Para cada imagen de entrada, es necesario convertirla a un formato aceptable para el modelo y normalizarla.
- Utilice el modelo para la detección de objetivos y obtenga resultados de predicción
- Analice los resultados de la predicción y guarde la imagen principal prevista
3. Código:
from PIL import Image
import torch
from super_gradients.training import models
device = torch.device("cuda:0") if torch.cuda.is_available() else torch.device("cpu")
model = models.get("yolo_nas_s", pretrained_weights="coco").to(device)
out = model.predict(r"D:\Desktop\tp.png", conf=0.6)
predictions = out[0]
# 提取预测框对应的主体图像并保存
num = 1
for bbox in predictions.prediction.bboxes_xyxy:
x1, y1, x2, y2 = bbox[:4] # 每个预测框的坐标
image = Image.open(r"D:\Desktop\tp.png")
cropped_image = image.crop((x1, y1, x2, y2)) # 根据坐标裁剪图像
output_path = f"output_{num}.jpg"
cropped_image.save(output_path) # 保存裁剪后的图像
num += 1
Imágenes detectadas:
Predecir el efecto del sujeto:
Si ve el código basándose en la imagen original de la siguiente manera:
from PIL import Image
import torch
from super_gradients.training import models
device = torch.device("cuda:0") if torch.cuda.is_available() else torch.device("cpu")
model = models.get("yolo_nas_s", pretrained_weights="coco").to(device)
out = model.predict(r"D:\Desktop\tp.png", conf=0.6)
out.save("save_folder_path")
resultado: