Descripción general del marco y construcción del entorno de MMDetection V3x (1)

    • Descripción general del marco de MMDetection V3x

MMDetection es una caja de herramientas de detección de objetivos que contiene una gran cantidad de detección de objetivos, segmentación de instancias, métodos de segmentación panorámica y componentes y módulos relacionados . El siguiente es su marco general:

MMDetection consta de 7 partes principales, api, estructura, conjunto de datos, modelo, motor, evaluación y visualización (apis, estructuras, conjuntos de datos, modelos, motor, evaluación y visualización)

apis proporciona una API de alto nivel para la inferencia de modelos.

Las estructuras proporcionan estructuras de datos como bbox, mask y DetDataSample.

Los conjuntos de datos admiten varios conjuntos de datos para la detección de objetos, la segmentación de instancias y la segmentación panóptica.

transforms contiene muchas transformaciones de aumento de datos útiles.

Sampler define diferentes estrategias de muestreo del cargador de datos.

El modelo es la parte más importante del detector y contiene los diferentes componentes del detector.

detectors define todas las clases de modelos de detección.

data_preprocessors se utilizan para preprocesar los datos de entrada del modelo.

backbones contiene varias redes troncales.

los cuellos contienen varios componentes del cuello.

dense_heads contiene varios cabezales de detección que realizan predicciones densas.

roi_heads contiene varios cabezales de detección previstos a partir de RoI.

seg_heads contiene varios encabezados de segmentación.

pérdidas contiene varias funciones de pérdida.

task_modules proporciona módulos para tareas de detección. Los ejemplos incluyen asignadores, muestreadores, codificadores de caja y generadores anteriores.

Layers proporciona algunas capas básicas de redes neuronales.

Los motores son parte de los componentes de tiempo de ejecución.

El corredor proporciona extensiones para el corredor de MMEngine .

Schedulers proporciona programadores para ajustar los hiperparámetros de optimización.

Optimizers proporciona optimizadores y envoltorios de optimizador.

ganchos proporciona varios ganchos para corredores.

La evaluación proporciona diferentes métricas para evaluar el rendimiento del modelo.

La visualización se utiliza para visualizar los resultados de la detección.

    • Construcción del entorno MMDetection V3x

Paso 1. Cree un entorno virtual conda y actívelo.

conda create -n mmdetection python=3.7 -y   #创建环境
conda activate mmdetection                  #激活环境

Paso 2. Instala PyTorch, por ejemplo

conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch  #安装 PyTorch and torchvision (官方)

#如果网不好,可以这样安装
pip3 install torch==1.8.2+cu102 torchvision==0.9.2+cu102 torchaudio===0.8.2 -f https://download.pytorch.org/whl/lts/1.8/torch_lts.html  -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

#验证是否安装成功

>>> import torchvision
>>> import torch
>>> import.__version__
  File "<stdin>", line 1
    import.__version__
          ^
SyntaxError: invalid syntax
>>> torch.__version__
'1.8.2+cu102'

Paso 3. Instale MMEngine y MMCV usando MIM .

pip install -U openmim
mim install mmengine
mim install "mmcv>=2.0.0rc1"
注意:在 MMCV-v2.x 中,mmcv-full重命名为mmcv,如果你想安装mmcv没有 CUDA ops,你可以使用安装精简版。mim install "mmcv-lite>=2.0.0rc1"

Paso 4. Instalar MMDetection

#从源码安装:
git clone https://github.com/open-mmlab/mmdetection.git -b 3.x
# "-b 3.x" means checkout to the `3.x` branch.
cd mmdetection
pip install -v -e .
# "-v" means verbose, or more output
# "-e" means installing a project in editable mode,
# thus any local modifications made to the code will take effect without reinstallation.

Paso 5. Verificar la instalación

Paso 1. Necesitamos descargar archivos de configuración y archivos de punto de control

mim download mmdet --config yolov3_mobilenetv2_8xb24-320-300e_coco --dest .

Paso 2. Verificar la demostración del razonamiento

python demo/image_demo.py demo/demo.jpg yolov3_mobilenetv2_8xb24-320-300e_coco.py yolov3_mobilenetv2_320_300e_coco_20210719_215349-d18dff72.pth --device cpu --out-file result.jpg

Supongo que te gusta

Origin blog.csdn.net/qq_41627642/article/details/128917298
Recomendado
Clasificación