[Preguntar a GPT] ¿Por qué la dirección del eje y del cuadro de etiquetas de estos conjuntos de datos de voc es hacia abajo?

Esto se debe a que, en el campo de la visión por computadora, el sistema de coordenadas generalmente utilizado se basa en la esquina superior izquierda de la imagen como el origen (0,0), la dirección derecha es la dirección positiva del eje x y la dirección hacia abajo. dirección es la dirección positiva del eje y, que es similar al cartesiano en matemáticas, el sistema de coordenadas es diferente. La definición de este sistema de coordenadas está determinada por la forma en que se representan los datos de la imagen.

En los formatos de imagen comunes (como JPEG, PNG), los valores de los píxeles se almacenan de izquierda a derecha y de arriba a abajo, es decir, el orden de almacenamiento de los valores de los píxeles es de izquierda a derecha y de arriba a abajo, por lo que cuando el análisis de datos de imagen también se maneja de esta manera. Por lo tanto, en la visión por computadora, la esquina superior izquierda de la imagen generalmente se usa como el origen del sistema de coordenadas, la dirección positiva del eje x es hacia la derecha y la dirección positiva del eje y es hacia abajo para encontrar las necesidades de los algoritmos comunes de procesamiento de imágenes.

Supongo que te gusta

Origin blog.csdn.net/crazyjinks/article/details/130411420
Recomendado
Clasificación