Aprendizaje de las notas de papel: Aprendizaje eficiente de imágenes RGBD utilizando una nueva representación de rectángulos

7d

La configuración completa de la pinza en 7 dimensiones: su ubicación 3D, orientación 3D y el ancho de la abertura de la pinza.

Método

Un algoritmo de aprendizaje de dos pasos para aprender eficientemente esta representación.

Describe una cierta clase de características que agilizan la inferencia en el algoritmo de aprendizaje.

describimos ciertas funciones avanzadas que son significativamente más precisas pero que requieren más tiempo para calcularlas. Cada paso se aprende utilizando el algoritmo de clasificación SVM.

Representación

Inserte la descripción de la imagen aquí
Rectángulo de
líneas azules: donde se colocarán las dos mordazas de la pinza para agarrar
las líneas rojas: el ancho de apertura de la pinza y la dirección de cierre
Rectángulo 2D \ (G (r_G, c_G, n_G, m_G, θ_G) \):

la esquina superior izquierda del rectángulo;
las dimensiones del rectángulo;
el ángulo entre el primer borde y el eje x
la normal al plano de la imagen indica una buena dirección para acercarse.

Algoritmo

Inserte la descripción de la imagen aquí