Tecnología

El método de estimación de pose 6D mejorado promete un mejor manejo de objetos robóticos

Crédito: Dominio público de Pixabay/CC0

El trabajo reciente en la estimación de pose de objetos 6D tiene una promesa significativa para avanzar en la robótica, la realidad aumentada (AR), la realidad virtual (VR), así como la navegación autónoma. La investigación, publicada en el International Journal of Computational Science and Engineering, presenta un método que mejora la precisión, la generalización y la eficiencia de determinar la rotación y la traducción de un objeto de una sola imagen. Esto podría mejorar significativamente la capacidad de los robots para interactuar con los objetos, especialmente en entornos dinámicos u obstruidos.

En robótica, la estimación de pose de objetos 6D se refiere a determinar la orientación (rotación) y la posición (traducción) de un objeto en el espacio tridimensional. “6d” describe seis grados de libertad: tres para la traducción (ejes x, y, z) y tres para rotación (alrededor de esos ejes). La estimación de pose precisa es crítica para los sistemas autónomos, incluidos los robots y los sistemas AR/VR.

Los desafíos surgen debido a las variaciones en formas de objetos, puntos de vista y demandas computacionales. Los métodos actuales se basan en técnicas de aprendizaje profundo que utilizan grandes conjuntos de datos de objetos vistos desde varios ángulos. Estos modelos luchan con objetos invisibles o aquellos con formas diferentes de los datos de entrenamiento.

La nueva técnica discutida por Zhizhong Chen, Zhihang Wang, Xue Hui Xing y Tao Kuai del Instituto del Noroeste de Ingeniería Mecánica y Eléctrica en la ciudad de Xianyang, China, aborda los diversos desafíos al incorporar características invariantes de rotación en un sistema de inteligencia artificial conocido como una red convolucional 3D.

Esto permite que el sistema procese la nube de puntos 3D de un objeto, independientemente de su orientación, lo que lleva a predicciones de pose más precisas incluso cuando el objeto se gira o se ve desde ángulos desconocidos. La red utiliza un conjunto consistente de coordenadas, conocidas como coordenadas canónicas, que representan el objeto en un marco de referencia no afectado por la rotación. Esta innovación mejora la capacidad del sistema para generalizar a nuevas poses, superando una limitación de los métodos convencionales.

El nuevo enfoque no solo es más preciso, es más eficiente y, por lo tanto, necesita menos datos de capacitación y menos potencia de computadora, lo que lo hace más adecuado para aplicaciones en tiempo real y en tiempo real.

Más información: Zhizhong Chen et al, redes neuronales convolucionales 3D invariantes para rotación para estimación de pose de objetos 6D, International Journal of Computational Science and Engineering (2025). Doi: 10.1504/ijcse.2025.145133

Cita: Método mejorado de estimación de 6d Pose promete un mejor manejo de objetos robóticos (2025, 27 de marzo) Recuperado el 27 de marzo de 2025 de https://techxplore.com/news/2025-03-6d-pose-method-robotic.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Back to top button