Método de aprendizaje profundo para gestionar quadrotores y robots móviles

Método de aprendizaje profundo para gestionar quadrotores y robots móviles
Método de aprendizaje profundo para administrar quadrotors y robots animados: por ejemplo, Real Time Neural se puede usar para imitar de manera efectiva los efectos de suelo aerodinámicos altamente complejos que ocurren cuando se vuela cerca de objetos. Salzmann et al., crédito

En los últimos años, los informáticos han creado algoritmos cada vez más sofisticados para guiar los movimientos de los agentes robóticos. Estos incluyen estrategias de control predictivo de modelos (MPC) que utilizan un modelo de la dinámica del agente para optimizar su comportamiento de aproximación hacia un objetivo dado mientras se satisface un conjunto de restricciones (por ejemplo, no golpear obstáculos).

Modelar estrategias de control predictivo y tecnologías de redes neuronales artificiales

Real-Time Neural MPC es un marco que integra arquitecturas modelo complejas basadas en redes neuronales artificiales (ANN) en un marco MPC para robots móviles (es decir, quadrotors-drones). Fue desarrollado recientemente por investigadores de la Universidad Técnica de Munich y la Universidad de Zúrich. Esta idea, publicada en IEEE Robotics and Automation Letters, amplía una idea creada previamente por el Grupo de Robótica y Percepción de la Universidad de Zúrich.

Tim Salzmann y Markus Ryll Tech, investigadores del Grupo de Sistemas Aéreos Autónomos de la Universidad Técnica de Múnich, dijeron: “Nos encontramos con el excelente trabajo del Grupo de Robótica y Detección dirigido por Davide Scaramuzza para desarrollar su idea central de tener datos Los componentes controlados (aprendidos) que potencian los algoritmos de control "tradicionales" nos cautivaron de inmediato.

“Después de desarrollar una prueba de concepto para extender su enfoque utilizando procesos gaussianos (GP) a redes neuronales generales (modelos de aprendizaje profundo), presentamos nuestra idea al grupo de robótica y percepción de la Universidad de Zúrich. A partir de ese momento, el trabajo técnico y las pruebas de los dos laboratorios avanzaron juntos y encendieron una nueva asociación”.

Los modelos de aprendizaje profundo y la optimización de MPC en línea se combinan en el nuevo marco propuesto por Salzmann, Ryll et al. Los modelos de expresión de aprendizaje profundo requieren mucho cálculo. Aún así, el marco puede usar hardware especializado (GPU) para representar estos modelos en línea de manera eficiente en tiempo real. Esto permite que sus sistemas predigan en tiempo real el mejor curso de acción para los robots.

Salzmann y Ryll dijeron: “El marco MPC neuronal en tiempo real permite que los dos dominios combinen el control óptimo y el aprendizaje profundo, al tiempo que permite que ambas partes aprovechen sus propios marcos y dispositivos computacionales altamente optimizados. “Por lo tanto, la optimización del control se puede realizar en código C compilado en la CPU, mientras que los cálculos de aprendizaje profundo se pueden realizar en una GPU en PyTorch/Tensorflow. Esto permite que el aprendizaje profundo se utilice en aplicaciones que hasta ahora no eran prácticas, como el control óptimo de un quadrotor a bordo”.

Los investigadores evalúan su marco a través de una serie de simulaciones y pruebas de campo. En estos estudios, se utiliza especialmente para controlar los movimientos de un quadrotor de gran movilidad en tiempo real.

La capacidad de utilizar topologías de redes neuronales con una capacidad paramétrica 4.000 veces mayor que las utilizadas anteriormente para regular los movimientos de los robots móviles en tiempo real les permitió lograr resultados muy prometedores. También descubrieron que el marco que desarrollaron puede reducir los errores de seguimiento espacial hasta en un 82 % en comparación con los enfoques MPC tradicionales sin un componente de aprendizaje profundo.

Según Salzmann y Ryll, “en robótica, buscamos patrones significativos de la dinámica de los sistemas controlados y su interacción con el entorno (p. ej., efectos aerodinámicos, fricción de los neumáticos, etc.)”. “Aunque a menudo son difíciles de analizar, los métodos basados ​​en el aprendizaje, especialmente los que utilizan redes neuronales, pueden capturar la dinámica y los efectos de interacción. Sin embargo, la precisión del modelo aumenta con el tamaño de la red neuronal. Cuando los modelos de aprendizaje profundo se utilizan en MPC neuronal en tiempo real, el modelo es mucho más poderoso y eficiente en el control predictivo de lo que era posible anteriormente”.

Los chips de GPU se están abriendo paso lentamente en los sistemas integrados, como lo demuestra la plataforma Nvidia Jetson recientemente presentada. Este equipo de investigadores ha desarrollado pronto un marco que permitirá a los diseñadores aprovechar el alto poder predictivo de las técnicas sofisticadas de IA basadas en datos para modelar mejor la dinámica y las interacciones de los robots con el entorno, reduciendo el riesgo de accidentes y mejorando las capacidades de navegación, integrando chips GPU.

Salzmann y Ryll señalaron que hay muchas posibilidades sin explorar para estudios posteriores. “El resultado de los métodos de aprendizaje profundo puede ser impredecible para situaciones no incluidas en los datos de entrenamiento (ODO no distribuido). La robustez en las condiciones de OOD provendrá de la detección de esas condiciones y de la provisión de un respaldo para que el control estabilice el sistema”.

Fuente: techxplore.com/news

Günceleme: 13/03/2023 14:09

Anuncios similares