“Ok Google ! Donne-moi un verre d’eau.” Et si cette consigne permet de se faire servir un verre d’eau par un robot ? Alphabet, la maison-mère de Google, a annoncé le 16 août 2022 doter ses robots conçus pour aider les gens dans la vie quotidienne d’une fonctionnalité de compréhension du langage naturel. Concrètement Google rapproche deux de ses projets de recherches les plus ambitieux que sont la robotique, via sa division Everyday Robots, et sa recherche autour du langage naturel. Explications sur un rapprochement plus complexe qu’il n’y paraît.
Communiquer en langage naturel
Souvent, les systèmes robotiques exécutent des commandes très courtes et simples comme “apporte-moi une pomme”. Il est plus facile de faire fonctionner les robots entant des tâches claires rattachées à des récompenses précises. A l’inverse, les robots ont du mal à réaliser des tâches sur le long terme ou imprécises comme une demande d’un repas sain pour aller faire du sport.
Google cherche à aller plus loin en exploitant les modèles de langage dans un environnement donné. Concrètement, l’objectif est de pouvoir communiquer avec le robot, sans lui donner une instruction précise, et que de lui-même il puisse définir la ou les tâches à réaliser selon ce qui lui a été dit, son environnement et ses compétences. Le robot filtre la demande à travers une liste d’actions possibles et opte pour le plus probable. Cette méthode, qui consiste à interpréter les commandes prononcées naturellement, à évaluer les actions possibles et à planifier les étapes pour répondre à la demande, est appelée PaLM-SayCan par Google.
74% des demandes réalisées
Pour l’évaluer, Google positionne des robots dans une cuisine et leur donne des tâches en langage naturel. Par exemple, si quelqu’un dit “j’ai renversé mon verre, peux-tu m’aider ?”, le robot pourra reporter une éponge de la cuisine. De même, l’objectif est que le robot puisse répondre aux demandes du type “Je viens de m’entraîner, s’il te plaît apporte-moi une collation et une boisson pour récupérer.”
Google assure avoir testé un total de 101 instructions pour évaluer la performance des robots et de son modèle PaLM-SayCan. Les robots sont parvenus dans 84 % des cas à planifier les commandes avec succès et à les exécuter 74 % du temps. Mais la liste des instructions n’est pas précisée par Google donc il n’est pas possible de savoir à quel point elles étaient complexes ou non.
Une technologie pas encore au point
C’est une petite avancée en vue de voir des robots débarquer dans les maisons, même s’il reste encore beaucoup de travail à réaliser car les commandes en langage naturel sont infinies et comportent des tâches plus ou moins difficiles à réaliser. Par exemple, si on demande au robot de “nettoyer un verre cassé”, ce dernier doit comprendre s’il doit prendre un balai, l’aspirateur ou les deux. Dans quel ordre. Et savoir où sont rangés ces objets.
Les robots ne répondent pas encore à la commande “Ok Google”, mais il est probable qu’à terme cela soit le cas. Google ambitionne de proposer des robots polyvalents aussi faciles à contrôler que les robots mono-tâche. Pour l’instant, un seul robot domestique pertinent est l’aspirateur autonome de la société Roomba (récemment racheté par Amazon), qui exécute une tâche unique en permanence : nettoyer les sols.