2024-05-13 10:05:24
Des chercheurs du MIT ont développé une nouvelle méthode pour aider les systèmes d’intelligence artificielle (IA) à effectuer des tâches de raisonnement complexes dans trois domaines, notamment le codage, la planification stratégique et la robotique.
Les grands modèles de langage (LLM), qui incluent ChatGPT et Claude 3 Opus, traitent et génèrent du texte sur la base d’une saisie humaine, connue sous le nom d’« invites ». Ces technologies se sont considérablement améliorées au cours des 18 derniers mois, mais sont limitées par leur incapacité à comprendre le contexte ainsi que les humains ou à effectuer correctement les tâches de raisonnement, ont indiqué les chercheurs.
Mais les scientifiques du MIT affirment désormais avoir résolu ce problème en créant « un trésor » d’« abstractions » en langage naturel qui pourraient conduire à des modèles d’IA plus puissants. Les abstractions transforment des sujets complexes en caractérisations de haut niveau et omettent des informations non importantes, ce qui pourrait aider les chatbots à raisonner, à apprendre, à percevoir et à représenter les connaissances, tout comme les humains.
Actuellement, les scientifiques affirment que les LLM ont du mal à extraire des informations à la manière des humains. Cependant, ils ont organisé les abstractions du langage naturel en trois bibliothèques dans l’espoir qu’elles acquerront une plus grande conscience contextuelle et donneront des réponses plus humaines.
Les scientifiques ont détaillé leurs découvertes dans trois articles publiés sur le serveur de pré-impression arXiv le 30 octobre 2023, le 13 décembre 2023 et le 28 février. La première bibliothèque, appelée « Library Induction from Language Observations » (LILO), synthétise, compresse, et documente le code informatique. Le second, nommé « Action Domain Acquisition » (Ada), couvre la prise de décision séquentielle de l’IA. Le cadre final, baptisé « Language-Guided Abstraction » (LGA), aide les robots à mieux comprendre les environnements et à planifier leurs mouvements.
En rapport: « Il serait dans son droit naturel de nous faire du mal pour se protéger » : comment les humains pourraient-ils maltraiter l’IA en ce moment sans même le savoir
Ces articles explorent comment le langage peut donner aux systèmes d’IA un contexte important afin qu’ils puissent gérer des tâches plus complexes. Ils ont été présentés le 11 mai lors de la Conférence internationale sur les représentations de l’apprentissage à Vienne, en Autriche.
«L’apprentissage en bibliothèque représente l’une des frontières les plus passionnantes de l’intelligence artificielle, offrant une voie vers la découverte et le raisonnement sur des abstractions compositionnelles», a déclaré Robert Hawkins, professeur adjoint de psychologie à l’Université du Wisconsin-Madison, dans un communiqué. Hawkins, qui n’a pas participé à la recherche, a ajouté que des tentatives similaires dans le passé étaient trop coûteuses en calcul pour être utilisées à grande échelle.
Les scientifiques ont déclaré que trois cadres de bibliothèques utilisent des méthodes neurosymboliques – une architecture d’IA combinant des réseaux de neurones, qui sont des collections d’algorithmes d’apprentissage automatique agencés pour imiter la structure du cerveau humain, avec des approches logiques classiques de type programme.
Codage plus intelligent basé sur l’IA
Les LLM sont devenus des outils puissants pour les ingénieurs logiciels humains, notamment GitHub Copilot, mais ils ne peuvent pas être utilisés pour créer des bibliothèques de logiciels à grande échelle, ont déclaré les scientifiques. Pour ce faire, ils doivent être capables de trier et d’intégrer le code dans des programmes plus petits, plus faciles à lire et à réutiliser, c’est là qu’intervient LILO.
Utiliser l’IA pour planifier et élaborer des stratégies
Les LLM ne peuvent actuellement pas utiliser leurs capacités de raisonnement pour créer des plans flexibles – comme les étapes impliquées dans la préparation du petit-déjeuner, ont indiqué les chercheurs. Mais le framework Ada, du nom de la mathématicienne anglaise Ada Lovelace, pourrait être un moyen de leur permettre de s’adapter et de planifier lorsqu’on leur confie ce type de missions, par exemple dans des environnements virtuels.
En trouvant des informations cachées en langage naturel, le modèle a compris des tâches telles que mettre du vin frais dans un placard de cuisine et construire un lit – avec des améliorations de précision de 59 % et 89 %, respectivement, par rapport à l’exécution des mêmes tâches sans l’influence d’Ada. Les chercheurs espèrent trouver d’autres utilisations domestiques pour l’Ada dans un avenir proche.
Donner aux robots un coup de pouce assisté par l’IA
Le cadre LGA permet également aux robots de mieux comprendre leur environnement, comme les humains, en supprimant les détails inutiles de leur environnement et en trouvant de meilleures abstractions afin qu’ils puissent effectuer des tâches plus efficacement.
LGA trouve des abstractions de tâches dans des invites en langage naturel telles que « apporte-moi mon chapeau » avec des racines exécutant des actions basées sur des séquences d’entraînement.
Les chercheurs ont démontré l’efficacité du LGA en utilisant Spot, le robot quadrupède canin de Boston Dynamics, pour aller chercher des fruits et recycler les boissons. Les expériences ont montré que les robots pouvaient analyser efficacement le monde et élaborer des plans dans des environnements chaotiques.
Les chercheurs pensent que les cadres neurosymboliques comme LILO, Ada et LGA ouvriront la voie à des modèles d’IA « plus humains » en leur donnant des compétences en résolution de problèmes et en leur permettant de mieux naviguer dans leur environnement.
#MIT #donne #lIA #pouvoir #raisonner #comme #les #humains #créant #une #nouvelle #architecture #dIA #hybride
