MSR theme: Reinforcement Learning Research

Retour au Laboratoire de recherche Microsoft – Montréal

ML robuste, adaptatif et modulaire | Montréal

Notre objectif est de comprendre les principes qui sous-tendent l'apprentissage et la généralisation, afin de créer des systèmes d'IA fiables capables d'apprendre plus efficacement à partir des données disponibles, de collecter intelligemment des données pertinentes supplémentaires, et de s'adapter et de raisonner rapidement sur des scénarios inhabituels lorsqu'ils sont déployés dans la nature.

Les systèmes d’IA déployés dans la nature sont souvent exposés à un flux d’exemples et de scénarios nouveaux qui peuvent différer considérablement de ceux observés lors de la formation. Il est important qu’un modèle donne le plus de sens à ces situations pour apporter des réponses robustes dans ces nouveaux contextes.

Voici quelques-unes des pistes de recherche explorées sous ce thème :

Quantification de l’incertitude et raisonnement dans des conditions incertaines, par exemple dans un contexte d’apprentissage par renforcement hors ligne
Décomposition et réutilisation du modèle, où un modèle représente une combinaison de modules plus petits, chacun pouvant être réutilisé pour une tâche différente, ce qui facilite le transfert de connaissances
Apprentissage de représentations factorisées et causales pour les images, le texte et les données médicales
Exemples de méthodes d’optimisation efficaces pour une adaptation rapide
Définition d’exemples pertinents pour le transfert de tâches et l’augmentation de la résistance aux fausses corrélations