La société Deepmind (rachetée par Google), la même que celle qui a battu le champion du monde du jeu de go, vient de démontrer une fois de plus que l'intelligence artificielle fait des pas de géant.
Aujourd'hui, un programme développé par Deepmind a obtenu de bien meilleurs résultats qu'un expert humain dans le domaine de la lecture labiale (lecture sur les lèvres).
Concrètement, Deepmind a travaillé avec l'université d'Oxford à partir de 5000h de vidéos de la BBC, totalisant environ 118 000 phrases. Cette phase d'apprentissage et le volume de données bien supérieur à celui traité par des systèmes précédents ont largement contribué au succès, le "deep learning" en ayant largement besoin.
Les résultats ont été les suivants : l'expert humain, ayant 10 ans d'expérience en travaillant avec la BBC, a identifié correctement 12,4% des mots, alors que le nouveau système WLAS (Watch, Listen, Attend and Spell) en a déchiffré 46,8% sans erreur. C'est un score nettement supérieur aux systèmes qui existaient jusque-là. Et pourtant, l'humain pouvait regarder les vidéos plusieurs fois, et celles-ci étaient diffusées bien plus lentement que celles analysées par WLAS.
Source : New Scientist
Aujourd'hui, un programme développé par Deepmind a obtenu de bien meilleurs résultats qu'un expert humain dans le domaine de la lecture labiale (lecture sur les lèvres).
Concrètement, Deepmind a travaillé avec l'université d'Oxford à partir de 5000h de vidéos de la BBC, totalisant environ 118 000 phrases. Cette phase d'apprentissage et le volume de données bien supérieur à celui traité par des systèmes précédents ont largement contribué au succès, le "deep learning" en ayant largement besoin.
Les résultats ont été les suivants : l'expert humain, ayant 10 ans d'expérience en travaillant avec la BBC, a identifié correctement 12,4% des mots, alors que le nouveau système WLAS (Watch, Listen, Attend and Spell) en a déchiffré 46,8% sans erreur. C'est un score nettement supérieur aux systèmes qui existaient jusque-là. Et pourtant, l'humain pouvait regarder les vidéos plusieurs fois, et celles-ci étaient diffusées bien plus lentement que celles analysées par WLAS.
Source : New Scientist