L’entreprise a dévoilé les résultats issus de sa nouvelle intelligence artificielle, capable d’isoler une seule voix alors même qu’il y a beaucoup de bruit ambiant.
Lors d’une soirée, il est relativement facile pour un être humain d’écouter une seule voix et de se concentrer uniquement sur celle-ci lors d’une conversation. Cependant, la chose n’est pas aussi aisée lorsqu’il s’agit d’une machine ou d’un micro. Dans le même cadre, un assistant vocal aura beaucoup de mal à se concentrer sur une unique requête et à répondre à la requête.
Néanmoins, Google a travaillé sur une intelligence artificielle capable d’isoler une seule voix, même si plusieurs personnes parlent en même temps et qu’il y a du bruit ambiant. Et autant dire que les résultats sont assez surprenants. Grâce à un système basé sur le deep learning, l’intelligence artificielle de la compagnie est donc capable de se focaliser sur une unique voix. Pour se faire, l’équipe de Google a formé un modèle de réseau neuronal qui reconnaît les personnes en train de parler et qui crée des extraits virtuels. Pour créer ces situations, les chercheurs ont mis en place des fausses soirées, comme des cocktails dînatoires, composés de plusieurs voix et de bruit de fond. Cela a permis d’enseigner à l’intelligence artificielle à isoler les voix multiples en différentes pistes audio. Comme le montre la vidéo, l’IA est désormais capable de générer une piste audio propre à la personne en train de parler.
L’entreprise a annoncé qu’elle explorait actuellement « les possibilités » d’application de cette nouvelle intelligence artificielle. L’outil pourrait par exemple servir à isoler des voix lors d’une conversation Hangouts tenu dans un open-space ou un lieu public.
Néanmoins, ce système peut aussi avoir une contrepartie légèrement plus effrayante en fonction de son domaine d’application. À long terme, un tel système pourrait permettre d’isoler une seule voix parmi une foule qui marche dans la rue par exemple.
Ajouter un commentaire