Agitateur de Neurones

Assistant vocal : importance de l’architecture technique

Lorsqu’on parle technologies des assistants vocaux, on se limite souvent aux parties logicielles, middleware et cloud. Pourtant, l’architecture technique est un vrai différentiant entre les produits qui arrivent en ce moment sur le marché.

En ce domaine, un acteur bien connu sort actuellement du lot avec des annonces très intéressantes lors du dernier CES. Il s’agit de NXP Semiconductors, avec sa nouvelle famille de processeurs applicatifs, i.MX 8M.

Avec plus de 50% de recherches qui seront faites en mode vocal en 2020, la révolution vocale est déjà là.

Cette nouvelle génération de processeurs est construite autour d’une unité multi-coeurs de quatre ARM Cortex-A53, d’une unité mono-coeur d’un Cortex-M4 et d’une unité GPU avec 4 shaders.

NXP s’est rapproché de Google et d’Amazon pour proposer des reference designs sur leurs technologies d’assistants vocaux. Le nouveau Sonos One est issu de cette collaboration.

Un des avantages de la technologie NXP, c’est qu’elle a été conçue dès l’origine pour pouvoir supporter simultanément plusieurs technologies concurrentes (Google, Amazon Alexa, Apple HomeKit) sur la même puce, entre autre grâce au multi-coeurs. Chaque coeur Cortex-A53 peut exécuter un environnement distinct. De plus, en rajoutant une unité comme le Cortex-M4 sur la puce, il est possible de s’abstenir momentanément du Cloud et d’utiliser le M4, même en mode veille, pour traiter les commandes vocales, comme le wake-word (Hello Alexa !).

Il est même possible d’intégrer des fonctionnalités de type réseaux de neurones pour effectuer de la reconnaissance vocale (basique mais efficace) ou de l’apprentissage uniquement sur la puce, sans passer par le Cloud, ce qui permet d’améliorer la sécurité de l’objet connecté et la gestion des données privées.

Nous avons déjà travaillé sur un des reference designs et avons grandement apprécié la possibilité de faire du traitement en local et du security-by-design.