La reconnaissance vocale et la synthèse vocale | Primaire

Fiche | Sciences et technologies

Dans cette fiche, tu en apprendras davantage sur la reconnaissance vocale et la synthèse vocale, sur le rôle de l’IA dans ces technologies et sur la façon dont elles peuvent t’aider dans tes apprentissages.

La reconnaissance vocale et la synthèse vocale sont deux technologies qui te permettent de communiquer avec les ordinateurs et les appareils électroniques.

  • La reconnaissance vocale permet de transformer une voix humaine en un texte écrit.
  • La synthèse vocale permet de transformer un texte écrit en une voix artificielle.
Une jeune fille utilise la fonctionnalité de reconnaissance vocale sur son cellulaire. Un jeune garçon utilise la fonctionnalité de synthèse vocale sur son ordinateur.
Exemples

Voici des situations dans lesquelles nous pouvons utiliser ces deux technologies.

On peut retrouver des fonctionnalités de reconnaissance vocale dans les applications de rédaction et de prise de notes, dans les moteurs de recherche et les assistants virtuels ainsi que dans les vidéos qui offrent la génération de sous-titres automatiques. On peut retrouver des fonctionnalités de synthèse vocale dans les lecteurs d’écran et de pages web, dans les applications de navigation GPS, dans les jeux vidéos et dans les menus téléphoniques.

Quel est le rôle de l’IA dans ces technologies?

La plupart des technologies de reconnaissance vocale et de synthèse vocale utilisent l’intelligence artificielle (IA). Voici comment ça fonctionne.

Le fonctionnement de la reconnaissance vocale

  1. Une très grande quantité de données de texte et de voix humaines libres de droits sont récoltées.
  2. L’IA utilise les données pour s’entrainer à associer les sons à du texte écrit.
    Par exemple, l’IA apprend que le son « ch » dans le mot schéma et dans le mot changement ne s’écrit pas de la même façon. Plus l’IA a de données pour s’entrainer, plus elle devient précise.
  3. Une fois entrainée, l’IA suit un ensemble de règles qui lui permettent de faire des prédictions. C’est ce qu’on appelle des algorithmes.
  4. Quand tu utilises la reconnaissance vocale, elle capte ta voix, elle la traite grâce à des algorithmes, puis elle prédit le texte à écrire.
Un schéma du fonctionnement de la reconnaissance vocale intégrée à un moteur de recherche.

Le fonctionnement de la synthèse vocale

  1. Une très grande quantité de données de texte et de voix humaines libres de droits sont récoltées.
  2. L’IA utilise les données pour s’entrainer à associer le texte écrit à des sons.
    Par exemple, l’IA apprend que lorsqu’il y a une virgule, la voix artificielle doit faire une pause.
  3. Une fois entrainée, l’IA suit des algorithmes.
  4. Quand tu utilises la synthèse vocale, elle analyse le texte écrit à l’aide des algorithmes, puis elle prédit les sons à produire par la voix artificielle.
Un schéma du fonctionnement de la synthèse vocale intégrée à une page web.

Quelques questions en rafale

Quelles voix sont utilisées pour entrainer l’IA?

Quels outils d’Alloprof offrent la synthèse vocale?

Comment ces technologies peuvent t’aider?

La reconnaissance vocale et la synthèse vocale sont pratiques pour tout le monde. Elles sont aussi d’une grande aide pour les gens qui ont de la difficulté à écrire et à lire, et ce, pour toutes sortes de raisons. En voici quelques-unes.

  • Les troubles de la vue
    Ex. Une personne aveugle ou malvoyante peut utiliser la synthèse vocale pour écouter le contenu d’une page web.
  • Les troubles auditifs
    Ex.  Une personne sourde ou malentendante peut lire les sous-titres générés automatiquement dans une vidéo.
  • Les handicaps moteurs temporaires ou permanents
    Ex. Une personne blessée à la main peut rédiger un texte grâce à la reconnaissance vocale.
  • L’apprentissage d’une nouvelle langue
    Ex. Deux personnes ne parlant pas la même langue peuvent communiquer grâce à des applications de traduction qui comprennent de la reconnaissance vocale et de la synthèse vocale.
  • Les troubles d’apprentissage (ex. dyslexie, dysorthographie, dyspraxie)
    Ex. Grâce à la synthèse vocale, une personne peut écouter les mots au fur et à mesure qu’elle écrit. Ceci permet de faciliter la correction de certaines erreurs.
Des élèves du primaire en classe. L’une des élèves a un ordinateur portable sur son pupitre.
Source : SeventyFour, Shutterstock.com

À l’école, des outils technologiques peuvent te permettre de réaliser et de démontrer tes apprentissages en réduisant les obstacles liés à une condition personnelle comme un trouble d’apprentissage.

Les logiciels utilisés à l’école les plus communs sont WordQ et Lexibar. WordQ comprend la reconnaissance vocale et la synthèse vocale. Lexibar comprend la synthèse vocale. Ces outils n’empêchent pas que tu doives prendre des décisions basées sur tes apprentissages, mais ils aident, entre autres, à :

  • augmenter la quantité de mots écrits;
  • décoder les mots;
  • écouter un texte à une vitesse qui permet de bien en comprendre le sens.

Ces outils utilisent aussi d’autres technologies d’IA pour :

  • prédire les prochains mots d’une phrase;
  • trouver les erreurs d’orthographe.
     

Références