Accéder au contenu principal

Tribune libre. Recherche vocale : vous allez bientôt parler avec votre téléviseur



Par Philippe Grang, Vice President Sales, Service Providers, Portals and Entertainment, EMEA and APAC chez Rovi


Pendant de nombreuses années, les technologies de recherche vocales efficaces sont restées éloignées des entreprises qui ont tenté de présenter des méthodes de saisie de nouvelle génération aux consommateurs. Confinées à la navigation de base sur le principe de « mots magiques », les commandes vocales ont été inefficaces et souvent difficiles à utiliser pour les consommateurs. La très large adoption des smartphones et tablettes a conduit à renouveler l'intérêt pour ce genre de technologie et l'assistant virtuel d'Apple, Siri, va au-delà des fonctions de base de navigation dans les menus. Le marché semble maintenant en mesure d'accueillir positivement une nouvelle génération de fonctions vocales, appelée par certains interface langagière, conçue pour simplifier un certain nombre d'interactions des consommateurs avec les systèmes et appareils, et surtout de permettre aux gens d'établir une véritable conversation avec leurs appareils comme ils le feraient entre eux.


Un des premiers domaines d'application des interfaces langagières est la télévision. Du fait du volume énorme de sources de divertissement et de programmation maintenant accessible dans les salons, les entreprises s'intéressent aux interfaces vocales ou langagières afin d’essayer de répondre au problème : comment aider le consommateur à trouver un programme intéressant à regarder à la télévision.

Parler la langue du spectateur

La vidéo est un support difficile pour la recherche, et les gens s'intéressent au contenu vidéo de façon particulière, en associant des choix personnels, des critères de distribution, d'intrigue et de genre, tous dépendant des préférences de l'utilisateur. Pour les interfaces langagières, qui doivent simuler les qualités de communication du langage naturel et éliminer la contrainte de conformité aux structures hiérarchiques des menus, la technologie doit comprendre quand un utilisateur souhaite avoir plus d’information sur un genre particulier ou quand il a changé d'avis et qu’il est passé à complètement autre chose dans sa tête.


Pour réussir, les interfaces langagières doivent intégrer différentes capacités très variées, chacune indispensable à leur succès :

  • Levée d'ambiguïté : la technologie de langage naturel doit réussir à comprendre et interpréter les intentions de l'utilisateur. Par exemple, l'interprétation phonétique de « Crouse » pourrait désigner aussi bien Tom Cruise que Penelope Cruz, et le système devrait être capable de comprendre ce que l'utilisateur recherche en fonction de la demande d'origine. « City » peut s'appliquer aussi bien à Manchester City que Norwich City dans un contexte sportif, donc ici encore le système doit apprendre à connaître les préférences de l'utilisateur.
  • Maintien d'état : pendant un dialogue avec un utilisateur, le système devrait être en mesure de conserver un contexte et de comprendre que les gens peuvent sauter d'un critère à un autre. L'utilisateur pourrait par exemple affirmer qu'il « verrait bien un polar », avant de sauter à « Bond » puis à « anciens ». Dans l'idéal, le système devrait être en mesure de comprendre ces requêtes et de proposer une série d'anciens films de James Bond au choix du spectateur.
  • Personnalisation : les systèmes langagiers doivent comprendre leurs utilisateurs individuellement. Le système devrait par exemple apprendre qu'un utilisateur basé à Manchester qui demande « à quelle heure est le match » souhaite avoir des informations sur son équipe locale et que s'il demande « à quelle heure est le match de City » il fait référence à Manchester City.


Faire passer la compréhension au niveau supérieur

Derrière les interfaces langagières réussies se trouve une excellente fonction de recherche. Les prestataires de recherche ont défriché la voie pour intégrer les nouvelles technologies de façon à mieux satisfaire leurs clients. En 2012, Google a présenté son « Graphe du savoir » qui a été conçu pour comprendre les mots clés avec une profondeur jamais atteinte et en faire plus des relations que des termes séparés. En 2013, Facebook a présenté sa « Recherche dans le graphe », qui explore les résultats à partir des amis, du contenu et des relations de la personne qui lance la recherche, ainsi que de tendances plus larges sur le site. Ces technologies ont apporté des résultats de recherche de haute qualité très pertinents aux consommateurs dans le monde entier et ont établi de nouvelles références dans divers domaines.

Dans le contexte de la télévision, la plupart des consommateurs ont des habitudes télévisuelles qui peuvent être cartographiées pour fournir des résultats de recherche extrêmement personnalisés. C'est plus précis que la création d'un profil par utilisateur ou des évaluations « pouce levé/baissé » qui sont à la fois sensibles aux erreurs et ne prennent pas automatiquement en compte l'évolution des goûts et des préférences au cours du temps des utilisateurs. La capacité à rendre la personnalisation précise et extrêmement pertinente – ce qu'on appelle maintenant dans le domaine hyperpersonnalisation – est corrélée aux capacités sémantiques du graphe des connaissances.

À la base, un moteur de recherche langagière de qualité pour les loisirs devrait couvrir les fonctions suivantes :

  • Graphe des connaissances : Il permet de mettre en correspondance les résultats de recherche avec l'intention et non pas simplement avec des mots clés et des termes de recherche.
  1. Un graphe des connaissances devrait rechercher des entités par leur nom dans les supports multimédias, les loisirs et la géographie
  2. Des algorithmes d'extraction, de déduplication et de levée d'ambiguïté des entités entre différentes sources
  3. Des capacités de codage pour bâtir des relations entre entités.


  • Graphe de contenu : Il intègre les éléments de contenu eux-mêmes pouvant être consommés par les utilisateurs, qu'il s'agisse de films, de programmes ou de manifestations sportives. Le graphe de contenu fait correspondre ces éléments au graphe des connaissances, et un même graphe de connaissances peut correspondre à plusieurs graphes de contenu


  • Graphe personnel : Élément crucial des systèmes vraiment langagiers, le graphe personnel optimise le système langagier en fonction de chaque personne pour simuler des conversations naturelles. Le graphe personnel est :


  1. Basé sur un apprentissage automatique statistique
  2. Capable d'apprendre les modèles comportementaux et intérêts de chaque personne
  3. Capable d'apprendre l'influence du temps et de l'appareil sur les recommandations


Pour l'interface extérieure du système, le moteur de requêtes langagier doit relier tous ces éléments. Ceci fait appel à des algorithmes clés de mise en correspondance et d'apprentissage de fonctions linguistiques pour fournir des fonctions et des API de découverte de contenu aux consommateurs.

Recherche et recommandation intuitives

La technologie de langage naturel appuyée sur des graphes de connaissances peut offrir une révolution dans les interfaces langagières, la recherche et la recommandation de programmes TV. En l'associant à d'excellentes métadonnées couvrant les acteurs et actrices, les synopsis de contenu et même des citations célèbres des films, les opérateurs de chaîne peuvent créer un cerveau de loisirs sans équivalent permettant d'offrir à leurs consommateurs un accès rapide et précis à leurs émissions favorites, et à des contenus similaires qu'ils pourraient aussi apprécier. La recherche langagière autour de graphes de connaissances n'est pas un gadget – elle est destinée à changer le mode d'interaction des gens avec leur téléviseur.

Posts les plus consultés de ce blog

Le bipeur des années 80 plus efficace que le smartphone ?

Par André Spicer, professeur en comportement organisationnel à la Cass Business School (City University of London) : Vous vous souvenez des bipeurs ? Ces appareils étaient utilisés largement avant l'arrivée massive des téléphones portables et des SMS. Si vous aviez un bipeur, vous pouviez recevoir des messages simples, mais vous ne pouviez pas répondre. Un des rares endroits où on peut encore en trouver aujourd’hui sont les hôpitaux. Le Service National de Santé au Royaume-Uni (National Health Service) en utilise plus de 130 000. Cela représente environ 10 % du nombre total de bipeurs présents dans le monde. Une récente enquête menée au sein des hôpitaux américains a révélé que malgré la disponibilité de nombreuses solutions de rechange, les bipeurs demeurent le moyen de communication le plus couramment utilisée par les médecins américains. La fin du bipeur dans les hôpitaux britanniques ? Néanmoins, les jours du bipeur dans les hôpitaux britanniques pourraient être compté

Univers parallèles et mondes virtuels : la guerre des métavers est commencée

  Une partie de poker dans le métavers (capture d'écran de la vidéo “Le métavers et comment nous allons le construire ensemble” sur YouTube) Par  Oihab Allal-Chérif , Neoma Business School Le 17 octobre 2021, Mark Zuckerberg a lancé les hostilités de manière assez théâtrale, comme s’il défiait ses concurrents d’en faire autant. Afin de concrétiser son rêve d’enfant, le métavers, il a décidé de mettre en œuvre des moyens colossaux : 10 000 ingénieurs hautement qualifiés seront recrutés en Europe dans les 5 prochaines années. Cette annonce a été faite quelques jours avant celle du changement de nom du groupe Facebook en Meta , le 28 octobre, démontrant ainsi l’engagement total du fournisseur de réseaux sociaux dans la transition vers le métavers. Le 22 juillet 2021, dans une interview à The Verge , le créateur de Facebook racontait : « Je pense à certains de ces trucs depuis le collège quand je commençais tout juste à coder. […] J’écrivais du code

Sans Sauvegarde, pas de cyber-résilience

Par Alexandra Lemarigny, directrice commercial Europe du Sud Opentext Security Solutions Les études diverses sur les habitudes de sauvegarde des entreprises et leurs collaborateurs sont sans équivoque : très majoritairement, elles ne s’attardent vraiment sur ces questions de sauvegarde ou de récupération qu’en cas d’incidents. Pourtant la sauvegarde est l’élément majeur des dispositifs de cyber-résilience, à savoir la capacité à rester opérationnel, même face aux cyberattaques et à la perte de données. La sauvegarde n’est pas suffisamment considérée Dans les faits, force est de constater que la sauvegarde n’est pas envisagée dans son entièreté par les entreprises qui n’ont pas eu à subir d’accidents et il est fréquent qu’elles ne sauvegardent pas les éléments les plus pertinents. A titre d’exemples une entreprise peut ne sauvegarder qu’un ou deux serveurs, ou un élément qu’elle a identifié comme critique quelques années auparavant. Certaines ne tiennent pas compte de l’évolution de leu

Implants cérébraux : la délicate question de la responsabilité juridique des interfaces homme-machine

Dans le film Transcendance , de Wally Pfister, sorti en 2014, le héros mourant transfère son esprit dans un ordinateur quantique. Wally Pfister, 2014 Par  Elise Roumeau , Université Clermont Auvergne (UCA) Depuis quelques années, Elon Musk ne cesse de faire des annonces relatives à des avancées technologiques. Voitures autonomes , voyages interplanétaires , interface homme-machine , achat du réseau social Twitter… rien ne semble arrêter l’homme d’affaires. Aucun obstacle technique, géographique, physiologique ne lui semble infranchissable. Pourtant, ses projets pourraient, à court terme, poser de véritables difficultés du point de vue juridique. La recherche d’une fusion entre le cerveau et l’intelligence artificielle Avec Neuralink, l’un des objectifs visés par Elon Musk est de créer une interface entre l’humain et la machine . À plus ou moins court terme, le projet porte sur le développement d’implants cérébraux pour pallier des troubles neur

Sondage : quatre Français sur dix craignent le vol d'identité

Selon un sondage représentatif commandé par le fournisseur de messagerie GMX , de nombreux internautes français sont préoccupés (31%), voire très inquiets (9%), d'être victimes d'un vol d'identité. La majorité craint que des inconnus puissent faire des achats (52%) avec leur argent. Dans le cas d'une usurpation d'identité, les criminels accèdent aux comptes en ligne et agissent au nom de leurs victimes. De nombreuses personnes interrogées craignent que des inconnus signent des contrats en leur nom (37 %), que des escrocs utilisent l'identité volée pour ouvrir de nouveaux comptes (36 %) et que des informations les plus privées tombent entre des mains étrangères ou soient rendues publiques (28 %). Besoin de rattrapage en matière de sécurité des mots de passe Il est urgent de rattraper le retard en matière d'utilisation de mots de passe sûrs selon GMX : 34 % des utilisateurs d'Internet en France utilisent dans leurs mots de passe des informations personnell

Sources d’information et orientation politique : ce que nous apprend Twitter

  Par  Laura Hernandez , CY Cergy Paris Université et Rémi Perrier , CY Cergy Paris Université Plusieurs études du discours médiatique ont mis en lumière, par des analyses quantitatives et qualitatives, des soutiens à peine voilés de certains médias envers certains courants politiques . Et si l’on inversait la question ? Bien qu’on ait tendance à considérer, par exemple, qu’un lecteur régulier du Figaro s’oriente politiquement à droite, peut-on établir des corrélations à grande échelle entre choix de sources d’information et orientation politique ? Des études basées sur des enquêtes d’opinion ont montré notamment la part grandissante des réseaux sociaux dans la diffusion de l’information et le rôle qu’ils jouent dans la formation de l’opinion publique depuis une décennie, à l’image des évolutions observées lors de deux dernières élections aux États-Unis (voir ici et ici ). Les médias traditionnels ont intégré cette donnée et utilisent les réseaux sociaux en se faisant l’écho