<aside> 👨🏻 Auteur : Arnaud Ramponneau

</aside>

<aside> 📖 Publié le 17 février 2024 • 1838 mots

</aside>

Ce qui fascine avec Internet en tant que technologie, c’est qu’il a absorbé les anciens médias pour les démocratiser, et qu’il s’est offert à tous comme un nouveau moyen d’expression. Internet a révolutionné la presse, la radio et la télévision en permettant aux internautes d’en être les producteurs directs, libres d’éditer et de diffuser leurs propres contenus. Désormais, la télévision offre une expérience de visionnage, la radio se transforme en écoute et le journal évolue au format blog. Les informations en ligne sont accessibles en flux continu, marquant la transition d’une consommation linéaire des médias à un accès instantané et à la demande à des fichiers numériques.

Avec ce l'on nomme de façon réductrice intelligence artificielle (IA), un saut technologique similaire est en cours : tout le contenu du web est aspiré par les technologies d’IA. Nous parlons ici de dizaines de milliards de pages web et documents qui deviennent la matière première dont se nourrissent les modèles d’intelligence artificielle. Les services, les connaissances et les données du web sont exponentiellement absorbés, ce qui positionne les agents IA comme le pivot central des interactions homme-machine. Les assistants intelligents, les agents conversationnels et les avatars virtuels vont redéfinir notre consommation informationnelle et les usages que nous en faisons.

Pour autant, les limites en termes d’ergonomie et de service bloquent encore l’adoption à grande échelle des assistants intelligents tels que ChatGPT d’OpenAI, Copilot de Microsoft ou Gemini de Google. Le fonctionnement de ces outils est conversationnel, autrement dit les interactions entre le système et l’utilisateur sont bidirectionnelles. Elle s’opère via des commandes que l’utilisateur doit formuler à la machine. Sous forme de requête, écrite ou orale, depuis une interface qui fait penser à une messagerie instantanée, il faut formuler une intention bien précise en échange d’un résultat. Et cela n’est pas si naturel à prendre en main, malgré les arguments commerciaux des services IA dits révolutionnaires. Voyons tout de même ce qui remodèle déjà le futur des services numériques.

Brève histoire des interfaces informatiques

Au fil du temps, l'évolution des interfaces informatiques a connu cinq générations :

Actuellement, l’expérience de navigation via des sites et des pages web, depuis des interfaces utilisateurs graphiques et dynamiques sur ordinateurs, téléphones et tablettes, reste la norme pratique. Un navigateur est notre fenêtre sur le monde facilitant l’accès à toute la richesse de l’information et des contenus en ligne. En ce qui concerne les assistants intelligents, un espace de texte limité à des phrases et des instructions est très différent à prendre en main. Pour un utilisateur lambda, écrire une instruction à une machine qui donne l’impression de dialoguer avec un robot se situant de l’autre côté de l’écran, reste inadapté.

Une évolution des assistants vers des interfaces génératives

Trop régulièrement, les utilisateurs rencontrent des difficultés lorsque la réponse générée par un agent IA ne satisfait pas leurs attentes. La réponse est soit trop vague, soit formulée de façon incorrecte, voire même erronée, ce qui demande à l’utilisateur un travail de relecture et de vérification. En plus de porter atteinte à la fiabilité du service, l’utilisateur passera son chemin pour trouver mieux, et changera tout simplement d’onglet sur son navigateur ou d’application sur son téléphone. Instinctivement, il se tournera vers des outils numériques plus familiers et plus fonctionnels : moteurs de recherche, réseaux sociaux ou sites marchands.

N’oublions pas que l’information visuelle est plus facile à comprendre et plus rapide à manipuler que le texte. Cliquer ou taper sur des composants graphiques est intuitif pour communiquer avec un système informatique. Or, les mots ne remplacent ni les boutons, ni les menus et ni les pages. Tout ne se soustrait pas au verbe. Devoir formuler textuellement ou vocalement est souvent moins efficace pour naviguer en ligne ou piloter une application. Cependant, les agents conversationnels offrent la possibilité de formuler des tâches bien plus complexes et bien fastidieuses à exécuter. On peut donc formuler une intention, c’est- à-dire une action que l’on va faire appuyer par l'assistant.

Personnellement, mon intuition est que les interfaces vont évoluer comme du contenu dynamique, combinant des réponses fonctionnelles avec des éléments graphiques adaptés. Nous entrons dans une ère des interfaces utilisateurs qui se modélisent à la volée et de façon totalement dynamique. Je les appellerais les interfaces génératives, car elles vont se générer entièrement selon le contexte, la demande et le prédictif. Par exemple, lorsqu'on communique avec ChatGPT, nous pourrons lui donner des instructions telles que « fais-moi une synthèse de cet article » et « épingle-la à droite » pour que l’interface se façonne de façon intelligente. Ce sera comme un bureau que l’on programme facilement.