L’interaction vocale ou l’oubli des techniques

L’interaction vocale ou l’oubli des techniques

Selon une étude du cabinet d’analyse Juniper Research, 2,5 milliards d’assistants vocaux étaient utilisés fin 2018. Ils devraient être 8 milliards d’ici 2023. Le « marché de la voix », tel qu’on le nomme désormais, semble donc promis à un grand avenir. Des enceintes connectées aux smart TV en passant par les objets connectés, nos voix seront de plus en plus sollicitées pour interagir avec les technologies. Certains prédisent même un recul substantiel du tactile au profit du vocal.
Si l’avenir des interactions humain-machine est à la voix, il semble nécessaire de questionner dès maintenant ce phénomène technique et, en particulier, les implications d’une de ses caractéristiques majeures : sa capacité à plonger l’artefact dans une nouvelle forme d’oubli.
J’en propose ici quelques éléments d’analyse débouchant sur deux idées éthico-politiques permettant de contrer les effets potentiellement délétères de l’occultation technique.

L’oubli des techniques

Un oubli par subjectivation

L’oubli est un thème cher à la philosophie des techniques depuis la distinction proposée par Heidegger entre ustensile et outil dans Être et Temps. Le premier désigne les choses qui possèdent ontologiquement la structure du « pour » quelque chose, c’est-à-dire tout ce qui peut servir à quelque-chose. Le second est une catégorie d’ustensile permettant la réalisation d’une œuvre au sens large. Selon Heidegger, l’outil a ceci de particulier qu’il s’illustre en tant que tel par sa capacité à se retirer du champ de notre conscience, à se faire oublier. En effet, lorsque j’utilise un marteau pour planter un clou, mon attention ne se focalise pas tant sur le marteau lui-même que sur la tâche qu’il me permet de réaliser. Ce qu’Heidegger nomme le « mode d’être » habituel de l’outil est donc celui du retrait, de l’oubli. Ce n’est que lorsqu’il se brise ou qu’il tombe en panne que l’outil m’apparaît pleinement comme un objet au sens de ce qui se trouve là, devant moi. A l’inverse, quand tout va bien, l’outil est cet artefact qui disparaît au profit du faire qu’il rend possible.
Les technologies comme les assistants vocaux, que j’appellerai des « vocartefacts », participent également d’un oubli, mais d’un genre nouveau. Tout d’abord, signalons que ces dispositifs ne sont pas des outils au sens heideggérien du terme. L’assistant vocal ne permet pas, comme le marteau, le pinceau ou même l’ordinateur, de réaliser une œuvre à proprement parler. En revanche, il s’agit bien d’un ustensile en ce qu’il reste un objet pourvu d’une structure utilitaire : l’assistant vocal est un artefact que j’utilise pour faire/obtenir quelque chose. La participation de celui-ci à une nouvelle forme d’occultation technique tient justement à son mode singulier d’ustensilité qu’est la subjectivation. Doter un artefact d’une capacité d’interaction verbale, c’est concevoir une interface en empruntant au registre de la subjectivité. Notre environnement technique se peuple petit à petit d’objets apparaissant, à divers degrés, comme des quasi-sujets. Sur ce point, les vocartefacts représentent une évolution potentiellement substantielle de notre rapport aux technologies du quotidien. En effet, ils ne s’activent ni ne produisent plus leurs effets suite à une manipulation au sens propre de « conduire par la main », mais par ce qu’on peut désormais appeler une vocapulation. En d’autres termes, contrairement aux outils et à de très nombreux ustensiles, les interfaces vocales s’affranchissent de « l’instrument des instruments[1] » qu’est la main et consacrent la parole, le logos comme medium d’activation. La techno-logie n’a donc jamais aussi bien porté son nom.
Cette nouvelle forme d’interaction humain-machine (IHM) déplace l’usage et son contexte dans la sphère de la socialité. Pour obtenir quelque-chose de l’objet, il faut lui parler, ce qui est généralement le propre des relations intersubjectives. Cette subjectivation – bien entendu partielle – de l’artefact installe une nouvelle forme d’oubli de la technique liée à l’anthropomorphisme qu’elle génère, c’est-à-dire à la projection d’attributs humains sur la machine. Subjectiver un artefact a donc pour effet de nous le faire apparaître, comme un objet « augmenté » de quelque chose relevant de la volonté, de l’intelligence, de l’émotion ou, plus largement de la conscience. Ainsi, tout se passe comme si l’enjeu de ces technologies étaient d’occulter leur nature en produisant les conditions techniques d’une psychophanie, c’est-à-dire la manifestation de phénomène, en l’occurrence la parole, renvoyant à la subjectivité. Très concrètement, nous expérimentons cette nouvelle forme d’oubli lorsque nous nous demandons s’il convient d’être poli envers son enceintes connectées. La référence à la politesse montre bien l’immixtion du vocartefact dans la sphère sociale et sa normativité. Le rapport que nous entretenons avec lui n’est pas uniquement saisi sous l’angle du fonctionnement ou de l’usage, mais aussi sous celui de l’ethos, de l’attitude que nous devons adopter envers lui. Subjectiver un artefact c’est donc aussi poser la question éthique de son statut et de sa place dans la communauté morale.

Un oubli par « contextuation »

Une seconde forme d’oubli vient se greffer à ce premier phénomène d’occultation : celle générée par le retrait des vocartefacts dans l’arrière-plan de nos vies quotidiennes ou, pour le dire autrement, par leur devenir ambiant. J’appelle ce phénomène la contextuation. Les outils et les ustensiles en général se caractérisent par leur patiente disponibilité : ils se tiennent à disposition, « en attente » d’utilisation. Ainsi, on pourrait dire que ce retrait dans l’arrière-plan est la marque de tout objet inutilisé : quand je suis assis à mon bureau pour écrire ces lignes via mon traitement de texte, le stylo posé sur ma gauche ne m’est pas immédiatement utile, mais il ne s’en tient pas moins disponible en arrière-plan de mon activité du moment. Cela est parfaitement juste, mais, dans les cas des technologies vocales comme les enceintes connectées, disponibilité en toile de fond rime avec disponibilité ambiante en ce que l’activateur qu’est la voix est disponible partout à tout instant « en » nous. La contextuation marque l’affranchissement de l’artefact de l’espace et de la matière solide : celui-ci est comme répandu, sublimé dans l’air qui nous enveloppe en permanence. Mais quelle différence, demandera-t-on, entre le vocartefact et le smartphone, par exemple ? Une différence attentionnelle de taille : alors que le premier se fait oublier en ce qu’il s’intègre au contexte et devient un là permanent, le second, lui, se substitue au contexte et nous pousse à n’avoir d’yeux que pour lui. On peut alors décrire la contextuation comme phénomène où la disponibilité ambiante, à l’instar de l’air qui nous entoure, est une invisible omniprésence. L’oubli par contextuation est donc double : en devenant comme aéroporté, c’est à la fois la « corporéité » de l’objet et sa nature objectale qui est oubliée. Il devient en quelque sorte un « génie », pour reprendre le mot de Nicolas Santolaria[2].

De quoi l’oubli est-il l’émissaire ?

La tentation dataïste

Il est désormais commun de penser la technique comme une infrastructure, un substrat existentiel pour l’humain. Nous sommes en permanence insérés dans divers réseaux qui sous-tendent et participent à la structuration de notre mode de vie. Au quotidien, nous considérons ces réseaux et leurs composantes individuelles comme évidentes, nous n’y pensons pas. A l’instar de l’outil, ce n’est que lorsqu’une panne se présente que nous nous tournons vers ces entités comme vers des objets et que nous réalisons notre dépendance à leur égard. Barjavel a magistralement décrit cette idée dans son célèbre roman Ravage où l’énergie électrique disparaît subitement de la surface du globe.
Subjectivation et contextuation artefactuelle participent d’une plus grande incrustation des techniques dans nos existences. En ce sens, elles se présentent comme une nouvelle modalité du continuum technique dans lequel nous évoluons à chaque instant. Mais de quoi ce continuum est-il l’émissaire ? Un problème dont nous avons tous entendu parler est celui des menaces que les vocartefacts font planer sur notre vie privée. Ces génies ou « fantômes dans la machine » ont, en effet, la capacité de nous écouter. Sur ce point, les entreprises conceptrices affirment que seules les « requêtes » adressées directement à l’artefact sont enregistrées et traitées par des opérateurs humains pour améliorer les algorithmes et l’ « expérience utilisateur ». Ces requêtes seraient, en outre, parfaitement anonymisées. Toutefois, indépendamment de cette question du respect de la vie privée par l’anonymat (que je décrivais ailleurs comme l’arbre cachant la forêt), la vraie question, je pense, est celle de la vision de l’humain et de la société qui se cache derrière les dispositifs capables de récolter des données. On en vient d’ailleurs à se demander si le développement de technologie de services divers n’est pas tout simplement le prétexte à l’ambition plus fondamentale qu’est la récolte des données. Nous ne sommes pas loin du paradoxe de l’œuf et de la poule. Une chose est sûre : la poule est aux œufs d’or.
Le point ne consiste pas, ici, à nier les vertus potentielles de la récolte et de l’analyse des données, mais plutôt de déplorer ce qui apparaît comme son emprise absolue sur l’économie numériques et sur un nombre croissant de dimension de nos existences. A bien des égards, le datavorisme actuel me rappelle l’analyse heideggérienne de la technique moderne. Dans un texte issu d’une conférence et intitulé « La question de la technique[3] », Heidegger propose sa célèbre thèse selon laquelle : « L’essence de la technique n’est absolument rien de technique. » Par cette idée, le philosophe cherche à dégager l’analyse technologique du plan purement pragmatique (qu’il nomme ontique) pour la replacer à échelle ontologique : ce qui compte, pour comprendre la technique moderne, ce ne sont pas les entités individuelles et concrètes qui en émanent, mais la “structure” essentielle qui les rend possibles, c’est-à-dire leur condition de possibilité. Cette condition, Heidegger la nomme “arraisonnement” (gestell). Il s’agit d’une structure a priori de notre perception du monde qui nous pousse à l’interpréter, le « dévoiler » dit Heidegger, uniquement comme un “fonds” dans lequel il est possible de puiser. La technique moderne est donc ce rapport prédateur au monde où l’ensemble de ce qui est, l’étant, dans la terminologie heideggérienne, se présente à nous sur le mode de la ressource. Dans cette optique, ce qui caractérise l’essence de la technique moderne, c’est la commission : chaque chose est commissionnée par l’humain, c’est-à-dire chargée de s’intégrer à un système de production-consommation en tant que ressources permettant à ce système de fonctionner.
N’est-ce pas là ce qu’il se passe avec une partie considérable de l’économie des données ? L’humain n’est-il pas lui-même commissionné, dévoilé comme une ressource disponible ou, plutôt, comme le foyer de ressources infinies que sont les données ? Pour nombre de fabricants et de leur partenaires, l’existence elle-même est une mine dans laquelle il s’agit de prélever indéfiniment pour s’auto-perpétuer. Dans ces conditions, on comprend pourquoi, dans certains cas, le défi ne consiste plus seulement à s’intéresser au fameux « dernier kilomètre » de livraison, mais également à assurer ce qu’on peut appeler le « dernier mètre de captation ». Nombre de fondateurs et dirigeants de géants (ou non, d’ailleurs) du numérique exaltent des valeurs datant d’une époque où les modèles économiques actuels n’avaient pas encore émergé, oubliant que si la fin justifie les moyens, les moyens, en retour, co-constiuent les fins. A l’idéal émancipateur des origines, s’est substitué un individualisme contrôlé. C’est là, peut-être, la partie la plus dérangeante du dataïsme : récolter avidement les traces numériques laissées par les individus pour mieux les profiler, mieux les « connaître », en un sens. Or, quand cette connaissance est massivement mise au service d’un système de production-consommation, comme c’est de plus en plus le cas, par exemple, avec la publicité ciblée, l’individu est « dividué » (pour reprendre le mot de Deleuze) en consommateur : la confrontation permanente à la logique de consommation finit par prendre une part démesurée dans la façon dont l’humain se définit. Métro-boulot-conso-dodo, en somme. La dystopie est ici celle imaginée par nombre d’auteurs de science-fiction : une correspondance permanente entre continuum technologique et continuum de contrôle (notamment) par la consommation[4]. Mais pourquoi parler de contrôle ? Car l’idéal réductionniste dans lequel l’humain se confond avec l’acte consumériste est celui de l’anticipation des comportements d’achat. Ici, avoir une longueur d’avance permet de réduire le futur à du présent permanent et de dompter l’incertitude comportementale. L’humain perd son statut d’existant, c’est-à-dire d’être caractérisé par sa capacité à devenir autre que ce qu’il est déjà, à se réaliser, au profit du statut d’entité douée d’un mode d’existence figé, autrement dit de simple étant. De façon à la fois sérieuse et provocatrice, j’appelle ce processus « triangulation dans l’inexistence ». Il se caractérise par la commission de l’humain (qui est aussi, en un sens, sa définition, la façon dont il est « dévoilé ») au triptyque : achat-consommation-amat.

Bien entendu, l’ensemble du monde numérique ne se résume pas à ce déploiement délétère. Toutefois, celui-ci n’en constitue pas moins un des traits saillants.

Déjouer le scénario dystopique

Face à ce risque déjà en partie actuel, il me semble indispensable de questionner le modèle économique dataïste. Devenu l’alpha et l’oméga de l’économie numérique, rien ne semble plus s’imaginer sans lui. L’innovation, de ce point de vue, se montre particulièrement conservatrice. Le débat éthique et, j’insiste, politique fondamental ne devrait pas concerner l’anonymat des données, mais plutôt les causes et modes légitimes de récoltes. Par exemple, que souhaitons-nous faire de la capacité de détecter une possible crise cardiaque à partir d’une analyse de la voix ? Faut-il limiter l’obtention de cette information à des fins strictement médicales ou autoriser sa vente à des structures types compagnies d’assurances ? En dernière instance, c’est à une axiologie fondée sur une vision de l’humain et de la société que renvoie ce problème. Pour Emmanuel Levinas, grand penseur de l’altérité, autrui est comme profané lorsqu’on s’intéresse à lui sous l’angle de la connaissance objective. L’autre est celui ou celle dont on ne peut « faire le tour » et qui, en tant que tel, incarne la transcendance. Dit avec les mots du philosophes, autrui est ce qui ne peut jamais faire l’objet d’une totalité car il est infini. On peut se demander ce que Levinas aurait pensé de l’économie des données. Tenter de continuer à faire parler un grand penseur disparu peut se révéler délicat, mais on peut poser l’hypothèse suivante : autrui étant cet être transcendant qui limite l’empire de la subjectivité en la rendant responsable, le philosophe, une économie des données « levinassienne »serait celle qui permettrait d’augmenter notre capacité à nous acquitter de cette responsabilité. Dans ce contexte, permettre de sauver une vie grâce à l’analyse vocale semble conforme à l’éthique contrairement à l’utilisation de cette donnée dans le but de refuser ou d’augmenter le coût d’une assurance. Faire triompher la totalité au détriment de l’infinité conduit à des logiques dividualisantes potentiellement très inquiétantes : la réduction de l’humain à quelques caractéristiques soit disant objectives a rarement eu des lendemains vertueux. Pourtant, le dataïsme a le pouvoir d’hyper-massifier la totalisation. Il semble donc plus que jamais nécessaire de la circonscrire à des domaines préalablement légitimés par la voix du Commun, c’est-à-dire de la démocratie. La solution n’est donc pas d’abord technique, mais politique (puis juridique, bien sur). L’occultation du politique dans la sphère technique est déjà profonde, faisons en sorte que l’oubli des techniques dont il est ici question ne l’accentue pas. C’est un premier point.
Dans son sillage, la seconde idée concerne le modèle alternatif d’innovation qu’on peut imaginer pour favoriser l’existence au détriment de l’inexistence. L’interaction vocale est, à l’heure actuelle, la principale composante d’un type d’interaction que l’on nomme « naturelle » en ce qu’elle cherche à appliquer aux IHM les modalités d’interaction entre humains. Cette technique ne sera vertueuse que si sa capacité à faire oublier l’artefact ne contribue pas à en faire un cheval de Troie de la triangulation précédemment décrite. Pour ce faire, l’interaction naturelle doit se détourner des chemins obscurantistes et promouvoir une vision transparente de la technique. Contre la logique actuelle, c’est à la technologie de s' »extimiser » (de révéler son « intimité ») et non à l’humain, même anonyme. Si la subjectivation participe d’une allophanie de nos artefacts, c’est-à-dire qu’elle les fait apparaître comme des autres et non comme de simples choses, cette nouvelle altérité ne peut être pensée comme équivalente à l’altérité humaine. Alors que l’humain devient de plus en plus transparent pour les artefacts numériques, leurs algorithmes, eux, s’opacifient. L’interaction naturelle devrait être utilisée pour contrer ce phénomène et rendre les technologies aisément explicables et maîtrisables, pas pour renforcer leur opacité. Cette idée invite à repenser en profondeur la notion de service numérique et, surtout, la question du comment servir l’utilisateur. Là question est essentielle car liée à la façon dont nous nous subjectivons (i.e. nous construisons comme sujets) à travers les artefacts et l’usage qu’on en a. L’interaction naturelle doit être l’occasion d’expérimenter la subjectivation par « boite blanche », c’est-à-dire en permettant à l’utilisateur de construire consciemment et librement son rapport à l’artefact sur la base de sa transparence. Ici, transparence et connaissance sont indissociables : c’est parce que l’objet pourrait s’expliquer sur demande en langage « naturel », qu’il participerait à la diffusion potentiellement massive d’une culture technique que le philosophe français Gilbert Simondon appelait de ses vœux. La connaissance, lorsqu’elle débouche sur une meilleure compréhension de son objet, est à la fois libératrice et responsabilisante. En promouvant une vision de l’utilisateur comme connaisseur en puissance, ce « blanchiment » des artefacts aurait également pour vertu d’extraire la technologie de sa gangue technocratique pour la réintroduire en place publique : si chacun peut connaître et comprendre (même un peu) et que nous continuons à chérir le modèle démocratique du vivre ensemble, alors aucune raison ne s’oppose à ce notre devenir technique soit administré démocratiquement.
En matière éthique (et politique) comme ailleurs, tout est question des moyens qu’on se donne. L’éthique est à l’action ce que l’oulipo est à la littérature : une opportunité d’explorer des contraintes créatrices. Expérimenter cette idée, c’est prendre le risque bienvenu d’innover en profondeur.

Julien De Sanctis

Cover photo by Joshua Ness on Unsplash

[1] Cette célèbre caractérisation de la main vient d’Aristote qui, dans son traité De l’Âme, la désigne comme organon organôn, « instrument des instruments ».
[2] Journaliste et auteur de « Dis Siri ». Enquête sur le génie à l’intérieur du smartphone, Anamosa, 2016.
[3] In Martin Heidegger, Essais et conférences, Gallimard, coll.Tel, 1980. [4] Deux références récentes sur ce point : Simili love d’Antoine Jaquier et Les furtifs d’Alain Damasio.


Julien De Sanctis

Julien De Sanctis

http://reflections.spoon.ai/author/julien-de-sanctis/

Julien est doctorant à l'UTC (laboratoire Costech/équipe CRED) en philosophie et éthique appliquées à la robotique sociale. Il effectue sa thèse en CIFRE chez SPooN qui lui offre un terrain d'étude où réflexion et action philosophiques s'effectuent en prise avec les pratiques concrètes du domaine.