Risques de la numérisation de la culture (4) – L’interprétation et la composition musicales et l’intelligence artificielle

Suite des billets du 9 juin, du 14 juin et du 25 juin 2023.

 

Dans mon billet du 25 juin 2023, j’ai envisagé la possibilité que les enregistrements musicaux, qui sont de plus en plus en ligne, deviennent inaccessibles ou difficiles d’accès à cause d’un effondrement technologique, de pénuries énergétiques et de censure, dans un contexte de moralite aiguë ou de guerre froide. Dans ce billet, je veux plutôt examiner la manière dont nos rapports à la musique et la musique elle-même se transformeraient si, au cours des prochaines décennies, l’utilisation de l’intelligence artificielle se généralisait pour produire des interprétations et des compositions musicales.


Il faut des années pour apprendre à jouer d’un instrument ou à chanter. Après quoi, il faut s’exercer tous les jours ou presque pour continuer à s’améliorer ou seulement pour ne pas perdre la main. Il faut que des milliers de personnes s’exercent pendant des années, sous le regard attentif d’un ou de plusieurs professeurs, pour obtenir au bout du compte un musicien professionnel, et des millions pour obtenir un seul virtuose. Et c’est encore plus difficile pour obtenir un grand compositeur. Nous pourrions donc nous dire que cela fait beaucoup de temps, d’énergie et d’argent dépensés en vain, et chercher d’autres moyens plus efficaces pour obtenir de bonnes interprétations et de bonnes compositions.

Une des manières d’utiliser l’intelligence artificielle, ce serait de remplacer en tout ou en partie les professeurs de musique par des intelligences artificielles, qui donneraient des leçons aux apprentis-musiciens et qui les accompagneraient pendant leurs exercices quotidiens. À partir de programmes élaborés par des professeurs de musique, des intelligences artificielles, auxquelles on aurait fait analyser de nombreux enregistrements audio et vidéo qui portent sur la « matière » à enseigner, pourraient reprendre leurs élèves quand ils jouent faux ou quand le tempo n’est pas bon, en leur montrant le résultat visé grâce à un enregistrement, lequel pourrait être comparé avec la prestation musicale ratée des étudiants, qui a été enregistrée. Il en irait ainsi jusqu’à ce que les élèves se conforment suffisamment aux modèles proposés par les intelligences intellectuelles. Ce serait déjà plus compliqué, surtout au début de l’apprentissage, quand il s’agirait de corriger la posture des élèves qui apprennent à jouer du violoncelle et la manière dont ils tiennent leur instrument et leur archet, et dont ils appuient sur les cordes, avec les doigts et l’archet. Les intelligences artificielles n’ayant pas de corps et n’ayant jamais été assis sur une chaise ou sur un banc en tenant un violoncelle et un archet, elles pourraient tout au plus constater, grâce à une caméra dont les images seraient analysées, la conformité ou la non-conformité des élèves aux modèles qu’on leur aurait donnés sous la forme d’enregistrements vidéo et qu’elles pourraient faire jouer pour guider les élèves. Il leur serait bien évidemment impossible de corriger ce qui ne va pas en redressant le dos des élèves, en repositionnant leurs jambes et en replaçant leurs mains et leurs doigts sur le manche et les cordes de l’instrument et sur l’archet, et en guidant leurs mouvements, comme pourrait le faire un professeur de musique. Encore plus difficile à enseigner ou à faire acquérir, c’est la perception et la compréhension des sentiments que véhiculent les œuvres musicales et qui se déploient grâce à elles. Dépourvues de sentiments, les intelligences artificielles sont et seront toujours insensibles aux modifications sentimentales qui se produisent dans la Follia de Corelli, par exemple. Elles pourraient seulement répéter ce qu’il est convenu de dire à ce sujet, à partir de textes ou de paroles dont on les aurait alimentées, et vérifier dans quelle mesure le jeu des élèves serait conforme aux sonorités qui auraient été associées à ces tonalités sentimentales dans leurs bases de données. À mon avis, il résulterait de tout ça un apprentissage mécanique de la musique, plus propice au dressage des élèves qu’à l’acquisition et la transmission d’une culture musicale. Car jouer de la musique, ce n’est pas seulement lire la partition (où tout n’est pas écrit) et reproduire les notes grâce à un instrument. C’est aussi et surtout une manière de cultiver et de comprendre sa sensibilité dans sa relation avec la musique. Un tel apprentissage implique un fort engagement passionnel dans la pratique de la musique, alors qu’on voit mal comment des intelligences artificielles dépourvues de sensibilité et de sentiments, et tout au plus capables de discourir à leur sujet, pourraient communiquer la passion de la musique aux élèves, de la manière dont pourrait le faire des professeurs humains qui éprouvent et cultivent ce sentiment.


Si nous en venions à nous dire que l’enseignement de la musique, même avec l’assistance de l’intelligence artificielle, exige trop de temps, d’énergie et d’argent, et à juger que les résultats obtenus après tant d’efforts sont souvent médiocres ou mauvais, nous pourrions nous dire qu’il faut faire corriger les interprétations musicales par des intelligences artificielles et même leur confier l’interprétation musicale.

Dans le premier cas, c’est-à-dire quand on demanderait aux intelligences artificielles de corriger les interprétations de musiciens médiocres, ce serait difficile à faire dans le cadre de concerts où des hauts-parleurs ne seraient pas utilisés, comme cela arrive souvent pour des concerts de musique classique, où on s’en remet plutôt à la caisse de résonance des instruments, à la force de la voix des chanteurs et à l’acoustique des salles de spectacle. Je ne vois pas comment ça serait possible sans avoir recours à des dispositifs assez complexes qui permettraient de capter le jeu de ces musiciens grâce à des senseurs mis sur des instruments qui n’émettraient pas de sons, de transmettre les données à une intelligence artificielle qui les corrigerait, et de les relayer ensuite à des robots (pas nécessairement d’apparence humaine) qui joueraient l’interprétation corrigée grâce à de véritables instruments. Plus simplement et plus probablement, on ne se donnerait pas ce mal : les musiciens joueraient sur des instruments électriques ou devant des microphones, leur jeu serait corrigé par des intelligences artificielles et le résultat serait projeté dans la salle grâce à des hauts-parleurs, comme cela se fait déjà dans des concerts de musique industrielle, bien qu’avec des technologies généralement plus simples. Par le fait même, c’est une partie de ce qui caractérise chaque instrument qui serait perdue à cause des hauts-parleurs, qui deviendraient – comme c’est déjà trop souvent le cas – l’instrument par l’intermédiaire duquel tous les autres instruments devraient se faire entendre. Même dans l’hypothèse peu vraisemblable où les résultats obtenus seraient bons ou même excellents, l’expérience que nous pourrions en avoir serait atténuée ou gâchée par le recours aux hauts-parleurs et, abstraction faite de l’événement musical qui joue un rôle dans notre expérience de la musique, ce serait à peine mieux que d’écouter ou de regarder la même prestation musicale à domicile, avec de bons écouteurs ou de bons hauts-parleurs. Et c’est peut-être ce qui se produirait souvent, encore plus si on mettait à profit la réalité virtuelle et si on rendait beaucoup plus accessible les équipements requis.

Dans le deuxième cas, c’est-à-dire quand on confierait l’interprétation musicale à des intelligences artificielles, je vois encore moins l’intérêt d’assister à des concerts, pour voir et entendre des robots jouer de la musique à partir d’instructions qui seraient données par des intelligences artificielles, ou pour écouter une musique de synthèse qui serait générée entièrement par des ordinateurs et projetée par des hauts-parleurs, le tout peut-être agrémenté d’effets visuels obtenus grâce à des casques de réalité virtuelle qui seraient distribués aux spectateurs, qui auraient souvent pour effet de détourner l’attention de la musique ou qui pourraient compenser pour ses défauts ou ses insuffisances. À ce compte, une expérience musicale semblable pourrait avoir lieu avec des équipements de réalité virtuelle qui nous donneraient l’illusion d’être sur place, au moins par l’image et le son, et peut-être par d’autres sens. Ce serait à mon avis sonner le glas des concerts, qui appartiendraient à une réalité artificielle accessible aussi bien à domicile que dans une salle de spectacle. Voilà qui réjouirait sans doute les autorités sanitaires, qui nous annoncent déjà d’autres pandémies, et pour lesquelles toute manifestation culturelle « en présentiel » constitue un risque injustifié et inadmissible pour la santé publique en période de forte propagation.

Mais ne mettons pas la charrue devant les bœufs. Car malgré toutes les aptitudes merveilleuses qu’on attribue aux intelligences artificielles qui existent présentement ou qui existeront dans le futur, elles sont et seront toujours dépourvues d’ouïe et de sentiments. Elles dépendraient donc, pour établir si les interprétations et les corrections qu’elles feraient sont bonnes ou mauvaises, d’êtres humains qui, par leur goût, leur culture musicale et leur pratique de la musique, seraient capables d’évaluer en connaissance de cause les différentes interprétations. S’il est vrai qu’on pourrait alimenter les intelligences artificielles avec des enregistrements d’interprétations reconnues comme particulièrement réussies, et qu’elles pourraient les convertir en données et y repérer des régularités à partir desquelles elles pourraient générer des interprétations d’autres œuvres musicales ou proposer des corrections à des interprétations déjà existantes, nous ne serions pas plus avancés puisqu’elles demeureraient toujours incapables d’évaluer ces interprétations et ces corrections et de réaliser qu’elles dénatureraient souvent les œuvres musicales en appliquant et en combinant mal les schémas repérés, sans une rétroaction humaine. Pour une intelligence artificielle, une sonate de Corelli et une nocturne de Chopin, c’est du pareil au même du point de vue des effets sensibles et sentimentaux qu’elles peuvent produire sur nous, quand elles sont bien interprétées. Incapable de sentir ces effets et ignorante d’eux, elle dépendrait des êtres humains (surtout des mélomanes et des musiciens) qu’elle serait censée surpasser pour évaluer les effets produits par les interprétations qu’elle générerait ou modifierait. Elle serait du même coup incapable de comprendre les critiques faites de ces interprétations et de sentir leur bien-fondé ou leur absence de bien-fondé.

Le problème s’aggrave quand on considère que le jugement musical des êtres humains dont dépendraient les intelligences artificielles dépend en grande partie de la pratique musicale qu’on aimerait leur déléguer de plus en plus. Dans l’hypothèse où, au début, ce serait de bons juges musicaux qui évalueraient les interprétations produites ou corrigées par les intelligences artificielles afin de dispenser un grand nombre de personnes de cultiver leur sensibilité musicale, ces transformations dans la pratique de la musique auraient pour effet de réduire le nombre de musiciens, de diminuer le nombre de juges capables de guider intelligemment les intelligences artificielles, et de rendre plus improbable le fait qu’on les reconnaisse quand ils existeraient. Il serait absurde de se fier aux intelligences artificielles pour identifier les juges musicaux dont elles auraient besoin, puisque si elles étaient capables de bien faire ce choix, elles n’auraient manifestement pas besoin d’eux. Ce qui arriverait alors, quand elles erreraient dans leurs interprétations, c’est qu’elles choisiraient les juges qui leur permettraient de continuer à errer et qu’elles écarteraient ceux qui pourraient les corriger, puisque ce choix pourrait seulement être fondé sur les schémas d’interprétation déficients qu’auraient les intelligences artificielles à tel moment. Plus les corrections apportées aux interprétations musicales par les intelligences artificielles deviendraient fréquentes et importantes, plus les interprétations des intelligences artificielles se substitueraient aux interprétations des musiciens humains, et plus la culture musicale et la finesse du jugement dont elle est la condition se dégraderaient, et plus les chances que les productions des intelligences artificielles corrompent le goût musical, sans que ne s’en aperçoivent ou s’en soucient les juges, deviendraient grandes. À terme, ces juges, dont le goût serait principalement formé par des intelligences artificielles qu’on se mettrait à considérer comme les références en matière de musique, serviraient principalement à confirmer la valeur de leurs productions musicales. Ou s’ils avaient la prétention de guider de continuer à guider ou à orienter ces dispositifs technologiques, leurs déficiences culturelles et musicales auraient pour principal effet de les faire errer autrement, de manière peut-être pire, ce qui dégraderait encore plus la culture musicale et reviendrait peut-être à tout bousiller. Et même si par un heureux hasard, c’est-à-dire à force d’essais et de combinaisons, les intelligences artificielles se retrouvaient malgré tout à produire parfois de grandes interprétations musicales, la culture musicale des juges et du public mélomane serait souvent insuffisante pour les apprécier à leur juste valeur ou même pour les reconnaître, puisque la musique aurait été déléguée en grande partie à ces dispositifs technologiques et l’éducation de la sensibilité par la pratique de la musique aurait été délaissée. Un tel public pourrait difficilement voir la différence entre des interprétations mauvaises, passables, bonnes ou excellentes, et serait dressé à croire que les interprétations des intelligences artificielles, qui surpasseraient nécessairement les capacités musicales humaines (alors sous-développées), seraient nécessairement bonnes. Le fait qu’il n’éprouverait pas d’enthousiasme et que ses sentiments demeureraient assez plats et rudimentaires à l’écoute de cette musique ne changerait rien à l’affaire, puisque, faute d’une culture musicale suffisante, il ne concevrait même pas qu’on puisse éprouver ces sentiments dont il est incapable.


Imaginons maintenant qu’on en vienne aussi à demander aux intelligences artificielles de corriger les nouvelles compositions musicales et celles du répertoire classique, et aussi d’en produire de nouvelles, afin de ménager les ressources allouées à la musique et dans l’espoir de rendre ces investissements plus productifs.

Je pourrais ici redire presque intégralement ce que j’ai écrit un peu plus haut sur l’incapacité des intelligences artificielles à juger elles-mêmes de leurs productions musicales, puisque cela vaut aussi bien pour les compositions musicales que pour les interprétations musicales. Je pourrais en faire autant pour les effets désastreux qu’auraient sur la culture musicale le fait de s’en remettre aux intelligences artificielles pour créer ou corriger des œuvres musicales, qui seraient semblables à ceux qu’aurait le fait de leur déléguer l’interprétation de ces œuvres. Cependant, je ne veux pas infliger ces répétitions à mon lecteur, et je le laisse faire lui-même la transposition de ces analyses pour qu’elle s’applique à la composition musicale par les intelligences artificielles, avec les ajustements qu’il jugera pertinents.

Je me concentre plutôt sur ce qui concerne spécifiquement cette nouvelle activité musicale qu’on pourrait confier de plus en plus, d’ici quelques décennies, aux intelligences artificielles. Par leur nature même, les intelligences artificielles sont incapables de se former elles-mêmes un projet musical comme ont pu le faire les grands compositeurs, et où intervenaient non seulement l’expérience sensible des œuvres et des traditions musicales antérieures, mais aussi l’expérience vécue des milieux naturels et humains dans lesquels ils ont vécu, et à partir de là une inspiration ou une intuition plus ou moins claire de l’œuvre à créer, qui se modifiera au cours d’un processus de création qui peut durer des années, quelques décennies ou toute une vie, en empruntant différentes voies, en faisant des détours et des retours en arrière, et parfois grâce à des ruptures ou de brusques retournements.

Surtout dans un contexte de dégradation de la culture musicale aggravée par le recours à l’intelligence artificielle, le fait de confier la composition d’œuvres musicales ou leur correction à des intelligences artificielles risqueraient de conduire à la production de masse de clichés musicaux (de nombreuses compositions à la manière de Vivaldi, de Beethoven ou de Chostakovitch, ou encore de Piazzolla ou de Fahey) qui videraient de leur sens même les originaux, ou de combinaisons aveugles, ou plutôt sourdes, de schémas musicaux. Car il ne faut pas sous-estimer l’importance des expériences sensibles et vécues dans la création musicale et dans la création artistique de manière plus générale. Et les intelligences artificielles en sont irrémédiablement dépourvues ; tout ce qu’elles ont, ce sont des données tirées du monde physique dans lequel nous vivons.

Ce qui montre, à mon sens, que ceux qui veulent confier aux intelligences artificielles la création musicale, et de manière plus générale la création artistique, n’ont aucune expérience de la création artistique, ou du moins qu’ils comprennent très mal celle-ci, faute d’y avoir réfléchi suffisamment.


Comme pour la plupart des transformations dont j’ai parlé dans les billets précédents de cette série, celles dont il s’agit dans ce billet pourraient s’achever, au plus vite, dans quelques décennies. Il nous faudrait profiter de ce temps pour essayer d’atténuer les conséquences de ces changements ou les empêcher de se produire dans certains milieux culturels. Mais ces formes de résistance sont à peu près vaines si les principaux intéressés, à savoir les musiciens, ne recommencent pas à prendre plus au sérieux leur art, ne travaillent pas sérieusement sur leur sensibilité et leurs sentiments, se contentent souvent de réaliser mécaniquement des interprétations et de faire de petites compositions insignifiantes ou qui sont essentiellement constituées de clichés musicaux, et ne sont pas en mesure de montrer et de faire sentir que leurs interprétations et leurs compositions sont supérieures à celles des intelligences artificielles, et qu’ils sont par conséquent tout à fait capables de se passer d’elles. Si les musiciens professionnels, les professeurs de musique et les étudiants en musique en sont incapables et sont dépourvus de véritables aspirations musicales, il arrivera ce qui doit arriver, à savoir qu’ils seront progressivement remplacés par des intelligences artificielles toujours plus perfectionnées, mais toujours dépourvues de sensibilité, de sentiments et de compréhension et d’inventivité artistiques. Et ça ne sera pas une grande perte, parce que ces musiciens ne vaudraient pas mieux que les intelligences artificielles qui les remplaceront, ni des têtes d’affiche qu’on pourrait faire monter sur scène (dans la réalité ou virtuellement) pour redonner une apparence humaine aux productions musicales générées par ces dispositifs technologiques.

Suite