Attendre, le thème de l'émission Metaclassique
Attendre, le thème de l'émis

De l’anticipation mélodique par le cerveau

21 minutes de lecture

Pour évoquer les questions liées à l’anticipation mélodique, David Christoffel a invité deux chercheurs du Laboratoire des systèmes perceptifs de l’ENS d’Ulm à Paris : Jackson Graves et Guilhem Marion.

 

Quand une phrase musicale commence, on est souvent capable d’imaginer comment elle va se poursuivre. Il y a alors deux types d’auditeurs au moins : ceux qui se réjouissent du réconfort éprouvé à l’écoute de cette phrase, qui se poursuit comme son commencement le laissait prévoir, et ceux qui s’agacent de l’ennui provoqué par un déroulement prévisible. Mais les choses ne sont pas aussi manichéennes, puisqu’il y a au moins deux types de compositeurs : ceux qui comptent sur le plaisir certain qu’ils fourniront aux auditeurs en leur offrant ce qu’ils ont annoncé, et ceux qui placent dans leur musique une part d’imprévu et de surprise. Au-delà même des humeurs des auditeurs et des dispositions psychologiques de celles et ceux qui écrivent de la musique, il en va d’une question de langage : quelles sont les manières de fabriquer une mélodie laissant plus ou moins prise aux attentes ? Y a-t-il des formes musicales plus faciles à anticiper ? Si oui, que peut-on déduire de celles et ceux qui les préfèrent ? Pour répondre à ces questions, nous accueillons deux chercheurs du Laboratoire des systèmes perceptifs de l’ENS d’Ulm à Paris : Jackson Graves et Guilhem Marion.

Extraits tirés de l’émission Metaclassique

Si une musique est stoppée au milieu de son déroulement, son auditeur est capable de deviner, en partie, comment elle va se poursuivre. Et en fonction de ce qu’il devine, il éprouvera plus ou moins de plaisir. Guilhem Marion, c’est bien ce qui se passe dans notre cerveau quand on écoute de la musique ?

G.M. : C’est sûrement ce qui se passe : le cerveau prédit les notes qui suivent. Dans nos recherches, nous regardons des modèles statistiques qui estiment les structures grammaticales gouvernant la musique. Pour cela, on prend de nombreuses partitions et on regarde comment s’enchaînent les notes et les formes « grammaticales » apparaissent. Comme dans le langage avec la forme sujet-verbe-complément, en musique, on a sous-dominante, dominante, tonique, et d’autres structures plus précises. En estimant ces structures avec des probabilités, on remarque effectivement que la probabilité d’une note, en fonction de son contexte, est encodée dans le cerveau. C’est-à-dire que le cerveau essaye de prédire la note d’après, et sera plus ou moins surpris, en fonction de la probabilité qu’avait la note d’apparaître.

Comment faites-vous, en tant que chercheur en sciences cognitives, pour mesurer cette surprise ?

G.M. : C’est une notion statistique. Elle est complètement différente de la notion de tension en musique. Une note peu surprenante n’est pas nécessairement une note sur laquelle on peut s’arrêter, ou sur laquelle une phrase musicale peut se terminer. Ce n’est pas non plus forcément une note qui engendre peu de tension. C’est une note qui introduit un motif grammatical qui avait peu de chance d’arriver.

Vous en arrivez donc à définir la surprise comme étant liée à une faible probabilité. Et comment faites-vous expérimentalement ? Vous faites entendre à des cobayes des chorals de Bach, aux contours plus ou moins attendus ?

G.M. : La probabilité de chaque est définit de façon théorique, sans l’aide de données expérimentale.  On a une méthode assez intéressante, qui fait lien avec votre entretien avec Philippe Esling et Léopold Crestel, chercheurs à l’Ircam. Pour générer de la musique, ils estiment la probabilité des notes en fonction du contexte, et comme nous, ils utilisent des réseaux de neurones et des chaînes de Markov. Mais nous ne générons pas, nous nous servons de ces probabilités pour comprendre la musique, pour essayer d’estimer des structures grammaticales. Comme les chercheurs que je citais, on réunit beaucoup de données, à savoir des partitions, et on fait tourner des algorithmes d’intelligence artificielle. En gros, on prend tous les chorals de Bach, et on regarde, à chaque fois qu’il y a do-ré dans ces chorals, quelle est en moyenne la note qui suit. On voit que dans 30% des cas il y a un mi, que dans 40% des cas un fa, etc. Et on construit ce qu’on appelle une « grammaire probabiliste » à partir de ces données.

Vous pouvez nous donner quelques exemples ?

G.M.: Oui, je vous propose le choral de Bach Das walt mein Gott Vater und Gott Sohn und heilger Geist, BWV 291 :

Choral de Bach Das walt mein Gott Vater und Gott Sohn und heilger Geist, BWV 291 
Choral de Bach Das walt mein Gott Vater und Gott Sohn
und heilger Geist, BWV 291

Il y a là des tensions, des résolutions, des cadences de différentes natures. Mais à quel point toutes ces notes sont surprenantes ou pas, du point de vue de l’estimation probabiliste ? Après avoir entraîné notre modèle statistique avec tous les chorals de Bach, on regarde la probabilité qu’avaient chacune des notes d’apparaître. Par exemple, cette note est très peu surprenante :

Choral de Bach Das walt mein Gott Vater und Gott Sohn und heilger Geist, BWV 291 
Choral de Bach Das walt mein Gott Vater und Gott Sohn
und heilger Geist, BWV 291

C’est aussi la note de la cadence, c’est-à-dire de repos. On peut trouver d’autres exemples de notes peu surprenantes mais situées en plein milieu d’une phrase. Par exemple :

Choral de Bach Das walt mein Gott Vater und Gott Sohn und heilger Geist, BWV 291 
Choral de Bach Das walt mein Gott Vater und Gott Sohn
und heilger Geist, BWV 291

Cela veut dire que ce mouvement mélodique est très fréquent dans les chorals de Bach. Néanmoins, ce n’est pas ici une note sur laquelle on peut s’arrêter, une note de cadence ou de faible tension. Au contraire, voyons maintenant une note ayant une forte qualité de surprise : 

Choral de Bach Das walt mein Gott Vater und Gott Sohn und heilger Geist, BWV 291 
Choral de Bach Das walt mein Gott Vater und Gott Sohn
und heilger Geist, BWV 291

Cette note n’est pas particulièrement dissonante, mais elle est très surprenante, au sens de notre notion de la surprise. Ce qui signifie que ce mouvement mélodique, sol-sol-sol-do, est très peu fréquent dans les chorals de Bach.

Jackson Grave, vous êtes d’accord avec cette façon de définir l’attente?

J.G. : Je suis plus ou moins d’accord. Il est certain que le cerveau essaye de prédire ce qui va se passer dans l’environnement acoustique, quand il s’agit de la musique. Dans le contexte d’un choral de Bach, on écoute un mélange de plusieurs voix, et l’une des tâches les plus difficiles, que l’on arrive néanmoins à faire sans beaucoup d’effort, c’est d’entendre une seule ligne mélodique au sein de ce mélange. Car il y a certaines tendances de continuité des lignes mélodiques. Cette situation est assez commune, dans la vie quotidienne comme dans la musique : devoir isoler un objet auditif, une source sonore, et comprendre quelles informations de l’environnement acoustique appartiennent à cette voix, et non pas aux autres. Dans l’exemple qu’on a vu, sol-sol-sol-do, le do provoque beaucoup de surprise. Une raison possible à cela est son grand saut de sept demi-tons. C’est une caractéristique qui est remarquée par tous les modèles existants d’attentes mélodiques. Car la chose la plus évidente, c’est de s’attendre à des intervalles assez petits entre les notes. C’est logique, car dans l’environnement quotidien, les voix des autres humains, et les sons produits par les animaux ou par des objets, une voiture par exemple, ne changent pas rapidement de fréquence, mais plutôt graduellement. Le chercheur David Huron a défendu l’hypothèse que les règles de la conduite des voix dans les chorals de Bach peuvent être décrites comme des déductions logiques des principes de suivi des objets sonores dans l’environnement.

Pour discriminer un événement musical, il n’y a pas que les fréquences et les hauteurs qui sont en jeu. À ce sujet, vous avez mené une expérience avec une mélodie.

J.G. : On voulait savoir si la hauteur était vraiment la seule dimension capable de transmettre l’information contenue dans une mélodie, et permettant aux auditeurs de la reconnaître, ou de développer des attentes mélodiques. La hauteur est une propriété d’un son liée à sa fréquence fondamentale. Chaque note, chantée par une voix ou jouée par un instrument, contient plusieurs composants fréquentiels, des harmoniques, et c’est en changeant la fréquence fondamentale qu’on change la hauteur de la note. Mais il y a des façons de distinguer deux notes de même fréquence fondamentale. Un paramètre assez évident à comprendre est le niveau sonore : certaines notes sont plus fortes que d’autres. Pareillement, deux notes de même fréquence fondamentale et de même niveau sonore peuvent être distinguées, par exemple si elles sont jouées par des instruments musicaux différents : c’est alors le paramètre du timbre.

Vous avez donc mis en évidence ces paramètres, un à un, en faisant d’abord entendre une mélodie dont vous aviez retiré les hauteurs, et auquel il ne restait que son rythme.

J.G. : Exactement. Normalement il est très difficile de reconnaître la mélodie ainsi, avec toutes les notes de même hauteur. Cela permet en fait de vérifier que les auditeurs participant à l’étude ne reconnaissent pas la mélodie à partir de la seule information rythmique. Puis on distingue les notes, non pas avec leur fréquence fondamentale, qui est toujours la même, mais par leur niveau sonore, certaines notes étant plus fortes que d’autres. En écoutant ce contour de niveau sonore, on peut déjà arriver à reconnaître l’identité de la mélodie.

On a donc, en plus de la rythmique, la dynamique, ce qui aide.

J.G. : Exactement. Mais ici, nous avons transformé les distances de hauteurs en niveau sonore : toutes les notes originellement aiguës sont fortes dans notre extrait, et toutes les notes originellement graves sont faibles. La dynamique remplace le contour des hauteurs. On peut faire ça aussi avec une autre dimension acoustique, la brillance, à savoir un aspect du timbre : deux instruments jouant la même note au même niveau sonore ont quand même des qualités de son différentes. Par exemple, la trompette contient des composants fréquentiels à forte amplitude, et l’on qualifie son timbre de « brillant »  en acoustique ; le violoncelle, au contraire, n’est pas très « brillant ». Dans notre expérience, on a donc manipulé les sons, pour que les notes aiguës de la mélodie originale apparaissent brillantes. Cela peut aussi donner la sensation d’un contour.

Et là on reconnaît la mélodie, n’est-ce pas ?

J.G. : Oui, l’étape de la brillance le permet souvent. Il y a encore deux étapes ensuite, puisqu’il manque encore des informations dans la mélodie. Pour le montrer, il y a une autre condition de contrôle, à savoir la hauteur de la mélodie, qui a été étirée, en doublant la distance intervallique entre les notes. Ce faisant, on supprime la structure tonale de la mélodie : les notes ne partagent pas de tonalité, mais respectent le chemin de la mélodie.

Une anamorphose… Dans une autre émission, avec le compositeur Alain Louvier, on avait évoqué une version microtonale de La Marseillaise, qu’il était possible de reconnaître.

J.G. : C’est logique en effet.

Quelles sont finalement les conclusions de votre étude ?

J.G. : Les résultats ont montré que les trois conditions du milieu – impliquant le niveau sonore, la brillance et la hauteur étirée –, sont plus ou moins égales en termes de reconnaissance de la mélodie. On conclut donc que le niveau sonore et la brillance sont autant capables de transmettre le contour d’une mélodie que la hauteur. Le seul avantage de la hauteur se trouve dans la structure tonale, et dans les propriétés de consonance et de dissonance.

Guilhem Marion, le plaisir, tel qu’on peut le pister dans le cerveau à travers la dopamine, est-il indexé à ce qui est attendu, ou au contraire à ce qui est surprenant ?

G.M. : C’est en fait un peu plus compliqué. Des études ont montré que le système de récompense dopaminergique est lié à la notion de surprise grammaticale. Il y a deux situations très particulières dans lesquelles la dopamine est relâchée, ce qui permet d’ailleurs de faire une petite distinction probabiliste par rapport à la notion de surprise. En effet, dans ces modèles statistiques, la notion de surprise indique à quel point la note était peu probable. Mais une deuxième valeur serait l’incertitude : à quel point on s’attendait à ce que soit cette note-là. Par exemple, vous pouvez attendre très fortement que la prochaine soit un do, mais elle sera un ré. Mais vous pouvez aussi attendre moyennement que la prochaine note soit un do, mais elle sera un ré. L’idée, est que cette notion de surprise se lit en deux dimensions. Les chercheurs ont montré qu’on ressent du plaisir quand on est surpris mais très sûr, ou quand on est peu surpris mais peu sûr. Cela correspond aux cas où le modèle interne de la musique – notre modèle statistique interne – fait une grosse erreur. Dans le premier cas c’est bien une grosse erreur (ce n’est pas la note attendue : le modèle était mauvais), et dans le deuxième cas, vous êtes moyennement surpris mais vous étiez peu sûr (le modèle avait une bonne intuition, qu’on aimerait peut-être consolider). Donc, le système de récompense dopaminergique donne peut-être une récompense au cerveau dans les cas où le modèle peut s’améliorer : ce serait une espèce de véhicule culturel, qui pousserait le cerveau à se placer dans des situations culturelles (ou d’écoute de la musique) dans lesquelles le modèle peut s’améliorer. Ce serait une forme de moteur pour créer une cohésion sociale avec la musique. Cela pourrait expliquer pourquoi on a tant de mécanismes cognitifs reliés à la musique, et pourquoi le système de récompense est activé dans ces cas-là.

(Révision de cette transcription : Nicolas Southon)

 

Toutes les émissions Metaclassique sur Classicagenda

Homme de lettre et de radio, David Christoffel compose des opéras parlés (récemment Echecs opératiques à l'Opéra de Rouen en 2018 et Consensus partium au Festival d'Automne à Paris en 2020), publie des essais sur la musique (La musique vous veut du bien aux PUF en 2018) et produit des émissions de radio, notamment la série Métaclassique.

Derniers articles de Métaclassique

Des palindromes en musique

Dans cette émission Metaclassique, David Christoffel explore les palindromes musicaux, de Machaut jusqu’à Pierre Boulez, en…