Cet article, modifié pour la cause, a fait l'objet d'une radiodiffusion en direct sur la Radio Parfaite, l'antenne officielle du Festival musical du Printemps des Arts de Monte-Carlo, le 4 avril 2018. L'écho différé est disponible ici : .
Personne ne conteste raisonnablement que la théorie musicale repose sur les principes de l'acoustique physique. En privilégiant les rapports consonants que les fréquences des sons entretiennent entre elles, l'acoustique fait appel, à son tour, à l'étude des fractions simples. Cependant, il n'y a que les mathématiciens pour s'intéresser à l'arithmétique musicale et les physiciens pour invoquer les lois de l'acoustique. Les musiciens ne se soucient généralement ni de l'une ni de l'autre : peu concernés par les sciences exactes, ils estiment avec quelques raisons qu'ils n'en ont nul besoin et qu'il leur suffit d'obéir à leur instinct. De fait, la théorie musicale, ils l'apprennent le plus souvent à un âge précoce (le plus tôt est le mieux) où aucune des bases scientifiques nécessaires n'est acquise. Lorsqu'ils seraient en âge de les assimiler, leur formation musicale est suffisamment engagée pour qu'ils n'éprouvent plus le besoin d'y revenir, ne serait-ce que pour asseoir ce qu'ils ont appris sur des bases logiques incontestables. Il vaut peut-être mieux qu'il en soit ainsi car ils s'apercevraient que cette logique a souvent fait défaut à l'enseignement qu'ils ont reçu. Cette chronique s'inspire, en particulier, quoique très librement, de la lecture de quelques textes du grand musicologue français, Jacques Chailley (1910-1999). La sentence qui ouvre ses leçons dispensées en Sorbonne (Formation et transformation du langage musical - Intervalles et échelles), peut certes interpeller même si elle n'a guère été suivie d'effets :
Il règne dans la Musique un ordre admirable. Mais on a pu l'accuser de désordre par la faute de ceux qui ont entrepris de l'expliquer. (Aristoxène, Elém. Harm.)
Déjà en 1722, les premiers articles de Jean-Jacques Rousseau, parus dans l'Encyclopédie de d'Alembert et Diderot, déploraient les contresens qui commençaient à se répandre dans la théorie musicale. 300 ans plus tard, force est de constater qu'aucun travail sérieux de rationalisation n'a été entrepris, comparable à celui que se sont imposées toutes les théories scientifiques, au tournant des années 1900. Rien qu'une simplification de la gestion des clefs et des altérations ne serait pas un luxe mais il semble aussi difficile de réformer l'orthographe musicale d'usage que son équivalent français. Les musiciens (comme les académiciens) ont leurs raisons que nous tenterons de comprendre car, de toutes façons, ils auront toujours le dernier mot.
Comme son titre l'indique, cette chronique ne s'occupe que de gammes et de tempéraments. Elle ne poursuit pas l'objectif de prospecter les réformes possibles de la syntaxe musicale. Seulement évoquées ponctuellement, celles-ci feront l'objet d'un prochain article.
La musique étant l'art d'ordonner les sons, la justesse de leurs superpositions harmoniques et/ou de leurs enchaînements mélodiques semblent a priori primordiales. En première approximation, largement suffisante à ce stade, un son se distingue d'un bruit du fait qu'il est périodique, sollicitant nos tympans à la fréquence de f impulsions par secondes (Pour une oreille "normale", f doit être comprise entre 16 Hz et 16000 Hz). Il est grave si f est basse et aigu si elle est élevée.
On a identifié depuis très longtemps la règle essentielle de la consonance : deux sons résonnent en harmonie si le rapport de leurs fréquences fondamentales s'exprime par une fraction simple. En dehors du trivial unisson, on retient prioritairement les rapports : 2/1 (octave), 3/2 (quinte), 4/3 (quarte), 5/4 (tierce majeure), 5/3 (sixte majeure), 6/5 (tierce mineure) et 8/5 (sixte mineure).
La justification de cette règle est d'ordre physique : un son fait vibrer l'air à sa fréquence fondamentale, f, mais aussi et simultanément aux fréquences multiples (dites harmoniques), 2f, 3f, 4f, ..., avec des intensités relatives (et accessoirement des déphasages) qui dépendent (du timbre) de l'instrument émetteur (On se limite aux instruments harmoniques qui vibrent de façon parfaitement élastique, une corde de violon par exemple; une cloche en bronze ou un xylopohone ne rentrent pas dans cette catégorie). Deux sons distincts sont particulièrement consonants lorsqu'ils partagent un nombre "appréciable" de composantes harmoniques. Voici les exemples les plus simples :
L'intervalle entre deux sons est défini selon le rapport (et non la différence !) de leurs fréquences respectives. Cette règle géométrique (et non arithmétique !) découle du fait que l'oreille humaine est sensible au phénomène d'octave : une mélodie répétée en doublant les fréquences de chaque note sonne comme la mélodie primitive mais en plus aiguë, à l'octave supérieure. Cela reste vrai si on multiplie les fréquences des notes par un facteur constant quelconque, x (>1; si x < 1, la deuxième mélodie sonnera en plus grave). Une autre manière d'exprimer la propriété invoquée de l'oreille consiste à dire que sa réponse en fréquence est logarithmique : des sons émis en séquence, dont les fréquences croissent (ou décroissent) selon une progression géométrique, f, x f, x2 f, x3 f, ..., sont perçus comme "équidistants".
On définit, sur cette base, l'intervalle séparant deux sons de fréquences, f1 et f2 : Int = 1200 ℓg(f2/f1) (mesuré en cents), où ℓg désigne le logarithme en base 2. Connaissant l'intervalle qui sépare deux sons, il est possible de retrouver leur rapport fréquentiel, il suffit d'inverser la formule précédente sous la forme, f2/f1 = 2Int/1200. Voici les valeurs exactes de quelques intervalles consonants :
unisson (1/1) | octave (2/1) | quinte (3/2) | quarte (4/3) | tierce majeure (5/4) | sixte majeure (5/3) | tierce mineure (6/5) | sixte mineure (8/5) |
---|---|---|---|---|---|---|---|
0 (cents) | 1200 (cents) | 701.955 (cents) | 498.045 (cents) | 386.314 (cents) | 884.359 (cents) | 315.641 (cents) | 813.686 (cents) |
Le défaut de consonance, en tous cas le désagrément qu'il provoque à l'audition, est largement imputable au phénomène physique de battement. Lorsqu'on superpose deux sons de fréquences nettement différentes, tout se passe bien, l'oreille les perçoit distinctement. Lorsque les fréquences se rapprochent, un battement apparaît sous la forme d'une ondulation de l'intensité résultante, à la fréquence, fbatt = f2 - f1. Le temps que dure une oscillation complète s'appelle la période de battement, Tbatt = 1/(f2 - f1). Ce phénomène peut présenter une gêne pour l'oreille , à la manière d'une lumière stroboscopique perturbante pour l'oeil. La plage des fréquences gênantes, fbatt, se situe (très) approximativement entre 5 Hz et 25 Hz : en-deçà, le battement est d'autant mieux toléré que les notes se suivent et s'estompent à un rythme soutenu et, au-delà, l'oreille ne détecte plus le phénomène, incapable de suivre la cadence des oscillations. On traduit cette plage fréquentielle, en termes d'intervalles, en partant de la formule, fbatt = f2 - f1 = f1 (2Int/1200-1) ≅ f1 0.693 (Int/1200). On en déduit la zone critique : 10390/f1 < Int < 43290/f1. Dans l'octave du milieu, f1 est de l'ordre de 260 Hz d'où on a : 33 (cents) < Int < 165 (cents). Une ou deux octaves plus bas, ces limites devraient être corrigées à la hausse.
Note. Les octaves inférieures sont très fréquentées par l'orgue qui est, de fait, l'instrument le plus sensible aux battements. Le problème est encore aggravé par le fait que c'est aussi l'instrument où les notes sont souvent (main)tenues le plus longtemps. Les organistes sont donc particulièrement concernés par les problèmes de justesse et de tempérament (cf infra). Toujours, à l'orgue, le phénomène de battement est exceptionnellement cultivé : la plupart des instruments possèdent un registre particulier qu'on nomme "voix céleste", qui implique des tuyaux volontairement accordés sur des fréquences voisines. Le battement y est alors cultivé pour ses trémolos évocateurs (Olivier Messiaen : Le Banquet céleste).
Les intervalles usuels de types "courts", 2de mineure (do-réb) et 2de majeure (do-ré), sont concernés par la limite calculée et ils sont, de ce fait, classés parmi les intervalles dissonants. Les intervalles plus "longs" semblent y échapper, d'où on pourrait s'étonner que la quarte augmentée (do-fa#) et la quinte diminuée (do-solb) soient également rangés parmi les intervalles particulièrement dissonants.
La réponse est que les battements ne concernent pas que les fréquences fondamentales des sons mais aussi celles de leurs harmoniques. Si les sons étaient dépourvus d'harmoniques, par exemple émis par des diapasons sinusoïdaux (pas très musicaux évidemment car complètement détimbrés), alors, effectivement, aucun battement secondaire n'existerait. Mais l'existence des harmoniques a pour conséquence que des battements secondaires peuvent se produire entre harmoniques de rangs plus ou moins élevés. Considérons les exemples de la superposition d'un moderne do4 (f1 = 261.63 Hz) et de sa tierce majeure, pure (f2 = 5/4 x 261.63 = 327.04 Hz) ou tempérée (f2 = 1.26 x 261.63 = 329.65 Hz).
Lorsque le rapport fréquentiel, f2/f1 = m/n, est simple et exact, par exemple 1.25 = 5/4 (cas de la tierce majeure pure), aucun battement, fondamental ou secondaire, n'est à redouter. Cela apparaît sur la figure ci-contre (à gauche) qui mentionne les intervalles (en cents) entre les premières combinaisons d'harmoniques possibles : ils sont soit supérieurs à 300 cents soit nuls, dans les deux cas en-dehors de la zone gênante. Si, pour quelque raison que ce soit, le rapport 5/4 n'est pas absolument respecté, par exemple s'il vaut 1.26 (ce qui est le cas de la moderne tierce majeure tempérée), la même figure (à droite) montre que la consonance est notamment menacée par un battement entre les composantes de fréquences 5 f1 et 4 f2 (coin inférieur droit). Ce battement prend la forme d'une ondulation de l'intensité, à la fréquence, n f2 - m f1, de l'ordre de 10 Hz dans l'exemple considéré. Le phénomène apparaît nettement sur la figure ci-dessous (à droite).
Le tableau suivant illustre quelques cas de figures qui seront détaillés en cours de texte. On peut y entendre plusieurs enchaînements d'un do4, synthétisé sur base d'une sinusoïde fondamentale et de quatre sinusoïdes harmoniques, avec une notes choisie parmi un ensemble de cinq, puis la superposition des deux. Ces 5 notes sont, dans l'ordre des lignes, un réb pythagoricien, un sol pythagoricien (quinte parfaite), un sol pythagoricien faussé d'un neuvième de ton (quinte fausse), un mi pythagoricien (tierce majeure impure) et un mi zarlinien (tierce majeure pure) :
Rapport | Intervalle (cents) | Fréquence (Hz) | Battement ? | |
---|---|---|---|---|
do4 | 1/1 | 0 (cents) | 261.626 (Hz) | sans objet |
réb (pyth) | 256/243 | 90.225 (td) | 275.623 | fondamental |
sol (pyth) | 3/2 | 701.955 | 392.439 | non |
sol (faux) | 1.5197 | 724.612 | 397.609 | harmonique |
mi (pyth) | 81/64 | 407.82 | 331.12 | harmonique |
mi (pur) | 5/4 | 386.314 | 327.032 | non |
Note. L'incrimination du battement dans l'explication du phénomène de dissonance est due au physicien von Helmholtz (1821-1894) mais il est juste de dire qu'elle ne fait plus l'unanimité depuis que le psychologue Carl Stumpf (1848-1936) a montré, dans une série d'expériences psychoacoustiques, qu'il pouvait y avoir (perception de) dissonance sans battement. Le musicologue Heinrich Husmann (1908-1983) a alors préconisé de renverser le problème en affirmant que c'est la consonance qui est perçue lorsque les sons superposés présentent un maximum d'harmoniques communs. Cette diversité d'opinions est typique des disciplines où des chercheurs aux formations aussi différentes tentent de se mettre d'accord.
Transposer un air, c'est multiplier la fréquence de chacune de ses notes par un facteur constant, x, ou, ce qui revient au même, c'est translater chaque note d'un intervalle constant, 1200 ℓg(x) (cents). On recourt à la transposition toutes les fois que l'on veut jouer un air sur un instrument (éventuellement la voix) dont la tessiture diffère de celle de l'instrument prévu originellement. On pourrait s'étonner que des musiciens réputés sérieux s'encombrent d'une telle notion : si le compositeur a pris la peine d'écrire son oeuvre pour un instrument donné, dans une tonalité précisée, c'est pour qu'elle soit jouée de cette façon et pas d'une autre. Cette latitude a pourtant toujours existé, ne fut-ce que pour satisfaire de nombreux amateurs désireux d'adapter des oeuvres pas trop difficiles du répertoire à leur usage personnel. Les chanteurs (ou les chanteuses !) de toutes tessitures sont également demandeurs, qui rêvent d'interpréter "leur" Voyage d'Hiver de Schubert, même s'ils ne sont pas ténors comme la partition l'a prévu.
Apparentée à la transposition mais fondamentalement plus importante, la modulation est utilisée par le compositeur toutes les fois qu'il veut agrémenter un mouvement en cours par une diversion durable, dans une tonalité contrastée, en changeant de tonique et/ou de mode. Ce procédé, désormais omniprésent en musique dite classique, a tôt inspiré des curiosités didactiques telles Le Petit Labyrinthe harmonique, pour orgue, attribué à J-S Bach (BWV 591) mais plus probablement l'oeuvre de Johann David Heinichen ou encore, plus tardivement, les Deux Préludes (opus 39), dans tous les tons majeurs, écrit par le jeune Beethoven à l'époque où il était encore l'élève de Neefe. Bien qu'annoncé en ré mineur, l'un des premiers grands chefs-d'oeuvre à jouer avec l'incertitude tonale est une oeuvre isolée de J-S Bach, la Fantaisie chromatique et Fugue, BWV 903.
Justesse et transposition sont mathématiquement incompatibles et ce conflit a préoccupé les musiciens à toutes les époques, depuis la Renaissance. Epris de justesse, les premiers compositeurs baroques ont renoncé à la modulation intégrale mais leurs successeurs ont fait le choix inverse, abandonnant la justesse à tout prix, au bénéfice d'une plus grande liberté d'écriture. Les ressorts de ce revirement vont nous occuper.
On crédite habituellement Pythagore (né vers -580) et plus probablement ses élèves, d'avoir développé le premier modèle de gamme musicale. Ils l'ont fait en privilégiant les deux intervalles les plus immédiatement consonants, l'octave et la quinte.
La gamme d'essence pythagoricienne est ancienne mais elle n'a, au fond, rien perdu de son actualité. Elle a, en particulier, conditionné l'orthographe musicale telle que nous la connaissons encore aujourd'hui. Sa construction s'effectue en deux temps :
L'incommensurabilité (géométrique, pas arithmétique, cf supra !) entre les intervalles d'octave et de quinte rend cette double opération irréalisable en toute rigueur, d'où un compromis s'impose qui reste à définir.
Le schéma pythagoricien génère les notes successives, au sein de l'octave de référence, [f0 - 2f0[, en suivant la procédure élémentaire suivante :
Une simplification est utile, à ce stade : plutôt que de raisonner en termes de fréquences, il est bien plus commode de considérer les intervalles entre les notes. On permet ainsi une description graphique au moyen d'un cercle dont le périmètre complet représente l'intervalle d'octave. Sur la figure ci-contre, 12 points rouges graduent ce cercle de 0 à 1200 (cents), par pas de 100 (cents). Dans cette représentation, l'intervalle de quinte ascendante, Q = 1200 ℓg(3/2) = 701.95 (cents) correspond à un arc de cercle de 3.67543 radians (soit 210° 35' 12" ou encore 0.584963 tour de circonférence), orienté dans le sens horlogique. L'idée est alors de choisir une origine a priori quelconque pour la note de départ (notée 0 sur la figure) puis de positionner les autres notes (1, 2, ..., 6) successivement une quinte plus haut. La suite des intervalles, mesurés depuis l'origine, se note Mod[k Q, 1200] (k = 0, 1, 2, ..., 6) = { 0, 701.955, 203.91, 905.865, 407.82, 1109.78, 611.73} (cents), où la fonction Mod rappelle que lorsqu'on dépasse 1200 cents, on ne considère que l'excédent, ce qui correspond bien à l'idée d'une réduction à une octave unique.
Note. Dans la suite nous serons amenés à poursuivre la construction précédente donc à empiler un nombre croissant de quintes. A aucun moment on ne retombera sur une note déjà trouvée car l'intervalle, Q = 1200 ℓg(3/2), est un nombre irrationnel. Il en résulte que le nombre des notes que l'on peut définir par ce procédé, au sein de l'octave, ne connaît pas de limite et qu'il faudra tôt ou tard dicter un critère limitant. Par ailleurs, le lecteur attentif aura noté que le principe même de la construction de la gamme entraîne à effectuer plusieurs tours du cercle des quintes afin de positionner les notes. Cela ne devrait pas poser de problème à tous ceux qui ne s'étonnent pas de devoir lire l'heure sur un cadran de montre qui indique 5 heures tous les jours de la semaine, matin et soir, sans autre explication. Dans tous les cas, le contexte résout les ambiguïtés liées à cette représentation modulaire.
Sur la figure précédente, on est parti (avec une idée derrière la tête !) du point 0, situé une quinte en-dessous du point 1, lui-même situé au sommet du cercle. Une quinte descendante correspond au rapport inverse (2/3) donc au même arc de cercle mais orienté dans l'autre sens. Au bilan, les six quintes ascendantes successives sont donc, 0-1, 1-2, 2-3, ... et 5-6. Ne confondez pas l'ordre des 6 quintes, qui sont des intervalles, avec celui des 7 notes qu'elles définissent et qui parcourent l'octave dans l'ordre horlogique des fréquences croissantes, 1, 3, 5, 0, 2, 4, 6. Le choix de la note n°1 comme point de départ est compatible avec l'énumération classique, do, ré, mi, fa, sol, la, si; il n'est pas essentiel mais il permet de respecter la tradition.
La première chose à faire, dans l'immédiat, est de justifier le choix fait de se limiter (provisoirement !) à 7 notes. Ne répondez pas que c'est parce que tout le monde sait bien que la gamme occidentale comporte 7 notes, c'est précisément ce que nous tentons de justifier, au moins heuristiquement !
Empiler des quintes et les ramener à l'octave de référence n'est pas la façon la plus élégante de procéder, d'autant qu'à force de multiplier itérativement la fréquence de base par 3/2, on se retrouve vite dans le domaine des ultrasons ! La variante suivante est équivalente mais plus réaliste. Le début est identique : on conserve la note de base, de fréquence, f0, mais cette fois, on alterne une quinte ascendante et une quarte descendante. La quarte est le complément naturel de la quinte : un son situé une quarte en-dessous d'un son de fréquence, f0, possède, par définition, la fréquence 3f0/4; il se situe donc une octave en-dessous de la quinte ascendante. On représente une quarte descendante, en se déplaçant de q = 1200 ℓg(4/3) = 498.045 (cents) dans le sens contre-horlogique, ce qui revient bien au même que d'augmenter d'une quinte (à une octave près). Encore dit autrement, une quinte (701.95) plus une quarte (498.045) vaut une octave 1200 (cents).
Remplacer l'empilement des quintes par l'alternance répétée d'une quinte ascendante et d'une quarte descendante ne change donc rien au résultat du calcul de la suite des fréquences des notes engendrées (Multipliez les fractions si vous doutez encore!). Cependant, on en tire ce bénéfice qu'en partant de la fréquence basse, f0, de l'octave, [f0 - 2f0[, il n'est plus nécessaire de changer artificiellement d'octave, pendant les 6 premières itérations. Les 7 notes de la gamme heptatonique apparaissent spontanément, dans l'énumération dite "par les quintes", fa, do, sol, ré, la, mi, si. La note de départ, fa, ne joue aucun rôle particulier dans ce processus et l'on pourrait partir de n'importe quelle autre note mais si l'on veut retarder autant que possible l'apparition des altérations, donc retrouver en séquence les 7 notes traditionnelles, alors il convient de partir de cette note-là.
La figure ci-contre nomme les 7 notes définies par l'empilement de 6 quintes, au départ de la note fa, et elle souligne les intervalles qui les séparent par un système de flèches. Deux types d'intervalles apparaissent (ton et demi-ton diatonique, on y reviendra), qui définissent le mode (de do) majeur. Ne confondez pas :
Les musiciens inscrivent traditionnellement ces notes sur une portée comportant (au moins) 5 lignes, dans l'ordre vertical ascendant des fréquences croissantes. Cette portée peut être vue comme une échelle un peu spéciale dont les échelons successifs (les lignes et les interlignes) sont de hauteurs ... inégales, cela apparaît clairement sur le cercle des quintes (Les intervalles, mi-fa et si-do, sont, à vue de nez, deux fois plus court que les autres). Vous commencez à comprendre pourquoi il faut commencer le solfège le plus tôt possible : seul un jeune enfant peut s'accommoder, sans broncher, d'une échelle pareille. Reconnaissons que cela ne perturbe aucun musicien aguerri, les autres ayant abandonné depuis longtemps. Trêve d'ironie, la succession des flèches définit les degrés de la gamme et c'est bien pratique : si do est la tonique, de degré Ⅰ, la quarte (fa) occupe le degré Ⅳ, la quinte (sol) occupe le degré Ⅴ et l'octave (do supérieur) le degré Ⅷ, les noms sont évocateurs. Sur une portée, on monte d'un degré toute les fois qu'on passe d'une ligne à l'interligne suivante (ou l'inverse) comme représenté sur la figure ci-dessous.
Note. Dans tous les domaines de l'activité humaine, y compris scientifiques, les traditions sont porteuses de conventions séculaires (mal)heureuses, impossibles à changer tant elles sont ancrées dans les habitudes. La notation musicale n'échappe pas à cette constatation. Cette figure utilise la convention anglo-saxonne de représenter les notes par des lettres : C = do, D = ré, E = mi, F = fa, G = sol, A = la et B = si (mais les germanophones utilisent H !). Cet ordre étrange pourrait laisser penser que les anglo-saxons démarrent l'octave à partir du la mais ce n'est pas le cas. Dans tout système de notation, chaque note est, en théorie, porteuse d'un indice qui rappelle le numéro de l'octave à laquelle elle appartient (la3, la4, la5, ...). Les américains respectent la recommandation internationale qui situe le diapason moderne (la = 440 Hz) dans l'octave n°4, ce que ne font pas les latins qui en sont encore à le situer dans l'octave n°3. Bref, do3 = C4, ré3 = D4, mi3 = E4, fa3 = F4, sol3 = G4, la3 = A4, si3 = B4 et on recommence une octave plus haut, do4 = C5, etc.
Dans l'immense majorité des cas, une partition représente graphiquement les notes sur une portée, une aide au déchiffrement des interprètes. Les rares exceptions concernent les musiques expérimentales (Stockhausen) et/ou algorithmiques (Xenakis). Dans le cadre théorique lié à l'enseignement de la musique, l'appellation des notes diffère cependant selon les écoles, recourant à une version syllabique (pays latins et Russie) et/ou alphabétique (pays anglo-saxons). On a même rêvé d'une écriture chiffrée.
Sept notes par octave, c'est trop peu ! On aimerait poursuivre l'alternance des quintes et des quartes et ainsi définir de nouvelles notes qu'il faut pouvoir nommer. Leur donner des noms inédits ne serait pas une bonne idée, pensez aux compositeurs et aux interprètes qui devraient gérer un vocabulaire de plus en plus encombrant ! Dès le Moyen-Age, les théoriciens de la musique ont trouvé une solution astucieuse, toujours en vigueur, c'est le principe de l'altération.
Reconsidérons l'alternance des quintes ascendantes et des quartes descendantes, au départ de la note, fa, et reportons-la sur une portée. La figure suivante est facile à décoder : une quinte fait monter de 5 degrés, une quarte fait descendre de 4 degrés, lignes et interlignes compris, et les 7 notes traditionnelles apparaissent bien dans l'ordre des quintes, fa, do, sol, ré, la, mi, si. On constate qu'une quinte supplémentaire amènerait à dépasser l'octave de référence (note blanche sur la figure) d'où une réduction d'une octave s'impose, qui semble ramener la nouvelle note au niveau du fa initial (on descend de 8 degrés). Cependant cette note ne peut être un vrai fa car elle n'en possède pas la fréquence. On calcule aisément l'intervalle qui sépare ces deux notes cependant voisines en effectuant les produits successifs correspondant aux 4 quintes ascendantes (3/2)4, entremêlées aux 3 quartes descendantes (3/4)3, enfin à l'abaissement d'une octave (1/2) : Int = 1200 ℓg(37/211) = 113.685 (cents) (ce qui correspond à un rapport de fréquences valant, 37/211 = 1.06787). On appelle "fa dièse = fa#" cet autre fa. En poursuivant l'alternance, on engendrerait de nouvelles notes diésées, séparées de "leur" note naturelle par le même intervalle, appelé demi-ton chromatique, tc = 113.685 (cents).
La portée précédente peut être prolongée, vers la droite, autant de fois qu'on le souhaite : le cycle, fa, do, sol, ré, la, mi, si, est suivi d'un deuxième cycle avec dièses, fa#, do#, sol#, ré#, la#, mi#, si#, puis par un troisième cycle, avec doubles dièses, fa##, do##, sol##, ..., si##, etc. La règle précédente demeure valable : chaque fois qu'on ajoute un dièse à la note naturelle, on augmente l'intervalle de tc.
Rien n'empêche de prolonger la portée vers la gauche, au départ du fa initial : une première quarte ascendante génère une nouvelle sorte de si qu'on distingue du si habituel en lui collant cette fois un bémol (b). On calcule aisément que l'intervalle qui sépare le si naturel du sib vaut encore un demi-ton chromatique et cela reste vrai à tous les niveaux : un bémol abaisse la note de 113.685 (cents). Le lecteur égaré va pouvoir se récupérer grâce à la figure suivante, qui empile 20 quintes ascendantes à partir de fab.
L'empilement de 20 quintes (ou l'alternance équivalente de quintes et de quartes), ramenées à une octave unique, détermine 21 notes, naturelles ou simplement altérées. Il n'est pas nécessaire de s'embarrasser des calculs de fractions car nous savons, une fois pour toutes, qu'une quinte ascendante correspond à une rotation de Q = 701.95 (cents) dans le sens horlogique. Les 21 notes se notent comme suit, dans l'ordre des quintes et au départ de fab (histoire de se conformer à l'usage, cf supra) : fab, dob, solb, réb, lab, mib, sib, fa, do, sol, ré, la mi, si, fa#, do#, sol#, ré#, la#, mi#, si#. Ne le confondez pas avec l'ordre selon les fréquences (du grave vers l'aigu) que vous lisez en parcourant le cercle dans le sens horlogique, selon l'usage à partir du do (do, si#, réb, do#, ré, etc).
Les intervalles qui séparent les 21 notes sont de deux types principaux :
Les autres intervalles observés sont des combinaisons linéaires de ces deux-là. Par exemple :
Note. Bien que la logique ait peu à dire sur la question, vous trouverez dans la littérature au moins une autre "explication" du fait qu'on se soit limité à 7 (noms de) notes, recourant aux symboles d'altérations pour les autres.
Dans la figure précédente, les repères fléchés signent le mode (de do) majeur. Sauf altérations passagères, les notes utilisées dans ce mode sont celles désignées par les vecteurs, ici les notes naturelles. La figure suivante permet de (re)trouver les notes utilisées dans n'importe quelle autre tonalité majeure : servez-vous du bouton curseur situé en bas pour changer de tonique, les 7 vecteurs tourneront automatiquement.
La figure suivante affiche, à gauche, le cas particulier de la transposition en ré majeur. On constate que les notes constitutives du nouveau ton (do#, ré, mi, fa#, sol, la, si) puisent largement dans l'ensemble des notes naturelles (seules les do et fa sont diésées) : on dit que les tonalités de do et de ré majeur sont proches d'où une modulation peut se faire en douceur. Vérifiez à présent qu'en do# majeur, toutes les notes sont diésées : ce mode est particulièrement éloigné (de do majeur).
La transposition en ré# majeur, visible sur la figure de droite, pose un problème inédit : deux notes manquent manifestement à l'appel. Parmi les 21 tonalités majeures envisageables, six d'entre elles posent ce problème : ré#, mi#, sol#, la#, si# et fab. On génère les notes manquantes en poursuivant l'empilement des quintes, ce qui fait apparaître les notes doublement altérées.
Empilons 34 quintes, par le procédé que nous connaissons, et générons toutes les notes au plus doublement altérées, de fabb à si##. Si vous avez suivi, les notes multiplement altérées sont distantes de la note naturelle de même nom d'autant de demi-tons chromatiques que l'on compte de dièses ou de bémols. Par exemple, les intervalles, fab-fa, fabb-fab, fa-fa# ou fa#-fa## valent tous tc, d'où l'intervalle fabb-fa vaut 2tc. La liste des 35 notes s'écrit comme suit, dans l'ordre des quintes ascendantes :
Le cercle ci-dessus a été étudié en détails pour la première fois par William Holder (1616-1697) dans son traité "A Treatise of the natural Grounds and Principles of Harmony", daté de 1694. Divisé en 53 parties égales (points verts sur la figure), on constate, qu'à peu de choses près, les 35 notes occupent chacune un de ces sites. Holder en a déduit qu'une partition de l'octave en 53 parties égales serait bien proche de l'idéal, sauf que cela commence à faire beaucoup de notes et que, de toute façon, les problèmes de transpositions subsistent dans certaines tonalités, qui exigeraient de nouvelles notes triplement altérées. Personne n'a souhaité s'engager dans cette direction, ni les facteurs de claviers, les accordeurs, les compositeurs ni les interprètes !
Le système de Holder est impraticable mais il constitue une base de travail qu'on peut espérer simplifier. Un premier élagage consiste à écarter les tonalités exotiques, basées sur une tonique doublement altérée (par exemple do## majeur). On ne conserve donc, dans un premier temps, que les 21 tonalités, de fab à si#.
Aux 21 notes correspondantes, nous avons ajouté six notes doublement altérées, sibb, fa##, do##, sol##, ré## et la##, afin de couvrir tous les cas de transpositions majeures. Au bilan (provisoire), nous avons besoin de 27 notes, que nous extrayons de la liste précédente, toujours dans l'ordre des quintes :
Si vous doutez, promenez la tonique de fab à si#, sur la figure dynamique suivante et retenez les notes dont vous avez besoin.
On générerait cette liste tronquée en empilant 26 quintes au départ de sibb, comme représenté ci-dessus. Elle contient l'information relative aux 21 tonalités majeures, de fab à si#; récapitulons-les :
Tout cela est résumé dans la grille suivante dont la fenêtre peut être déplacée à loisir de telle manière que la tonique soit positionnée en face de la lettre M, si on est en mode majeur, ou en face de la lettre m, si on est en mode mineur; on visualise instantanément les notes constitutives donc le nombre d'altérations. A titre d'exercice, vérifiez que les seules tonalités majeures qui acceptent les notes sol, ré, la et mi sont fa M, do M, sol M et ré M. De même les seules tonalités mineures sont ré m, la m, mi m et si m. Sachant que les 4 cordes à vide du violon moderne sont accordées sur les notes sol3, ré4, la4 (440 Hz) et mi5, vous comprenez mieux pourquoi l'immense majorité des grands concertos du répertoire sont écrits dans une des 8 tonalités mentionnées (Les exceptions sont rares mais elles existent, telle le rarement joué second concerto de Schostakovitch qui est en ut dièse mineur). Vous pouvez recommencer le raisonnement à propos du violoncelle dont les cordes à vides sont également accordées selon le cycle des quintes réelles, do2, sol2, ré3 et la3 (220 Hz) : les tonalités "confortables" sont cette fois : sib M, fa M, do M, sol M, sol m, ré m, la m et mi m. Le raisonnement ne tient pas pour le piano qui est accordé au tempérament égal (Cf infra) : rien ne s'oppose à ce qu'il existe des concertos pour piano dans une tonalité quelconque.
Un second élagage est rendu possible par le fait que les notes se regroupent sur le cercle par deux (ou par trois) autour des sommets d'un dodécagone régulier. Au voisinage de chaque sommet, les notes ne sont distantes que d'un comma pythagoricien (on pourrait les appeler enharmoniques, cf supra), d'où l'idée de n'en retenir qu'une seule par sommet. Cela se fait très simplement en sélectionnant 12 notes consécutives dans la liste précédente : on constate que, quel que soit le point de départ qu'on se donne, chaque note est bien voisine d'un sommet différent du dodécagone. Il existe, en théorie, 10 gammes de 12 notes, de ce type, qu'on pourrait également qualifier d'enharmoniques car elles ne diffèrent que par le choix de notes enharmoniques. On n'en conserve habituellement que 6, précisément celles qui contiennent les notes naturelles (do, ré, mi, fa, sol, la , si), que l'on réarrange comme suit, dans l'ordre des fréquences croissantes :
do | réb | ré | mib | mi | fa | solb | sol | lab | la | sib | si | (do) | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
td | tc | td | tc | td | td | tc | td | tc | td | tc | td | |||||||||||||
do | réb | ré | mib | mi | fa | fa# | sol | lab | la | sib | si | (do) | ||||||||||||
td | tc | td | tc | td | tc | td | td | tc | td | tc | td | |||||||||||||
do | do# | ré | mib | mi | fa | fa# | sol | lab | la | sib | si | (do) | ||||||||||||
tc | td | td | tc | td | tc | td | td | tc | td | tc | td | |||||||||||||
do | do# | ré | mib | mi | fa | fa# | sol | sol# | la | sib | si | (do) | ||||||||||||
tc | td | td | tc | td | tc | td | tc | td | td | tc | td | |||||||||||||
do | do# | ré | ré# | mi | fa | fa# | sol | sol# | la | sib | si | (do) | ||||||||||||
tc | td | tc | td | td | tc | td | tc | td | td | tc | td | |||||||||||||
do | do# | ré | ré# | mi | fa | fa# | sol | sol# | la | la# | si | (do) | ||||||||||||
tc | td | tc | td | td | tc | td | tc | td | tc | td | td |
Note. Les variantes enharmoniques des première et sixième lignes sont aisées, ne contenant que des bémols ou des dièses. La variante de la troisième ligne est celle adoptée par J-S Bach pour l'ordre des tonalités majeures dans le Livre I des 24 Préludes et Fugues du Clavier bien tempéré (do, do#, ré, mib, mi, fa, fa#, sol, lab, la, sib, si). Un tel choix enharmonique n'a plus de raison d'être avec l'adoption du tempérament égal qui confond un do# et un réb. Dans son hommage à Bach, Dimitri Schostakovitch a ordonné ses 24 Préludes et Fugues, opus 87, dans l'ordre des quintes ascendantes, de réb à fa# pour les tonalités majeures et de mib à sol# pour les tonalités mineures. Chopin ne procédera pas autrement dans son recueil de 24 Préludes, opus 28.
Il semblerait que nous ayons bien progressé dans la construction d'une gamme acceptable mais le modèle pythagoricien souffre encore de deux défauts majeurs qu'il faut corriger :
Dans les deux cas, c'est déjà ça, les quintes s'avèrent trop longues. Evidemment, il ne faut pas trop demander : pour refermer l'octave sur le cycle des quintes il faudrait diminuer, en moyenne, 12 quintes de P soit environ P/12 = 1.955 (cents), par quinte, tandis que pour rendre les tierces pures, il faudrait diminuer, en moyenne, 4 quintes de Z, soit Z/4 = 5.38 (cents), par quinte, ce qui est nettement plus ! Vous étiez prévenus, un compromis s'avère nécessaire, c'est tout le problème du (choix d'un bon) tempérament.
Le modèle pythagoricien n'assure, par construction, que la pureté de l'intervalle de quinte ascendante. Il ne se préoccupe absolument pas de la justesse des autres intervalles, par exemple des tierces (majeures, 5/4), fausses d'un comma syntonique, Z.
Cependant le travail qu'on a fait, en empilant des quintes justes, ne pourrait-on pas aussi le faire pour les tierces ? C'est en effet possible mais au prix d'une complication inévitable : passer de une à deux dimensions.
Rappelons l'alignement des quintes, toutes espacées d'un intervalle, Q = 701.955 (cents) :
On étend le modèle aux tierces (majeures) en propageant le tableau dans la direction verticale du plan. Au départ de n'importe quelle note, toute progression horizontale (de gauche à droite) fait monter d'une quinte (3/2) et toute progression verticale (de haut en bas) fait monter d'une tierce majeure (5/4), toujours ramenées à l'octave de base. Le tableau résultant est infini et la figure ci-dessous ne fait que l'ébaucher, au départ de la note do, prise comme référence.
Le point délicat concerne l'appellation des notes. Il devrait être clair que les notes présentes sur la ligne du "do" doivent recevoir un nom conforme au cycle des quintes mais que pour toutes les autres, il faut respecter une nomenclature cohérente. Il se démontre que chaque note se situe dans le voisinage immédiat, c'est-à-dire à quelques schismas (σ = P - Z = 1.955 cents) près, d'une note située quelque part dans le cycle des quintes primitif (de la ligne du do). Le tableau ci-dessus montre quelques exemples.
Note technique. Bien que ce ne soit pas le lieu d'une savante démonstration, indiquons néanmoins le principe de cette nomenclature, souvent maltraitée dans la littérature. On numérote comme suit les lignes et les colonnes de ce tableau infini : la ligne et la colonne qui se croisent sur la note "do" portent chacune le n°0. Les lignes supérieures et les colonnes situées à gauche sont numérotées en reculant, -1, -2, etc, tandis que les lignes inférieures et les colonnes situées à droite sont numérotées en progressant, +1, +2, etc. Les coordonnées (u, v) de n'importe quelle note sont à présent définies par les numéros de la ligne et de la colonne qui se croisent sur elle. Par exemple, la note située dans le coin inférieur gauche possède les coordonnées, u = -1, et v = 2. On passe du "do" de référence à cette note en empilant u quintes (rapport 3/2, attention si u est négatif, la quinte est descendante, de rapport 2/3) et v tierces (rapport 5/4, attention si v est négatif, la tierce est descendante, de rapport 4/5). On calcule que la note la plus proche (à v σ près) dans le cycle des quintes est caractérisée par le doublet (m = Mod[1+u-8v,7], n = Floor[(1+u-8v)/7]), où l'entier, m, désigne la note selon le code, fa (m=0), do (m=1), sol (m=2), ré (m=3), la (m=4), mi (m=5) et si (m=6), et où l'entier relatif, n, indique le nombre d'altérations (-n bémols si n est négatif et n dièses s'il est positif). Dans l'exemple du coin inférieur gauche, u = -1, et v = 2, on trouve : m = 5 et n = -3, donc la note correspondante est située 2σ au-dessus du mibbb (Rappels scolaires : Mod[a,b] désigne le reste de la division de l'entier a par l'entier b et Floor[x] désigne l'entier immédiatement inférieur ou égal à x).
Cette description compliquée suffit à montrer que l'extension rigoureuse de ce tableau théoriquement infini le rend quasiment inutilisable. Il constitue cependant, mais dans une version radicalement simplifiée, le principe de base de la gamme naturelle développée par Gioseffo Zarlino (1517-1590). La simplification consiste à ignorer les enharmonies et les petits schismas correcteurs. On obtient dès lors le modèle suivant.
L'octave y est partitionnée en intervalles prédéfinis, fixant comme suit les fréquences relatives des notes : f0 {1 (do), 9/8 (ré), 5/4 (mi), 4/3 (fa), 3/2 (sol), 5/3 (la), 15/8 (si), 2 (do)}. Ce choix est dicté par le souci de reproduire par trois fois l'accord parfait (majeur), composé d'une note de base, de sa tierce (majeure) et de sa quinte, soit les rapports {1, 5/4, 3/2}; on a bien les accords parfaits, do-mi-sol, sol-si-ré et fa-la-do, révisez vos fractions ! En particulier, on vérifie sans peine que la tierce majeure, 5/4, est la moyenne arithmétique entre les extrêmes, 5/4 = (1+3/2)/2. Mentionnons qu'il existe également un accord parfait mineur correspondant aux rapports {1, 6/5, 3/2} où intervient la tierce mineure, de rapport 6/5, moyenne harmonique entre les mêmes extrêmes, 6/5 = 2x1x3/2/(1+3/2). Ci-contre, les 7 notes naturelles ont été ombrées et le motif de l'accord parfait majeur (trois fois répétable) a été mis en évidence, en rose. Il reste alors à compléter par les notes altérées afin que la partition de l'octave soit harmonieuse.
Cette gamme dont l'origine remonterait à Aristoxène (né vers -352) est basée non plus sur l'obsession arithmétique, typique de la philosophie pythagoricienne, mais sur le respect de l'harmonie acoustique qu'assure l'accord parfait.
Ce réseau tonal pourrait à la rigueur être reporté sur le cercle d'octave mais le résultat serait fort peu lisible du fait de l'incommensurabilité entre les intervalles de quinte et de tierce. On observerait une accumulation pseudo périodique de notes, difficile à débrouiller. Topologiquement, la structure correcte est celle d'un tore (tridimensionnel) où le cycle des quintes est parcouru hélicoïdalement (donc sans se refermer, il faudrait le tempérament égal pour que cela se produise et ce n'est évidemment pas le but) selon les arcs de grands cercles et les tierces selon les arcs de petits cercles.
A diapason égal, les fréquences des notes zarliniennes ne coïncident évidemment pas exactement avec celles du modèle pythagoricien. Les intervalles ont tendance à se multiplier, c'est le prix qu'on paye pour la justesse des tierces :
Cette démultiplication des intervalles est, en fait, incompatible avec le principe de la construction d'une gamme stable convenant à un instrument à son fixe. Un tel instrument requiert, en effet, autant de systèmes oscillants autonomes (par exemple, des cordes sur un clavecin ou un piano) que de notes distinctes à émettre, d'où les facteurs d'instruments protesteraient avec raison. On a pourtant tenté de construire des claviers spéciaux adaptés à la gamme de Zarlino, par exemple à doubles feintes pour jouer différemment les altérations voisines, ou, plus compliqué encore, des claviers transpositeurs mobiles mais l'accumulation des difficultés a fait abandonner le projet. La gamme naturelle n'a pourtant pas disparu pour autant, les voix non accompagnées ayant tendance à respecter les intervalles consonants purs.
Revenus de l'utopie zarlinienne, les théoriciens ont reconsidéré le modèle pythagoricien, prêts à lâcher du lest en matière de quintes pures. Nous l'avons dit, les quintes pythagoriciennes sont trop longues pour fermer l'octave et elles sont aussi trop longues pour engendrer des tierces majeures pure. Il faut donc se résoudre à les raccourcir (les tempérer est le mot juste), toutes les quintes ou certaines d'entre elles seulement, sans trop les abîmer. On a inventé des tempéraments par dizaines et leur nombre indique bien qu'il n'en existe aucun qui soit parfait. Les présenter tous n'aurait aucun sens mais il vaut la peine d'en expliquer certains parmi les plus significatifs. Précisons que le calcul, un brin technique, des fréquences d'accordage des notes découlant du tempérament retenu ne fait pas partie de cette présentation.
Douze quintes justes étant trop longues de P = 23.46 (cents) pour refermer exactement l'octave, quel(s) raccourcissement(s) peut-on envisager ? Pour y voir clair, redessinons le cercle de l'octave en positionnant différemment les notes, dans l'ordre des quintes avec un choix enharmonique, par exemple, mib, sib, fa, do, sol, ré, la, mi, si, fa#, do# et sol#. Dans cette représentation, une quinte pure est représentée par un arc mesurant 101.955 (cents) afin que 12x101.955 - 23.46 = 1200 (cents).
Une solution extrême consiste à raccourcir une seule quinte de l'entièreté de P, d'où les 11 autres quintes restent pures. La quinte raccourcie est inutilisable car elle sonne complètement faux, d'où son surnom de "quinte du loup (qui hurle !)". Les tonalités où cette quinte intervient sont donc proscrites, ce qui est une limitation sévère. On peut certes décider de la situer au sein d'une tonalité éloignée (de do majeur), par exemple entre sol# et mib, mais l'objection demeure que les modulations autorisées seront limitées aux tonalités voisines (de do majeur) sans quoi la quinte défectueuse est assurée de resurgir. Inutile d'ajouter que le problème des tierces fausses n'est pas réglé par cette option : à l'exception du raccourcissement dû à la quinte du loup, il n'est même pas abordé. Quintes et tierces confondues, un calcul de fausseté globale, quantité définie dans la note ci-dessous, donne une valeur de 65.31 (cents).
Le tempérament suivant, dû à Andreas Werckmeister (1645-1706), a connu un certain succès à l'époque baroque : il raccourcit les quintes do-sol, sol-ré, ré-la et si-fa# de P/4, qui deviennent, de ce fait, trop courtes de 5.865 (cents), un défaut acceptable pour l'oreille. Les 8 autres quintes restent pures et les tierces s'en trouvent (un peu) améliorées, surtout do-mi, qui profite de l'amputation de trois quarts de comma. Les tierces plus éloignées demeurent en l'état d'imperfection pythagoricienne. Quintes et tierces confondues, le même calcul livre une fausseté globale de 53.11 (cents).
Si l'on pousse à l'extrême la logique de la répartition de P sur plusieurs quintes, on aboutit, à la limite, à un partage équitable entre les 12 quintes, qui se trouvent raccourcies chacune de 2 cents environ, ce qui est tout à fait raisonnable. Les tierces demeurent fausses à concurrence de 1200 ℓg(4/5 24/12) = 13.685 (cents) mais c'est déjà mieux que les tierces pythagoriciennes (fausses de Z = 21.506 cents, pour rappel). Les quintes raccourcies valent à présent Q-P/12 = 700 (cents), une valeur commensurable avec la quinte (1200 cents) et garantissant forcément la fermeture de l'octave. Les intervalles entre les 12 notes partitionnant l'octave valent désormais exactement 100 cents d'où les notes se placent exactement sur les points rouges qui servaient de séparateurs (Toutes les modulations sont à présent trivialement possibles). La fausseté globale est minimale dans ce tempérament, elle vaut 47.89 (cents) et il n'y a pas moyen de faire mieux.
Note à l'usage des matheux. Vous trouverez dans la littérature, y compris dans celle remontant au 18ème siècle, quantité d'autres tempéraments amputant une quinte par-ci une quinte par-là, à la recherche du meilleur compromis. Ce désordre est plutôt étonnant à une époque où des mathématiciens fameux (Euler, d'Alembert, Descartes, ...) s'intéressaient à cette recherche. Ils auraient dû (sa)voir que ce problème d'optimisation quadratique ne possédait qu'une seule solution, précisément celle du tempérament égal. On s'en convainc en posant que les 12 quintes successives sont amputées (donc faussées) d'une quantité, zi (i = 1, 2, ..., 12; n'oubliez pas la contrainte que le total de ces amputations doit valoir le comma, P). Les 12 tierces s'en trouvent faussées, à leur tour, d'une quantité égale à, Z-(zi + zi+1 + zi+2 + zi+3), où l'entier i parcourt encore les valeurs de 1 à 12. On peut définir, sur cette base, une grandeur, F, qui quantifie raisonnablement la fausseté de la gamme résultante, quantité que l'on minimise par les procédés habituels de l'analyse mathématique. On trouve que le minimum de fausseté, F, est atteint lorsque tous les zi sont égaux à P/12, c'est bien le tempérament égal. Sans doute les musiciens objecteront-ils qu'une bonne oreille vaut mieux qu'un calcul aussi savant soit-il. Il n'empêche que pour cette fois ce furent les mathématiques qui finirent par avoir raison : le tempérament égal s'est progressivement imposé, à partir de 1800, non sans mal il est vrai.
La possibilité d'un tempérament égal n'avait pas échappé aux théoriciens de la Renaissance et de la période baroque (On dit même qu'elle était connue des chinois, depuis très longtemps). S'ils l'ont rejetée, dans un premier temps, c'est qu'ils étaient obsédés par la pureté des tierces.
Bien qu'à ce stade toute prospection supplémentaire paraisse superflue, au motif que l'optimum mathématique ait été prouvé coïncider avec le tempérament égal, l'histoire de la musique baroque mais aussi son renouveau actuel serait incompréhensible sans faire le détour par les tempéraments inégaux, adaptés à une plus grande pureté des tierces (donc une dégradation des quintes).
4 quintes pures étant trop longues de Z = 21.506 (cents) pour fabriquer une tierce majeure pure et Z n'étant après tout pas si éloigné de P = 23.46 (cents), les théoriciens de l'époque baroque ont passé un certain temps à chercher d'autres compromis basés sur l'amputation des quintes d'une fraction de Z (au lieu de P).
Le tempérament qui garantit le maximum (8) de tierces pures raccourcit 11 quintes de Z/4 et il allonge la douzième, qui fatalement devient fausse, de 7Z/4 - σ = 35.682 (cents), afin de garantir la fermeture de l'octave. Ce loup peut à nouveau être déplacé dans l'intervalle éloigné sol#-mib mais les modulations dans les tons éloignés demeurent problématiques.
Diderot a fait mention d'un "Tempérament ordinaire" dans ses écrits et Rousseau y a également fait allusion dans son tardif Dictionnaire de Musique (1768). Il s'agirait, selon toute vraisemblance, du tempérament en usage en France vers le milieu du 18ème siècle. Etrangement, Diderot n'en a donné aucune description précise comme si le sujet était suffisamment connu de tous pour se passer des détails (mais alors à qu(o)i servait l'Encyclopédie ?). Les musicologues ont analysé la description de Rousseau, un brin obscure et même contradictoire, et ils ont fini par admettre (sans garantie !) que 6 quintes (fa-do-dol-ré-la-mi-si) devaient être amputées de Z/4, les trois suivantes demeurer pures et les trois dernières être dilatées de Z/6 - σ/3, afin de refermer l'octave. Cela est représenté dans la figure ci-dessous. Les musiciens actuels sont au moins d'accord sur un point : ce tempérament ordinaire est plaisant et jouable dans toutes les tonalités. De plus, chaque tonalité possède sa couleur propre ce qui est bien dans l'idéal baroque.
On aurait pu espérer que Rameau, notoirement impliqué dans la théorie musicale au point de lui avoir consacré trois traités successifs (1722, 1726 et 1737), nous aurait éclairé définitivement sur la nature du tempérament idéal à ses oreilles mais il n'en est rien. D'un exposé à l'autre, il n'a cessé de se contredire pour finir par recommander du bout des lèvres le tempérament égal en pleine ascension dans l'air du temps. Le raffinement harmonique de sa musique est pourtant en parfaite contradiction avec cette recommandation et cela ne fait pas l'affaire des interprètes actuels qui en sont toujours à se demander quel tempérament ils doivent utiliser quand ils jouent sa musique. William Christie, engagé à Glyndebourne pour une représentation d'Hippolyte et Aricie, en 2013, a adopté un tempérament basé sur 7 quintes amputées de P/4, 2 quintes exactes, une quinte amputée de P/6 et deux quintes dilatées de 11P/24 (des demi-loups en quelque sorte, cf ce diagramme, proposé par la CBH Technical Library) mais tout le monde n'approuve pas qu'il s'agisse réellement du tempérament préféré du compositeur. La seule chose qui est sûre, c'est qu'on ne veut plus entendre jouer Rameau au tempérament égal (et sur instruments modernes) comme cela se pratiquait dans les années 1950 (On ne s'en plaignait même pas, tout heureux d'entendre un peu de musique de cet illustre musicien !).
Une autre polémique divise les musicologues concernant la diffusion du tempérament ordinaire en-dehors des frontières de l'Hexagone. Nul ne sait avec exactitude comment étaient accordés les instruments joués par J-S Bach ni ne connaît le tempérament souhaité par le compositeur dans son oeuvre didactique et magistrale "Das Wohltemperierte Klavier", regroupant 24 préludes et Fugues dans tous les demi-tons majeurs et mineurs de la gamme chromatique (Le premier cahier date de 1722 et le second, identique dans son esprit, date de 1744).
Bien que le principe du tempérament égal ait été connu à l'époque de Bach, celui-ci n'était nullement en usage. Avant Bach, il était courant de renoncer aux tonalités trop chargées en altérations afin de préserver (les nuances de) celles qui étaient jouables. "Bien" tempéré ne signifie donc pas "également" tempéré mais "convenablement" tempéré, de telle manière que les modulations dans les 24 tonalités majeures et mineures soient effectivement possibles.
Le 19ème siècle a vécu avec cette erreur que Bach pensait au tempérament égal mais si l'on y réfléchit un instant, cela n'aurait eu aucun sens que Bach passe son temps à écrire une pièce en do majeur puis une autre en do# majeur quand celle-ci sonnerait simplement comme la précédente, un demi-ton plus haut. Ce que Bach avait en tête était, sans doute, un tempérament inégal quoique jouable dans toutes les tonalités sans réaccordage de l'instrument. En particulier, chaque prélude devait conserver sa couleur particulière, conformément à l'esprit baroque. Quand on comprend ce raisonnement il ne reste plus qu'à en tirer la conclusion inéluctable : le Clavier bien tempéré "doit" être joué sur un (bon !) clavecin convenablement accordé. Réécoutez Kenneth Gilbert, c'est tout à fait convaincant. Datée de 1983, la très documentée pochette de son quadruple CD mentionne l'incertitude planant encore et toujours sur le tempérament voulu par Bach mais, inexplicablement, elle ne dit rien du tempérament qu'il a réellement utilisé comme interprète. Cela dit, on peut faire ce reproche à la plupart des enregistrements pour clavecin, ce qui devrait désormais vous agacer.
Sans y avoir assez réfléchi, j'ai longtemps été de l'avis de ceux qui pensaient que si Bach avait disposé du piano moderne, il aurait écrit son oeuvre pour cet instrument mais c'est un contresens manifeste. Cela dit, rien n'empêche que vous conserviez précieusement la version pianistique qui vous tient à coeur (Andras Schiff ?) !
Reste qu'à ce stade, on ne connait toujours pas le tempérament sous-entendu par Bach. Le musicologue, Bradley Lehman (site à visiter !), a publié une thèse, en 2005, tendant à démontrer que la clé de l'énigme se trouvait peut-être dans la succession des volutes, présumée cryptée, gribouillées par Bach en haut de la page de garde du manuscrit de son premier cahier. Vous en trouverez un agrandissement ci-dessous, renversé pour les besoins de la démonstration à venir.
Personne aujourd'hui ne pense que ces arabesques étaient là pour faire joli, ni qu'un enfant les a griffonnées, à l'insu de son illustre père. Le compositeur cryptait volontiers quelques messages numérologiques dans ses partitions (cf l'exposé de Gilles Cantagrel, Symbolique et Rhétorique chez J-S Bach); n'aurait-il pas utilisé le procédé dans un autre registre ? Certains le pensent et Lehman croit pouvoir affirmer que ce rébus indique le tempérament souhaité. C'est d'autant plus crédible que dans le texte de présentation qui complète la page de garde de son recueil, Bach précise son intention d'inciter les clavecinistes à faire la démonstration qu'il est possible de jouer dans tous les tons majeurs et mineurs. Reste à décrypter la devinette, si devinette il y a.
Quelques observations sautent aux yeux lorsqu'on regarde la fresque, de gauche à droite :
Les 12 volutes réparties en trois classes font irrésistiblement penser aux 12 quintes, tempérées de trois façons différentes. Je n'ai entendu personne mettre en doute la pertinence de la thèse du rébus, par contre les interprétations divergent :
L'étude des tempéraments n'est plus d'actualité depuis qu'on a adopté le tempérament égal. Seuls les baroqueux continuent de s'y intéresser, par la force des choses. Un tempérament commode car facile à implémenter est celui de Francesco Antonio Vallotti : il diminue les 6 quintes allant de fa à si de Z/6 et dilate la quinte sol#-mib du schisma résiduel, les autres quintes demeurant pures. Cela dit les querelles d'écoles ne se sont pas tues et les interprètes peuvent parfaitement hésiter avant d'opter pour un tempérament ! Au clavecin, il n'est d'ailleurs pas rare que l'instrument soit réaccordé à la pause d'un concert afin de mieux se prêter au répertoire de la deuxième partie.
Aujourd'hui, rien n'empêche de concevoir un tempérament original. Le facteur, Anthony Sidey, a pris cette initiative, relayée par Blandine Verlet dans un enregistrement récent de pièces choisies de François Couperin.
Le tempérament égal revient à diviser l'octave en douze intervalles rigoureusement égaux à 100 cents chacun (demi-tons tempérés). Dans ce système, le cycle des notes se répète avec une périodicité parfaite d'où la transposition devient un jeu d'enfant : il suffit de décaler les intervalles du pas constant désiré et on est certain de retomber sur une note de la gamme ainsi définie. On note que, par rapport au cycle pythagoricien, les notes enharmoniques ont purement et simplement fusionné. Vous trouverez ci-dessous le tableau des fréquences des notes en tempérament égal et au diapason moderne (la4 = 440 Hz). Ce tableau ne convient pas pour la musique ancienne, qui opte pour un tempérament inégal et pour un diapason généralement situé (à peu près) un demi-ton plus bas, à 415 Hz.
Le piano est, par excellence, l'instrument qui a adopté le tempérament égal, à quelques subtilités près qui concernent les registres extrêmes où les octaves sont légèrement étirées. Cette facilité s'est d'autant mieux imposée que l'intensité du son produit masque les imperfections harmoniques. Le tempérament égal est un non-sens au clavecin car il s'oppose au raffinement sonore de l'instrument; il est pourtant fréquent, en particulier au concert, lorsqu'on ne peut se permettre un réaccordage en fonction de la tonalité des pièces programmées. En enregistrement de studio, il ne se justifie absolument pas. Les cordes du violon moderne sont habituellement accordées selon l'ordre des quintes, sol, ré, la et mi, pythagoriciennes en théorie mais égales en pratique car un violon joue rarement seul. La situation du violon baroque peut s'avérer (nettement) plus compliquée, certaines partitions exigeant des accordages différents (par quartes, tierces, etc, c'est la Scordatura). Les célèbres (et difficultueuses !) Sonates du Rosaire de Heinrich Ignaz Franz Biber (1644-1704) sont dans ce cas.
L'adoption du tempérament égal simplifie incontestablement la tâche des pianistes mais le (modeste) prix à payer, c'est qu'à l'exception de l'octave, plus aucun intervalle ne sonne rigoureusement juste. Les rapports de fréquences des notes, tous du type, 2k/12 (k entier), sont devenus irrationnels, bien loin de l'idéal pythagoricien des fractions simples : si les quintes et les quartes sont pures à 1.95 cents près, ce qui est excellent, les tierces majeures et les sixtes mineures ne le sont qu'à 13.686 cents et c'est encore pire pour les tierces mineures et les sixtes majeures, "pures" à 15.641 cents près seulement. De plus, le tempérament égal gomme les différences de couleurs entre les tonalités d'où c'est devenu un abus de prétendre qu'en musique classico-romantique, l'ut majeur est martial et le fa majeur furieux et emporté : les deux sonnent pareillement à une quinte de distance.
Aucun musicien de l'époque baroque naissante n'aurait souscrit au tempérament égal. Pourtant, avec le temps, en particulier le développement de la musique pour ensembles instrumentaux, les musiciens ont compris que les problèmes de modulation allaient vite devenir insolubles, ce qui ouvrait inexorablement la porte au tempérament égal. Celui-ci n'a cependant été complètement effectif que vers 1850 (Beethoven était mort depuis 23 ans !), le temps que les accordeurs se mettent ... d'accord. Parmi tous les tempéraments envisageables, il est, en effet, resté longtemps un des plus difficile à régler, précisément par ce qu'aucun de ses intervalles n'est rigoureusement exact : l'accordage par l'ouïe, traditionnellement basé sur l'écoute des battements, est restée problématique jusqu'à l'avènement du diapason électronique. En 1940, Llewellyn Lloyd s'autorisait encore à publier un article (The Myth of Equal Temperament”, Music & Letters (1940b), 347-361), prétendant que le tempérament égal demeurait un mythe impossible à atteindre. En particulier, les chorales a capella n'adhèrent pas spontanément à un système contraire à l'intuition du chanter juste.
Il faut s'en faire une raison, le tempérament égal est une hérésie musicale à laquelle nos oreilles se sont parfaitement habituées. Seuls certains pavillons fragiles (mais expérimentés !) en souffr(ai)ent encore, telles celles du grand baroqueux, Nikolaus Harnoncourt, qui ne parvenait pas à s'y faire. Alors oubliées les conséquences du tempérament inégal ? Pas du tout et les apprentis musiciens en savent quelque chose qui doivent apprendre une orthographe musicale précisément héritée du tempérament inégal et bien peu en rapport avec la simplicité qu'aurait dû leur promettre une gamme "enfin rationnalisée". Mais ceci est une autre histoire dont un chapitre, au moins, relatif aux excès de la notation, fera l'objet d'une prochaine présentation.
Note ajoutée en 2020. Un opuscule recommandable vient de paraître aux éditions Aedam Musicae, sous le titre "Clavier bien tempéré et Justesse numérique". L'auteur, Florent Ploquin, y retrace l'histoire de l'accordage des instruments à clavier, en particulier la quête sans fin d'un tempérament idéal jusqu'à l'adoption plus ou moins contrainte et forcée du tempérament égal. Le dernier chapitre, particulièrement original, aborde les résultats des recherches acoustiques récentes appliquées au domaine des claviers numériques.
Le moment est venu d'illustrer les notions évoquées par quelques musiques d'époque.
C'est en France, pendant l'ère médiévale, que la polyphonie savante a fait ses premiers pas. Cela s'est fait très progressivement et jusque vers l'an 1000, on ne dépassait pas le stade de la diaphonie (ou organum parallèle) : la mélodie du plain-chant grégorien (vox principalis, aiguë) était simplement doublée en notes parallèles situées une quinte (ou une quarte) plus bas (vox organa), l'idéal pythagoricien était respecté. Des variantes multiples ont très vite prospéré (déchant, renversements, mouvements contraires, etc) mais ce n'est pas le lieu de les commenter.
Un siècle plus tard, en Angleterre, cette technique a été étendue à la tierce (et à son complément, la sixte), c'est le procédé plus rugueux du gymel. On attribue généralement cette initiative à John Dunstable (1390-1453). L'oeuvre de ce musicien a malheureusement été largement détruite lors du saccage des monastères à l'époque de la Réforme (1538). Nous n'en avons conservé que quelques copies passées à temps sur le continent, où elles ont influencé durablement la génération de Guillaume Dufay. La tierce a alors acquis son statut définitif de consonance imparfaite. Voici une illustration de cette "Contenance angloise" (sic), "Thomas Gemma Cantuarie" (Auteur anonyme de 14ème siècle), dans deux interprétations radicalement différentes, dues aux Ensembles Hilliard et De Caelis. La première regarde logiquement vers le Moyen-Age finissant tandis que l'autre emprunte abusivement au courant de la Renaissance (cf infra).
Avec le temps (et le commerce des épices ?), les oreilles continentales se sont habituées aux frottements créés par ces tierces un peu fausses, jusqu'à y prendre goût. L'idée a dès lors germé de les purifier, ce qui réclamait soit des aménagements dans le modèle pythagoricien, c'était la technique du tempérament, soit une refonte complète de la théorie, c'était l'idéal de la gamme naturelle. La Renaissance tardive a largement cultivé les tierces exactes dans un ensemble de pièces vocales a capella conformes à l'idéal de pureté de la Contre-Réforme. Les choeurs non accompagnés se sont sentis à l'aise dans cette justesse intrinsèque même si les objections ne manquaient pas : comme l'a noté Jacques Chailley, les accords zarliniens se satisfont de leur propre justesse sans chercher ailleurs leur résolution. Il en résulte un chant lisse, certes impeccable mais lassant sur le long terme et peu prometteur pour (la musique de) l'avenir (Giovanni Pierluigi da Palestrina (1525-1594) : Sicut cervus et Sitivit anima mea et Missa brevis; Tomas Luis de Victoria (1548-1611) : Missa Salve Regina). Avec ses tierces légèrement trop longues (de Z/4), le modèle pythagoricien crée davantage de tensions qui demandent à être résolues. Il en résulte un discours dynamique quand le discours zarlinien demeure nettement statique. Entre les deux, le tempérament égal saura se frayer un chemin, représentant un compromis fonctionnel qui n'a que le défaut d'abolir notre instinct de justesse.
Le tempérament inégal, cultivé par l'école française de clavecin (François Couperin (1668-1733) : La Ménetou) - on pourrait y ajouter le répertoire pour orgue - fut encore célébré par Rousseau, 50 ans plus tard. Les musiciens baroques, férus de pittoresque, se sont délectés des atmosphères différentes propres à chaque tonalité. Marc-Antoine Charpentier (1636-1704) avait même tenté un inventaire des caractères par tonalités (cf ce lien : Muse baroque), que Rameau n'approuva que dans les cas flagrants.
Le tempérament inégal n'a pas pas passé le cap de la Révolution française. Les clavecins, victimes d'un Ordre nouveau, ont fait place aux piano(forte) plus sonores et moins regardants quant aux nuances infinies que les auditeurs percevaient, de toute façon, de moins en moins. L'histoire allait dans le sens d'une lente appropriation d'intervalles de moins en moins confortables, comptant sur la complicité d'auditeurs tolérants et surtout curieux.
Aux époques classique et romantique, les oreilles se sont complètement habituées au tempérament égal, préférant se concentrer sur les possibilités infinies qu'offrait le jeu des modulations. Les quintes (Joseph Haydn : Célèbres deux premières mesures du Quatuor opus 76 n°2) et autres accords parfaits ont prospéré jusque dans des oeuvres tardives et célèbres : les fameuses premières mesures du poème symphonique Also sprach Zarathoustra (1896) de Richard Strauss en proposent un condensé éloquent.
L'époque moderne a tellement brouillé les pistes (et les intervalles !) qu'elle n'est plus guère susceptible d'illustrations pertinentes : les quintes et les tierces subsistent évidemment mais elles côtoient désormais des intervalles de plus en plus larges, frisant l'extravagance quand ils s'adressent à la voix. Dans ses mémoires, le grand chef russe Guennadi Rojdestvenski raconte que, tant à Saint-Pétersbourg qu'à Moscou, les visites d'inspection des travaux de fins d'étude, par la Commission du Prolektikut, déclenchait un vent de panique chez les élèves : tous, armés d'une gomme ou d'un grattoir, remplaçaient (provisoirement !) les intervalles dissonants par une quinte par-ci, une quarte par-là.
Le cas posé par la seconde école de Vienne est différent. Le dodécaphonisme a clairement adopté le tempérament égal non par commodité mais par nécessité quasiment logique. Cela ne l'a pas empêché de connaître toutes sortes de variantes dissidentes où la consonance n'était pas forcément absente. Si celle-ci fut nettement évitée par Webern, tel ne fut pas le cas d'Arnold Schönberg ni d'Alban Berg (Concerto pour violon), pour s'en tenir à deux acteurs essentiels de cette école. Que l'uniformisation de la gamme à 12 sons n'ait pas débouché sur une refonte simplificatrice de la notation musicale est un mystère sur lequel je reviendrai prochainement.
Enfin et provisoirement, les 40 dernières années ont connu le retour en force de la tonalité et de son extension, la modalité, pour le plus grand plaisir de ceux qui ne se lassent pas de ces quintes, quartes, tierces et autres sixtes qui nous ont tant occupés (Philip Glass : Dance IX et sa caricature, Music in Fifths, une réaction contre "l'interdiction" enseignée dans tous les conservatoires d'(ab)user de ces mouvements en quintes parallèles qu'un 20ème siècle blasé a jugées tout juste dignes de l'an 1000).