Peut-on se fier au dictionnaire pour déterminer quelle langue a le plus de mots ?
Si l’on ne se base que sur le nombre d’entrées dans le dictionnaire, l’anglais est en pole position des langues les plus riches, avec plus de 200 000 mots recensés dans l’Oxford English Dictionary, dont 171 476 mots en usage et 47 156 mots obsolètes.
Cette richesse lexicale tient en grande partie aux invasions de l’Angleterre par les Vikings puis les Normands, ainsi qu’à la colonisation et aux vagues successives d’exploration qui ont enrichi le vocabulaire anglais en mots étrangers. Aujourd’hui, les rapides avancées dans le monde technologique, où l’anglais fait office de lingua franca, viennent constamment compléter le lexique anglais et conforter sa position.
Le français, pour lequel le Larousse recense quelques 59 000 mots, semblerait presque être une langue pauvre. Mais est-ce aussi simple ? Le fait que des mots d’usage courant depuis des années tels que « burrata », « yuzu », ou encore « covoiturer » n’aient fait leur entrée dans les pages du Larousse . Et ce d’autant plus que le nombre d’entrées du dictionnaire semble parfois correspondre davantage à des choix arbitraires qu’à l’usage courant. Le Littré, lui, compte 132 000 mots actifs, soit près de trois fois plus que le Larousse. De plus, ces dictionnaires, publiés pour un usage local, se limitent aux mots du pays en question. Or, l’usage du français dépasse largement les frontières de la France : on voit très vite que la tâche devient incroyablement complexe dès que l’on cherche à être exhaustif.
Tenter de trouver un nombre absolu pour classer les langues ne semble pas forcément être la meilleure approche. Il deviendrait par ailleurs impossible d’intégrer les langues sans écriture dans ce classement. Enfin, si le dictionnaire peut aider à trancher la question concernant les langues mortes, les langues vivantes, elles, évoluent constamment. On peut dès lors poser la question différemment : plus que le nombre absolu de mots, il s’agit d’estimer la richesse de la langue et sa capacité à pouvoir, à travers son vocabulaire et ses expressions idiomatiques, décrire précisément les expériences du réel et du monde des idées.
La notion de « mot » au cœur du débat du classement des langues les plus riches
Au cœur de la controverse réside la définition, nécessairement imprécise et relative, de ce qu’est un mot. En effet, d’après le Larousse, un mot est « un élément de la langue composé d’un ou de plusieurs phonèmes, susceptible d’une transcription écrite individualisée et participant au fonctionnement syntacticosémantique d’un énoncé ». La notion de phonème, petite unité de langage, est elle-même difficile à appréhender. Doit-on considérer les changements résultant de l’inflexion des racines comme des entités distinctes, à l’instar de beso, besito, besar en espagnol (un baiser, un bisou, embrasser) ? La deuxième question est celle des significations multiples, nombreuses en anglais : le mot walk, par exemple, renvoie tant à un verbe (marcher) qu’à nom commun (une marche, une promenade).
Mot : un élément de la langue composé d’un ou de plusieurs phonèmes, susceptible d’une transcription écrite individualisée et participant au fonctionnement syntacticosémantique d’un énoncé.
Par ailleurs, certaines langues font pratique commune de composer des mots par association. L’allemand, avec ses nombreux mots valises, est un cas d’école. Mais peut-on vraiment considérer que le simple ajout d’un -S pour relier deux noms communs donne un mot entièrement nouveau ? Peut-on véritablement considérer Unabhängigkeitserklärung, à traduire « déclaration d’indépendance », comme un mot à part entière ?
De même, le turc, langue agglutinante, permet la construction de mots à partir de nombreux suffixes collés les uns aux autres. Le très coloré muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine, qui signifie littéralement « bien que vous n’êtes pas l’un de ceux que nous puissions changer en créateur de personnes qui réussissent », ne contient pas moins de 70 lettres ! Doit-on le compter comme une entrée à part entière, ou se baser uniquement sur la racine du mot muvaffakiyet (succès) ?
Romances sans paroles
Le problème se pose pour les langues où la combinaison est une nécessité. Ainsi, les Chinois, à l’inverse des Occidentaux, ne se préoccupent pas tant du concept de mot lorsqu’ils apprennent du vocabulaire. L’unité de base est, certes, un logogramme, mais c’est son utilisation combinée avec un autre logogramme qui créé le sens. 中國 (Zongguo) désigne le nom propre « Chine ». « Empire du Milieu », bien que plus coloré, n’est qu’une traduction littérale de chaque sinogramme. Il combine les mots milieu et empire Cela signifie-t-il que « Zongguo » n’est pas un mot à part entière ?
Finalement, si la question de savoir quelle langue contient le plus de mots est complexe, il s’avère encore plus difficile de tenter une classification des langues selon leur richesse, une notion aléatoire. Certains concepts existent dans une langue et peuvent manquer dans d’autres. Ainsi, la notion de tutoiement et vouvoiement est étrangère à un anglophone, mais existe dans de nombreuses langues latines telles que le français, l’espagnol, l’italien ou le portugais. D’autres langues, comme le japonais ou le coréen, ont une approche encore plus complexe de la politesse.
Plutôt que de comparer les langues entre elles, pourquoi ne pas repenser la question différemment en se demandant en quoi les langues étrangères s’enrichissent mutuellement ? Chacune d’entre elles représente un univers propre, comparable en cela à la pièce d’un immense puzzle que chaque idiome contribue à compléter.