25 août 2023: Meta vient de mettre en opensource à disposition Seamlessm4t qui se targue d’être un traducteur universel qui prend en compte 100 langues par écrit et en speech to text >>> en savoir plus : https://thetechportal.com/2023/08/22/meta-introduces-seamlessm4t-an-ai-model-that-translates-and-transcribes-nearly-100-languages/
L’humanité a toujours été fascinée par l’idée de surmonter les barrières linguistiques. Cette ambition est ancrée dans nos mythes les plus anciens, comme le récit biblique de la Tour de Babel. Aujourd’hui, cette aspiration trouve écho dans les avancées des technologies des modèles de langage à grande échelle (Large Language Models, LLM) basés sur l’architecture Transformer de type ChatGPT, Bing Chat, Bard, Llama, Claude…
Le récit biblique de la Tour de Babel et les LLM partagent une ambition commune : transcender les limites linguistiques. Dans le mythe de Babel, l’humanité, unie par une seule langue, entreprend de construire une tour qui atteindrait le ciel, illustrant une volonté d’unification et de grandeur. De même, les LLM cherchent à créer une intelligence artificielle polyglotte capable de comprendre et de générer du texte dans diverses langues, démontrant une aspiration à l’unité malgré la diversité linguistique.

Toutefois, il est essentiel de reconnaître que les motivations à la base de ces ambitions sont très différentes. Dans le récit biblique, l’ambition est teintée d’orgueil, avec une volonté de rivaliser avec le divin. Par contraste, les LLM sont motivés par une volonté de résoudre un défi technologique et d’améliorer les interactions humaines à travers les barrières linguistiques.
La Tour de Babel et les LLM représentent tous deux des moments de progrès significatifs. D’un côté, nous avons une tour monumentale, symbole de l’innovation architecturale de l’époque. De l’autre, les LLM, qui sont le fruit des avancées en apprentissage profond et en traitement du langage naturel, sont de véritables prouesses technologiques. Cependant, les conséquences de ces avancées diffèrent considérablement. La construction de la Tour de Babel a fini par entraîner la dispersion de l’humanité à travers le monde et la naissance de différentes langues, entravant ainsi la communication. À l’inverse, les LLM ont le potentiel d’unir les personnes en facilitant la communication à travers les barrières linguistiques.

Dans le récit de la Tour de Babel, l’intervention divine a mis fin à l’ambition humaine. Avec les LLM, il n’y a pas d’intervention divine, mais il y a de sérieuses considérations éthiques et sociales. L’essor des LLM soulève des questions sur leur utilisation responsable, la protection de la vie privée, les biais algorithmiques, et la fracture numérique. Alors, est-ce que ChatGPT, ou tout autre LLM, est une version réussie de la Tour de Babel ? La réponse est plus compliqué qu’il n’y parait.
D’une part, les LLM réussissent là où la Tour de Babel a échoué : ils parviennent à surmonter les barrières linguistiques, facilitant ainsi la communication et l’échange d’idées. ChatGPT, Bard et les autres permettent à des personnes ne maitrisant pas bien une langue (illettrisme, personnes muettes ou sourdes, dyslexie, dysorthographie, etc) de s’exprimer, d’être comprises et d’obtenir une réponse dans plusieurs langues (bientôt toutes y compris le Breton, l’Occitan, etc) ou selon leur degré de compréhension (« explique moi l’informatique quantique comme si j’avais 12 ans »).

D’autre part, les LLM ne sont pas encore « parfaits » loin de là. En premier lieu le nombre de langues qu’ils maîtrisent n’est pas encore complet (100 environ). Ensuite les questions éthiques et sociales qui les entourent nécessitent une réflexion et une réglementation attentives. On sait que les corpus de textes qui sont tokenisés par les LLM pour leur entrainement sont linguistiquement biaisés (contenus anglo-saxons ou « occidentaux ») et à posteriori « traduits » dans d’autres langues. Donc on serait légitimes à se poser la question de savoir si un LLM « francophone », entraîné sur des contenus exclusivement francophones, serait différent par nature d’un LLM multi-linguistique ou anglo-saxon qui serait ensuite « transposé » dans d’autres langues.
Tout comme la construction de la Tour de Babel, l’essor des LLM est une manifestation de l’ingéniosité et de l’ambition humaines. Cependant, il est essentiel que cette ambition ne nous aveugle pas aux implications potentiellement néfastes de ces technologies. Comme le récit biblique nous le rappelle, l’orgueil humain doit avoir des limites. En matière de LLM, nous ne devons pas pécher par solutionnisme technologique, car ce sont les personnes les plus vulnérables, celles qui risquent d’être laissées pour compte, qui pourraient nous en vouloir… et l’idée que l’anglais puissent être la « méta-langue » qui permet de traduire toutes les autres, ou que le langage est réductible à des tokens vectorisés serait un « blasphème » pour les linguistes autant que pour le bon sens.

Abordons donc le développement et l’utilisation des LLM avec humilité et prévoyance, en gardant à l’esprit les leçons de la Tour de Babel. C’est seulement alors que nous pourrons vraiment dire que nous avons réussi là où la Tour de Babel a échoué et reconstruire une autre unité du genre humain dont nous avons tant besoin pour faire face aux défis communs qui sont devant nous.



Vous devez être connecté pour poster un commentaire.