.
-

Les langues > Indo-européen > langues indiennes
La langue romani
Les langues tsiganes
L'ensemble désigné sous le nom de romani (ou de langues tsiganes) constitue un groupe de variétés linguistiques étroitement apparentées, parlées par les communautés Roms, Sintés, Kalés et d'autres populations similaires à travers le monde (Les Tsiganes). Ces langues partagent une origine unique en Inde, plus précisément dans le nord-ouest du sous-continent indien, d'où elles sont issues il y a environ un millénaire. Leur parenté avec les langues indo-aryennes centrales (comme le hindi ou le rajasthani) est évidente au niveau de la grammaire de base et d'une partie substantielle du vocabulaire fondamental. Leur développement et leur diffusion sont le résultat direct des grandes migrations des peuples roms à travers l'histoire, principalement vers l'ouest.

Le lexique est un témoin  du parcours historique des Roms. À la couche fondamentale indo-aryenne se sont superposés des emprunts massifs, qui varient selon les routes migratoires. On trouve ainsi un important substrat persan et arménien, puis, de manière plus significative, un apport considérable du grec médiéval, notamment pour des termes abstraits, techniques ou religieux. Cette influence grecque est si profonde qu'elle touche également la morphologie. Ensuite, chaque variété régionale a intégré un vocabulaire issu de la langue majoritaire du pays d'accueil : du roumain pour les Vlax, de l'allemand pour les Sintés, du hongrois, des langues slaves, et ainsi de suite. Cela rend parfois l'intercompréhension difficile entre locuteurs de variétés géographiquement éloignées. La diversité dialectale est donc immense. 

Le romani est avant tout une langue de l'oralité et de la vie communautaire intime. Son écriture et sa standardisation sont des phénomènes récents et encore limités. La transmission est menacée par les politiques d'assimilation passées et présentes, la sédentarisation forcée, la scolarisation dans la langue dominante et la stigmatisation sociale.

La grammaire romani.
L'ordre de base des constituants dans le romani est sujet-objet-verbe (SOV), conforme à ce qui prévaut dans les langues indo-aryennes anciennes et modernes. Cet ordre peut toutefois être flexible dans certains dialectes modernes, notamment sous l'influence de langues à ordre SVO comme le roumain ou le français.

Les noms en romani distinguent deux genres grammaticaux : masculin et féminin. Ce genre est marqué tant sur le nom lui-même (en particulier par des suffixes comme -o pour le masculin et -i pour le féminin dans les formes nominatives) que sur les adjectifs, articles et déterminants qui s'y rapportent. Il existe également un système casuel développé, avec jusqu'à huit cas dans certaines variétés archaïques (nominatif, accusatif, datif, génitif, locatif, ablatif, instrumental, vocatif), bien que les dialectes modernes aient souvent réduit ce système à trois ou quatre cas principaux, voire à une opposition binaire entre forme directe et forme oblique (utilisée avec des postpositions ou pour marquer l'objet). Le marquage casuel se fait généralement par des suffixes. 

Le pluriel des noms se forme par des suffixes variables selon le genre et le type nominal. Par exemple, en romani balkanique, on trouve souvent -a pour les noms masculins (rom = homme → roma = hommes) et -a ou -i pour les féminins (romni =  femme → romnja ou romni au pluriel selon le dialecte). L'accord en nombre et en genre s'applique aussi aux adjectifs et aux participes. 

Les pronoms personnels présentent des formes pour les trois personnes, au singulier et au pluriel, et parfois une distinction entre formes sujet et formes obliques. Certains dialectes conservent une distinction entre nous inclusif (incluant l'interlocuteur) et nous exclusif (l'excluant), héritée des langues indo-aryennes. Les pronoms démonstratifs et interrogatifs suivent des paradigmes casuels similaires à ceux des noms, ce qui reflète une forte intégration du système nominal. 

Les verbes s'accordent en général avec le sujet en personne et en nombre, et parfois en genre, surtout au participe passé, ce qui constitue une caractéristique clé héritée du sanscrit et des prâkrit. Le système verbal distingue plusieurs temps (présent, passé, futur) et aspects (accompli, inaccompli, habituel), souvent exprimés à l'aide de constructions analytiques ou de suffixes verbaux. Le futur, par exemple, est fréquemment formé avec un auxiliaire dérivé du verbe aller, tandis que le passé parfait utilise un participe passé combiné à un auxiliaire signifiant être. Les langues tsiganes possèdent un mode subjonctif (souvent utilisé après des conjonctions ou dans des propositions subordonnées), un impératif, et parfois un conditionnel formé analytiquement. 

Les verbes se conjuguent à l'aide de suffixes personnels, bien que certaines formes modernes tendent à simplifier ces paradigmes sous l'effet de langues hôtes analytiques. Les participes, en particulier le participe passé, jouent un rôle clé dans la formation des temps composés et s'accordent en genre et en nombre avec le sujet ou l'objet, selon la variante dialectale et la construction (active ou passive). 

Le romani utilise des postpositions plutôt que des prépositions, conformément à sa typologie SOV. Ces postpositions gouvernent souvent un cas particulier (généralement l'oblique ou le locatif), et leur emploi est cohérent avec les structures indo-aryennes. Par exemple, pour dire "dans la maison", on dira quelque chose comme ghar-e ( = maison-LOC) dans plusieurs dialectes. 

La dérivation lexicale est très productive, notamment grâce à des affixes d'origine indo-aryenne. Les préfixes et suffixes permettent de former des noms d'agent, des adjectifs, des verbes causatifs ou réfléchis, etc. Par exemple, le suffixe -ipen ou -iben forme des noms abstraits (baro = grand  → bariben = grandeur). Le verbe peut aussi servir de base à des noms d'action ou d'état. 

Le lexique de base reste largement indo-aryen (environ 60 à 70 % du vocabulaire fondamental), mais de nombreuses langues tsiganes ont intégré d'importantes couches lexicales : mots grecs dans les variétés balkaniques (résultat d'un long séjour en territoire byzantin), mots slaves dans les dialectes d'Europe centrale et orientale, mots roumains en Valachie, mots persans ou arméniens dans certaines variétés du Proche-Orient, et plus récemment, emprunts à l'anglais, au français ou à l'allemand. Ces emprunts ne se limitent pas au vocabulaire : certaines variétés ont adopté des structures syntaxiques calquées sur la langue dominante, comme l'emploi de l'auxiliaire avoir dans les temps composés, ce qui est atypique pour une langue indo-aryenne. 

L'histoire du romani.
L'étude linguistique des différentes variantes du romani a permis de reconstituer avec une relative précision l'histoire ancienne des Tsiganes, en particulier leur origine indienne, bien avant que les sources écrites européennes ne mentionnent leur présence. Les bases structurelles du romani, notamment la morphologie verbale, le système des cas nominaux et une grande partie du vocabulaire fondamental, remontent à un état de langue proche des prâkrit tardifs et des formes indo-aryennes médiévales. Les analyses comparatives montrent que les ancêtres des locuteurs romani ont quitté le sous-continent indien probablement entre le IXe et le XIe siècle. Cette migration progressive, plutôt qu'un déplacement unique, s'est accompagnée d'un long séjour dans différentes régions, ce qui explique la stratification lexicale observable dans les langues romani actuelles.

Après la sortie de l'Inde, les populations proto-romani ont transité par l'Afghanistan et l'Iran, où leurs langues ont intégré un nombre significatif d'emprunts au persan, tant lexicaux que phonétiques. Cette couche iranienne est suivie d'une couche arménienne, attestée par des emprunts au vocabulaire de base et par certaines constructions syntaxiques, ce qui suggère un séjour prolongé dans le Caucase ou en Arménie. L'étape byzantine est particulièrement déterminante : au contact du grec médiéval, les variétés romani empruntent non seulement de nombreux mots, mais aussi des éléments grammaticaux, tels que des préfixes verbaux, des particules et certains modèles dérivationnels.

L'arrivée des Tsiganes en Europe, à partir du XIVe siècle, marque le début d'une diversification linguistique rapide. En se dispersant sur un vaste territoire allant des Balkans à la péninsule Ibérique, puis à l'Europe centrale et septentrionale, les communautés romani entrent en contact avec une grande variété de langues européennes. Chaque groupe intègre alors des emprunts massifs à la langue majoritaire environnante, tout en conservant un noyau grammatical commun. Cette dynamique produit une fragmentation dialectale importante, au point que certaines variétés romani sont aujourd'hui mutuellement peu intelligibles sans exposition préalable.

Dans certains cas, le contact prolongé avec les sociétés environnantes a conduit à des formes de rélexification avancée. Le caló ibérique, par exemple, conserve une morphologie romani très réduite et repose largement sur un lexique espagnol ou portugais, avec seulement un substrat romani identifiable. À l'inverse, d'autres variétés ont maintenu une structure grammaticale complexe, notamment un système de cas et de conjugaison élaboré, témoignant d'une forte continuité linguistique malgré la dispersion géographique.

L'histoire des langues tsiganes est également caractérisée par l'absence prolongée de tradition écrite standardisée. Transmises principalement à l'oral, elles ont longtemps été marginalisées, parfois réprimées, et rarement utilisées dans des contextes officiels. Ce n'est qu'au XXe siècle que des tentatives de codification et de standardisation émergent, souvent à des fins éducatives, culturelles ou militantes. Ces initiatives se heurtent toutefois à la grande diversité dialectale et à la sensibilité identitaire des communautés, pour lesquelles la variété locale de la langue constitue un marqueur central d'appartenance.

Aujourd'hui, les variétés du romani se trouvent dans des situations sociolinguistiques très contrastées. Certaines variétés sont encore transmises activement aux jeunes générations, tandis que d'autres sont gravement menacées de disparition. La pression des langues dominantes, l'urbanisation, la scolarisation monolingue et la stigmatisation sociale ont accéléré le déclin linguistique dans de nombreux contextes. 

Classification interne du romani.
Le romani présente une grande variation dialectale, au point que certains linguistes parlent d'un continuum dialectal plutôt que d'une seule langue. Ce continuum de variétés apparentées,  peut être organisé en groupes dialectaux relativement cohérents, mais aux frontières parfois floues. 

Un premier critère majeur de classification est la chronologie des emprunts lexicaux et morphologiques. Toutes les variétés romani partagent une couche indo-aryenne héritée, suivie de couches d'emprunts persans, arméniens et grecs, ce qui atteste d'une histoire commune jusqu'à l'entrée dans l'espace byzantin. Les différences apparaissent principalement après la dispersion en Europe, lorsque chaque groupe adopte des emprunts massifs à la langue dominante de son environnement. La nature de ces emprunts, leur intégration morphologique et leur ancienneté constituent des indicateurs essentiels pour regrouper les variétés.

Les variétés dites balkaniques forment généralement un premier ensemble. Elles sont parlées dans le sud-est de l'Europe, notamment en Grèce, en Bulgarie, en Macédoine du Nord et en Turquie européenne. Elles se caractérisent par une forte influence grecque, visible dans le lexique, la phonologie et certaines constructions syntaxiques. Sur le plan morphologique, ces variétés tendent à simplifier le système de cas nominal et à adopter des structures analytiques proches de celles des langues balkaniques environnantes. Elles conservent néanmoins des traits anciens, ce qui conduit certains linguistes à les considérer comme relativement conservatrices sur le plan historique.

Un deuxième grand ensemble est constitué par les variétés vlax, issues de groupes ayant séjourné durablement dans les principautés roumaines. Ces variétés, aujourd'hui largement répandues en Europe et au-delà en raison de migrations récentes, se distinguent par une influence roumaine très marquée. Celle-ci se manifeste par un important apport lexical, mais aussi par des éléments morphosyntaxiques, tels que l'usage de certains suffixes dérivationnels et des modèles de formation verbale. Les variétés vlax ont généralement conservé un système de cas plus riche que celui des variétés balkaniques et présentent une structure grammaticale souvent perçue comme plus classique dans les descriptions linguistiques.

Les variétés centrales regroupent des parlers d'Europe centrale et orientale, notamment en Slovaquie, en Hongrie, en Autriche, en République tchèque et dans le sud de la Pologne. Elles se caractérisent par des contacts intenses avec les langues slaves et germaniques, qui ont influencé la phonologie, le lexique et certaines constructions syntaxiques. Ces variétés occupent une position intermédiaire dans la classification, partageant des traits avec les groupes balkaniques et vlax, tout en développant des innovations propres. Leur diversité interne est importante, ce qui rend leur délimitation parfois délicate.

Les variétés septentrionales ou nordiques constituent un autre ensemble, souvent associé aux groupes romani présents en Europe du Nord et du Nord-Ouest. Elles incluent notamment le romani parlé en Scandinavie et certaines variétés liées historiquement aux groupes voyageurs. Ces parlers montrent une influence marquée des langues germaniques et scandinaves, ainsi qu'une simplification morphologique accrue. Dans certains cas, l'érosion du vocabulaire d'origine et la réduction du système grammatical sont suffisamment avancées pour remettre en question leur inclusion pleine et entière dans le romani au sens strict, bien qu'un noyau hérité reste identifiable.

Les variétés occidentales, telles que le sinti et les formes apparentées, occupent une place particulière dans la classification. Parlées principalement en Allemagne, en France, en Italie et dans les régions voisines, elles présentent une forte influence des langues germaniques et romanes. Le sinti, en particulier, conserve une morphologie romani relativement développée, tout en intégrant un lexique largement germanisé. À l'extrémité de ce continuum se trouvent des parlers comme le caló ibérique, où la structure grammaticale romani est fortement réduite et où la langue fonctionne essentiellement comme un système lexical inséré dans une grammaire romane.

Certains linguistes distinguent par ailleurs des variétés méridionales spécifiques, comme le romani de Crimée ou certaines variétés du Caucase, qui ne s'intègrent que partiellement aux grands ensembles précédents. Ces parlers présentent des combinaisons particulières d'emprunts et de traits structurels, reflétant des trajectoires migratoires distinctes. 

.


[Histoire culturelle][Grammaire][Littératures]
[Aide][Recherche sur Internet]

© Serge Jodra, 2025. - Reproduction interdite.