Persan (farsi) : locuteurs, grammaire et Iran

Language

persan

53M speakers · Indo-European › Indo-Iranian · Arabic

Sur la carte

En un coup d'œil

Pendant plus d'un millénaire, le persan a été la langue de prestige d'une vaste sphère culturelle s'étendant de l'Anatolie au Bengale et jusqu'à certaines parties de la Chine. Il fut la langue de cour de l'Empire moghol en Inde pendant des siècles. Il a servi de langue littéraire et administrative majeure de l'Empire ottoman. Il était la lingua franca de la poésie, du savoir et de l'art de gouverner à travers ce que les historiens appellent le monde persanophone. Le canon poétique — le Shahnameh de Ferdowsi, Rûmî, Hâfez, Saadi, Khayyam — est l'une des grandes littératures du monde, et a été lu dans toute cette région pendant des siècles. Le persan n'a plus cette portée géographique, mais le prestige et la littérature perdurent.

Le persan est le plus grand membre de la branche iranienne de la famille indo-européenne, aux côtés de langues sœurs comme le pachto, le kurde, le baloutche et le tadjik. Plus précisément, il se situe dans le sous-groupe sud-occidental, avec le lori et le bakhtiari comme cousins proches. Le persan moderne a environ 1 400 ans en tant que tradition écrite continue. Les plus anciens poèmes et proses qui nous soient parvenus datent des IXe et Xe siècles de notre ère et restent lisibles pour les locuteurs lettrés d'aujourd'hui, d'une manière que le vieil anglais ne l'est pas pour les anglophones. Avant cela venait le moyen-persan (pahlavi), écrit dans un alphabet dérivé de l'araméen et utilisé par l'Empire sassanide. Et avant cela, le vieux-persan, la langue des inscriptions royales achéménides, écrite dans une écriture cunéiforme semi-alphabétique à partir du VIe–Ve siècle avant notre ère.

Aujourd'hui, le persan est la langue officielle de l'Iran, où il est la première langue de plus de la moitié des quelque 80 millions d'habitants du pays. Des dizaines de millions d'autres le parlent en Afghanistan, au Tadjikistan et dans une diaspora mondiale. Le taux d'alphabétisation des adultes en Iran est d'environ 93 %. Comme le dit Yousef dans sa grammaire complète, « Le persan moderne a été grandement simplifié. Pas de genre, et pas de déclinaison des noms et des adjectifs » — un fait frappant pour une langue dont les lointains cousins indo-européens (russe, allemand, latin, sanskrit) sont célèbres pour leurs systèmes de cas et de genre. Le persan s'est débarrassé de presque tout cela. Ce qu'il a conservé, et ce qu'il a construit par-dessus, fait l'objet du reste de cette page.

Varieties

Le persan est une langue pluricentrique. Il existe trois standards nationaux, chacun avec son propre nom, dans trois pays. En Iran, on l'appelle le fārsi (فارسی). En Afghanistan, on l'appelle le dari (دری). Au Tadjikistan, on l'appelle le tadjik (тоҷикӣ). La dénomination reflète davantage l'histoire politique que la distance linguistique : Yousef compare la situation à l'allemand, que les Allemands appellent Deutsch. Dans les écrits académiques, les trois sont généralement regroupés sous le seul nom de « persan », et la littérature classique est partagée entre les trois avec pratiquement aucune différence. Le persan écrit formel est largement uniforme. Là où les trois divergent le plus, c'est dans le vocabulaire quotidien, la prononciation et — le plus visiblement — l'écriture. L'Iran et l'Afghanistan utilisent l'alphabet perso-arabe. Le Tadjikistan, sous la politique linguistique soviétique au XXe siècle, est passé au cyrillique, qu'il utilise encore. L'ISO 639-3 sépare les trois en codes distincts (pes pour le persan occidental / farsi iranien, prs pour le dari, tgk pour le tadjik) ; cette page se concentre sur le persan occidental.

En Iran même, le fait sociolinguistique majeur est qu'un accent est effectivement devenu le standard national. La prononciation, le vocabulaire et les schémas familiers de Téhéran servent désormais de norme parlée de facto à travers le pays, propagés par les médias de masse, le système éducatif et la migration vers la capitale. Yousef énonce la tendance sans ambages : le téhérani « n'est pas seulement compris dans tout l'Iran — et au-delà — grâce aux médias, mais menace d'assimiler tous les vernaculaires locaux avec le temps ». Windfuhr, écrivant en 1979, qualifiait le téhérani de « dialecte socialement le plus prestigieux » et « en voie de devenir rapidement le dialecte standard de l'Iran ». En 2026, ce processus est en grande partie achevé dans les contextes formels et médiatiques. Les accents régionaux — à Mashhad, Ispahan, Chiraz, Yazd, Kerman, la côte caspienne, la côte du Golfe — existent encore dans le langage quotidien et restent facilement reconnaissables, mais ils reculent, et les linguistes ont lancé des efforts de documentation pour les enregistrer avant qu'ils ne disparaissent. L'Iran abrite également d'importantes communautés linguistiques dans des langues non iraniennes, la plus grande étant l'azéri ; le kurde, l'arabe, le baloutche, le turkmène et l'arménien sont également largement parlés dans leurs régions respectives.

La division la plus importante dans la vie quotidienne n'est pas régionale mais stylistique. Il existe essentiellement deux registres qui coexistent. Le persan formel/écrit est la langue des journaux télévisés, des conférences, des discours publics, des manuels, des documents gouvernementaux et de la plupart des documents imprimés. Le téhérani familier est la langue des amis, de la famille et des conversations ordinaires. Les deux diffèrent de manière prévisible — les voyelles s'effondrent (xāne « maison » devient xune à l'oral), les terminaisons verbales se réduisent (mi-rav-ad « il va » devient mi-re), et certains mots sont simplement différents — mais le même locuteur passe fluidement de l'un à l'autre. Les grammaires de référence traitent cela de différentes manières : Lazard et Windfuhr privilégient les formes littéraires, tandis que Mahootian et Yousef décrivent explicitement le parler familier téhérani.

Superposé au registre se trouve le ta'ārof (تعارف), l'une des caractéristiques sociolinguistiques les plus distinctives du persan. Le ta'ārof est le terme générique désignant le système élaboré d'échanges rituels polis qui imprègne l'interaction sociale iranienne. Comme le décrit Yousef, le ta'ārof couvre « toute la gamme des comportements sociaux visant à montrer la courtoisie et les bonnes manières, principalement par la déférence, en utilisant des mots et des expressions devenus des clichés et qui ne doivent pas être pris au pied de la lettre ou au sérieux ». Linguistiquement, il est encodé à plusieurs niveaux. Les pronoms changent : to est le « tu » informel/intime (singulier), tandis que šomā (à l'origine 2PL) fait office de « vous » de politesse avec l'accord verbal à la 2PL. Le pronom de politesse à la troisième personne est ishān, littéralement 3PL, utilisé pour une personne absente que l'on respecte, également avec l'accord à la 3PL. Des paires de verbes honorifiques couvrent certains actes quotidiens : farmudan est utilisé lorsque le destinataire parle ou fait quelque chose (« Avez-vous dit quelque chose ? »), tandis que arz kardan est utilisé avec auto-dépréciation lorsqu'on parle de sa propre action. Pour « je », les locuteurs utilisent le modeste bande (« serviteur ») ou haqir (« humble ») ; pour « vous », sarkār (« surveillant »), jenāb-e ʿāli (« Votre Excellence »), ou hazrat-e ʿāli (« Votre Éminence »). Yousef note avec ironie que ces deux derniers « ne sont pas très sérieux ; vous pouvez les utiliser pour n'importe quelle personne afin de montrer un grand respect ». La jeune génération observe ces formalités avec moins de rigueur, mais le ta'ārof est encore un système bien vivant.

How it works

L'ordre de base des mots en persan est sujet–objet–verbe. Le verbe se trouve à la fin de la proposition : man fārsi harf mi-zanam signifie « Je parle persan », littéralement « Je persan mot duratif-frapper ». C'est typologiquement inhabituel en soi. Ce qui rend le persan inhabituel parmi les langues SOV, c'est qu'il associe des propositions à verbe final avec des prépositions plutôt que des postpositions, et avec des syntagmes nominaux à tête initiale — le nom vient en premier et ses modifieurs (adjectifs, possesseurs, propositions relatives) le suivent. Ainsi, la proposition est à tête finale, mais le syntagme nominal et le syntagme prépositionnel sont à tête initiale. Ce schéma mixte est rare parmi les langues du monde et donne au persan une sensation distinctive : les longs syntagmes nominaux se déploient vers la gauche dans la phrase avec des prépositions en tête, mais le verbe attend toujours à la fin.

La particule grammaticale la plus célèbre du persan est l'ezafe (اضافه). C'est un petit -e atone (ou -ye après une voyelle) qui relie un nom à ce qui le modifie : ketāb-e qermez « livre rouge » (littéralement « livre-EZ rouge »), māshin-e Ali « la voiture d'Ali » (littéralement « voiture-EZ Ali »), le nom suivi d'un adjectif, d'un possesseur ou d'un autre nom. L'ezafe s'enchaîne. Dans ketāb-e qermez-e man « mon livre rouge », il apparaît deux fois. Il accomplit un travail syntaxique énorme — c'est ainsi que le persan construit pratiquement tout syntagme nominal modifié — et pourtant il n'est presque jamais écrit dans l'écriture perso-arabe. Les lecteurs le déduisent. C'est pourquoi le texte persan semble trompeusement dépouillé sur la page : une grande partie de la grammaire n'est pas écrite et est fournie par le lecteur.

Le persan n'a pas de genre grammatical. Les mots et les pronoms ne font aucune distinction entre « il », « elle » et « cela » — tout est u (ou, dans le langage familier, un). Il n'a pas de marquage casuel morphologique sur les noms ou les adjectifs. Il existe une exception majeure : la postposition rā (را), qui marque les objets directs spécifiques. ketāb mi-xānam signifie « Je lis un livre » (un livre quelconque, indéfini). ketāb-rā mi-xānam signifie « Je lis le livre » (un livre spécifique et identifiable). Dans le langage familier, rā se réduit à -ro après les voyelles et à -o après les consonnes. C'est ce que les linguistes appellent le marquage différentiel de l'objet, et c'est l'une des caractéristiques qui distinguent le plus le persan des langues indo-européennes que la plupart des lecteurs connaîtront.

Les verbes sont l'endroit où le persan concentre sa morphologie. Chaque verbe a deux thèmes — un thème du présent et un thème du passé — qui doivent être mémorisés séparément. De māndan « rester », on obtient le thème du présent mān- et le thème du passé mānd- ; de kardan « faire », on obtient kon- et kard- ; de raftan « aller », on obtient rav- et raft-. Sur ces thèmes, le persan colle un paradigme de désinences de personne et de nombre (six cellules, une pour chaque combinaison de personne 1/2/3 et de nombre singulier/pluriel) plus un petit ensemble de préfixes qui marquent l'aspect et le mode : mi- pour l'imperfectif (habituel + progressif), be- pour le subjonctif et l'impératif, et na- pour la négation. Étant donné que la désinence de personne et de nombre identifie déjà qui agit, les pronoms sujets sont généralement omis — le persan est une langue pro-drop. Le persan familier moderne n'a pas de futur dédié ; le présent est utilisé pour le sens futur, le contexte ou un adverbe fournissant le moment. Un futur littéraire avec l'auxiliaire xāstan existe mais est réservé à l'écrit formel.

Les verbes composés sont extrêmement productifs. Le persan forme la plupart de ses significations verbales quotidiennes en combinant un nom ou un adjectif avec un petit ensemble de verbes légers — le plus souvent kardan (« faire »), šodan (« devenir »), zadan (« frapper ») et dādan (« donner »). harf zadan « parler » est littéralement « mot-frapper ». kār kardan « travailler » est littéralement « travail-faire ». Mahootian estime que les verbes composés surpassent de loin les verbes simples dans le lexique moderne. De nouveaux composés sont librement créés, souvent avec des emprunts à l'anglais ou au français : telefon kardan « téléphoner ».

Le système d'écriture est le plus grand obstacle à l'apprentissage pour les lecteurs extérieurs. Le persan utilise un abjad perso-arabe de 32 lettres : les 28 arabes plus quatre lettres que le persan a ajoutées pour des sons que l'arabe ne possède pas — پ p, چ č, ژ ž, گ g. Il s'écrit de droite à gauche. Les lettres se connectent entre elles sous forme cursive, mais sept lettres ne se connectent pas vers l'avant (ا د ذ ر ز ژ و) — elles mettent fin à la séquence cursive et la lettre suivante en commence une nouvelle. Chaque lettre prend jusqu'à quatre formes positionnelles — initiale, médiane, finale et isolée — selon ce qui l'entoure. Les voyelles brèves (a, e, o) ne sont normalement pas écrites du tout en position médiane ; les lecteurs les déduisent. Les voyelles longues (ā, i, u) sont écrites, parfois avec les mêmes lettres utilisées pour les consonnes apparentées. La caractéristique la plus déroutante pour les nouveaux venus est ce que le persan a hérité de l'arabe : de nombreux mots d'emprunt arabes conservent leur orthographe arabe originale, même lorsque plusieurs lettres différentes se sont désormais confondues en un même son. س, ث et ص sont trois lettres différentes qui sonnent toutes /s/. ز, ذ, ض et ظ sont quatre lettres différentes qui sonnent toutes /z/. ت et ط sonnent toutes deux /t/. ق et غ sonnent toutes deux /ɢ/ (une sorte d'uvulaire voisée). Les mots persans natifs ont chacun une orthographe fixe ; les emprunts arabes conservent leur orthographe étymologique. Les chiffres utilisent les chiffres arabo-indiens orientaux ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹, qui sont légèrement différents des chiffres arabo-indiens utilisés pour l'arabe lui-même, et s'écrivent de gauche à droite à l'intérieur du texte de droite à gauche.

Explorer

Sur la carte

Officielle dans 3 pays

IranAfghanistanTadjikistan

Asia

Voir sur la carte →

Langues apparentées

Common questions about persan

Quelle est la différence entre le farsi, le dari et le tadjik ?

Ces trois variétés de persan sont mutuellement intelligibles, un peu comme l'espagnol d'Amérique latine et d'Europe. Le farsi est la norme iranienne, écrite en perso-arabe. Le dari est la variété afghane, également écrite en perso-arabe, avec quelques différences de prononciation et de vocabulaire. Le tadjik est parlé au Tadjikistan et s'écrit en cyrillique depuis l'époque soviétique. Ils partagent la grammaire de base et une grande partie du vocabulaire.

Qu'est-ce que l'ezafe ?

La caractéristique emblématique du persan : une petite clitique -e (ou -ye après une voyelle) qui lie un nom à son modificateur. Ketāb (livre) + bozorg (grand) devient ketāb-e bozorg (le grand livre). La même clitique enchaîne les possesseurs et les adjectifs : ketāb-e man (mon livre), ketāb-e bozorg-e man (mon grand livre). Il est presque toujours prononcé mais rarement écrit, ce qui rend les textes persans étrangement dépendants de la connaissance préalable de la langue.

Le persan est-il apparenté à l'arabe ?

Non — le persan est indo-européen, apparenté à l'anglais, au français, au hindi et au russe. L'arabe est afro-asiatique. Les deux langues sont en contact profond depuis plus de mille ans, cependant, et le persan utilise l'écriture perso-arabe et a emprunté un vocabulaire arabe considérable, en particulier dans les registres formels et religieux. Grammaticalement, les langues restent totalement distinctes.

Le persan a-t-il un genre grammatical ?

Non. Comme l'anglais, le persan a perdu son système de genre il y a longtemps. Il existe un seul pronom de troisième personne (u en persan iranien) utilisé pour il, elle ou cela. Les adjectifs ne s'accordent avec rien. Les noms n'ont pas de classes de genre. C'est une simplification majeure par rapport à l'arabe ou à la plupart des langues européennes.

Le persan est-il difficile pour les anglophones ?

Parmi les langues indo-européennes, le persan est plus accessible qu'il n'y paraît. L'écriture demande quelques semaines. La grammaire est sans genre, se conjugue régulièrement et suit un ordre SOV avec des schémas prévisibles. Les difficultés sont l'omission des voyelles courtes dans l'écriture et des marqueurs d'ezafe, ainsi que le fossé diglossique entre le persan écrit formel et la langue parlée familière.