persa

persa

فارسی
53M speakers · Indo-European Indo-Iranian · Arabic
No mapa

Em resumo

Durante mais de mil anos o persa foi a língua de prestígio de uma vasta esfera cultural que se estendia da Anatólia a Bengala e partes da China. Foi a língua da corte do Império Mogol na Índia durante séculos. Serviu como importante língua literária e administrativa do Império Otomano. Foi a língua franca da poesia, da erudição e da arte de governar no que os historiadores chamam o mundo persianizado. O cânone poético —o Shahnameh de Ferdowsi, Rumi, Hafez, Saʿdi, Khayyam— constitui uma das grandes literaturas do mundo e foi lido em toda esta região durante séculos. O persa já não tem esse alcance geográfico, mas o prestígio e a literatura perduram.

O persa é o membro mais numeroso do ramo iraniano da família indo-europeia, ao lado de línguas irmãs como o pastó, o curdo, o balochi e o tajique. Concretamente situa-se no subgrupo sudoeste, com o luri e o bakhtiari como parentes próximos. O persa moderno tem aproximadamente 1.400 anos como tradição escrita contínua. A poesia e a prosa mais antigas que se conservam datam dos séculos IX e X d.C. e permanecem legíveis para os falantes cultos de hoje, de um modo que o inglês antigo não é para os anglófonos. Antes veio o persa médio (pahlavi), escrito numa escrita derivada do aramaico e usado pelo Império Sassânida. E antes ainda, o persa antigo, a língua das inscrições reais aqueménidas, escrito numa escrita cuneiforme semialfabética de cerca dos séculos VI–V a.C.

Hoje o persa é a língua oficial do Irão, onde é a primeira língua de mais de metade dos cerca de 80 milhões de habitantes do país. Dezenas de milhões mais falam-no no Afeganistão, no Tajiquistão e numa diáspora mundial. A literacia adulta no Irão ronda os 93%. Como observa Yousef na sua gramática exaustiva, "o persa moderno simplificou-se muito. Sem género e sem declinação de substantivos e adjetivos" —um facto surpreendente para uma língua cujos parentes indo-europeus distantes (russo, alemão, latim, sânscrito) são famosos pelos seus sistemas de casos e género. O persa desfez-se de quase tudo isso. O que conservou, e o que construiu em cima, é o tema do resto desta página.

Varieties

O persa é uma língua pluricêntrica. Tem três padrões nacionais, cada um com o seu próprio nome, em três países. No Irão chama-se Fārsi (فارسی). No Afeganistão chama-se Dari (دری). No Tajiquistão chama-se Tajiki (тоҷикӣ). A designação reflete mais a história política do que a distância linguística: Yousef compara a situação ao alemão, que os alemães chamam Deutsch. Na escrita académica os três costumam ser agrupados sob o nome único de "persa", e a literatura clássica é partilhada entre os três praticamente sem diferenças. O persa escrito formal é largamente uniforme. Onde os três mais divergem é no vocabulário quotidiano, na pronúncia e —de forma mais visível— na escrita. O Irão e o Afeganistão usam o alfabeto perso-árabe. O Tajiquistão, sob a política linguística soviética do século XX, adotou o cirílico, que ainda usa. A norma ISO 639-3 divide os três como códigos separados (pes para o persa ocidental / farsi iraniano, prs para o dari, tgk para o tajique); esta página centra-se no persa ocidental.

Dentro do próprio Irão, o facto sociolinguístico principal é que um sotaque se tornou efetivamente o padrão nacional. A pronúncia, o vocabulário e os padrões coloquiais de Teerão funcionam agora como a norma falada de facto em todo o país, propagados pelos meios de comunicação, o sistema educativo e a migração para a capital. Yousef enuncia a tendência sem rodeios: o teerani "não só é compreendido em todo o Irão —e além— graças aos meios de comunicação, como ameaça assimilar todos os vernáculos locais com o passar do tempo". Windfuhr, escrevendo em 1979, qualificou o teerani como "o dialeto socialmente mais prestigiado" e "em rápido processo de se tornar o dialeto padrão do Irão". Em 2026 esse processo está praticamente completado em contextos formais e mediáticos. Os sotaques regionais —em Mashhad, Isfahan, Shiraz, Yazd, Kerman, a costa cáspia, a costa do Golfo— ainda existem na fala quotidiana e permanecem facilmente reconhecíveis, mas estão a recuar, e os linguistas lançaram iniciativas de documentação para os registar antes que desapareçam. O Irão também alberga comunidades de fala substanciais em línguas não iranianas, sendo a maior a azeri; o curdo, o árabe, o balúchi, o turcomeno e o arménio também são amplamente falados nas suas respetivas regiões.

A divisão que mais importa na vida diária não é regional mas estilística. Existem essencialmente dois registos a funcionar em paralelo. O persa formal/escrito é a língua dos noticiários, das conferências, da oratória, dos manuais escolares, dos documentos governamentais e da maioria do material impresso. O teerani coloquial é a língua dos amigos, da família e da conversa comum. Os dois diferem de forma previsível —as vogais reduzem-se (xāne "casa" passa a xune na fala), as terminações verbais encurtam (mi-rav-ad "ele vai" passa a mi-re) e certas palavras são simplesmente diferentes— mas o mesmo falante alterna fluidamente entre eles. As gramáticas de referência lidam com isto de maneiras distintas: Lazard e Windfuhr usam por defeito as formas literárias, enquanto Mahootian e Yousef descrevem explicitamente a fala coloquial teerani.

Sobreposto ao registo está o ta'ārof (تعارف), um dos traços sociolinguísticos mais distintivos do persa. O ta'ārof é o termo que engloba o elaborado sistema de troca ritualizada e cortês que impregna a interação social iraniana. Como o descreve Yousef, o ta'ārof cobre "toda a gama de comportamentos sociais destinados a mostrar cortesia e boas maneiras, sobretudo através da deferência, usando palavras e expressões que se tornaram cliché e não devem ser tomadas literalmente nem a sério". Linguisticamente é codificado em múltiplos níveis. Os pronomes mudam: to é o "tu" informal/íntimo (singular), enquanto šomā (originalmente 2PL) funciona também como o "você" cortês com concordância verbal de 2PL. O pronome cortês de terceira pessoa ishān é literalmente 3PL, usado para uma pessoa ausente que se respeita, também com concordância de 3PL. Os pares verbais honoríficos cobrem certos atos quotidianos: farmudan usa-se quando o interlocutor fala ou faz algo ("Disse alguma coisa?"), enquanto arz kardan se usa de forma autodepreciativa ao falar da própria ação. Para "eu", os falantes usam o humilde bande ("servo") ou haqir ("humilde"); para "você", sarkār ("supervisor"), jenāb-e ʿāli ("Vossa Excelência") ou hazrat-e ʿāli ("Vossa Eminência"). Yousef observa ironicamente que os dois últimos "não são muito sérios; podem usar-se para qualquer pessoa para mostrar grande respeito". A geração mais jovem observa estas formalidades com menos rigor, mas o ta'ārof ainda é um sistema muito vivo.

How it works

A ordem básica de palavras do persa é sujeito–objeto–verbo. O verbo situa-se no final da oração: man fārsi harf mi-zanam significa "eu falo persa", literalmente "eu persa palavra durativo-bato". Isto é tipologicamente incomum por si só. O que torna o persa incomum entre as línguas SOV é que combina orações de verbo final com preposições em vez de posposições, e com sintagmas nominais de núcleo inicial —o substantivo vem primeiro e os seus modificadores (adjetivos, possessivos, orações relativas) seguem-no. Portanto, a oração é de núcleo final, mas o sintagma nominal e o sintagma preposicional são de núcleo inicial. Este padrão misto é raro entre as línguas do mundo e dá ao persa uma sensação distintiva: os sintagmas nominais longos desdobram-se para a esquerda na frase com preposições à frente, mas o verbo está sempre à espera no final.

A partícula gramatical mais famosa do persa é o ezafe (اضافه). É um pequeno -e átono (ou -ye depois de vogal) que liga um substantivo ao que o modifica: ketāb-e qermez "livro vermelho" (literalmente "livro-EZ vermelho"), māshin-e Ali "o carro do Ali" (literalmente "carro-EZ Ali"), o substantivo seguido de um adjetivo, um possuidor ou outro substantivo. O ezafe encadeia-se. Em ketāb-e qermez-e man "o meu livro vermelho", aparece duas vezes. Realiza um enorme trabalho sintático —é como o persa constrói praticamente todo o sintagma nominal modificado— e no entanto quase nunca se escreve na escrita perso-árabe. Os leitores inferem-no. É por isso que o texto persa parece enganosamente sóbrio na página: uma grande parte da gramática não é escrita e é fornecida pelo leitor.

O persa não tem género gramatical. As palavras e os pronomes não fazem distinção entre "ele", "ela" e "isso" —todos são u (ou, na fala coloquial, un). Não tem marcação morfológica de caso em substantivos nem adjetivos. Há uma exceção importante: a posposição rā (را), que marca os objetos diretos específicos. ketāb mi-xānam significa "estou a ler um livro" (um livro qualquer, indefinido). ketāb-rā mi-xānam significa "estou a ler o livro" (um livro específico, identificável). Na fala coloquial rā reduz-se a -ro depois de vogais e -o depois de consoantes. Isto é o que os linguistas chamam marcação diferencial de objeto, e é um dos traços que mais distingue o persa das línguas indo-europeias que a maioria dos leitores conhecerá.

Os verbos são onde o persa concentra a sua morfologia. Cada verbo tem dois radicais —um de presente e um de passado— que devem ser memorizados separadamente. De māndan "ficar" obtém-se o radical de presente mān- e o de passado mānd-; de kardan "fazer" obtém-se kon- e kard-; de raftan "ir" obtém-se rav- e raft-. Sobre estes radicais o persa cola um paradigma de desinências de pessoa e número (seis células, uma para cada combinação de 1.ª/2.ª/3.ª pessoa e singular/plural) mais um pequeno conjunto de prefixos que marcam aspeto e modo: mi- para o imperfectivo (habitual + progressivo), be- para o subjuntivo e imperativo, e na- para a negação. Como a desinência de pessoa e número já identifica quem atua, os pronomes de sujeito são normalmente omitidos —o persa é uma língua pro-drop. O persa coloquial moderno não tem um tempo futuro específico; o presente é usado para o significado futuro, e o contexto ou um advérbio fornecem a referência temporal. Existe um futuro literário com o auxiliar xāstan mas está reservado para a escrita formal.

Os verbos compostos são extraordinariamente produtivos. O persa forma a maioria dos seus significados verbais quotidianos combinando um substantivo ou adjetivo com um pequeno conjunto de verbos leves —os mais frequentes são kardan ("fazer"), šodan ("tornar-se"), zadan ("bater") e dādan ("dar"). harf zadan "falar" é literalmente "palavra-bater". kār kardan "trabalhar" é literalmente "trabalho-fazer". Mahootian estima que os verbos compostos ultrapassam largamente em número os verbos simples no léxico moderno. Novos compostos são cunhados livremente, muitas vezes com empréstimos do inglês ou do francês: telefon kardan "telefonar".

O sistema de escrita é a maior barreira de aprendizagem para os leitores não familiarizados. O persa usa um abjad perso-árabe de 32 letras: as 28 do árabe mais quatro letras que o persa acrescentou para sons que o árabe não tem —پ p, چ č, ژ ž, گ g. Escreve-se da direita para a esquerda. As letras ligam-se entre si em forma cursiva, mas sete letras não se ligam para a frente (ا د ذ ر ز ژ و) —terminam o traço cursivo e a letra seguinte começa um novo. Cada letra assume até quatro formas posicionais —inicial, medial, final e isolada— conforme o que tem ao lado. As vogais breves (a, e, o) normalmente não se escrevem em posição medial; os leitores inferem-nas. As vogais longas (ā, i, u) escrevem-se, por vezes com as mesmas letras usadas para consoantes relacionadas. O traço mais desconcertante para os recém-chegados é o que o persa herdou do árabe: muitos empréstimos árabes conservam a sua ortografia árabe original mesmo quando várias letras diferentes colapsaram no mesmo som. س, ث e ص são três letras distintas que todas soam /s/. ز, ذ, ض e ظ são quatro letras distintas que todas soam /z/. ت e ط ambas soam /t/. ق e غ ambas soam /ɢ/ (uma espécie de uvular sonora). As palavras persas nativas usam cada uma uma ortografia fixa; os empréstimos árabes conservam a sua etimológica. Os numerais usam dígitos indo-arábicos orientais ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹, que são ligeiramente diferentes dos dígitos indo-arábicos usados para o próprio árabe, e escrevem-se da esquerda para a direita dentro do texto da direita para a esquerda.

Explorar

No mapa

Oficial em 3 países

IrãAfeganistãoTadjiquistão
Asia
Ver no mapa →

Idiomas relacionados

Common questions about persa

Qual é a diferença entre farsi, dari e tadjique?
As três são variedades mutuamente inteligíveis do persa, muito parecidas com o espanhol latino-americano e o europeu. O farsi é o padrão iraniano, escrito em perso-árabe. O dari é a variedade afegã, também escrita em perso-árabe, com algumas diferenças de pronúncia e vocabulário. O tadjique é falado no Tajiquistão e escrito em cirílico desde a era soviética. Elas compartilham a gramática central e grande parte do vocabulário.
O que é o ezafe?
Característica marcante do persa: um pequeno clítico -e (ou -ye após vogais) que liga um substantivo ao seu modificador. Ketāb (livro) + bozorg (grande) vira ketāb-e bozorg (o livro grande). O mesmo clítico encadeia possuidores e adjetivos: ketāb-e man (meu livro), ketāb-e bozorg-e man (meu livro grande). Quase sempre é pronunciado, mas raramente escrito, o que faz os textos em persa parecerem estranhamente dependentes de quem já conhece a língua.
O persa é parente do árabe?
Não — o persa é indo-europeu, parente do inglês, francês, hindi e russo. O árabe é afro-asiático. As duas línguas estão em contato profundo há mais de mil anos, no entanto, e o persa usa o alfabeto perso-árabe e emprestou um vocabulário árabe substancial, especialmente em registros formais e religiosos. Gramaticalmente, as línguas permanecem totalmente distintas.
O persa tem gênero gramatical?
Não. Como o inglês, o persa perdeu seu sistema de gênero há muito tempo. Há um único pronome de terceira pessoa (u no persa iraniano) usado para ele, ela ou neutro. Adjetivos não concordam com nada. Substantivos não têm classes de gênero. Isso é uma grande simplificação em comparação com o árabe ou a maioria das línguas europeias.
O persa é difícil para falantes de inglês?
Entre as línguas indo-europeias, o persa é mais acessível do que parece. O alfabeto leva algumas semanas. A gramática não tem gênero, a conjugação é regular e segue a ordem SOV com padrões previsíveis. As partes difíceis são a omissão de vogais curtas e marcadores de ezafe na escrita, além da diferença diglóssica entre o persa formal escrito e a língua falada coloquial.
enzhesfrpt