Navegar

24/11/2021

Na Folha de S.Paulo, Viana fala da misteriosa lei de Zipf

Foto: Pxhere

Coluna de Marcelo Viana, diretor-geral do IMPA, na Folha de S.Paulo:

Por volta de 1935, o linguista norte-americano George Zipf observou que quando listava palavras em ordem decrescente de seu uso em diferentes contextos, a frequência da primeira palavra da lista costumava ser (aproximadamente) 2 vezes maior do que a da segunda palavra, 3 vezes maior do que a da terceira, e assim sucessivamente.

Por exemplo, as três palavras mais usadas no inglês são o artigo “the”, a preposição “of” e a conjunção “and”, sendo que “the” aparece 1,92 vezes mais do que “of” e 2,42 vezes mais do que “and”.

Na verdade, este comportamento peculiar já tinha sido apontado antes, pelo estenógrafo francês Jean-Baptist Estoup (1868 – 1950) e pelo físico alemão Felix Auerbach, e também não é privilégio da língua inglesa: ele vale para todos os idiomas conhecidos, inclusive idiomas artificiais como o esperanto.

Mais ainda, ele não se restringe ao domínio da linguística: o mesmo tipo de distribuição ocorre em listas de dados das mais diferentes origens. Uma das situações mais estudadas, já apontada por Auerbach em 1913, diz respeito ao tamanho de cidades.

Por exemplo, quando listamos as cidades brasileiras em ordem decrescente de suas populações observamos que a maior (São Paulo) é 1,92 vezes maior do que a segunda (Rio de Janeiro) e 2,42 vezes maior do que a terceira (Brasília).

A primeira tentativa de explicar este fenômeno matematicamente foi devida ao próprio Zipf e é muito curiosa. Ele partiu do princípio de que tanto quem fala quanto quem escuta quer fazer o menor esforço possível na comunicação, e usou argumentos de estatística para concluir que isso conduziria ao tipo de distribuição de frequências previsto na lei. Mas não é claro como essa ideia poderia ser estendida a outras instâncias da lei de Zipf, fora da linguística.

Leia a coluna na íntegra no site do jornal