Lei de Zipf

PROBLEMA

Estudos com textos de várias línguas indicam que as frequências das palavras nesses textos seguem, aproximadamente, a Lei de Zipf: ao contarmos quantas vezes aparecem cada uma das palavras de um texto, o número de ocorrência [tex]f(n)[/tex] da [tex]n[/tex]-ésima palavra mais frequente é inversamente proporcional a [tex]n[/tex], ou seja, [tex]f(n)\approx \dfrac{k}{n}[/tex], em que [tex]k[/tex] é uma constante de proporcionalidade que depende do texto em questão. A lei é nomeada em homenagem a George Kingsley Zipf, linguista da Universidade de Harvard, que a popularizou na década de 1940 por meio de sua obra Human Behaviour and the Principle of Least-Effort (“Comportamento Humano e o Princípio do Menor Esforço”). A Lei de Zipf tem algumas aplicações interessantes como, por exemplo, acreditava-se que o livro medieval Código Voynich, indecifrado até hoje, pudesse ser um livro falso, uma fraude. Porém, como o texto do Código segue a Lei de Zipf, isso indica que o livro deve estar escrito em alguma linguagem desconhecida, ao invés de ser pura invenção.

Na obra Fausto de J. W. Goethe, a nona palavra mais frequente é sich, que ocorre [tex]770[/tex] vezes. Calcule a constante de proporcionalidade da Lei de Zipf para o texto Fausto e o número aproximado de vezes que a segunda palavra mais frequente ocorre.

DICA

Substitua as informações referentes à obra Fausto na Lei de Zipf.

Reúnam seus Clubes e tentem resolver o problema.
Se a dica não for suficiente, não faz mal: a partir da próxima quinta, 09.09.2021, deem uma passadinha na Sala Problemas 2020: Dicas e Dúvidas do nosso Fórum e postem lá as suas dúvidas para que os nossos Moderadores possam lhes ajudar.
Resolvido o problema, postem suas soluções no Blog para que todos tenham acesso a elas.

Bons estudos, pessoal!

Link permanente para este artigo: http://clubes.obmep.org.br/blog/2021/09/lei-de-zipf/

Deixe uma resposta