Greenheart
Messages : 4041 Date d'inscription : 03/05/2008
| Sujet: La loi de Zipf Mar 7 Jan 2014 - 11:56 | |
| Le début de l'article suivant part d'une constatation sur les proportions qui existeraient entre les mots les plus utilisés dans une langue, quelque soit la langue. Le même principe s'appliquerait à la taille des villes et permettrait de prévoir la taille des mégapoles du futur. Cette loi serait inexplicable scientifiquement. - io9 a écrit:
- Back in 1949, the linguist George Zipf noticed something odd about how often people use words in a given language. He found that a small number of words are used all the time, while the vast majority are used very rarely. If he ranked the words in order of popularity, a striking pattern emerged. The number one ranked word was always used twice as often as the second rank word, and three times as often as the third rank. He called this a rank vs. frequency rule, and found that it could also be used to describe income distributions in any given country, with the richest person making twice as much money as the next richest, and so forth.
Later dubbed Zipf's law, the rank vs. frequency rule also works if you apply it to the sizes of cities. The city with the largest population in any country is generally twice as large as the next-biggest, and so on. Incredibly, Zipf's law for cities has held true for every country in the world, for the past century. Est-ce que cela vous pourrait vraisemblable ? Par ailleurs, cela me rappelle le nombre d'or (un principe de proportion appliqué à l'architecture et en peinture depuis l'Antiquité). http://io9.com/the-mysterious-law-that-governs-the-size-of-your-city-1479244159 | |
|
PatrikGC
Messages : 6732 Date d'inscription : 28/02/2010 Localisation : France - Nord
| Sujet: Re: La loi de Zipf Mar 7 Jan 2014 - 12:10 | |
| C'est tout à fait logique et normal.
C'est assez proche de la fameuse règle des 80-20 (80% des choses servent 20% du temps, et 20% des choses servent 80% du temps. Néanmoins, si on prend toute l'étendue du vocabulaire d'une langue, on arrive plutôt à un ratio 95-05.
Pourquoi peut-il exister des langues minimalistes pour exprimer le minimum usuel ? Parce que le nombre de concepts pour s'exprimer dans la vie de tous les jours est faible. Un pidgin ou un créole arrivent à exprimer beaucoup avec peu.
Je rebondis sur la programmation informatique : le nombre d'instructions, de fonctions, d'objets dans un langage informatique est très important. Pourtant à l'usage, quand on écrit un programme, on ne se sert fréquemment que d'un tout petit sous-ensemble.
Bien sûr, dès qu'on s'aventure dans un domaine plus pointu, il faut du vocabulaire en plus. | |
|
Leo
Messages : 2324 Date d'inscription : 26/03/2009 Localisation : Peut-être
| Sujet: Re: La loi de Zipf Mar 7 Jan 2014 - 12:21 | |
| On en avait discuté un peu il y a quelque temps: https://aphil.1fr1.net/t1673-zipf-et-yule-simonLe plus marrant c'est que Mandelbrot semble avoir réussi a dériver cette "loi" sur la base de l'entropie, mais c'est plus une tendance qui ne prend pas forcément tous les facteurs en compte: http://fr.wikipedia.org/wiki/Loi_de_Zipf | |
|
Greenheart
Messages : 4041 Date d'inscription : 03/05/2008
| Sujet: Re: La loi de Zipf Mar 7 Jan 2014 - 16:58 | |
| Merci pour ce lien. Dans cette discussion, Sab remarque que les mots fréquents sont aussi les mots les plus courts.
Est-ce que la proportion constatée de Zipf ne tient tout simplement pas à cela : un mot court (une syllabe) est formé en général d'une seule lettre (par exemple "a") ou d'une combinaison de deux (par exemple "ab", ba"). Ce nombre de combinaisons est forcément plus limitées que celles qu'offrent les mots à plusieurs syllabes (par exemple "baba", "abba", "abab", "ababab" etc).
Or les mots courants sont ceux qui servent les plus souvent donc ce seront eux qui seront abrégés en priorité et qui vont récupérer les combinaisons courtes. Si on compare les possibilités de combinaisons courtes avec les possibilités de combinaisons longues, ne va-t-on pas retomber sur cette fameuse loi, simplement à cause du rapport entre les combinaisons à 1 ou 2 "chiffres" et les combinaisons à 3 et plus "chiffres" ?
Et là il y aurait une explication simple au phénomène.
Cela expliquerait aussi pourquoi la loi de Zipf s'étendrait à tout contexte de combinaisons (le jeu de go, le nombre de bâtiments d'une ville). | |
|
Leo
Messages : 2324 Date d'inscription : 26/03/2009 Localisation : Peut-être
| Sujet: Re: La loi de Zipf Mer 8 Jan 2014 - 12:50 | |
| Les mots les plus fréquents s'érodent le plus ( hui), mais aussi, les mots les plus érodés se voient remplacés par des mots plus longs ( aujourd'hui), ça nous fait comme un cycle de convection. Mais les liens de cause à effet ne sont pas forcément clairs dans cette corrélation entre fréquence et longueur (et possibilités de combinaisons). Il y a encore de la recherche à faire | |
|
Contenu sponsorisé
| Sujet: Re: La loi de Zipf | |
| |
|