| Statistiques et fréquence d'apparition des lettres | |
|
+4Aquila Ex Machina Anoev Olivier Simon Bedal 8 participants |
|
Auteur | Message |
---|
Invité Invité
| Sujet: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 17:54 | |
| J'ouvre ce fil car je serais curieux de connaître les particularités orthographiques des langues construites, personnelles ou non, et de voir un peu les plus exotiques sur ce point. Je n'ai pas trouvé de sujet déjà ouvert sur ce thème (hormis celui-ci, un peu vide et plutôt orienté vers le Scrabble), mais j'ai pu retrouver ce lien posté par Genou en 2013 : Analyseur de fréquences de lettres. Le calcul est même fait pour les bigrammes et les trigrammes. Voilà, n'hésitez pas à y copier/coller certains de vos textes pour voir les résultats. De même, quelle serait la lettre qui débute le plus grand nombre de mots chez vous |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:00 | |
| Après avoir analysé un texte svakâram j'ai l'honneur de vous dire que le a est de très loin la lettre la plus utilisée (22.7%) suivit du i (8.22%) puis du u (7.75%) et enfin du s (6.81%).
|
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:10 | |
| l'ennui c'est qu'il ne reconnait pas les lettres additionnelles et les diacritiques !!
pour lui j'ai aucun ß ni "g" !
j'ai pris le 1er chapitre de mon roman, le plus long extrait disponible en algardien:
du coup c'est un peu biaisé mais :
le top 6 :
A : 16.21% E : 13.18% I : 10.43% R : 9.38% S : 7.06% L : 6.26 %
ça ne m'étonne absolument pas ! ce sont mes lettres préférees celles que l'on retrouve probablement à chaque mot ! _________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:22 | |
| - bedal a écrit:
- l'ennui c'est qu'il ne reconnait pas les lettres additionnelles et les diacritiques !!
pour lui j'ai aucun ß ni "g" ! Oui j'ai remarqué ça après avoir ouvert ce fil ! Y'a deux solutions : - remplacer ces lettres par des lettres entre A et Z mais pas utilisées dans la langue (genre X/Q/...) ; - trouver un autre outil (j'ai rien trouvé sur le net, sur Excel en revanche ça marche bien). |
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:33 | |
| ben tiens j'ai trouvé celui-ci :
http://www.dcode.fr/analyse-frequences
il prend en compte "tous caractères", j'ai donc la fréquence finale : (apres bidouillage et retour à "lettres uniquement" pour les lettres normales)
A : 16.4% E : 13% I : 10.4 % R : 9.3 % L : 6.2 % N : 6 %
finalement le S a été surestimé, j'imagine que l'autre logiciel a calculé ß comme un SS !
du coup le "vrai" S se porte à 4% en 8e position, derrière le O à 4.4 %
la fréquence des caractères "spéciaux" : ß : 1.46 %, le ğ : 1.8 % (pas mal quand même)
le ð (0.1%) et le þ (0.3%) sont très rares finalement, tout comme le P (0.2%) le Y (0.3%) et le F (0.4 %) _________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:35 | |
|
Dernière édition par odd le Mer 16 Déc 2015 - 20:53, édité 1 fois |
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:45 | |
| j'ai pas de texte nardar ou helfina conséquent, hum...
donc je sais pas si c'est pertinent pour de petits textes...
_________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:55 | |
|
Dernière édition par odd le Mer 16 Déc 2015 - 20:53, édité 1 fois |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 18:59 | |
| - odd a écrit:
- La question est: qu'en conclure ?
Personnellement, c'est juste par curiosité, et pour m'étonner. 1 lettre sur 5 est un "a" en svakâramtra, le nom de cette langue ne ment pas |
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 19:17 | |
| AEIRLNO en algardien (pour le top 7)
à comparer à :
EASINTR en français
ETAONIS en anglais
ENRISAT en allemand
EAOINSR en espagnol
du coup le "E" est utilisé en majorité dans ces langues,
l'algardien se démarque déjà avec plus de A, des I, R et L plus fréquents, et des T et S moins fréquents _________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 19:43 | |
| La disposition des touches des claviers AZERTY pour le français et sa légère variante pour le français de Belgique viennent de leur fréquence d'apparaition, et des contraintes techniques des typewriters. Retrouve-t-on ça dans vos Idéomondes ?
Quelqu'un a-t-il une idéolangue où la lettre la plus courante est une consonne ?
Pour le titée, le corpus n'est pas encore assez important pour que je me prononce. |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 19:47 | |
|
Dernière édition par odd le Mer 16 Déc 2015 - 20:54, édité 1 fois |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 19:49 | |
| - odd a écrit:
- En idiolinguistan c'eut été intéressant, chaque signe étant un sens, mais impossible de trier automatiquement... Même avec une retranscription latine... Dommage...
Et en donnant un identifiant numéral à chaque caractère ? |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 19:58 | |
|
Dernière édition par odd le Mer 16 Déc 2015 - 21:40, édité 1 fois |
|
| |
Olivier Simon Modérateur
Messages : 5572 Date d'inscription : 20/02/2009 Localisation : Lorraine
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 20:45 | |
| J'ai essayé le logiciel proposé par Bedal (sans rapport : dans le coin de ce site, une pub me demande si je voterai pour Justin Trudeau à la prochaine élection fédérale...) sur un texte sambahsa de 11 pages. Voici le résultat :
E 2272 I 1666 A 1348 S 1327 T 1248 N 1245 O 1115 R 1043 D 975 U 788 H 726 M 689 L 546 G 483 K 465 P 382 B 379 W 321 C 311 Y 303 V 196 Q 115 F 109 X 46 J 33 Z 23
#26
Total (Σ)
18154
| |
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 21:05 | |
| ç'est étonamment similaire au Français ! mais le I passe devant le A, plus proche de l'allemand _________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Olivier Simon Modérateur
Messages : 5572 Date d'inscription : 20/02/2009 Localisation : Lorraine
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 21:55 | |
| - bedal a écrit:
- ç'est étonamment similaire au Français ! mais le I passe devant le A, plus proche de l'allemand
Précisément, l'orthographe du sambahsa prend son inspiration des langues d'Europe Occidentale, notamment le français et l'allemand. | |
|
| |
Anoev Modérateur
Messages : 37610 Date d'inscription : 16/10/2008 Localisation : Île-de-France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Sam 10 Oct 2015 - 23:15 | |
| Bouh ! J'm'aperçois en choisissant un de mes textes pour faire la statistique que j'ai fait une relex assez peu logique. Il va donc falloir que je change le mot. _________________ - Pœr æse qua stane:
Pour ceux qui restent.
| |
|
| |
Aquila Ex Machina
Messages : 2163 Date d'inscription : 15/01/2012 Localisation : Reims
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Dim 11 Oct 2015 - 14:41 | |
| Sans surprise, le A est à la première place pour le Dèyrik. | |
|
| |
Anoev Modérateur
Messages : 37610 Date d'inscription : 16/10/2008 Localisation : Île-de-France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Lun 12 Oct 2015 - 0:48 | |
| - Anoev a écrit:
- Bouh ! J'm'aperçois en choisissant un de mes textes pour faire la statistique que j'ai fait une relex assez peu logique. Il va donc falloir que je change le mot.
C'est fait ! _________________ - Pœr æse qua stane:
Pour ceux qui restent.
| |
|
| |
Invité Invité
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Lun 12 Oct 2015 - 6:47 | |
|
Dernière édition par odd le Ven 18 Déc 2015 - 18:56, édité 1 fois |
|
| |
Anoev Modérateur
Messages : 37610 Date d'inscription : 16/10/2008 Localisation : Île-de-France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Lun 12 Oct 2015 - 11:01 | |
| - odd a écrit:
- ???
Pour "désabusé", j'avais dyskárvan, qui était un calque sans recherche du français "dé s- + abuser". Sauf que ça ne pouvait pas correspondre à une signification exacte : l'abus ( karv) ne correspond pas du tout à un espoir, même futile. Donc, je ne pouvais pas garder dys+kárv+an. Je l'ai donc remplacé par dysáton. Ato (illusion), c'est une déformation de aata (espoir) ou de aatet (espérance) : le AA est raccourci. * L'autre traduction, pour "illusion, c'est eratvèdyn, mais c'est plutôt l'illusion dioptri... euh... d'optique._________________ - Pœr æse qua stane:
Pour ceux qui restent.
| |
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Lun 12 Oct 2015 - 15:32 | |
| - Anoev a écrit:
- odd a écrit:
- ???
Pour "désabusé", j'avais dyskárvan, qui était un calque sans recherche du français "dés- + abuser". Sauf que ça ne pouvait pas correspondre à une signification exacte : l'abus (karv) ne correspond pas du tout à un espoir, même futile. Donc, je ne pouvais pas garder dys+kárv+an. Je l'ai donc remplacé par dysáton. Ato (illusion), c'est une déformation de aata (espoir) ou de aatet (espérance) : le AA est raccourci.
*L'autre traduction, pour "illusion, c'est eratvèdyn, mais c'est plutôt l'illusion dioptri... euh... d'optique. ok, mais as-tu fait la répartition des lettres pour l'aneuvien finalement ? _________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Anoev Modérateur
Messages : 37610 Date d'inscription : 16/10/2008 Localisation : Île-de-France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Lun 12 Oct 2015 - 18:44 | |
| - bedal a écrit:
- Ok, mais as-tu fait la répartition des lettres pour l'aneuvien finalement ?
Oui, et voici le résultat : - Analyseur a écrit:
- Nombre de caractères analysés du texte : 301
A : 43--14.33% E : 41--13.67% N : 21--7% O : 21--7% R : 21--7% T : 20--6.67% D : 16--5.33% S : 16--5.33% L : 15--5% U : 14--4.67% K : 12--4% P : 11--3.67% M : 8--2.67% B : 7--2.33% V : 6--2% C : 4--1.33% I : 4--1.33% X : 4--1.33% Y : 4--1.33% H : 3--1% J : 3--1% F : 2--0.67% G : 2--0.67% Q : 2--0.67% W : 1--0.33% Z : 0--0%
pour ce texte : Ùr ove! Àt opportyn ere rec lort! Do àt lob ere rec renearanert ber klàtakun. A kjas fàl, ber loot fàktun, tep ùt ane, recedunas dysaaċan kom caldun àt kols ni sed toshese. Siă't lob dem legă ea waadă, àt remmas opan sàjev. Ùt quàtax hoψev pylaser, ùt rub-mihan nexàvkad passă; at lob dem diktă: «Æt an kàn prodòles ed rooż: eg reen nep vœnda kàplables ajoelkaden kœm pexe quav dorun med auryxe pasun!»• Honnêtement, j'ai des doutes quant à la fiabilité des pourcentages : des lettres comme le Æ, le Œ ont-elles été prises en compte ? Avec les arrondis des poucentages, on ne peut rien vérifier du tout. Y a qu'un W, mais y a deux Œ. Par ailleurs, je me suis rendu compte qu'y avait une faute d'orthographe dans mon texte. Après correction, l'analyseur comptait deux lettres de moins (au lieu d'une). _________________ - Pœr æse qua stane:
Pour ceux qui restent.
| |
|
| |
Bedal Modérateur
Messages : 6798 Date d'inscription : 23/06/2014 Localisation : Lyon, France
| Sujet: Re: Statistiques et fréquence d'apparition des lettres Mar 8 Aoû 2017 - 17:06 | |
| Je poste ici également, c'est plus logique: Sur la base du corpus du lexique, Voici la fréquence de chaque lettre, en %, en langue algardienne (diacritiques non comptés) Les lettres les plus fréquentes sont donc A, E, I, R, N, L, S qui représentent à elles sept, environ 64 % des lettres. à comparer à : EASINTR en français ETAONIS en anglais ENRISAT en allemand EAOINSR en espagnol _________________ "L'Atelier" alas a bin jerli foromte! : L'Atelier est le meilleur des forums Idéolangues : algardien, nardar, helfina, mernien, syrélien, brakin, nurménien, leryen, romanais. Idéomondes : Univers d'Heimdalir, Iles Romanes Non au terrorisme et à la barbarie. Oui à la paix, la fraternité et la solidarité. Quelles que soient notre religion, notre langue ou notre couleur de peau. | |
|
| |
Contenu sponsorisé
| Sujet: Re: Statistiques et fréquence d'apparition des lettres | |
| |
|
| |
| Statistiques et fréquence d'apparition des lettres | |
|