Bibm@th

Forum de mathématiques - Bibm@th.net

Bienvenue dans les forums du site BibM@th, des forums où on dit Bonjour (Bonsoir), Merci, S'il vous plaît...

Vous n'êtes pas identifié(e).

#1 26-07-2011 19:52:15

ermaen
Membre
Inscription : 26-07-2011
Messages : 2

analyse fréquentielle d'un texte

Bonsoir à tous,

Savez-vous si la recherche statistique suivante a été tentée?

A partir d'un texte, calculons la somme des valeurs dans l'alphabet (exemple: E=5) des lettres le constituant et celà modulo 20.
Et ce, pour savoir si suivant l'auteur littéraire ou bien la langue le nombre obtenu est caractéristique. Et quid de la somme des chiffres significatifs
du nomnre obtenu.
Enfin, comment programmer cette recherche sur un OI? Un tableur peut-il être utile pour un texte court?

J'espère avoir été clair.

A bientôt

Hors ligne

#2 27-07-2011 12:36:08

nerosson
Membre actif
Inscription : 21-03-2009
Messages : 1 658

Re : analyse fréquentielle d'un texte

Bonjour, ermaen et bienvenue dans le site.

Question intéressante, qui aurait aussi pu trouver sa place sur le site cryptographie.

Personnellement, je n'ai jamais entendu dire que cette recherche ait été tentée.

Par contre, tu dois savoir comme moi qu'on a parfois fait des statistiques des mots dans les textes ou les discours des hommes politiques, pour y chercher un lien avec leurs opinions ou leur caractère.

Deux questions à te poser :
a) pourquoi modulo 20 , J'aurais plutôt attendu modulo 26,
b) est-il bénéfique de faire ces multiples manipulations (numérotation des lettres, modulo) qui risquent de "dissoudre" les différences qu'on pourrait espérer trouver ? Pourquoi ne pas faire simplement une différence de fréquence des lettres ?

A ce point de vue, l'objet du texte pourrait, me semble-t-il avoir une influence et plutôt, curieusement, sur les lettres rares.

Exemples :
a)un texte sur l'électricité ferait probablement monter la fréquence de la lettre W (a cause du mot "Watt" et de ses dérivés).
b) Dans les "Trois mousquetaires" de Dumas, ont trouverait sans doute un petit excédent de H à cause d' Athos et de Porthos, et peut être de A à cause de D'Artagnan, mais là, ce serait sans doute moins net parce que "a" est une lettre fréquente, et que cet excédent s'en trouverait "dilué".
c) D'autre part, il est bien évident que le texte d' un dialogue fait monter la fréquence du Z dans une très grande proportion.

Tout ce que je dis là concerne bien entendu une seule langue.

A Plutarque, comme dirait Freddy (avec un grand "F" : sa verve intarissable lui vaut bien ça , même si yoshi tord le nez !)

Dernière modification par nerosson (27-07-2011 12:48:53)

Hors ligne

#3 28-07-2011 19:05:15

ermaen
Membre
Inscription : 26-07-2011
Messages : 2

Re : analyse fréquentielle d'un texte

Merci Nérosson pour ta réponse détaillée.
Il est certain que comme ma fourche langue parfois, ma vue  m'a fait prendre le "O" pour un "6". Je vais creuser la question des différences auquelles je n'avais pas pensé.
A plus tard.

Hors ligne

Pied de page des forums