Je cherche à établir une liste fréquentielle (du plus au moins courants) des structures syntaxiques, de manière à pouvoir l'appliquer dans plusieurs domaines :
- enseignement des langues
- liste des structures syntaxiques vides à remplir pour la génération de textes aléatoires cohérents
- méthode d'analyse sémantique rapide et facile à maîtriser d'un texte
- modèle de progression sémantique (narrative, rhétorique, dialogué) rapide et facile à utiliser.
Le système doit pouvoir fonctionner dans toutes les langues naturelles ou construites.
Il n'a pas à correspondre la vision de la grammaire d'une langue à une époque donnée.
Bref, voilà l'ébauche d'une langue construite servant à décrire la syntaxe d'une autre langue
***
Voici un premier code, testé sur le premier chapitre du Comte de Monte-Cristo d'Alexandre Dumas.
Il consiste à utiliser les lettres de l'alphabet occidental et à grouper les lettres chaque fois que les structures forment un "groupe logique" (une demi clause apparemment, avec d'un côté le groupe nominal, de l'autre le groupe verbal).
A partir de là,
1°) on peut lister alphabétiquement les "groupes logiques" dans leur forme complète ou élidée / contractée et dresser une liste de fréquence, les classer du plus simple au plus complexe, repérer si une langue privilégie ou empêche telle ou telle structure, noter si une langue utilise une structure / un groupe ou un enchaînement de groupe donné pour transmettre une idée particulière, et à quel niveau du discours cela correspond.
2°) on peut coder les phrases et distinguer ce qu'elles racontent en trois plans - 1er plan sujet (thème), 2nd plan (objet et datif); 3ème plan cadre / contexte (génitif, ablatif, aspects circonstanciels) et dégager la progression d'une description, d'un discours, coder les jeux et rites littéraires depuis l'idée du jeu jusqu'à la phrase à rédiger effectivement, quelque soit le vocabulaire qu'on utilisera au final.
3°) on peut dresser un portrait a minima d'une langue et en déduire quelle syntaxe et quel vocabulaire on doit créer pour obtenir une nouvelle langue - et si on dispose du codage d'un texte, le traduire dans cette nouvelle langue en utilisant une table qui indique quel groupe utiliser (en français, japonais, russe, latin etc.) pour quel groupe (dans la langue construite). On peut aussi construire une table de conversion d'une langue naturelle vers une autre langue naturelle.
CODE DE STRUCTURE SYNTAXIQUEA : Adverbe.
B : pronom réflexif
C : donnée chiffrée.
D : déterminant.
E : verbe d’expression
F : Verbe infinitif.
G : génitif.
H : datif.
I : ordinal.
J : conjonction.
K : interrogatif
L : verbe lien (copule).
M : verbe de mouvement.
N : propre (nommé, avec une majuscule).
O : objet du verbe.
P : pronom.
Q : adjectif.
R : Pronom relatif.
S : nom sujet.
T : Participe présent.
U : unité.
V : Verbe.
W : Verbe modal.
X : Préposition
Y : pronom circonstanciel.
Z : Interjection, onomatopée, insertion, smiley, ponctuation autre que respiration.
LE COMTE DE MONTE-CRISTOAlexandre Dumas
PREMIERE PARTIE
CHAPITRE 1
MARSEILLE - L'ARRIVEE
PREMIERE PARTIE
MARSEILLE – L’ARRIVEE
Le 24 février 1815, la vigie de Notre-Dame de la Garde signala le trois-mâts le Pharaon, venant de Smyrne, Trieste et Naples.
Le bâtiment avait heureusement franchi le détroit que quelque secousse volcanique avait creusé entre l’île de Calasareigne et l’île de Jaros ; il avait doublé Pomègue, et il s’avançait sous ses trois huniers, son grand foc et sa brigantine, mais si lentement et d’une allure si triste, que les curieux, avec cet instinct qui pressent un malheur, se demandaient quel accident pouvait être arrivé à bord. Néanmoins les experts en navigation reconnaissaient que si un accident en navigation était arrivé, ce ne pouvait être au bâtiment lui-même ; ...
Paragraphe 1 - Phrase 1"Le 24 février 1815, la vigie de Notre-Dame de la Garde signala le trois-mâts le Pharaon, venant de Smyrne, Trieste et Naples."
D(U)C (XDG) (XG)N (XDU)C, Le (jour) 24 (du mois de) Février (de l’année) 1815
DS XDGN XDGN VEDO XDGN, La vigie de (nom propre) de (nom propre) signale le trois-mâts le Pharaon,
(RS VL) VT XGN, (X)GN, J (X)GN. (Qui est) venant de (nom propre), de (nom propre) et de (nom propre).
Exemple de liste de "groupes logiques" pour cette seule phrase :
D(U)C = DUC = DCIU (Le 24 = Le jour numéro 24, le 24ème jour).
DS = La vigie
VMP = RS VLVMP = venant = qui est venant
VEDO = signale le trois-mâts.
XDGN = de Notre-Dame.
XDN = de La Garde.
XDUC = (XDU)C = 1815.
XDUN = (XDU)N = Février.
XGN = de Smyrne.
Codage de la version anglaise :
On the 24th (day) of (the month of) February, (of the year) 1815, XDC(U) (XDG) XGN, (XU)C
the look-out at Notre-Dame de la Garde signalled the three-master, DS XGN XDGN VEDO
the Pharaon from Smyrna, Trieste, and Naples. DON XGN, (X)GN, J (X)GN.
Paragraphe 2 - Phrase 1« Le bâtiment avait heureusement franchi le détroit que quelque secousse volcanique avait creusé entre l’île de Calasareigne et l’île de Jaros ; »
DN VMADO Le bâtiment = trois-mâts = franchit heureusement le détroit.
RO DSQ VM XDG XGN Une secousse volcanique creuse que = le détroit = entre l’île de...
J (VM) (X)DG XDGN. Et (creuse que = le détroit = entre) l’île de (nom propre) ;
Paragraphe 2 - Phrase 2" il avait doublé Pomègue, et il s’avançait sous ses trois huniers, son grand foc et sa brigantine, mais si lentement et d’une allure si triste, que les curieux, avec cet instinct qui pressent un malheur, se demandaient quel accident pouvait être arrivé à bord."
PS VM ON, J PS PB VM XDCUG, Il double (objet nommé) et il avance sous ses 3 huniers
(X)D(U)QG, J D(U)G, (sous) son grand foc et sa brigantine,
J AA J XSG AQ, Mais si lentement et (il s’avance) d’une allure si triste.
RY DS, XDG RS VTDO, Que les curieux, avec cet instinct qui pressent un malheur.
PB VEDOK WF XG. Se demandent quel accident peut être arrivé à bord.
Paragraphe 2 - Phrase 3« Néanmoins les experts en navigation reconnaissaient que si un accident en navigation était arrivé, ce ne pouvait être au bâtiment lui-même »
J DS XG VE Néanmoins, les experts en navigation reconnaissent
RO JK DS XG VLQ, Que si un accident en navigation est arrivé
PS A WF Q XH PBA. Cela ne peut être arrivé au bâtiment lui-même.
***
D'autres tests suivront.
***edit***
Je m'aperçois que le texte français utilisé est une version abrégée du roman original. Désolé.