ホームページ rkappa.fr

LEXIC, étude de corpus

Dictionnaire japonais->français

Synthèse des analyses textométriques du lexique de 16.000 noms et adjectif nominaux japonais (LJ16), effectuées sur plusieurs corpus japonais écrits de styles sensiblement différents. Le lexique est trop limité pour permettre de produire des résultats généraux pertinents, qui serviraient en particulier à dégager les caractéristiques lexicales, voires morphologiques, de ces styles textuels.
Nous donnons néanmoins les résultats à titre indicatifs, comme une mise en place de la méthodologie.

Les corpus exploités sont :
  Livres blancs : Livres blancs du gouvernement édités en 2009/2010/2011
  Dict. Daijirin : Extraits du dictionnaire japonais-japonais 大辞林
  Journaux : Journaux 2011, 朝日, 日経, 産業
  Txt juridiques : 六法+lois 2008/2009/2010
  QR gouv. : Questions du parlement au gouvernement 2008/2010/2011
  QR divers : Extraits du site de questions-réponses diverses, oshiete.goo.ne.jp
  Tchats : Extraits de sites de Tchats

Nombre d'énoncés par corpus:

Sauf les tchats dont l'énoncé est défini par un retour à la ligne, les autres énoncés sont bornés par '。'. Ce n'est pas sans conséquence sur les résultats puisque l'analyseur SAGACE ne distingue pas les ronds dans une citation dans une phrase et les rond en fin de phrase. Il y a alors risque d'erreur. Néanmoins, on peut estimer que ce type d'occurrence (un rond dans une citation) est rare, et donc le nombre d'erreurs faible.

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
9348917680983372346885490113694628271

Nombre d'occurrences des mots du dictionnaire:

Occurrences du mot seul + avec le suffixe adjectivisant 的 + avec le suffixe nominalisant 性 + avec les suffixes du pluriel ら et たち.

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
180 181120 13188 17949 43180 319163 10528 256

Proportion de mots différents:

Lorsque le mot est seul.

La proportion est ramenée sur 100 pour être comparée entre corpus.

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
Valeur brute3500636844861301244460392403
Val. max ramenée à 10064.0 77.7 40.2 6.5 19.9 100.0 6.9

Fréquence moyenne:

Donne une idée du nombre de fois où les mots sont répétés.

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
Moyenne
Ecart type
47.01
219.16
17.57
75.25
18.41
30.67
35.04
93.55
29.75
103.70
24.75
108.44
11.17
42.39

Nombre d'occurrences moyennes des mots par phrases:

Obtenu simplement en calculant : Taille corpus / nombre de phrases

Le logiciel utilisé pour l'analyse ne permet pas de calculer un écart type.

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
1.750.630.991.311.321.090.94

Fréquence de la construction nom+的

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
Valeur brute546197188323513062272113
Val. max ramenée à 100100.0 11.9 7.9 1.2 10.7 37.7 0.3

Nombre (pondéré) de noms en 的

Lorsque le mot est seul.
Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
Valeur brute179.00 132.68 53.83 11.25 51.71 221.78 7.84
Val. max ramenée à 10080.7 59.8 24.3 5.1 23.3 100.0 3.5

Fréquences des suffixes de pluriel ら et たち

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
ra
tati
1545.00
216.00
44.67
18.67
209.46
125.28
179.69
0.00
265.68
12.48
171.99
234.45
3.61
7.84

Rapport entre les fréquences des suffixes de pluriel ら et たち

"ra" (resp."tati") signfie que seul ra (resp. tati) est utilisé
"(ra)  X" signifie qu'on compte X occurrences de ra pour une seule occurrence de tati (idem pour tati-ra)

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
(ra) 7.15 (ra) 2.39 (ra) 1.67 ra (ra) 21.29 (tati) 1.36 (tati) 2.17

Nombre de noms pour chaque suffixe de pluriel ら et たち

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
ra
tati
12.00
22.00
5.33
10.00
52.85
24.96
0.82
0.00
7.58
3.12
13.58
38.92
1.88
2.20

Rapport entre les nombre de noms pour chaque suffixe du pluriel ら et たち

Livres blancsDict. DaijirinJournauxTxt juridiquesQR gouv.QR diversTchats
(tati) 1.83 (tati) 1.88 (ra) 2.12 ra (ra) 2.43 (tati) 2.87 (tati) 1.17

2011-07-22
blin a t ehess . fr