LEXIC, étude de corpus |
Synthèse des analyses textométriques du lexique de 16.000 noms et adjectif nominaux japonais (LJ16), effectuées sur plusieurs corpus japonais écrits de styles sensiblement différents. Le lexique est trop limité pour permettre de produire des résultats généraux pertinents, qui serviraient en particulier à dégager les caractéristiques lexicales, voires morphologiques, de ces styles textuels.
Nous donnons néanmoins les résultats à titre indicatifs, comme une mise en place de la méthodologie.
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
93489 | 176809 | 83372 | 34688 | 54901 | 136946 | 28271 |
Nombre d'occurrences des mots du dictionnaire:
Occurrences du mot seul + avec le suffixe adjectivisant 的 + avec le suffixe nominalisant 性 + avec les suffixes du pluriel ら et たち.
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
180 181 | 120 131 | 88 179 | 49 431 | 80 319 | 163 105 | 28 256 |
Proportion de mots différents:
Lorsque le mot est seul.
La proportion est ramenée sur 100 pour être comparée entre corpus.
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
Valeur brute | 3500 | 6368 | 4486 | 1301 | 2444 | 6039 | 2403 |
Val. max ramenée à 100 | 64.0 | 77.7 | 40.2 | 6.5 | 19.9 | 100.0 | 6.9 |
Fréquence moyenne:
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
Moyenne Ecart type | 47.01 219.16 | 17.57 75.25 | 18.41 30.67 | 35.04 93.55 | 29.75 103.70 | 24.75 108.44 | 11.17 42.39 |
Nombre d'occurrences moyennes des mots par phrases:
Obtenu simplement en calculant : Taille corpus / nombre de phrases
Le logiciel utilisé pour l'analyse ne permet pas de calculer un écart type.
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
1.75 | 0.63 | 0.99 | 1.31 | 1.32 | 1.09 | 0.94 |
Fréquence de la construction nom+的
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
Valeur brute | 5461 | 971 | 883 | 235 | 1306 | 2272 | 113 |
Val. max ramenée à 100 | 100.0 | 11.9 | 7.9 | 1.2 | 10.7 | 37.7 | 0.3 |
Nombre (pondéré) de noms en 的
Lorsque le mot est seul.
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
Valeur brute | 179.00 | 132.68 | 53.83 | 11.25 | 51.71 | 221.78 | 7.84 |
Val. max ramenée à 100 | 80.7 | 59.8 | 24.3 | 5.1 | 23.3 | 100.0 | 3.5 |
Fréquences des suffixes de pluriel ら et たち
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
ra tati |
1545.00 216.00 |
44.67 18.67 |
209.46 125.28 |
179.69 0.00 |
265.68 12.48 |
171.99 234.45 |
3.61 7.84 |
Rapport entre les fréquences des suffixes de pluriel ら et たち
"ra" (resp."tati") signfie que seul ra (resp. tati) est utilisé
"(ra) X" signifie qu'on compte X occurrences de ra pour une seule occurrence de tati (idem pour tati-ra)
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
(ra) 7.15 | (ra) 2.39 | (ra) 1.67 | ra | (ra) 21.29 | (tati) 1.36 | (tati) 2.17 |
Nombre de noms pour chaque suffixe de pluriel ら et たち
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
ra tati |
12.00 22.00 |
5.33 10.00 |
52.85 24.96 |
0.82 0.00 |
7.58 3.12 |
13.58 38.92 |
1.88 2.20 |
Rapport entre les nombre de noms pour chaque suffixe du pluriel ら et たち
Livres blancs | Dict. Daijirin | Journaux | Txt juridiques | QR gouv. | QR divers | Tchats | |
(tati) 1.83 | (tati) 1.88 | (ra) 2.12 | ra | (ra) 2.43 | (tati) 2.87 | (tati) 1.17 |
2011-07-22
blin a t ehess . fr