Lexicometreja v.0.1
Lexicometreja est une application web d'analyse lexicométrique de textes rédigés en japonais. Pour l'instant, elle ne traite que des sites web.
Le document suivant propose une explication détaillée, une discussion sur la qualité des résultats et un exemple d'analyse.
Raoul Blin, 2017, Analyse lexicométrique du roman japonais kokoro (« Le pauvre coeur des hommes ») de Natsume Soseki. 2017. hal-01473996v2.
Si vous mentionnez les résultats des analyses obtenues ici, veuillez citer l'article et la version de l'application Lexicometreja: v.0.1.
Méthode
La page web est d'abords débarrassée de ses balises. Puis Mecab+ipadic produisent l'analyse morphologique. Le tout est ensuite compté.
Versions des outils et ressources utilisés
Lexicometreja v.0.1
Analyseur morphologique mecab of 0.996
Dictionnaire mecab-ipadic.x86_64 2.7.0.20070801 pour le japonais contemporain
Dictionnaire Kindai Bungo UniDic pour le japonais moderne (Meiji, Taisho)
Remarques
Lexicometreja est en cours de rodage. Si vous rencontrez des difficultés, n'hésitez pas à les signaler.
Pour toute information : blin@ehess.fr
|