Tutoriel basé
sur le japonais

  • Introduction
  • Prise en main
  • Description par la catégorie
  • Chaîne simple
  • Chaîne discontinue
  • Plus de détails sur le comptage
  • Créer sa propre catégorie
  • Créer sa propre catégorie

    Les exemples vus jusqu'à présent montrent que Sagace permet de faire des recherches plus complexes que ce que permettent d'autres services en ligne d'analyses de corpus. Mais l'outil permet d'aller plus loin (et c'est là que réside son principal intértêt): il permet de créer "à la volée" de nouvelles catégories, en utilisant des catégories existantes. Pour cela, on utilise un langage de description des catégories proche du langage logique propositionnel.

    Nous proposons quelques exempels. Pour approfondir, nous invitons l'utilisateur à consulter le manuel d'utilisation de Sagace.

    Objectif : Modifier une catégorie existante.

    Dans "brevets industriels, lister 10 phrases commençant par un nom commun (nc).

    Nous constatons que la catégorie inclue les noms verbaux (nv), par exemple 請求.
    En effet, dans la catégosation appliquée au vocabulaire, les noms verbaux sont aussi des noms communs.
    Avec l'instruction suivante, nous ordonnons de chercher des noms communs, en excluant les noms verbaux. La description de cette nouvelle catégorie est
    nc & -nv
    . Cette description s'interprète "catégorie dont les constituants sont des "noms communs (nc) ET (&) qui NE SONT PAS (-) des noms verbaux".
    Récupérons les mêmes morphes, à l'exclusion du morphe particulier, コンパイン Pour cela, à la description précédente, nous ajoutons que les morphes de la catégorie cherchée ont la propriété supplémentaire de ne pas avoir le trait "lemme" valué コンパイン.
    nc & -nv & -lemme:コンパイン
    Pour comprendre en détail cette instruction, nous renvoyons au manuel.

    Le langage de description des composants de Sagace est comparable au langage propositionnel. Il comprend aussi la disjonction (OU). Voici l'instruction pour chercher toutes les occurrences des morphes コンパイン et 猫植:

    lemme:コンパイン |  lemme:猫植

    Interprétée en termes ensemblistes, cette formule se comprend (voir la sémantique du calcul des propositions): catégorie constituée des morphes qui ont le trait lemme:コンパイン OU (|) le trait lemme:猫植.

    2013-2020
    blin -chez -ehess . fr