Strumenti Utente

Strumenti Sito


manuale_utente:liste_di_frequenza_sulle_concordanze

Questa è una vecchia versione del documento!


Distribuzione di frequenza delle concordanze

Oltra alle funzioni rapide Forme e Nome doc. descritte nella pagina dei risultati, da questa pagina è possibile calcolare la distribuzione di frequenza in modo più articolato.

Distribuzione di frequenza multilivello

Questa funzione permette di generare delle liste di frequenza multilivello sui risultati della ricerca (e non su tutto il corpus come dalla pagina di calcolo delle Liste di Frequenza).

La prima opzione, Limite di frequenza, serve per escludere i risultati con frequenza troppo bassa.

Nella tabella è poi possibile selezionare il livello (primo, secondo,…), che corrisponde al numero di token orizzontali da considerare nel calcolo della frequenza e quindi al numero di colonne della tabella in uscita.

Per ogni livello considerato si deve specificare a quale token (da 6L a 6R) e a quale attributo (forma, pos, lemma, …) fa riferimento quel livello.

Esempio 1

Parametri:

  • ricerca di concordanza: il lemma andare;
  • livello 1: posizione 1R, attributo lemma;

Questa ricerca ad un solo livello mostra i lemmi più usati nel primo token a destra di andare.

Esempio 2

Parametri:

  • ricerca di concordanza: il lemma andare;
  • livello 1: posizione Node, attributo word;
  • livello 2: posizione 1R, attributo pos;

Questa ricerca mostra la frequenza <forma,pos> e consente di vedere quali part-of-speech vengono usati più frequentemente nel primo token a destra con ogni forma del lemma andare.

Distribuzione di frequenza per tipologia di testo

Da questo pannello è possibile analizzare come le concordanze che abbiamo cercato si distribuiscono nei testi del corpus.

Si possono selezionare o il nome del file o una delle tipologie testuali del corpus e verrà generata la distribuzione quantitativa delle concordanze in ogni file (nel primo caso) o in ogni tipologia testuale (nel secondo caso). E' possibile la selezione multipla, ma, in tal caso verranno generate più liste indipendenti e mostrate una dopo l'altra.


Questo esempio mostra la distribuzione del lemma andare nelle tipologie testuali del corpus CorDIC-parlato.

/var/www/wiki/data/attic/manuale_utente/liste_di_frequenza_sulle_concordanze.1384525283.txt.gz · Ultima modifica: 15/11/2013 15:21 da admin