fbpx

Segmentazione e tagging del parlato dialettale: sperimentazione di tecniche di language equivalence a partire da materiali dialettali (CLiMAlp e AlpiLINK)

Le procedure di tagging e di segmentazione del parlato sono fra gli strumenti importanti della corpus linguistics, soprattutto nell’ambito delle lingue non standard. La ricerca è funzionale allo sviluppo di due progetti PRIN (CLiMAlp, PRIN 2017; AlpiLInK, PRIN 2020), dedicati alla raccolta di testimonianze scritte e parlate (raccolte attraverso registrazioni audio in modalità crowd-sourcing) nelle lingue minoritarie dell’Arco Alpino. Parte delle attività di raccolta dati si è svolta attraverso una collaborazione con la Sovrintendenza agli Studi che prevede la sperimentazione di un percorso di familiar tutoring, coinvolgendo studenti di un campione di scuole secondarie valdostane nell’inchiesta che diverranno “intervistatori” dei membri più anziani delle loro famiglie sottoponendo loro il questionario predisposto dal progetto AlpiLInK.

Il programma di ricerca si propone di sperimentare sui materiali disponibili tecniche di tagging sintattico realizzabili attraverso l’uso di applicazioni già sperimentate sulle lingue nazionali, utilizzando come ipotesi di base la possibile equivalenza fra i costrutti sintattici di queste (in particolare italiano e francese) e quelli delle lingue minoritarie (nello specifico francoprovenzale e occitano).

Si prevede la costruzione e il tagging sintattico di un campione (ottenuto dall’ordinamento, segmentazione digitale, caricamento e trascrizione di almeno 200 segmenti di parlato dialettale, con l’integrazione di almeno altri 200 segmenti tratti dalle attestazioni scritte raccolte nel progetto CLiMAlp) funzionale alla successiva descrizione della sintassi delle parlate francoprovenzali.

L’obiettivo del progetto è la messa a disposizione sulla piattaforma AlpiLInK (https://alpilink.it/) dei dati georeferenziati rappresentati dai segmenti di parlato dialettale raccolti durante le interviste e della trascrizione e tagging sintattico di una parte di esse, a titolo di saggio metodologico funzionale alla realizzazione di un prototipo descrittivo di alcuni fenomeni sintattici propri delle parlate francoprovenzali e occitane.

Responsabile scientifico: Gianmario Raimondi

Durata: dal 1° ottobre 2023 al 31 dicembre 2024

Salva