l presente studio ha indagato in maniera sperimentale l’impatto delle caratteristiche segmentali e soprasegmentali della voce sulla capacità degli apprendenti di elaborare e trattenere le informazioni in contesti di apprendimento a distanza. Per lo scopo una madrelingua italiana con pronuncia standard (priva di riconoscibili tratti regionali), due italiane native con accento regionale (campano e toscano), due parlanti non native di italiano con forte accento straniero (inglese e cinese) hanno letto un testo tecnico-scientifico sul tema della speciazione ovvero il processo di formazione di nuove specie zoologiche e botaniche, a partire da una di origine. Per includere nel corpus una voce priva di coloriture regionali a livello segmentale e/o soprasegmentale, ne è stata aggiunta una sesta sintetizzata che è stata anche manipolata attraverso il trapianto dell’intonazione e del ritmo delle cinque voci naturali. È stato così raccolto un corpus di parlato letto realizzato da 11 voci differenti: cinque voci naturali, una voce sintetizzata e cinque voci con segmenti sintetizzati e prosodia naturale. In qualità di ascoltatori hanno partecipato alla sperimentazione 165 studenti campani, di età media pari a 21 anni e con un normale sviluppo delle funzioni uditive e cognitive. I partecipanti sono stati suddivisi in 11 gruppi omogenei per numerosità (15 ascoltatori per gruppo), provenienza, età, scolarizzazione, privi di conoscenze relative al tema della speciazione. Ciascun gruppo ha ascoltato la lezione sul tema della speciazione prodotta da una delle 11 voci selezionate per lo studio. Ai soggetti, che avevano dichiarato di non avere alcuna conoscenza dell’argomento, non è stato fornito alcun supporto visivo, né è stata data loro la possibilità di riascoltare il testo e/o di prendere appunti. Al termine dell’ascolto, è stato somministrato un test di comprensione orale, costruito con le tecniche della scelta binaria, dell’abbinamento parole/immagini e del riordino di sequenze di immagini. L’esercizio di scelta binaria è stato utilizzato solo come attività preparatoria di warm-up, finalizzata a predisporre positivamente i soggetti alle attività di verifica successive. Per questo motivo, gli esiti di questa prova non sono stati considerati nella valutazione del carico cognitivo. Delle letture prodotte dalle cinque voci naturali e da quella sintetizzata è stata condotta un’analisi spettro-acustica. Per ciascuna produzione sono state misurate: • il numero di sillabe realmente prodotte; • in numero e la durata delle catene foniche prodotte (s); • la durata delle pause silenti e delle disfluenze (s); • il valore minimo e massimo della frequenza fondamentale (f0). Sulla base di tali dati sono stati calcolati i seguenti indici ritmico-prosodici: • velocità di articolazione (VdA) – sill/s; • velocità di eloquio (VdE) – sill/s; • fluenza (F) – sill/n. catene foniche; • range tonale (RT) – st; • composizione del parlato (% silenzi, tempo di fonazione, disfluenze). Tali analisi hanno permesso sia di caratterizzare le sei produzioni orali in termini prosodico-intonativi, sia di accertare l’esistenza di una possibile correlazione tra il diverso profilo prosodico delle voci e gli esiti del test di comprensione. Fatta eccezione dell’esercizio di warm-up, per il quale la percentuale di risposte corrette, come atteso, non ha mai superato la soglia della casualità, i risultati delle attività di abbinamento e di riordino hanno evidenziato un effetto positivo dell’utilizzo di una voce con pronuncia standard sull’elaborazione dei contenuti. Favorisce l’apprendimento anche l’esposizione all’accento regionale familiare all’ascoltatore, il campano. Non incontrando difficoltà particolari con la decodifica del segnale acustico, il ricevente riesce a canalizzare le sue risorse cognitive esclusivamente sulla strutturazione e la ritenzione delle informazioni. Particolarmente penalizzante ai fini dell’apprendimento è, invece, l’effetto prodotto dalla voce non nativa con un accento straniero poco familiare ai partecipanti; i gruppi a cui era stata somministrata la produzione della madrelingua cinese nella versione naturale e sintetizzata hanno infatti conseguito la percentuale superiore di risposte errate. Seppur in misura differenziata, deviazioni segmentali abbinate ad un’intonazione monotona e deviazioni prosodiche sovrimposte a segmenti sintetizzati sottraggono parte delle risorse cognitive necessarie all’attività di elaborazione dei contenuti, poiché l’apprendente deve impegnarsi nell’attività preliminare di decodifica del significante. Le difficoltà incontrate dagli ascoltatori campani nella comprensione del parlato con accento cinese trovano riscontro nei dati dell’analisi spettro-acustica. La parlante cinese mostra valori di velocità di articolazione, di eloquio, fluenza e range tonale inferiori rispetto a quelli degli altri modelli analizzati (sintetizzato, non nativo e nativo). Dal punto di vista della produzione, tali differenze denotano la maggiore difficoltà del locutore a gestire in maniera accurata il piano segmentale e soprasegmentale della L2. Dal punto di vista della ricezione, tali incertezze determinano nell’ascoltatore un sovraccarico cognitivo che ostacola la piena elaborazione e ritenzione delle informazioni.

Voce e apprendimento multimediale

DE MEO, Anna;VITALE, MARILISA;PELLEGRINO, ELISA
2015-01-01

Abstract

l presente studio ha indagato in maniera sperimentale l’impatto delle caratteristiche segmentali e soprasegmentali della voce sulla capacità degli apprendenti di elaborare e trattenere le informazioni in contesti di apprendimento a distanza. Per lo scopo una madrelingua italiana con pronuncia standard (priva di riconoscibili tratti regionali), due italiane native con accento regionale (campano e toscano), due parlanti non native di italiano con forte accento straniero (inglese e cinese) hanno letto un testo tecnico-scientifico sul tema della speciazione ovvero il processo di formazione di nuove specie zoologiche e botaniche, a partire da una di origine. Per includere nel corpus una voce priva di coloriture regionali a livello segmentale e/o soprasegmentale, ne è stata aggiunta una sesta sintetizzata che è stata anche manipolata attraverso il trapianto dell’intonazione e del ritmo delle cinque voci naturali. È stato così raccolto un corpus di parlato letto realizzato da 11 voci differenti: cinque voci naturali, una voce sintetizzata e cinque voci con segmenti sintetizzati e prosodia naturale. In qualità di ascoltatori hanno partecipato alla sperimentazione 165 studenti campani, di età media pari a 21 anni e con un normale sviluppo delle funzioni uditive e cognitive. I partecipanti sono stati suddivisi in 11 gruppi omogenei per numerosità (15 ascoltatori per gruppo), provenienza, età, scolarizzazione, privi di conoscenze relative al tema della speciazione. Ciascun gruppo ha ascoltato la lezione sul tema della speciazione prodotta da una delle 11 voci selezionate per lo studio. Ai soggetti, che avevano dichiarato di non avere alcuna conoscenza dell’argomento, non è stato fornito alcun supporto visivo, né è stata data loro la possibilità di riascoltare il testo e/o di prendere appunti. Al termine dell’ascolto, è stato somministrato un test di comprensione orale, costruito con le tecniche della scelta binaria, dell’abbinamento parole/immagini e del riordino di sequenze di immagini. L’esercizio di scelta binaria è stato utilizzato solo come attività preparatoria di warm-up, finalizzata a predisporre positivamente i soggetti alle attività di verifica successive. Per questo motivo, gli esiti di questa prova non sono stati considerati nella valutazione del carico cognitivo. Delle letture prodotte dalle cinque voci naturali e da quella sintetizzata è stata condotta un’analisi spettro-acustica. Per ciascuna produzione sono state misurate: • il numero di sillabe realmente prodotte; • in numero e la durata delle catene foniche prodotte (s); • la durata delle pause silenti e delle disfluenze (s); • il valore minimo e massimo della frequenza fondamentale (f0). Sulla base di tali dati sono stati calcolati i seguenti indici ritmico-prosodici: • velocità di articolazione (VdA) – sill/s; • velocità di eloquio (VdE) – sill/s; • fluenza (F) – sill/n. catene foniche; • range tonale (RT) – st; • composizione del parlato (% silenzi, tempo di fonazione, disfluenze). Tali analisi hanno permesso sia di caratterizzare le sei produzioni orali in termini prosodico-intonativi, sia di accertare l’esistenza di una possibile correlazione tra il diverso profilo prosodico delle voci e gli esiti del test di comprensione. Fatta eccezione dell’esercizio di warm-up, per il quale la percentuale di risposte corrette, come atteso, non ha mai superato la soglia della casualità, i risultati delle attività di abbinamento e di riordino hanno evidenziato un effetto positivo dell’utilizzo di una voce con pronuncia standard sull’elaborazione dei contenuti. Favorisce l’apprendimento anche l’esposizione all’accento regionale familiare all’ascoltatore, il campano. Non incontrando difficoltà particolari con la decodifica del segnale acustico, il ricevente riesce a canalizzare le sue risorse cognitive esclusivamente sulla strutturazione e la ritenzione delle informazioni. Particolarmente penalizzante ai fini dell’apprendimento è, invece, l’effetto prodotto dalla voce non nativa con un accento straniero poco familiare ai partecipanti; i gruppi a cui era stata somministrata la produzione della madrelingua cinese nella versione naturale e sintetizzata hanno infatti conseguito la percentuale superiore di risposte errate. Seppur in misura differenziata, deviazioni segmentali abbinate ad un’intonazione monotona e deviazioni prosodiche sovrimposte a segmenti sintetizzati sottraggono parte delle risorse cognitive necessarie all’attività di elaborazione dei contenuti, poiché l’apprendente deve impegnarsi nell’attività preliminare di decodifica del significante. Le difficoltà incontrate dagli ascoltatori campani nella comprensione del parlato con accento cinese trovano riscontro nei dati dell’analisi spettro-acustica. La parlante cinese mostra valori di velocità di articolazione, di eloquio, fluenza e range tonale inferiori rispetto a quelli degli altri modelli analizzati (sintetizzato, non nativo e nativo). Dal punto di vista della produzione, tali differenze denotano la maggiore difficoltà del locutore a gestire in maniera accurata il piano segmentale e soprasegmentale della L2. Dal punto di vista della ricezione, tali incertezze determinano nell’ascoltatore un sovraccarico cognitivo che ostacola la piena elaborazione e ritenzione delle informazioni.
2015
978-88-6274-602-1
File in questo prodotto:
File Dimensione Formato  
AISV 2014_DeMeo_et_alii.pdf

accesso aperto

Descrizione: articolo
Tipologia: Documento in Post-print
Licenza: PUBBLICO - Pubblico con Copyright
Dimensione 67.57 kB
Formato Adobe PDF
67.57 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11574/159249
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
social impact