Meccanismi di correzione degli errori nell'apprendimento delle lingue: modellare gli individui, parte 3
Nov 09, 2023
Relazione tra le misure basate sull'attivazione del modello e le scelte dei partecipanti e i tempi di risposta
In un'ulteriore valutazione della qualità dell'adattamento del modello R–W, abbiamo effettuato un'analisi di modellazione lineare generalizzata a effetti misti esaminando la relazione tra le scelte dei partecipanti e la misura basata sull'attivazione derivata dai modelli R–W adattati, ovvero , supporto per l'attivazione del modulo np (vedere la sezione sulla modellazione computazionale per maggiori dettagli). Abbiamo anche analizzato la relazione tra i tempi di risposta dei partecipanti e il supporto di attivazione adattando un modello lineare polinomiale a effetti misti con entrambi i termini lineari e quadratici del supporto di attivazione, poiché ci aspettavamo che il supporto di attivazione avesse un effetto quadratico sui tempi di risposta (Tabella 3). Riepiloghi più dettagliati dei modelli con le strutture a effetti casuali sono forniti nell'Appendice S8 nelle Informazioni di supporto online.
L’effetto casuale si riferisce all’impatto dei cambiamenti casuali tra gli individui. È ampiamente utilizzato in sociologia, psicologia e altri campi. La memoria è un indicatore importante per misurare la funzione cerebrale e influisce direttamente sull'apprendimento e sulla vita delle persone. Ma qual è esattamente la relazione tra effetti casuali e memoria?
La ricerca mostra che esiste una certa correlazione tra effetti casuali e memoria. Quando si eseguono compiti di memoria, l'interferenza di fattori casuali ridurrà l'efficienza e la precisione del completamento di un individuo, influenzando così le prestazioni della memoria. Di conseguenza, allenare l'abilità anti-interferenza di un individuo può migliorare la sua capacità di rispondere a effetti casuali, migliorando così la memoria.
Inoltre, diversi gruppi di persone rispondono in modo diverso a fattori casuali. Alcune persone hanno una forte adattabilità e mostrano una migliore capacità di memoria quando incontrano un ambiente altamente casuale; mentre per alcune persone, fattori casuali causeranno interferenze eccessive e ridurranno la memoria. livello. Ciò è legato alla capacità di memoria di base dell'individuo, alla qualità psicologica, all'esperienza di vita e ad altri fattori.
Pertanto, dobbiamo riconoscere l'impatto degli effetti casuali sulla memoria e utilizzare metodi scientifici per migliorare la capacità anti-interferenza individuale e l'adattabilità per migliorare i livelli di memoria. Credo che finché daremo il massimo, facendo affidamento sulla scienza e sulla tecnologia per esplorare continuamente e migliorare costantemente la nostra qualità personale, saremo in grado di continuare ad andare avanti sulla strada per perseguire una vita eccellente e padroneggiare vite più meravigliose! Si può vedere che abbiamo bisogno di migliorare la memoria, e la Cistanche deserticola può migliorare significativamente la memoria perché la Cistanche deserticola è un materiale medicinale tradizionale cinese che ha molti effetti unici, uno dei quali è quello di migliorare la memoria. L'efficacia della carne macinata deriva dai vari principi attivi che contiene, tra cui acidi, polisaccaridi, flavonoidi, ecc. Questi ingredienti possono favorire la salute del cervello in vari modi.

Fare clic su modi per migliorare la funzione cerebrale
Come previsto, il supporto di attivazione per la forma plurale non maschile è stato significativamente associato positivamente alla probabilità di scelte di forme non maschili, OR {{0}}.78, p < .001, 95 % IC [3,82, 12,03]. La Figura 4 (riquadro di sinistra) mostra anche che questa relazione è asimmetrica intorno allo 0, riflettendo una forte propensione verso la forma verbale maschile che, anche con prove (basate sull'attivazione) a sostegno della forma non maschile, può comunque portare a una preferenza per la forma maschile. Inoltre, e in linea con le nostre ipotesi, il termine polinomiale di secondo ordine del supporto di attivazione era un predittore significativo del tempo di risposta, poiché esisteva una relazione quadratica tra il supporto di attivazione e il tempo di risposta, con le risposte più lente registrate per gli eventi meno supportati, b {{ 12}} −0,20, p=0,012, IC 95% [−0,35, −0,04]; vedere anche la Figura 4, riquadro a destra.

Questi risultati suggeriscono che i modelli adattati hanno funzionato bene nel prevedere le scelte formali dei partecipanti e che l'informazione codificata nei pesi associativi - la valuta di base di un modello R-W - è un buon predittore sia della probabilità di scegliere una particolare forma verbale sia della velocità con cui viene data la risposta. Il livello di accordo dei partecipanti riguardo alla scelta di una certa forma verbale differiva quindi a seconda del supporto di attivazione di quella particolare forma, con un alto livello di accordo atteso e attestato per valori di supporto di attivazione alti positivi o bassi negativi e con un alto livello di disaccordo atteso e attestato per il supporto di attivazione intorno allo zero.
Livello di accordo tra i partecipanti attraverso la lente del modello
Abbiamo analizzato ulteriormente il comportamento dei partecipanti esplorando due domande aggiuntive. In primo luogo, quale livello di accordo c'era tra gli studenti di lingua, dato un particolare tipo di evento (ad esempio, eventi costituiti da segnali dello stesso genere grammaticale rispetto a eventi che mescolavano segnali di generi grammaticali diversi)? In secondo luogo, e soprattutto, le differenze nei livelli di accordo possono essere adeguatamente spiegate utilizzando il modello R–W?
Per rispondere a queste domande, abbiamo analizzato l'effetto della presenza di ciascuna categoria di eventi sulla proporzione di partecipanti che hanno scelto una delle due forme verbali (per un elenco completo delle categorie di eventi utilizzate nell'attività, vedere l'Appendice S3 nelle Informazioni di supporto online). Per ottenere le stime del modello delle proporzioni, abbiamo utilizzato il modello lineare generalizzato a effetti misti che abbiamo costruito nell'analisi precedente (Tabella 3, a sinistra) per modellare la relazione tra il supporto di attivazione e la scelta della forma plurale non maschile. Nello specifico, per ciascuna categoria di eventi, abbiamo calcolato la media delle proporzioni previste dal modello delle forme non maschili in base ai valori di supporto di attivazione tra i partecipanti (dato che ciascuna categoria di eventi è stata incontrata una volta da ciascun partecipante). I risultati sono riepilogati nella Figura 5. Gli eventi nella le figure sono ordinate in ordine crescente in base alle proporzioni di scelta osservate nell'esperimento, quindi i lati più a sinistra e più a destra rappresentano regioni con un alto livello di accordo tra i partecipanti, mentre gli eventi situati nella parte centrale hanno innescato un alto livello di disaccordo tra i partecipanti.
I partecipanti avevano una chiara preferenza per la forma plurale maschile quando l'evento conteneva un segnale personale maschile (uMP) o quando l'evento includeva solo segnali maschili animati (ad esempio, "uMA1 + uMA2"). Allo stesso modo, i partecipanti preferivano la forma plurale non maschile quando gli eventi contenevano esclusivamente segnali femminili, personali o animati (ad esempio, "uFA +uFP"). Alti livelli di disaccordo sono stati osservati principalmente per eventi che mescolavano il segnale inibitorio bloccato e un segnale femminile o un segnale animato maschile e un segnale personale femminile (con proporzioni comprese tra .44 e .51).

Confrontando le proporzioni osservate e previste, il modello è riuscito a catturare sorprendentemente bene la differenza nei livelli di accordo tra i partecipanti nelle diverse categorie di eventi. Le maggiori discrepanze tra le proporzioni osservate e quelle previste sembrano essersi verificate in eventi che coinvolgevano segnali bloccati e bloccati inibitori, suggerendo che era più difficile per il modello catturarne l'effetto sulle scelte dei partecipanti.

Relazione tra la qualità dell'adattamento del modello e le misure della differenza individuale I risultati dell'adattamento del modello hanno dimostrato che il modello R–W tiene conto con successo del comportamento di un'ampia percentuale dei nostri partecipanti, compresi i loro tempi di risposta. Tuttavia, la qualità dell’adattamento variava tra i partecipanti, con i dati di alcuni partecipanti che si adattavano molto male al modello. Nel tentativo di valutare se le altre misure raccolte durante l'esperimento (caratteristiche demografiche, WM span e apprendimento implicito) possano spiegare le differenze individuali osservate nella qualità di adattamento del modello, abbiamo eseguito una regressione lineare multipla per prevedere i tassi di corrispondenza partecipante-modello (logit -trasformato) sulla base delle diverse misure di differenza individuale raccolte. Nello specifico, i predittori includevano l’intervallo della WM (trasformata in z), il sesso e l’età; gli intervalli temporali estratti per ciascun partecipante dal compito di apprendimento implicito non hanno dato un contributo significativo e sono riportati nell'Appendice S5 nelle Informazioni di supporto online.

Dal modello di regressione lineare completo che includeva tutte e quattro le variabili di misura individuali nonché l'interazione tra genere e intervallo di WM, abbiamo derivato un modello finale contenente solo le variabili significative utilizzando la selezione delle variabili all'indietro basata sul test del rapporto di verosimiglianza. I dati di due partecipanti sono stati omessi da questa analisi perché uno non ha riportato il proprio genere e l'altro è stato identificato come un valore anomalo estremo, come spiegato nella sezione sull'attività WM. In totale, i dati di 61 partecipanti sono stati inseriti nel modello di regressione lineare. Il modello migliore dopo la selezione delle variabili includeva sia l’intervallo della WM che il genere, ma non la loro interazione (Tabella 4).
La precisione di adattamento del modello è aumentata in modo significativo con l'aumento dell'intervallo WM,b {{0}}.17, p=.008, IC 95% [{{24 }}.05, 0,30], come illustrato nella Figura 6 (riquadro di sinistra), ed era significativamente più alto per le partecipanti di sesso femminile (M=0,69, SD=0,17) nel confronto con partecipanti di sesso maschile (M=0,63, SD=0,16), b=−0,28, p=0,033, IC al 95% [−0,54, −0,02 ], come mostrato nella Figura 6 (riquadro destro). Per verificare che la rimozione dei residui influenti non abbia influenzato i nostri risultati, abbiamo applicato la critica del modello come descritto in Baayen e Milin (2010); l'esclusione del singolo residuo estremo con punteggio az maggiore di 2,5 nel nostro modello ha prodotto effetti ancora più forti (p=0,004 per l'intervallo WM e p=0,007 per il genere). Inoltre, lo span della WM non era significativamente correlato al genere (p=.058), il che suggerisce che è improbabile che la loro relazione abbia influenzato gli effetti del genere e dello span della WM sull'accuratezza dell'adattamento del modello (vedere Appendice S9 nelle Informazioni di supporto online per maggiori dettagli). I nostri risultati mostrano quindi che avere una maggiore capacità di WM o essere una donna aumenta la probabilità che un partecipante scelga le forme verbali secondo il modello R-W nel nostro compito di apprendimento della lingua.

Discussione
Riepilogo dei risultati
I nostri risultati mostrano che un meccanismo R-W cattura bene il modo in cui i partecipanti apprendono l’accordo soggetto-verbo in una lingua morfologicamente complessa e, per estensione, come potrebbero apprendere la lingua attraverso la semplice esposizione ad essa. Con una precisione di adattamento media del 68%, basata su una semplice strategia decisionale basata sull'attivazione, il modello ha spiegato piuttosto bene le scelte della forma verbale fatte da un'ampia percentuale di partecipanti.7 Ancora più interessante, una misura basata sull'attivazione estratta dai modelli con l'adattamento migliore ha correlato fortemente sia con la probabilità di una particolare scelta della forma verbale sia con il tempo necessario per fare quella scelta.
Il modello ha inoltre fornito informazioni sul motivo per cui i partecipanti potrebbero mostrare livelli di accordo alti o bassi quando scelgono una forma verbale, a seconda della natura del soggetto della clausola. Secondo il modello, ciò è dovuto alle forze associative acquisite dai partecipanti, che vengono utilizzate per calcolare il supporto di attivazione per ciascuna delle possibili forme verbali. Questi punti di forza dell'associazione sono influenzati principalmente da (a) il tasso di apprendimento degli studenti per gli spunti (il tasso di apprendimento determina l'entità della correzione dei pesi, in base all'errore stimato in ciascuna prova) e (b) la distribuzione degli eventi di apprendimento incontrati durante la prova. fase di apprendimento (questo includerebbe, tra le altre cose, la frequenza di ciascun evento di apprendimento e l'ordine degli eventi di apprendimento). Pertanto, una previsione del nostro studio è che cambiare l'ordine o le frequenze relative degli eventi di apprendimento durante la formazione potrebbe portare a modelli di scelta diversi da quelli che abbiamo osservato qui.
Abbiamo anche trovato una relazione significativa tra genere e capacità WM e tassi di corrispondenza partecipante-modello, che fa luce su ciò che potrebbe aver causato le differenze osservate nella qualità dell’adattamento del modello. Il fatto che nel nostro esperimento una percentuale maggiore di donne rispetto agli uomini abbia agito mediante un meccanismo R-W è in linea con i risultati di numerosi studi precedenti che hanno evidenziato l’associazione tra genere e condizionamento classico per entrambi gli esseri umani (Lonsdorf et al., 2015; Merz et al., 2018) e animali (ad esempio, Velasco et al., 2019). Ciò suggerisce una differenza significativa nell'apprendimento tra uomini e donne, con le donne che sono meglio modellate dalla regola di apprendimento di correzione degli errori R-W. È generalmente noto che le donne hanno un piccolo vantaggio linguistico rispetto agli uomini (vedi Kimura, 1999, per una valutazione approfondita), in particolare nelle aree relative al recupero lessicale (Balling & Baayen, 2008, 2012). È stato suggerito che ciò potrebbe essere dovuto al fatto che le donne hanno una memoria dichiarativa superiore, che potrebbero utilizzare per generalizzare sulle forme vicine memorizzate (Hartshorne & Ullman, 2006).
La scoperta che la probabilità che uno studente di lingua si comporti secondo il meccanismo R–W aumenta con la capacità WM fornisce la prova che WM può svolgere un ruolo nel condizionamento classico influenzando l’adozione di un meccanismo di condizionamento classico come la regola R–W. Sasaki (2009) e Baetu et al. (2018) avevano precedentemente fornito prove dell'interruzione delle prestazioni di condizionamento classico quando la WM viene caricata utilizzando paradigmi a doppio compito. La presente scoperta si aggiunge alla crescente evidenza che, contro la convinzione predominante, la WM può essere implicata in processi cognitivi di basso livello come l'apprendimento strumentale , più comunemente indicato come apprendimento per rinforzo nelle comunità delle neuroscienze e dell'apprendimento automatico (Collins & Frank,2012; Ez-zizi, 2016) e in alcune forme di apprendimento implicito (Medimorec et al.,2021).
Effetti bloccanti e inibitori simili al blocco non sono emersi dal modello R-W per tutti i partecipanti. Come mostrato, ciò è dovuto principalmente alla breve durata della fase di formazione. L’aumento del numero di prove di allenamento non solo ha portato al riemergere di effetti di blocco per i parametri più adatti di tutti i partecipanti, ma ha anche eliminato la variabilità nei pesi delle associazioni, prevedendo così che tutti i partecipanti dovrebbero finire per comportarsi allo stesso modo nel lungo periodo. vedere l'appendice S7 nelle informazioni di supporto online). Ciò non sorprende alla luce del lavoro di Danks (2003), il quale mostra che, in molti casi, il sistema R–W convergerà allo stesso equilibrio indipendentemente dai parametri utilizzati. In altre parole, la destinazione degli studenti è spesso la stessa (anche questo è auspicabile poiché spesso vogliamo che tutti gli studenti imparino a fare le stesse associazioni), ma i percorsi verso quelle destinazioni possono differire sostanzialmente a seconda della natura del problema di apprendimento (ad esempio, la quantità di dati disponibili, frequenze relative degli eventi, numero di segnali ed esiti). Ciò ha molte implicazioni per gli studi sull’apprendimento linguistico che utilizzano il modello R–W, come discusso nella sezione successiva.

Implicazioni per gli studi sull'apprendimento delle lingue che utilizzano il modello Rescorla-Wagner
Diversi gruppi di ricerca linguistica hanno abbracciato il modello R–W come un valido approccio per modellare i fenomeni di apprendimento linguistico grazie alla sua semplicità, alla sua plausibilità cognitiva e ai suoi successi nello spiegare un'ampia gamma di fenomeni di apprendimento linguistico. Il presente studio fornisce ulteriore supporto per la simulazione o la modellazione dell’apprendimento linguistico utilizzando questo modello, ma attira anche l’attenzione sull’importante questione delle differenze individuali, che finora è stata trascurata negli studi che combinano la modellazione computazionale utilizzando il modello R–W e dati sperimentali.
Data la quantità di differenze individuali che abbiamo osservato nei nostri dati, sarebbe prudente abbandonare l’approccio attualmente predominante in cui il modello R–W viene eseguito una volta con i suoi valori di parametro predefiniti e utilizzato per spiegare i dati di tutti i partecipanti. Sebbene l’effetto del parametro del tasso di apprendimento sull’accuratezza dell’adattamento del modello non fosse sostanziale per il compito scelto, in pratica, le prestazioni R–W saranno sempre influenzate dalla scelta del tasso di apprendimento, indipendentemente dalla particolare sfida di modellazione (Milin, Divjak, & Baayen, 2017, pp. 1739–1741).
Un'altra pratica comune che potrebbe dover essere riconsiderata è l'addestramento del modello su un set di dati di grandi dimensioni o su un piccolo sottoinsieme di esso. Di conseguenza, le caratteristiche che distinguono il modello dai modelli di classificazione puramente statistici – vale a dire la possibilità di scegliere parametri che catturano la velocità con cui un individuo può apprendere e la capacità di tenere conto degli effetti dell’ordine di input – rimangono inutilizzate. Non sorprende, quindi, che diversi studi abbiano riportato solo differenze minori o nessuna differenza tra il modello R–W e altri modelli statistici o di apprendimento come la regressione logistica, l’apprendimento basato sulla memoria e gli alberi decisionali (Baayen, 2011; Baayen et al. , 2013). Con un tale approccio, il vantaggio principale del modello R–W rispetto alle tecniche puramente statistiche è la sua capacità di eseguire un apprendimento incrementale, man mano che i dati diventano disponibili. Tuttavia, lo stesso vantaggio potrebbe essere ottenuto da qualsiasi modello di rete neurale senza strati nascosti poiché tale modello può anche produrre pesi tra segnali e risultati, sebbene con una regola di apprendimento diversa e, probabilmente, meno plausibile (qui alludiamo principalmente alla regola di apprendimento della propagazione all'indietro, (che è attualmente l'approccio predominante nell'addestramento dei modelli di reti neurali). Con un modello del genere, è ancora possibile applicare lo stesso approccio di adattamento del modello che abbiamo usato qui, ma con un diverso insieme di parametri da regolare, come il tipo di funzione di attivazione, il numero di neuroni e la velocità di apprendimento.
Un recente lavoro sui quadri basati sull'uso ha evidenziato le grandi differenze individuali che caratterizzano la conoscenza linguistica nelle popolazioni di prima lingua. Le differenze individuali nella grammatica sono paragonabili per dimensioni a quelle nella conoscenza lessicale e sono legate sia alla qualità dell'input che alle capacità cognitive dello studente (D ˛ abrowska, 2018). I nostri risultati dimostrano che l'adattamento del modello individuale dovrebbe essere l'opzione predefinita quando si confronta il modello R–W o altri modelli computazionali con i dati dei partecipanti. Nello specifico, i parametri del modello e gli input dei dati dovrebbero essere adattati separatamente per ciascun partecipante per consentire una migliore considerazione delle risposte individuali e ottenere un quadro più veritiero di dove risiede la conoscenza, ad esempio, di una regola, se nella mente aggregata del linguista o del singolo individuo. menti degli utenti (Divjak, 2018) e come è distribuito nella popolazione. I nostri dati supportano anche la posizione basata sull'uso secondo cui la nostra conoscenza linguistica è modellata dalle nostre caratteristiche personali e cognitive, come attestato dal ruolo significativo della WM e del genere nella qualità dell'adattamento del modello; tali fattori dovrebbero essere considerati per impostazione predefinita durante la modellazione del linguaggio.
Limitazioni e direzioni future
Il nostro studio è il primo ad adattare il modello R–W al comportamento dei singoli studenti in un reale compito di apprendimento della lingua. Abbiamo utilizzato il modello R–W nella forma ora disponibile, ma i nostri risultati, nonostante siano molto promettenti, mostrano che potrebbe essere interessante estendere il modello per gestire le limitazioni di capacità WM. Ulteriori indagini in tale direzione potrebbero essere ispirate dal lavoro svolto nell’apprendimento per rinforzo – un campo strettamente correlato al condizionamento classico – dove si presume da tempo che l’apprendimento avvenga in aree, spesso associate a funzioni cognitive di basso livello, come lo striato dorsale e ventrale. (Balleine& O'Doherty, 2010), ma è ora riconosciuto che coinvolge anche il controllo cognitivo di alto livello tramite la WM. Ciò ha portato allo sviluppo di nuovi quadri di apprendimento in cui la WM è esplicitamente modellata come una componente chiave che supporta l'apprendimento conservando informazioni da studi precedenti (ad esempio, vedere Collins & Frank, 2012; Ezzizi et al., 2015). Questo potrebbe essere l'approccio da adottare per R-W e altri modelli di condizionamento classico, soprattutto perché negli ampi studi linguistici basati sulla simulazione, gli eventi di apprendimento contengono tipicamente un gran numero di segnali (ad esempio, tutti i trigrafi o le parole in una frase), che non possono essere elaborati immediatamente da uno studente umano – come richiesto negli aggiornamenti del modello R–W – a causa delle note limitazioni della capacità WM (vedi Glautier, 2013 e Baayen et al., 2016, per i primi tentativi in questa direzione).
Un'altra direzione per l'estensione futura del nostro lavoro è quella di raccogliere le risposte dei partecipanti nel tempo mentre vengono formati sulle associazioni segnale-risultato piuttosto che avere una fase di test separata post-apprendimento. Ciò avrebbe il potenziale per migliorare ulteriormente l'adattamento del modello e per fornire un quadro più ampio del comportamento dei partecipanti mentre apprendono il compito. Inoltre, ciò potrebbe consentire l’estrazione di una misura di apprendimento basata sulla pendenza temporale per il compito di apprendimento linguistico, come abbiamo fatto per il compito di apprendimento implicito, e quindi aumenterebbe la probabilità di trovare un collegamento tra l’apprendimento implicito e la qualità dell’adattamento del R- Modello W (vedi anche la nostra discussione nell'Appendice S5 nelle Informazioni di supporto online). Un collegamento tra le due misure può anche essere sondato adattando il modello R–W ai tempi di risposta raccolti nel compito di apprendimento implicito, come fatto da Notaro et al. (2018), anziché utilizzare solo le pendenze temporali o una combinazione delle due.
Infine, la particolare struttura del nostro compito di apprendimento linguistico ha favorito la strategia normativa (di parte maschile), ma una domanda interessante che rimane senza risposta è se possiamo utilizzare il modello R-W per prevedere l’emergere di diverse strategie quando variamo la struttura dell’input linguistico. e controllo delle differenze individuali tra gli studenti di lingue. L'approccio che prevede l'utilizzo del modello R–W per spiegare o prevedere il livello di accordo tra gli utenti della lingua può essere esteso oltre l'accordo soggetto-verbo polacco al passato plurale per coprire altri aspetti della lingua dove è stata osservata una mancanza di consenso nell'uso della lingua (ad esempio, vedere Geeraert et al., 2020; Milin, Divjak e Baayen, 2017).
Conclusione
Il modello R–W è un modello di apprendimento molto semplice, ma ha molteplici fonti di variazione che possono essere utilizzate per spiegare il comportamento dei partecipanti negli esperimenti di apprendimento linguistico. Questi includono il tasso di apprendimento del modello, l'ordine di presentazione degli esempi di apprendimento e le frequenze relative delle co-occorrenze di segnali-risultati. Nel presente studio, abbiamo incorporato sistematicamente queste fonti di variazione adattando il modello ai dati dei partecipanti, consentendo così al modello di catturare con successo le scelte e le latenze di risposta della maggior parte dei partecipanti in un compito di apprendimento della lingua sull'accordo soggetto-verbo polacco. Inoltre, caratteristiche cognitive e demografiche come la WM e il genere determinavano la misura in cui l’apprendimento della lingua era guidato da principi di apprendimento simili a quelli di tipo R–W.
Badge di ricerca aperti
Questo articolo ha ottenuto i badge Open Data e Open Materials per aver reso pubblicamente disponibili i dati condivisibili digitalmente e i componenti dei metodi di ricerca necessari per riprodurre la procedura e i risultati riportati. Tutti i dati e i materiali che gli autori hanno utilizzato e hanno il diritto di condividere sono disponibili su https://github.com/ooominds/Error-correction-mechanismsin-lingual-learning e https://doi.org/10.25500/edata.bham. 00000911. Tutti i materiali proprietari sono stati identificati con precisione nel manoscritto.
Appunti
1 L'idea della competizione di segnali è anche al centro del modello di competizione di Batesand MacWhinney (1987) per l'acquisizione del linguaggio. Il loro modello, tuttavia, utilizza principalmente segnali simbolici/linguistici come l’ordine delle parole o le caratteristiche morfologiche delle parole e si basa su un approccio connessionista che richiede un’architettura molto più complessa rispetto al modello R–W.
2 I contenuti di qualsiasi corpus sono, nella migliore delle ipotesi, un'approssimazione molto approssimativa dell'input che ricevono gli utenti della lingua. Al contrario, i linguaggi artificiali sono illustrativi e informativi per comprendere i linguaggi naturali, ma difficilmente rappresentano un riflesso realistico della complessità riscontrata in un dato linguaggio naturale.
3 Le prime implementazioni della regola R-W come modello di apprendimento della discriminazione ingenua si basavano su una versione non iterativa dell'algoritmo, come fornito da Danks (2003), che elimina la possibilità che emergano effetti di ordine.
4 È importante notare che qui non eravamo interessati a testare gli effetti di blocco di per sé come viene tipicamente fatto negli esperimenti comportamentali del condizionamento classico. In questi esperimenti, sono inclusi solo gli eventi rilevanti per il blocco (il blocco è testato separatamente dagli altri effetti), e il blocco è testato su un secondo segnale anziché su un terzo come nel nostro caso (ad esempio, Kamin, 1969). Inoltre, lo studente viene solitamente addestrato per un tempo sufficiente a garantire che l'indicazione "bloccante" diventi un buon predittore del risultato di interesse. Un assetto sperimentale così pulito non rappresenterebbe in modo equo il “disordine” così pervasivo nei linguaggi naturali. Poiché il nostro studio riguarda l'apprendimento delle lingue, abbiamo deciso di imitare il più fedelmente possibile una situazione di apprendimento realistica.
5 Un altro partecipante ha riscontrato un malfunzionamento dell'attrezzatura nel bel mezzo della fase di test e ha dovuto ripetere il test. Abbiamo conservato i dati di questo partecipante poiché non ha seguito alcuna formazione aggiuntiva nella seconda esecuzione della fase di test e quindi ha iniziato la nuova esecuzione con le stesse conoscenze della prima esecuzione (ricorda che il feedback sui risultati viene fornito solo nella fase di formazione). L'effetto di familiarità non dovrebbe avere alcun ruolo in questo caso poiché tutti i partecipanti sono stati sottoposti ad alcune prove pratiche in tutte le fasi prima di iniziare l'esperimento vero e proprio. Abbiamo inoltre eseguito nuovamente tutte le analisi senza i dati di questo partecipante e abbiamo confermato che la loro rimozione non ha alterato nessuno dei risultati presentati nell'articolo.
6 La qualità dell'adattamento del modello ai dati invisibili è stata valutata utilizzando la convalida incrociata "leave-one-out". Nello specifico, per ciascun partecipante, abbiamo organizzato un evento tra quelli incontrati in fase di test e abbiamo adattato un modello R–W ai rimanenti eventi. Il modello è stato poi valutato solo sull'evento riservato valutando se la risposta del partecipante corrispondeva a quella di il suo modello R-W più adatto. Abbiamo ripetuto questa operazione per tutti gli eventi del test e poi abbiamo calcolato l'accuratezza media (leave-one-out), ovvero la proporzione di corrispondenze tra le risposte di un dato partecipante su ciascuno degli eventi riservati e le previsioni associate dall'R-più adatto del partecipante. Modello W.

7 In effetti, questo livello di accuratezza può essere considerato eccellente poiché abbiamo assunto un processo di selezione delle azioni molto semplice e non probabilistico in cui la forma verbale viene scelta se ha l'attivazione più alta. Ciò non tiene conto della variabilità che potrebbe derivare dall'esplorazione, dalla perdita di attenzione o dal rumore cerebrale intrinseco.
Riferimenti
1.Adani, S. e Cepanec, M. (2019). Differenze di sesso nello sviluppo precoce della comunicazione: indicatori comportamentali e neurobiologici dello sviluppo del sistema di comunicazione più vulnerabile nei ragazzi. Giornale medico croato, 60(2),141–149.https://doi.org/10.3325/cmj.2019.60.141
2.Ambridge, B. e Lieven, EVM (2011). Acquisizione del linguaggio infantile: approcci teorici contrastanti. Stampa dell'Università di Cambridge.
3.Baayen, RH (2011). Linguistica dei corpora e apprendimento discriminativo ingenuo. RevistaBrasileira de Linguística Aplicada, 11(2), 295–328.https://doi.org/10.1590/S1984-63982011000200003
4.Baayen, RH, Endresen, A., Janda, LA, Makarova, A., & Nesset, T. (2013). Fare delle scelte in russo: pro e contro dei metodi statistici per le forme rivali. Linguistica russa, 37(3), 253–291.https://doi.org/10.1007/s11185-013-9118-6
5.Baayen, RH e Milin, P. (2010). Analisi dei tempi di reazione. Giornale internazionale di ricerca psicologica, 3(2), 12–28.https://doi.org/10.21500/20112084.807
6. Baayen, RH, Milin, P., Filipovic Ður ´ đevic, D., Hendrix, P., & Marelli, M. (2011). Un modello amorfo per l'elaborazione morfologica nella comprensione visiva basato sull'apprendimento discriminativo ingenuo. Revisione psicologica, 118(3), 438–481.https://doi.org/10.1037/a0023851
7.Baayen, RH, Shaoul, C., Willits, J. e Ramscar, M. (2016). Comprensione senza segmentazione: una prova di concetto con apprendimento discriminativo ingenuo. Linguaggio, cognizione e neuroscienze, 31(1), 106–128.https://doi.org/10.1080/23273798.2015.1065336
8. Baetu, I., Burns, N., & Child, B. (2018). Le differenze individuali nella capacità della memoria di lavoro predicono le prestazioni in un compito di apprendimento associativo [Presentazione del documento]. Psicologo australiano, Sydney, Australia.https://doi.org/10.1111/ap.12372
9. Balleine, BW e O'Doherty, JP (2010). Omologie umane e di roditori nel controllo dell'azione: determinanti corticostriatali dell'azione diretta allo scopo e abituale. Neuropsicofarmacologia, 35(1), 48-69.https://doi.org/10.1038/npp.2009.131
10. Balling, LW e Baayen, RH (2008). Effetti morfologici nel riconoscimento delle parole uditive: prove dal danese. Linguaggio e processi cognitivi, 23 (7–8), 1159–1190.https://doi.org/10.1080/01690960802201010
For more information:1950477648nn@gmail.com






