Definizione di disambiguazione negli studi linguistici

In linguistica, la disambiguazione è il processo per determinare quale senso di a parola viene utilizzato in un particolare contesto. Conosciuto anche come disambiguazione lessicale.

In linguistica computazionale, questo processo discriminativo è chiamato disambiguazione del senso della parola (WSD).

Esempi e osservazioni

"Succede che il nostro comunicazione, in diversi le lingue allo stesso modo, consente di utilizzare la stessa forma di parola per significare cose diverse nelle singole transazioni comunicative. La conseguenza è che si deve capire, in una particolare transazione, il significato inteso di una data parola tra i suoi sensi potenzialmente associati. Mentre il ambiguità derivanti da tali molteplici associazioni forma-significato sono al lessicale livello, spesso devono essere risolti per mezzo di un contesto più ampio dal discorso incorporando la parola. Quindi i diversi significati della parola "servizio" potrebbero essere distinti solo se si potesse guardare oltre la parola stessa, come nel contrasto "il servizio del giocatore a Wimbledon' con 'il servizio del cameriere allo Sheraton.' Questo processo di identificazione dei significati delle parole in un discorso è generalmente conosciuto come

instagram viewer

senso della parola disambigua (WSD)." (Oi Yee Kwong, Nuove prospettive sulle strategie computazionali e cognitive per la disambiguazione del senso delle parole. Springer, 2013)

Disambiguazione lessicale e disambiguazione del senso della parola (WSD)

"Lessicale disambigua nella sua definizione più ampia non è altro che determinare il significato di ogni parola nel contesto, che sembra essere un processo in gran parte inconscio nelle persone. Come problema computazionale, è spesso descritto come "AI-complete", cioè un problema la cui soluzione presuppone una soluzione per completare linguaggio naturale comprensione o ragionamento di buon senso (Ide e Véronis 1998).

"Nel campo della linguistica computazionale, il problema è generalmente chiamato disambiguazione del senso della parola (WSD) ed è definito come il problema di determinare computazionalmente quale 'senso' di una parola è attivato dall'uso della parola in un particolare contesto. Il WSD è essenzialmente un compito di classificazione: i sensi delle parole sono le classi, il contesto fornisce le evidenza, e ogni occorrenza di una parola è assegnata a una o più delle sue possibili classi in base alla prova. Questa è la tradizionale e comune caratterizzazione del WSD che lo vede come un processo esplicito di disambiguazione rispetto a un inventario fisso dei sensi delle parole. Si presume che le parole abbiano un insieme finito e discreto di sensi da a dizionario, una base di conoscenza lessicale, o un'ontologia (in quest'ultima, i sensi corrispondono a concetti che una parola lessicalizza). Possono essere utilizzati anche inventari specifici per l'applicazione. Ad esempio, in un ambiente di traduzione automatica (MT), si possono trattare le traduzioni di parole come sensi di parole, an approccio che sta diventando sempre più fattibile a causa della disponibilità di grandi multi-lingue parallelo corpora che possono servire come dati di addestramento. L'inventario fisso del WSD tradizionale riduce la complessità del problema, ma esistono campi alternativi.. .." (Eneko Agirre e Philip Edmonds, "Introduzione". Disambiguazione del senso delle parole: algoritmi e applicazioni. Springer, 2007)

Omonimia e disambiguazione

"Lessicale disambigua è particolarmente adatto per i casi di omonimia, per esempio, un'occorrenza di basso deve essere mappato su uno degli elementi lessicali bass₁ o basso₂, a seconda del significato inteso.

"La disambiguazione lessicale implica una scelta cognitiva ed è un compito che inibisce i processi di comprensione. Dovrebbe essere distinto dai processi che portano a una differenziazione dei sensi delle parole. Il primo compito viene svolto in modo abbastanza affidabile anche senza molte informazioni contestuali mentre il secondo non lo è (cfr. Veroni 1998, 2001). È stato anche dimostrato che le parole omonime, che richiedono disambiguazione, rallentano l'accesso lessicale, mentre le parole polisemiche, che attivano una molteplicità di sensi verbali, velocizzano l'accesso lessicale (Rodd e.a. 2002).

"Tuttavia, sia la modifica produttiva dei valori semantici che la scelta diretta tra elementi lessicalmente diversi hanno in comune che richiedono ulteriori informazioni non lessicali." (Peter Bosch, "Produttività, polisemia e indicicità predicativa." Logica, linguaggio e calcolo: 6° Simposio internazionale di Tbilisi su logica, linguaggio e calcolo, ed. di Balder D. ten Cate e Henk W. Zeevat. Springer, 2007)

Disambigua delle categorie lessicali e principio di verosimiglianza

"Corley e Crocker (2000) presentano un modello ad ampia copertura di categoria lessicaledisambigua basato sul Principio di verosimiglianza. In particolare, suggeriscono che per una frase composta da parole w₀... w_n, il processore di frasi adotta il più probabile parte del discorso sequenza T₀... T_n. Più specificamente, il loro modello sfrutta due semplici probabilità: (io) la probabilità condizionata della parola w_io data una parte particolare del discorso T_io, e (ii) la probabilità di T_io vista la parte precedente del discorso T_i-1. Quando si incontra ogni parola della frase, il sistema le assegna quella parte del discorso T_io, che massimizza il prodotto di queste due probabilità. Questo modello sfrutta l'intuizione che molti sintattico le ambiguità hanno una base lessicale (MacDonald et al., 1994), come in (3):

(3) I prezzi/marche di magazzino sono più economici degli altri.

"Queste frasi sono temporaneamente ambigue tra una lettura in cui prezzi o fare è il verbo principale o parte di a nome composto. Dopo essere stato addestrato su un ampio corpus, il modello prevede la parte del discorso più probabile per prezzi, tenendo conto correttamente del fatto che le persone capiscono prezzo come sostantivo ma fare come verbo (vedi Crocker & Corley, 2002, e riferimenti ivi citati). Non solo il modello tiene conto di una serie di preferenze di disambiguazione radicate nella categoria lessicale ambiguità, spiega anche perché, in generale, le persone sono molto precise nel risolvere tali ambiguità". (Matteo W. Crocker, "Modelli razionali di comprensione: affrontare il paradosso della performance". Psicolinguistica del XXI secolo: quattro capisaldi, ed. di Anne Cutler. Lawrence Erlbaum, 2005)