I dati accoppiati nelle statistiche, spesso indicati come coppie ordinate, si riferiscono a due variabili negli individui di una popolazione che sono collegate tra loro per determinare la correlazione tra di loro. Affinché un set di dati sia considerato come dati accoppiati, entrambi questi valori di dati devono essere collegati o collegati tra loro e non considerati separatamente.
L'idea dei dati accoppiati è in contrasto con la consueta associazione di un numero a ciascun punto dati come in altri dati quantitativi stabilisce che ogni singolo punto dati è associato a due numeri, fornendo un grafico che consente agli statistici di osservare la relazione tra queste variabili in una popolazione.
Questo metodo di dati accoppiati viene utilizzato quando uno studio spera di confrontare due variabili negli individui della popolazione per trarre una sorta di conclusione sulla correlazione osservata. Quando si osservano questi punti di dati, l'ordine dell'associazione è importante perché il primo numero è una misura di una cosa mentre il secondo è una misura di qualcosa di completamente diverso.
Esempio di dati associati
Per vedere un esempio di dati accoppiati, supponi che un insegnante conti il numero di compiti a casa per ogni studente fornito per una determinata unità e quindi abbina questo numero alla percentuale di ogni studente sul test unitario. Le coppie sono le seguenti:
- Una persona che ha completato 10 incarichi ha guadagnato il 95% con il suo test. (10, 95%)
- Una persona che ha completato 5 incarichi ha guadagnato l'80% con il suo test. (5, 80%)
- Una persona che ha completato 9 incarichi ha guadagnato l'85% con il suo test. (9, 85%)
- Una persona che ha completato 2 incarichi ha guadagnato il 50% sul suo test. (2, 50%)
- Una persona che ha completato 5 incarichi ha guadagnato il 60% con il suo test. (5, 60%)
- Una persona che ha completato 3 incarichi ha guadagnato il 70% con il suo test. (3, 70%)
In ognuna di queste serie di dati accoppiati, possiamo vedere che il numero di incarichi viene sempre prima nel coppia ordinata mentre la percentuale guadagnata durante il test è al secondo posto, come mostrato nella prima istanza di (10, 95%).
Mentre un'analisi statistica di questi dati potrebbe anche essere utilizzata per calcolare il numero medio di compiti completati o il punteggio medio del test, potrebbero esserci altre domande da porre i dati. In questo caso, l'insegnante vuole sapere se esiste una connessione tra il numero di compiti a casa consegnati e prestazioni durante il test e l'insegnante avrebbe bisogno di mantenere i dati accoppiati per rispondere a questo domanda.
Analisi dei dati associati
Il tecniche statistiche di correlazione e la regressione sono utilizzate per analizzare i dati accoppiati in cui il file coefficiente di correlazione quantifica la precisione con cui i dati si trovano su una linea retta e misura la forza della relazione lineare.
La regressione, d'altra parte, viene utilizzata per diverse applicazioni, inclusa la determinazione della linea più adatta al nostro set di dati. A sua volta, questa linea può essere utilizzata per stimare o prevedere y valori per valori di X che non facevano parte del nostro set di dati originale.
Esiste un tipo speciale di grafico particolarmente adatto per i dati associati chiamato scatterplot. In questo tipo di grafico, un asse di coordinate rappresenta una quantità di dati associati mentre l'altro asse di coordinate rappresenta l'altra quantità di dati associati.
Un diagramma a dispersione per i dati di cui sopra dovrebbe indicare all'asse x il numero di incarichi eseguiti mentre l'asse y indica i punteggi nel test unitario.