Prima di proseguire, è importante capire di cosa stiamo parlando quando ci riferiamo a una relazione empirica e contrastarla con studi teorici. Alcuni risultati nelle statistiche e altri campi di conoscenza possono essere derivati da alcune dichiarazioni precedenti in modo teorico. Iniziamo con ciò che sappiamo, quindi usiamo la logica, la matematica e ragionamento deduttivo e vedere dove questo ci conduce. Il risultato è una conseguenza diretta di altri fatti noti.
In contrasto con il teorico è il modo empirico di acquisire conoscenza. Invece di ragionare su principi già stabiliti, possiamo osservare il mondo che ci circonda. Da queste osservazioni, possiamo quindi formulare una spiegazione di ciò che abbiamo visto. Gran parte della scienza è fatta in questo modo. Gli esperimenti ci forniscono dati empirici. L'obiettivo diventa quindi quello di formulare una spiegazione che si adatti a tutti i dati.
In statistica, esiste una relazione tra media, mediana e modalità basata empiricamente. Le osservazioni di innumerevoli set di dati hanno dimostrato che la differenza tra la media e la modalità è per lo più tre volte la differenza tra la media e la mediana. Questa relazione in forma di equazione è:
Per vedere la relazione di cui sopra con i dati del mondo reale, diamo un'occhiata alle popolazioni degli Stati Uniti nel 2010. In milioni, le popolazioni erano: California - 36.4, Texas - 23.5, New York - 19.3, Florida - 18.1, Illinois - 12.8, Pennsylvania - 12.4, Ohio - 11.5, Michigan - 10.1, Georgia - 9.4, North Carolina - 8.9, New Jersey - 8.7, Virginia - 7.6, Massachusetts - 6.4, Washington - 6.4, Indiana - 6.3, Arizona - 6.2, Tennessee - 6.0, Missouri - 5.8, Maryland - 5.6, Wisconsin - 5.6, Minnesota - 5.2, Colorado - 4.8, Alabama - 4.6, Carolina del Sud - 4.3, Louisiana - 4.3, Kentucky - 4.2, Oregon - 3.7, Oklahoma - 3.6, Connecticut - 3.5, Iowa - 3.0, Mississippi - 2.9, Arkansas - 2.8, Kansas - 2.8, Utah - 2.6, Nevada - 2.5, New Mexico - 2.0, West Virginia - 1.8, Nebraska - 1.8, Idaho - 1.5, Maine - 1.3, New Hampshire - 1.3, Hawaii - 1.3, Rhode Island - 1.1, Montana - .9, Delaware - .9, South Dakota - .8, Alaska - .7, North Dakota - .6, Vermont -. 6, Wyoming - .5
Ad esempio, se sappiamo che abbiamo una media di 10, una modalità di 4, qual è la mediana del nostro set di dati? Dato che Mean - Mode = 3 (Mean - Median), possiamo dire che 10 - 4 = 3 (10 - Median). Da qualche algebra, vediamo che 2 = (10 - Mediana), e quindi la mediana dei nostri dati è 8.
Come visto sopra, quanto sopra non è una relazione esatta. Invece, è una buona regola empirica, simile a quella del regola del range, che stabilisce una connessione approssimativa tra deviazione standard e gamma. La media, la mediana e la modalità potrebbero non adattarsi esattamente alla relazione empirica di cui sopra, ma ci sono buone probabilità che sia ragionevolmente vicina.