L'analisi di regressione, nella modellazione statistica, è un modo per ordinare matematicamente una serie di variabili. Lo usiamo per determinare quali variabili hanno un impatto e come si relazionano tra loro. In altre parole, l'analisi di regressione ci aiuta a determinare quali fattori contano di più e quali possiamo ignorare.
Ci aiuta anche a determinare quali fattori interagiscono tra loro. Inoltre, e soprattutto, ci aiuta a scoprire quanto siamo certi di tutti i fattori che stiamo esaminando.
La bontà dell'adattamento, ad esempio, è una componente dell'analisi di regressione. La bontà dell'adattamento si riferisce all'accuratezza dei valori attesi di un modello finanziario rispetto ai loro valori effettivi.
Analisi di regressione una misura statistica
L'analisi di regressione è una misura statistica che utilizziamo negli investimenti, nella finanza, nelle vendite, nel marketing, nella scienza, nella matematica, ecc. Cerca di determinare quanto sia fortemente correlata una variabile dipendente a una serie di altre variabili variabili. Di solito li chiamiamo variabili indipendenti.
La variabile dipendente è quella su cui ci concentriamo. In parole povere, vogliamo sapere se è interessato e, in caso affermativo, da quanto e da cosa.
Le variabili indipendenti sono i fattori che possono o meno influenzare la variabile dipendente. Dipendente riceve l'impatto, mentre Indipendente fornisce (o meno) l'impatto.
I gestori finanziari e degli investimenti affermano che li aiuta a valutare le risorse. Li aiuta anche a capire le relazioni tra le diverse variabili. Ad esempio, come il prezzo delle materie prime si rapporta alle azioni delle società che trattano tali merci.
La variabile dipendente (ad es. dati sulle vendite) si trova sull'asse y. La variabile indipendente (es. prezzo) si trova sull'asse x. Cerchiamo di creare una relazione tra queste due variabili e tracciamo una linea. Una relazione positiva è quella in cui entrambe le variabili indipendenti e dipendenti si muovono insieme. Ottieni una relazione negativa quando si muovono in direzioni opposte.
Analisi di regressione nelle vendite
Immagina di essere un responsabile vendite e di provare a prevedere le cifre dei prossimi mesi. Sai che ci sono dozzine che possono influenzare il numero. Ad esempio, il periodo dell'anno o le voci secondo cui un modello migliore uscirà presto possono influire sul numero. In effetti, potrebbero esserci centinaia di fattori.
Forse i colleghi di lavoro aggiungono le proprie variabili al mix. Si potrebbe dire, ad esempio, che quando nevica l'azienda vende di più. Altri, d'altra parte, potrebbero commentare che le vendite subiscono un calo circa sei settimane dopo una promozione della concorrenza.
L'analisi di regressione ci aiuta a determinare quali fattori contano davvero e le loro relazioni. Ci aiuta anche a scoprire quali sono i loro effetti sui dati di vendita.
Variabili
Chiamiamo tutti questi fattori variabili. C'è una variabile dipendente, cioè il fattore principale che stiamo cercando di prevedere o comprendere. Nel tuo caso come responsabile delle vendite, la variabile dipendente sono le vendite mensili.
Questo grafico di analisi di regressione si riferisce alla situazione che descrivo in questo testo, ovvero dove sei un responsabile vendite. I colleghi commentano che le nevicate hanno un impatto sui dati di vendita sembrano essere accurati. Ogni punto rosso rappresenta un mese di dati, vale a dire, i totali delle vendite e quanto ha nevicato quello stesso mese.
Ci sono anche variabili indipendenti; questi sono altri fattori che ritieni possano potenzialmente avere un impatto sulla variabile dipendente.
Per la tua analisi di regressione, devi raccogliere tutte le informazioni sulle variabili. Raccogli tutti i dati sui tuoi numeri di vendita mensili per l'ultimo trimestre, semestre, anno o tre anni. Raccogli anche tutti i dati sulle variabili indipendenti che vuoi considerare.
Esempio di analisi di regressione
Ad esempio, se ritieni che la neve possa influire sulle vendite, avrai bisogno dei dati sulle nevicate degli ultimi tre anni. Quindi traccia tutte queste informazioni su un grafico.
In un articolo pubblicato sulla Harvard Business Review nel novembre 2015, A Refresher on Regression Analysis Amy Gallo ha scritto:
La maggior parte delle aziende utilizza l'analisi di regressione per spiegare un fenomeno che desidera comprendere (ad esempio, perché le chiamate al servizio clienti sono diminuite il mese scorso?); prevedere le cose sul futuro (ad esempio, come saranno le vendite nei prossimi sei mesi?); o per decidere cosa fare (ad es. dovremmo andare con questa promozione o con un'altra?).
Secondo l'Environmental Systems Research Institute (ESRI): le analisi regressive tentano di dimostrare il grado in cui una o più variabili potenzialmente promuovono un cambiamento positivo o negativo in un'altra variabile. ( Immagine: adattato da resources.esri.com )
Secondo BusinessDictionary.com , l'analisi di regressione (RA) per definizione è:
Approccio statistico alla previsione della variazione di una variabile dipendente (ad esempio ricavi di vendita) sulla base della variazione di una o più variabili indipendenti (ad esempio popolazione e reddito).
Conosciuto anche come adattamento della curva o adattamento della linea perché un'equazione di analisi di regressione può essere utilizzata per adattare una curva o una linea ai punti dati, in modo tale da ridurre al minimo le differenze nelle distanze dei punti dati dalla curva o dalla linea.
Storia dell'analisi di regressione
Il matematico francese Adrien-Marie Legendre (1752-1833) pubblicò la prima forma di regressione che conosciamo nel 1805. Anche il matematico tedesco Johann Carl Friedrich Gauss (1777-1855) pubblicò un pezzo nel 1809.
Entrambi i matematici hanno scritto del metodo dei minimi quadrati. Il metodo dei minimi quadrati è un approccio standard nell'analisi di regressione quando ci sono più equazioni che incognite.
Gauss e Legendre hanno applicato il metodo al problema di scoprire quali fossero le orbite dei vari corpi celesti. Si sono concentrati principalmente sulle orbite delle comete attorno al Sole.
Nel 1821, Gaus pubblicò un ulteriore sviluppo della teoria dei minimi quadrati nel 1821. Inserì una versione di quello che chiamiamo il teorema di Gauss-Markov .
Sir Francis Galton (1922-1911), uno statistico britannico, coniò il termine Analisi di regressione nel 19° secolo. Ha usato il termine per descrivere le altezze delle persone attraverso le generazioni. Il suo studio ha mostrato che le altezze dei discendenti di antenati molto alti tendevano a spostarsi verso il basso verso una media normale. In effetti, chiamiamo questo una regressione verso la media .
Galton credeva che la regressione fosse applicabile solo quando la usava per descrivere il fenomeno biologico che aveva scoperto.
Tuttavia, Karl Pearson (1857-1936) e George Udny Yule (1871-1951) hanno esteso il suo lavoro a un contesto statistico più generale.
Entro la metà del 20 ° secolo, gli economisti utilizzavano calcolatrici da tavolo elettromeccaniche per i calcoli dell'analisi di regressione. Fino al 1970 potevano essere necessarie fino a ventiquattro ore per ottenere il risultato di una regressione.
Oggi, le persone stanno ancora ricercando attivamente metodi di regressione. Negli ultimi decenni, gli statistici hanno sviluppato nuovi metodi per:
Regressione robusta
Questa è una regressione che coinvolge risposte correlate, come le curve di crescita e le serie temporali.
Regressione più complessa
Ciò include la regressione in cui la variabile indipendente (il predittore) o le variabili di risposta sono immagini, curve o grafici.
Metodi che risolvono problemi di dati
Gli esempi includono i metodi bayesiani per la regressione, la regressione non parametrica, la regressione con un numero di variabili predittive maggiore rispetto all'osservazione. Altri esempi includono la regressione in cui le variabili predittive sono misurate in modo errato e l'inferenza causale con la regressione.
Analisi di regressione video
In questo video Statistics is Fun , il tutor spiega cos'è l'analisi di regressione utilizzando un linguaggio semplice ed esempi di facile comprensione.