Što je R2 Linearna regresija ?

Statističari i znanstvenici često imaju potrebu da istraži odnos između dvije varijable , obično naziva xiy . Svrha ispitivanja bilo koje dvije takve varijable je obično da se vidi da li postoji neka veza između njih , poznat kao korelacija u znanosti . Na primjer ,znanstvenici možda želite znati da li sati izloženosti suncu može biti povezan s cijenama od raka kože . Za matematički opisati snagu korelacije između dvije varijable , takvi istražitelji često koriste R2 . Linearna regresija

Statističari koristiti tehniku ​​linearne regresije pronaći ravnu liniju koja najbolje odgovara niz X i Y parova podataka . Oni su to učinili kroz niz kalkulacija koje proizlaze jednadžbu od najboljih linija . Ovaj matematički opis linije će bitilinearna jednadžba , a opća oblik y = mx + b , gdje xiy su dvije varijable u parovima podataka , m jenagib linije i b je njegov y presresti .
Koeficijent korelacije
< p> izračuni koji se pronašli najbolji pravac će proizvoditi linearnu jednadžbu kako bi odgovarao bilo koji skup podataka , čak i ako je taj podatak nije zapravo vrlo linearno . Da bi se pokazatelj koliko su podaci zapravo stane ravnu crtu , statističari i izračunati broj poznat kao koeficijenta korelacije . To je s obzirom na simbol R ili R imjera koliko usko usklađeni parovi podataka su na najbolji pravac kroz njih .
Značaj R

R može imati bilo koju vrijednost između -1 i 1.negativna vrijednost R jednostavno znači danajbolje odgovara pravac prema dolje kosine kreće lijevo -desno , a ne gore . Bliži R je bilood dvije krajnosti ,boljestati od točaka podataka na liniju , s bilo -1 ili 1 sesavršeno uklapaju iR vrijednost nula znači da ne postoji u formi , a bodovi su posve slučajna . Ako su točke podataka i poravnati na ravnoj liniji , tu se kaže da je neka povezanost između njih , pakoeficijent korelacije naziv za R.
R2

Neki statističari vole raditi s vrijednosti R2 , koji je jednostavnokoeficijent korelacije kvadrat , ili pomnožen sebi , a poznat je kao koeficijentom determinacije . R2 je vrlo slična istraživanja , a također opisuje korelaciju između dviju varijabli , no to je također nešto drugačiji. Mjeri posto varijacija u y varijabla koja se može pripisati varijacijama u x varijablu . R2 vrijednost 0,9 , na primjer , znači da je 90 posto varijacija u Y podataka zbog varijacija u X podataka . To ne znači nužno da je x doista utječe y , ali da se čini da se to učini.

Odgovori