Regresie logistică: model și metode

Metode de regresie logistică

și analiza discriminatorie sunt utilizate atunci când este necesar să se diferențieze în mod clar respondenții pe categorii țintă. În acest caz, grupurile în sine sunt reprezentate de nivelurile unui singur parametru univariant. Să analizăm în detaliu model de regresie logistică, și, de asemenea, aflați de ce este necesar.regresie logistică

Informații generale

Un exemplu de problemă în soluționarea căreia regresie logistică, poate fi o clasificare a respondenților prin grupuri care cumpără și nu cumpără muștar. Diferențierea se face în conformitate cu caracteristicile socio-demografice. Printre acestea, în special, includ vârsta, sexul, numărul de rude, veniturile etc. În operațiuni există criterii de diferențiere și variabile. Acesta din urmă codifică categoriile țintă, care, de fapt, trebuie să separe respondenții.

nuanțe

Trebuie remarcat faptul că gama de cazuri în care regresie logistică, mult mai îngust decât pentru analiza discriminatorie. În această privință, utilizarea acesteia ca metodă universală de diferențiere este considerată preferabilă. În plus, experții recomandă inițierea studiilor de clasificare cu analize discriminatorii. Și numai în caz de incertitudine pentru rezultate putem folosi regresia logistică. Această nevoie se datorează anumitor factori. Regresie logistică Se utilizează atunci când există o idee clară asupra tipului de variabile independente și dependente. În conformitate cu aceasta, se selectează una dintre cele 3 proceduri posibile. Cu o analiză discriminantă, cercetătorul se ocupă întotdeauna cu o operație statică. Aceasta implică o variabilă categorică independentă și una independentă, cu o scară de orice tip.

tipuri

Sarcina de cercetare statistică, care utilizează regresie logistică, este de a determina probabilitatea ca un anumit respondent să fie atribuit unui anumit grup. Diferențierea se face în funcție de anumiți parametri. În practică, în funcție de valorile unuia sau mai multor factori independenți, este posibilă clasificarea respondenților în două grupuri. În acest caz, regresie logistică binară. De asemenea, parametrii specificați pot fi utilizați pentru alocarea grupurilor care sunt mai mult de două. În această situație, există o regresie logistică multinomială. Grupurile rezultate sunt exprimate prin nivelurile unei singure variabile. logistică

exemplu

Să presupunem că există răspunsurile respondenților la întrebarea dacă acestea sunt interesați de o ofertă de a dobândi terenuri în suburbiile Moscovei. Opțiunile sunt "nu" și "da". Trebuie să aflăm ce factori au o influență predominantă asupra deciziei potențialilor cumpărători. Pentru acest respondent întrebări sunt întrebați despre infrastructura teritoriului, distanța până la capitală, suprafața de teren, prezența / absența clădirilor rezidențiale și așa mai departe. Cu ajutorul regresiei binare, pot fi distribuite în două grupuri de respondenți. Primul va include pe cei care sunt interesați de cumpărare - potențialii cumpărători, iar al doilea, respectiv, cei care nu sunt interesați de o astfel de ofertă. Pentru fiecare respondent, în plus, se calculează probabilitatea de a fi alocat unei categorii.

Caracteristici comparative

Diferența față de cele două variante menționate mai sus constă într-un număr diferit de grupuri și tipul variabilelor dependente și independente. Într-o regresie binară, de exemplu, este studiată dependența factorului dihotomos de una sau mai multe condiții independente. Acesta din urmă poate avea orice tip de scară. Regresia multinomială este considerată o variație a acestei opțiuni de clasificare. În el la variabila dependentă există mai mult de 2 grupe. Factorii independenți trebuie să aibă o scală ordinală sau nominală.

Regresie logistică în spss

În pachetul statistic 11-12, a fost introdusă o nouă versiune a analizei: secvențială. Această metodă este utilizată în cazul în care factorul dependent se referă la aceeași scală (ordinală). În acest caz, variabilele independente sunt selectate dintr-un tip specific. Acestea trebuie să fie ordonale sau nominale. Clasificarea pe mai multe categorii este considerată cea mai universală. Această metodă poate fi utilizată în toate studiile în care logistică. Îmbunătățiți calitatea modelului, Cu toate acestea, este posibil numai cu ajutorul celor trei tehnici. controlul calității privind gradul de adecvare și regresia logistică

Clasificare ordonată

De menționat că, mai devreme în pachetul statistic, nu a fost prevăzută o posibilitate tipică de a efectua o analiză specializată pentru factorii dependenți cu o scală ordinală. Pentru toate variabilele cu numărul de grupe mai mari de 2, a fost utilizată o variantă multinomială. Prezentat relativ recent, analiza ordinală are o serie de caracteristici. Acestea iau în considerare specificul scalei. Între timp, în manualele metodice, ordinalul logistică adesea nu este privită ca un dispozitiv separat. Acest lucru se datorează următoarelor aspecte: analiza ordinală nu are avantaje semnificative față de multinomială. Cercetătorul poate folosi bine acesta din urmă dacă există atât o variabilă ordinală cât și una nominală dependentă. În același timp, procesele de clasificare în sine nu diferă mult una de cealaltă. Aceasta înseamnă că efectuarea analizei ordinale nu va provoca dificultăți.

Opțiunea de analiză

Luați în considerare un caz simplu - regresia binară. Să presupunem că, în procesul de marketing, se estimează relevanța absolvenților unei anumite universități din capitală. În chestionar, respondenților li s-au adresat întrebări, inclusiv:

  1. Lucrezi? (Ql).
  2. Indicați anul absolvirii (q 21).
  3. Care este punctul mediu de absolvire (aver).
  4. Sex (q22).

Regresie logistică ne va permite să evaluăm efectul factorilor independenți aver, q 21 și q 22 asupra variabilei ql. Pur și simplu, scopul analizei va fi determinarea ocupării probabile a absolvenților pe baza informațiilor despre domeniu, anul absolvirii și scorul mediu. logistică indicator de regresie sigmoid

Regresie logistică

Pentru a seta parametrii folosind regresia binară, utilizați meniul Analyze►Regression►Binary Logistic. În fereastra de regresie logistică, trebuie să selectați factorul dependent din lista stângă a variabilelor disponibile. El este ql. Această variabilă trebuie plasată în câmpul Dependent. După aceea, factorii independenți ar trebui introduși în situl Covariates - q 21, q 22, aver. Apoi trebuie să alegeți o modalitate de a le include în analiză. Dacă numărul de factori independenți este mai mare de 2, atunci metoda de introducere simultană a tuturor variabilelor, care este instalată în mod prestabilit, dar nu este folosită o metodă pas cu pas. Cea mai populară modalitate este considerată a fi Înapoi: LR. Cu ajutorul butonului Selectați, nu puteți include toți respondenții în studiu, ci doar o anumită categorie țintă.

Definiți variabilele categorice



Butonul Categoric trebuie utilizat atunci când una dintre variabilele independente este nominală, iar numărul de categorii este mai mare de 2. În această situație, în fereastra Definiți variabilele categorice, acest parametru este plasat pe secțiunea Categoria Covariates. În acest exemplu, nu există o astfel de variabilă. După aceea, în lista derulantă Contrast, selectați Abatere și apăsați butonul Schimbare. Ca rezultat, se vor forma mai multe variabile dependente de la fiecare factor nominal. Numărul lor corespunde numărului de categorii de condiții inițiale.

Salvați noi variabile

Folosind butonul Save, creați parametri noi în caseta de dialog principală de cercetare. Acestea vor conține indicatori calculați în procesul de regresie. În special, puteți crea variabile care definesc:

  1. Apartenența la o anumită categorie de clasificare (grupuri de meșteri).
  2. Probabilitatea de a atribui un respondent fiecărui grup de studiu (Probabilități).

Când se utilizează butonul Opțiuni, cercetătorul nu primește caracteristici semnificative. În consecință, poate fi ignorată. După ce faceți clic pe butonul "OK", rezultatele analizei vor fi afișate în fereastra principală. logistic regresie coeficient

Controlul calității privind gradul de adecvare și regresia logistică

Luați în considerare tabelul Omnibus Testsof Model Coefficients. Afișează rezultatele analizei calității aproximării modelului. În legătură cu faptul că a fost specificată o versiune pas cu pas, este necesar să se analizeze rezultatele ultimei etape (Pasul 2). Un rezultat pozitiv va fi considerat astfel încât o creștere a indicatorului Chi-pătrat este detectată în timpul tranziției spre etapa următoare cu un grad ridicat de semnificație (Sig. < 0,05). Calitatea modelului este evaluată pe linia Model. Dacă se obține o valoare negativă, dar nu este considerată semnificativă la importanța generală a modelului, acesta din urmă poate fi considerat practic util.

tabele

Rezumatul modelului permite estimarea indexului varianței agregate descrise de modelul construit (indicatorul R Square). Se recomandă utilizarea valorii lui Nagelker. Un indicator pozitiv este parametrul Nagelkerke R Square, dacă este peste 0,50. După aceea, se evaluează rezultatele clasificării, în care indicele real al apartenenței la una sau la alta categorie studiată este comparat cu cel prognozat pe baza modelului de regresie. Pentru a face acest lucru, utilizați tabelul de clasificare. De asemenea, permite să se tragă concluzii privind corectitudinea diferențierii pentru fiecare grup în cauză. model de regresie logistică Tabelul următor oferă o oportunitate de a clarifica semnificația statistică a factorilor independenți introduși în analiză, precum și a fiecărei metode nestandardizate logistic regresie coeficient. Pe baza acestor indicatori este posibil să se prevadă apartenența fiecărui respondent la eșantion la un anumit grup. Utilizând butonul Salvare, puteți introduce variabile noi. Acestea vor conține informații despre apartenența la o anumită categorie de clasificare (prescrise) și probabilitatea de includere în aceste grupuri (prezicerea probabilităților de membru). După ce faceți clic pe "OK", rezultatele calculelor apar în fereastra principală a regresiei logistice multiple.

Primul tabel, în care sunt indicatori importanți pentru cercetător, este modelul de echipare a informațiilor. Un nivel ridicat de semnificație statistică va indica calitatea și adecvarea utilizării modelului în rezolvarea problemelor practice. O altă masă importantă este Pseudo-Square. Aceasta ne permite să estimăm ponderea varianței totale în factorul dependent, determinată de variabilele independente alese pentru analiză. Conform tabelului Testelor privind Rata Probabilității puteți să trageți concluzii cu privire la semnificația statistică a celor din urmă. În Estimările de parametri se reflectă coeficienții non-standardizați. Ele sunt folosite în construcția ecuației. În plus, pentru fiecare combinație de variabile, s-a determinat semnificația statistică a efectului lor asupra factorului dependent. Între timp, în cercetarea de marketing, este adesea nevoie să se diferențieze pe categorii de respondenți, nu individual, ci ca parte a grupului țintă. Pentru a face acest lucru, utilizați tabelul Observed and Predicted Frequencies.

Aplicare practică

Această metodă de analiză este utilizată pe scară largă în activitatea comercianților. În 1991, a fost dezvoltat un indicator al regresiei sigmoid logistice. Acesta este un instrument ușor de utilizat și eficient, cu care puteți anticipa prețurile probabile înainte ca acestea să "supraîncălzească". Indicatorul este reprezentat pe grafic sub forma unui canal format din două linii care rulează în paralel. Ele sunt la fel de distanțate de tendință. Lățimea coridorului va depinde numai de intervalul de timp. Indicatorul este utilizat atunci când se lucrează cu aproape toate activele - de la perechi valutare la metale prețioase.

regresia logistică în spss

În practică, au fost elaborate două strategii-cheie pentru aplicarea instrumentului: pe defalcare și pe rând. În acest din urmă caz, comerciantul va fi ghidat de dinamica schimbării prețului în cadrul canalului. Deoarece costul se apropie de linia de susținere sau de rezistență, pariul se face pe baza probabilității ca mișcarea să pornească în direcția opusă. Dacă prețul se apropie îndeaproape de limita superioară, atunci activul poate fi eliminat. Dacă este la limita inferioară, atunci merită să ne gândim la achiziție. Strategia de defalcare implică utilizarea comenzilor. Acestea sunt amplasate în afara limitelor unei distanțe relativ mici. Având în vedere că prețul într-un număr de cazuri le încălzește pentru o perioadă scurtă de timp, trebuie să fiți reasigurat și să instalați stop-loss. În același timp, bineînțeles, indiferent de strategia aleasă, comerciantul trebuie să fie la fel de răcoros și de rece ca să perceapă și să evalueze situația care a apărut pe piață.

concluzie

Astfel, utilizarea regresiei logistice vă permite să clasificați rapid și simplu respondenții în categorii în funcție de parametrii specificați. În analiză, puteți utiliza orice metodă particulară. În special, regresia multinomială este versatilă. Cu toate acestea, experții recomandă utilizarea tuturor metodelor de mai sus în complex. Acest lucru se datorează faptului că în acest caz calitatea modelului va fi mult mai mare. Aceasta, la rândul său, va extinde domeniul aplicației sale.

Distribuiți pe rețelele sociale:

înrudit
Logistica: ce este și care sunt sarcinile sale?Logistica: ce este și care sunt sarcinile sale?
Noi profesii: logistul este cine și ce face el?Noi profesii: logistul este cine și ce face el?
Logist - ce fel de profesie și care sunt responsabilitățile sale de muncă?Logist - ce fel de profesie și care sunt responsabilitățile sale de muncă?
Logist: îndatoririle și trăsăturile profesieiLogist: îndatoririle și trăsăturile profesiei
Analiza de corelație ca instrument de cercetare economică și statisticăAnaliza de corelație ca instrument de cercetare economică și statistică
Analiza de regresie-corelație și aplicarea sa în economieAnaliza de regresie-corelație și aplicarea sa în economie
Testarea prin regresie a software-ului. Ce este testarea de regresie?Testarea prin regresie a software-ului. Ce este testarea de regresie?
Logistică operațională: Caracteristicile unei specialități, îndatoriri și calificări ale unui…Logistică operațională: Caracteristicile unei specialități, îndatoriri și calificări ale unui…
Metode de statistică matematică. Analiza regresieiMetode de statistică matematică. Analiza regresiei
Ecuația de regresieEcuația de regresie
» » Regresie logistică: model și metode