Metoda de analiză a corelației: un exemplu. Analiza de corelație este ...
Cercetarea este adesea necesară pentru a găsi relația dintre variabilele productive și factoriale (randament orice cultură și precipitații, înălțimea și greutatea unei persoane în grupe omogene în funcție de sex, vârstă, ritmul cardiac și a temperaturii corpului, etc.).
conținut
- Conceptul de analiză a corelației
- Conceptul de falsitate a corelației
- Problemele analizei de corelație
- Corelația dintre analiza de corelație și regresie
- Termeni de utilizare
- Reguli pentru selectarea factorilor de analiză a corelației
- Afișați rezultatele
- Reprezentare tridimensională a diagramei scatter (dispersie)
- Estimarea stării de comunicare
- Un exemplu de aplicare a metodei de analiză de corelare
- Utilizarea software-ului în efectuarea unei analize de corelație
- În concluzie
Al doilea sunt semnele care contribuie la schimbarea celor asociate cu ele (prima).
Conceptul de analiză a corelației
Sunt mulți definițiile termenului. Plecând de la cele de mai sus, se poate spune că analiza de corelație este o metodă utilizată pentru a testa o ipoteză cu privire la semnificația statistică a două sau mai multe variabile, dacă cercetătorul le poate măsura, dar nu le poate schimba.
Există și alte definiții ale conceptului în cauză. Analiza de corelație este o metodă de procesare a datelor statistice, care constă în studierea coeficienților de corelație între variabile. Aceasta compară coeficienții de corelație între o pereche sau un set de perechi de caracteristici pentru a stabili relații statistice între ele. Analiza de corelație este o metodă pentru studierea dependenței statistice între variabilele aleatoare cu prezența opțională a unui caracter funcțional strict, în care dinamica unei variabile aleatorii conduce la dinamica așteptărilor matematice ale celuilalt.
Conceptul de falsitate a corelației
Atunci când se efectuează analiza de corelație, este necesar să se țină seama de faptul că aceasta poate fi efectuată cu privire la orice set de caracteristici, adesea absurde în raport unul cu celălalt. Uneori nu au o relație de cauzalitate între ele.
În acest caz, vorbesc despre o corelație falsă.
Problemele analizei de corelație
Plecând de la definițiile de mai sus, putem formula următoarele probleme ale metodei descrise: pentru a obține informații cu privire la una dintre variabilele necunoscute cu ajutorul altora, pentru a determina strânsa legătura dintre variabilele investigate.
Analiza de corelație implică determinarea relației dintre trăsăturile studiate și prin urmare sarcinile analizei de corelare pot fi completate cu următoarele:
- identificarea factorilor care au cel mai mare impact asupra rezultatului;
- identificarea cauzelor de legături inexplicabile anterior;
- construirea unui model de corelare cu analiza sa parametrică;
- studiul semnificației parametrilor de comunicare și estimarea intervalului lor.
Corelația dintre analiza de corelație și regresie
Metoda de analiză a corelației nu este adesea limitată la găsirea stării de legătură a cantităților investigate. Uneori este completat de formularea ecuațiilor de regresie, obținute cu ajutorul aceleiași analize de nume, și sunt o descriere a corelației dintre caracteristicile rezultate și factorul (caracteristica). Această metodă, împreună cu analiza analizată, este metoda de analiză corelație-regresie.
Termeni de utilizare
Factorii efectivi depind de unul la mai mulți factori. Metoda de analiză a corelației poate fi utilizată dacă există un număr mare de observații privind amploarea indicatorilor productivi și factori (factori), în timp ce factorii studiați trebuie să fie cantitativi și reflectați în surse specifice. Primul poate fi determinat de legea normală - în acest caz, coeficienții de corelație Pearson sunt rezultatul analizei de corelație sau, dacă semnele nu respectă această lege, se folosește coeficientul de corelație Spearman.
Reguli pentru selectarea factorilor de analiză a corelației
La aplicarea acestei metode, este necesar să se determine factorii care influențează indicii efectivi. Acestea sunt selectate, având în vedere faptul că între indicatorii trebuie să prezinte relații cauzale. În cazul unui model de corelare multi-factor selectat pe cele care au un impact semnificativ asupra indicatorului rezultat, factorii interdependente asociat cu un coeficient de corelație mai mare de 0,85 în modelul de corelare nu includ precum preferat ca cele în care comunicarea cu parametrul efectiv este non-liniară sau funcționale în natură.
Afișați rezultatele
Rezultatele analizei de corelație pot fi prezentate în forme text și grafice. În primul caz, ele sunt reprezentate ca un coeficient de corelație, în al doilea - sub forma unei diagrame scatter.
În absența unei corelații între parametri, punctele de pe diagramă sunt repartizate aleatoriu, gradul mediu de comunicare este caracterizat printr-un grad mai mare de ordonare și este caracterizat printr-o distanță mai mare sau mai mică a marcajelor marcate din mediană. O legătură puternică tinde spre o linie dreaptă, iar pentru r = 1 o diagramă de puncte este o linie dreaptă. Corelația inversă este diferită de direcția graficului de la stânga sus la dreapta jos, linia dreaptă din stânga jos în colțul din dreapta sus.
Reprezentare tridimensională a diagramei scatter (dispersie)
Pe lângă reprezentarea tradițională 2D a diagramei scatter, se utilizează în prezent o reprezentare grafică a reprezentării grafice a analizei de corelație.
Se utilizează, de asemenea, o matrice a diagramei scatter, care afișează toate graficele pereche într-o singură figură în formatul de matrice. Pentru n variabile, matricea conține n rânduri și n coloane. Diagrama localizată la intersecția rândului i și coloanei j este un grafic al variabilelor Xi în comparație cu Xj. Astfel, fiecare rând și coloană este o dimensiune, o singură celulă afișează o diagramă de scatter cu două dimensiuni.
Estimarea stării de comunicare
Etanseitatea corelație determinată de coeficientul de corelație (r): puternic - r = ± 0,7 la ± 1, media - r = ± 0,3 la ± 0,699, slab - r = 0 până la ± 0,299. Această clasificare nu este strictă. Figura prezintă un circuit oarecum diferit.
Un exemplu de aplicare a metodei de analiză de corelare
În Marea Britanie a fost efectuat un studiu curios. Este dedicată relației dintre fumat și cancerul pulmonar și a fost efectuată prin analiza corelației. Această observație este prezentată mai jos.
Grup profesional | fumat | mortalitate |
Agricultorii, silvicultorii și pescarii | 77 | 84 |
Minerii și lucrătorii din carieră | 137 | 116 |
Producători de gaz, cocs și produse chimice | 117 | 123 |
Producători de sticlă și ceramică | 94 | 128 |
Lucrători de cuptoare, forjare, turnare și laminare | 116 | 155 |
Lucrători în electrotehnică și electronică | 102 | 101 |
Inginerie și profesii conexe | 111 | 118 |
Prelucrarea lemnului | 93 | 113 |
Articole din piele | 88 | 104 |
Lucrători în industria textilă | 102 | 88 |
Producători de îmbrăcăminte de lucru | 91 | 104 |
Alimente, băuturi și tutun | 104 | 129 |
Producători de hârtie și de imprimare | 107 | 86 |
Producători de alte produse | 112 | 96 |
constructori | 113 | 144 |
Artisti si decoratori | 110 | 139 |
Conducătorii motoarelor staționare, macaralelor etc. | 125 | 113 |
Lucrătorii care nu sunt incluși în altă parte | 133 | 146 |
Lucrători în transport și comunicații | 115 | 128 |
Lucrători în depozite, depozitari, agenți de ambalare și muncitori ai mașinilor de umplere | 105 | 115 |
Lucrătorii în birouri | 87 | 79 |
agenții de vânzări | 91 | 85 |
Angajații serviciului de sport și recreere | 100 | 120 |
Administratori și manageri | 76 | 60 |
Profesioniști, tehnicieni și artiști | 66 | 51 |
Începem analiza de corelație. Soluția este mai bine să începem pentru claritate prin metoda grafică, pentru care construim o diagramă de împrăștiere (răspândire).
Aceasta demonstrează o legătură directă. Cu toate acestea, pe baza doar a metodei grafice, este dificil să se ajungă la o concluzie clară. Prin urmare, vom continua să efectuăm analiza de corelare. Un exemplu de calcul al coeficientului de corelație este prezentat mai jos.
Cu software-ul (MS Excel, de exemplu, vor fi descrise mai jos) definesc un coeficient de corelație care este 0,716, ceea ce înseamnă o legătură puternică între parametrii studiați. Definiți valabilitatea statistică a valorilor obținute din tabel corespunzător, atunci trebuie să se scadă 25 din cele două perechi de valori, prin aceasta se obține 23 și acest rând din tabel pentru a găsi critice r p = 0,01 (ca aceste date medicale sunt utilizate mai riguroase dependență, în alte cazuri, este suficient p = 0,05), care este 0,51 pentru analiza de corelație. Exemplu a demonstrat că mai valoarea critică r r calculată a coeficientului de corelație este considerată semnificativă din punct de vedere statistic.
Utilizarea software-ului în efectuarea unei analize de corelație
Tipul descris de prelucrare a datelor statistice poate fi realizat cu ajutorul software-ului, în special MS Excel. corelație analiză în Excel Următorii parametri sunt calculați folosind următoarele funcții:
1. Coeficientul de corelare este determinat folosind funcția CORREL (array1-array2). Array1,2 este o celulă a gamei de valori ale variabilelor productive și factor.
Coeficientul de corelare liniară este, de asemenea, numit coeficientul de corelare Pearson și, prin urmare, începând cu Excel 2007, puteți utiliza funcția PEARSON cu aceleași matrice.
Reprezentarea grafică a analizei de corelație în Excel se face folosind panoul "Diagrame" cu selecția "Diagrama spot".
După ce indicăm datele inițiale, obținem un grafic.
2. Evaluarea semnificației coeficientului de corelație a perechilor folosind testul t Student. Valoarea calculată a testului t este comparat cu valoarea tabulară (critică) a acestui indicator din tabelul corespunzător de valori al parametrului luat în considerare, luând în considerare nivelul de semnificație dat și numărul de grade de libertate. Această estimare se efectuează cu ajutorul funcției TIRE (probabilitatea-grad de libertate).
3. Matricea coeficienților de corelare a perechilor. Analiza este efectuată utilizând instrumentul "Analiza datelor", în care este selectată opțiunea "Corelație". Evaluarea statistică a coeficienților de corelare a perechilor se realizează atunci când se compară valoarea absolută cu valoarea tabulară (critică). Dacă coeficientul calculat al corelării perechilor este depășit peste această valoare critică, putem spune, cu un anumit grad de probabilitate, că ipoteza nulă despre semnificația conexiunii liniare nu este respinsă.
În concluzie
Utilizarea metodei de analiză a corelației în cercetarea științifică face posibilă determinarea relației dintre diferiți factori și indicatori de performanță. În acest caz, este necesar să se ia în considerare faptul că un coeficient de corelație ridicat poate fi obținut dintr-o pereche absurdă sau dintr-un set de date și acest tip de analiză trebuie efectuată pe un set de date suficient de mare.
După obținerea valorii calculate a lui r, este de dorit să o comparați cu r critic pentru a confirma fiabilitatea statistică a unei anumite valori. Analiza de corelație poate fi efectuată manual folosind formule sau cu ajutorul unor instrumente software, în special MS Excel. Aici este posibil de a construi diagrama scatter (dispersie) pentru a vizualiza relația dintre analiza factorilor de corelație studiat și caracteristica de notare.
- Analiza financiară: ce este și ce este necesar
- Conceptul de impozitare și colectare și adevărul său pentru economia transformatoare
- Analiza parcelei. Zhukovsky. "Marea"
- Spearman coeficientul de corelație. Coeficient de corelare a rangului Spearman
- Coeficient de corelație - caracteristică a modelului de corelare
- Analiza costurilor
- Analiza clusterului. O abordare științifică în studiul fenomenelor complexe
- Metode de analiză economică a întreprinderii - aspecte teoretice
- Analiza de corelație ca instrument de cercetare economică și statistică
- Analiza de regresie-corelație și aplicarea sa în economie
- Metode de statistică matematică. Analiza regresiei
- Ecuația de regresie
- Metode matematice în psihologie
- Metode empirice de cercetare în știința modernă.
- Teoria informațiilor
- Regresie liniară
- Metoda principalelor componente
- Metoda statistică este o minciună sau date obiective pentru luarea deciziilor?
- EMM - modelare economică și matematică
- Testarea ipotezelor statistice: logică generală
- Prelucrarea statistică a datelor și a caracteristicilor acestora