Čo dáva faktorová analýza. Metódy faktorovej analýzy. Základné metódy analýzy deterministických faktorov

Jedná sa o súbor štatistických postupov zameraných na extrakciu z daného súboru premenných podmnožín premenných, ktoré navzájom úzko súvisia (korelujú). Premenné zahrnuté v jednej podskupine a navzájom korelované, ale vo veľkej miere nezávislé od premenných z iných podskupín, tvoria faktory. Cieľ faktorová analýza- identifikovať jasne nepozorovateľné faktory pomocou rôznych pozorovateľných premenných. Ďalším spôsobom, ako skontrolovať počet vybraných faktorov, je výpočet korelačnej matice, ktorá je blízko pôvodnej, ak sú faktory vybrané správne. Táto matica sa nazýva reprodukované korelačná matica. Aby ste videli, ako sa táto matica odchyľuje od pôvodnej korelačnej matice (s ktorou začala analýza), môžete medzi nimi vypočítať rozdiel. Zvyšková matica môže naznačovať „nesúhlas“, to znamená skutočnosť, že uvažované korelačné koeficienty nie je možné získať s dostatočnou presnosťou na základe dostupných faktorov. V metódach hlavných zložiek a faktorovej analýze neexistuje také vonkajšie kritérium, ktoré by umožňovalo posúdiť správnosť riešenia. Druhým problémom je, že po izolovaní faktorov vznikne nekonečné množstvo možností rotácie založených na rovnakých počiatočných premenných, ktoré však poskytujú rôzne riešenia (štruktúry faktorov sa určujú trochu iným spôsobom). Konečná voľba medzi možnými alternatívami v rámci nekonečného súboru matematicky ekvivalentných riešení závisí od zmysluplného pochopenia výsledkov interpretácie výskumníkmi. A keďže neexistuje nijaké objektívne kritérium na hodnotenie rôznych riešení, navrhované odôvodnenie výberu riešenia sa môže javiť ako neopodstatnené a nepresvedčivé.


Je potrebné poznamenať, že neexistujú jasné štatistické kritériá pre úplnosť faktorizácie. Jeho nízke hodnoty, napríklad nižšie ako 0,7, však naznačujú, že je žiaduce znížiť počet znakov alebo zvýšiť počet faktorov.

Met Koeficient vzťahu medzi určitým znakom a všeobecným faktorom, ktorý vyjadruje mieru vplyvu faktora na znak, sa nazýva faktorové zaťaženie daného znaku pre tento všeobecný faktor.

Matica pozostávajúca z faktorového zaťaženia, ktorej počet stĺpcov sa rovná počtu bežných faktorov a počet riadkov sa rovná počtu pôvodných funkcií, sa nazýva faktorová matica.

Základom pre výpočet faktorovej matice je matica párových korelačných koeficientov pôvodných prvkov.

Korelačná matica zachytáva stupeň vzťahu medzi každou dvojicou znakov. Faktorová matica podobne fixuje stupeň lineárneho vzťahu každého znaku s každým spoločným faktorom.

Veľkosť faktorového zaťaženia nepresahuje jednotu modulu a jeho znamienko naznačuje pozitívny alebo negatívny vzťah medzi vlastnosťou a faktorom.

Viac absolútna hodnota faktorové zaťaženie znamienka niektorým faktorom, tým viac tento faktor určuje toto znamienko.

Hodnota faktorového zaťaženia pre určitý faktor, ktorá sa blíži k nule, naznačuje, že tento faktor túto vlastnosť prakticky neovplyvňuje.

Faktorový model umožňuje vypočítať príspevky faktorov k celkovej variancii všetkých funkcií. Ak zhrnieme druhé mocniny zaťaženia faktora pre každý faktor pre všetky charakteristiky, získame jeho príspevok k celkovej variancii systému charakteristík: čím vyšší je podiel tohto príspevku, tým je tento faktor významnejší a významnejší.

Zároveň je možné identifikovať optimálny počet bežných faktorov, ktoré dostatočne dobre popisujú systém počiatočných funkcií.

Hodnota (miera prejavu) faktora v jednotlivom objekte sa nazýva faktorová váha objektu pre tento faktor. Váha faktora vám umožňuje zoradiť a zoradiť objekty pre každý faktor.

Čím väčšia je faktoriálna váha určitého objektu, tým viac sa v ňom prejavuje tá strana javu alebo tento vzor, ​​čo sa odráža v tomto faktore.

Faktorové váhy môžu byť pozitívne alebo negatívne.

Vzhľadom na to, že faktormi sú štandardizované hodnoty s priemernou hodnotou nula, faktorové váhy blízke nule označujú priemerný stupeň prejavu faktora, pozitívne - že tento stupeň je vyšší ako priemerný negatívny - o tom . potom je to podpriemer.

V praxi, ak počet hlavných komponentov (alebo faktorov), ktoré už boli nájdené, nie je väčší ako m/ 2, nimi vysvetlená odchýlka nie je menšia ako 70% a nasledujúca zložka prispieva k celkovej odchýlke nie viac ako 5%, faktorový model sa považuje za celkom dobrý.

Ak chcete nájsť hodnoty faktorov a uložiť ich ako ďalšie premenné, zapnite prepínač Skóre ... (Hodnoty) Hodnota faktora sa spravidla pohybuje v rozmedzí -3 až +3.

Faktorová analýza je výkonnejším a zložitejším prístrojom ako metóda istiny

komponent, tak sa aplikuje v prípade, že výsledky

analýza komponentov nie je celkom uspokojivá. Ale keďže tieto dve metódy

vyriešiť rovnaké problémy, je potrebné porovnať výsledky komponentu a


faktorové analýzy, t.j. záťažové matice, ako aj regresné rovnice pre

hlavné zložky a spoločné faktory, komentovať podobnosti a rozdiely

výsledky.

Maximálny možný počet faktorov m pre daný počet funkcií R je definované nerovnosťou

(p + m)<(р-m)2,

Na konci celého postupu faktorovej analýzy pomocou matematických transformácií sú faktory fj vyjadrené prostredníctvom počiatočných znakov, to znamená, že parametre lineárneho diagnostického modelu sú získané v explicitnej forme.

Metódy hlavnej zložky a faktorovej analýzy sú súborom štatistických postupov zameraných na extrakciu podmnožín premenných, ktoré spolu úzko súvisia (navzájom súvisia). Premenné zahrnuté v jednej podskupine a navzájom korelované, ale vo veľkej miere nezávislé od premenných z iných podskupín, tvoria faktory 1 ... Cieľom faktorovej analýzy je identifikovať explicitne nepozorovateľné faktory pomocou rôznych pozorovateľných premenných.

Všeobecný výraz pre j-tý faktor možno napísať nasledovne:

kde Fj (j sa pohybuje od 1 do k) sú všeobecné faktory, Ui- charakteristika, Aij- konštanty použité v lineárnej kombinácii k faktorov. Charakteristické faktory nemusia navzájom korelovať a byť v súlade spoločné faktory.

Postupy faktorového analytického spracovania použité na získané údaje sú odlišné, ale štruktúra (algoritmus) analýzy pozostáva z rovnakých hlavných fáz: 1. Príprava počiatočnej dátovej matice. 2. Výpočet matice vzájomných vzťahov charakteristík. 3. Faktorizácia(v takom prípade je potrebné uviesť počet faktorov identifikovaných v priebehu faktoriálneho riešenia a spôsob výpočtu). V tejto fáze (aj v ďalšej) možno odhadnúť, ako dobre získané faktoriálne riešenie približuje počiatočné údaje k sebe. 4. Rotácia - transformácia faktorov, uľahčenie ich interpretácie. päť. Výpočet faktorových hodnôt pre každý faktor pre každé pozorovanie. 6. Interpretácia údajov.

vynález faktorovej analýzy bol spojený presne s potrebou súčasnej analýzy veľkého množstva korelačných koeficientov rôznych škál medzi sebou. Jedným z problémov spojených s metódami hlavných komponentov a faktorovou analýzou je, že neexistujú žiadne kritériá, ktoré by umožňovali kontrolu správnosti nájdeného riešenia. Napríklad pri regresnej analýze je možné porovnávať empiricky získané ukazovatele závislých premenných s ukazovateľmi vypočítanými teoreticky na základe navrhovaného modelu a použiť koreláciu medzi nimi ako kritérium správnosti riešenia podľa korelačnej analýzy. schéma pre dve sady premenných. V diskriminačnej analýze správnosť rozhodnutia vychádza z toho, ako presne sa predpovedá príslušnosť jednotlivcov k jednej alebo inej triede (v porovnaní so skutočnou životnou príslušnosťou). Bohužiaľ v metódach hlavných komponentov a faktorovej analýze neexistuje také vonkajšie kritérium, ktoré by umožňovalo posúdiť správnosť riešenia. Druhým problémom je, že po výbere faktorov vznikne nekonečné množstvo možností rotácie, založených na rovnakom počiatočnom premenných, ale poskytujúcich rôzne riešenia (faktorové štruktúry sú definované trochu iným spôsobom). Konečná voľba medzi možnými alternatívami v rámci nekonečného súboru matematicky ekvivalentných riešení závisí od zmysluplného pochopenia výsledkov interpretácie výskumníkmi. A keďže neexistuje nijaké objektívne kritérium na hodnotenie rôznych riešení, navrhované odôvodnenie výberu riešenia sa môže javiť ako neopodstatnené a nepresvedčivé.

Tretím problémom je, že faktorová analýza sa často používa na záchranu zle navrhnutej štúdie, keď je zrejmé, že žiadny štatistický postup neprináša požadovaný výsledok. Sila metód hlavných komponentov a faktorová analýza im umožňujú vybudovať usporiadaný koncept z chaotických informácií (ktoré im dávajú pochybnú reputáciu).

Druhá skupina termínov sa týka matíc, ktoré sú zostavené a interpretované ako súčasť riešenia. Otočiť sa faktorov je proces hľadania najľahšie interpretovateľného riešenia pre daný počet faktorov. Existujú dve hlavné triedy ťahov: kolmý a šikmý... V prvom prípade sú všetky faktory a priori vybrané ako ortogonálne (navzájom nekorelované) a zostrojené matica faktorového zaťaženia, ktorá je maticou vzťahov medzi sledovanými premennými a faktormi. Veľkosť zaťažení odráža stupeň spojenia medzi každou pozorovanou premennou a každým faktorom a interpretuje sa ako korelačný koeficient medzi pozorovanou premennou a faktorom (latentná premenná), a preto sa pohybuje od -1 do 1. Riešenie získané po ortogonálna rotácia sa interpretuje na základe analýzy faktoriálnej matice zaťaženia identifikáciou, ktorý z faktorov je najviac spojený s konkrétnou pozorovateľnou premennou. Ukázalo sa teda, že každý faktor je daný skupinou primárnych premenných, ktoré majú najvyššie zaťaženie faktormi.

Ak sa vykonáva šikmá rotácia (to znamená, že je a priori povolená možnosť vzájomnej korekcie faktorov), potom sa skonštruuje niekoľko ďalších matíc. Faktorová korelačná matica obsahuje korelácie medzi faktormi. Matica zaťaženia faktora vyššie sa rozdelí na dve časti: štruktúrna matica vzťahov medzi faktormi a premennými a matica faktorového mapovania, ktorý vyjadruje lineárny vzťah medzi každou pozorovanou veličinou a každým faktorom (bez zohľadnenia vplyvu superpozície niektorých faktorov na iné, vyjadrený vzájomnou koreláciou faktorov). Po šikmej rotácii je interpretácia faktorov založená na zoskupení primárnych premenných (podobných tým, ktoré sú popísané vyššie), ale predovšetkým na základe matice mapovania faktorov.

Nakoniec pre obe rotácie platí matica koeficientu hodnoty faktora, používané v špeciálnych rovniciach regresného typu na výpočet hodnôt faktorov (body faktora, faktory po faktoroch) pre každé pozorovanie na základe hodnôt pre ne primárnych premenných.

Pri porovnaní metód hlavných zložiek a faktorovej analýzy si všimneme nasledujúce skutočnosti. V priebehu vykonávania analýzy hlavných komponentov je zostavený model, ktorý najlepšie vysvetľuje (maximalizuje reprodukciu) celkovú odchýlku experimentálnych údajov získaných pre všetky premenné. Vo výsledku sú „komponenty“ zvýraznené. Pri faktorovej analýze sa predpokladá, že každú premennú vysvetľujú (určujú) viaceré hypotetické všeobecné faktory (ovplyvňujúce všetky premenné) a charakteristické faktory (odlišné pre každú premennú). A výpočtové postupy sa vykonávajú takým spôsobom, aby sa zbavili ako odchýlky vyplývajúcej z chyby merania, tak odchýlky vysvetlenej konkrétnymi faktormi a aby sa analyzovali iba odchýlky vysvetlené hypoteticky existujúcimi všeobecnými faktormi. Výsledkom sú objekty nazývané faktory. Ako však už bolo spomenuté, z obsahovo-psychologického hľadiska tento rozdiel v matematických modeloch nemá podstatný význam, preto v budúcnosti, ak nebudeme podávať nijaké zvláštne vysvetlenia, o ktorom konkrétnom prípade sa hovorí, použijeme pojem „faktor“ vo vzťahu k komponentom a vo vzťahu k faktorom.

Veľkosti vzoriek a chýbajúce údaje. Čím väčšia je vzorka, tým vyššia je spoľahlivosť ukazovateľov vzťahu. Preto je veľmi dôležité mať dostatočne veľkú vzorku. Požadovaná veľkosť vzorky závisí aj od stupňa vzťahu medzi ukazovateľmi v populácii ako celku a od množstva faktorov: pri silnom a spoľahlivom vzťahu a malom počte jasne vymedzených faktorov bude stačiť malá vzorka.

Preto je vzorka 50 subjektov hodnotená ako veľmi zlá, 100 - zlá, 200 - priemerná, 300 - dobrá, 500 - veľmi dobrá a 1000 - vynikajúca ( Comrey, Lee 1992). Na základe týchto úvah sa všeobecne odporúča študovať vzorky najmenej 300 subjektov. Pre riešenie založené na dostatočnom počte markerových premenných s vysokým faktorovým zaťažením (> 0,80) bola použitá vzorka asi 150 osôb ( Guadagnoli, Velicer 1988). normálnosť pre každú premennú osobitne kontroluje asymetrie(o koľko sa krivka študovaného rozdelenia posunie doprava alebo doľava v porovnaní s teoreticky normálnou krivkou) a prebytok(stupeň predĺženia smerom hore alebo dole smerom dole od „zvonu“ existujúceho rozdelenia, vizuálne znázornený vo frekvenčnom diagrame v porovnaní so „zvonom“ v grafe hustoty, charakteristický pre normálne rozdelenie). Ak má premenná významnú asymetriu a špičatosť, je možné ju transformovať zavedením novej premennej (ako funkcie s jednou hodnotou posudzovanej premennej) takým spôsobom, aby bola táto nová premenná normálne distribuovaná (ďalšie informácie nájdete na tejto stránke: Tabachnik, Fidell, 1996, ch. 4).

Vlastné vektory a zodpovedajúce vlastné čísla
pre príslušnú prípadovú štúdiu

Vlastný vektor 1

Vlastný vektor 2

Vlastné číslo 1

Vlastné číslo 2

Pretože je korelačná matica diagonalizovateľná, je možné na ňu použiť maticovú algebru vlastných vektorov a vlastných čísel na získanie výsledkov faktorovej analýzy (pozri prílohu 1). Ak je matica diagonalizovateľná, potom sú všetky základné informácie o faktoriálnej štruktúre obsiahnuté v jej diagonálnej podobe. Pri faktorovej analýze vlastné hodnoty zodpovedajú variancii vysvetlenej faktormi. Faktor s najväčšou vlastnou hodnotou vysvetľuje najväčšiu odchýlku atď., Kým nepríde k faktorom s malými alebo negatívnymi vlastnými hodnotami, ktoré sa pri analýze zvyčajne nezohľadňujú. Matica zaťaženia faktorov je maticou vzťahov (interpretovaných ako korelačné koeficienty) medzi faktormi a premennými. Prvý stĺpec obsahuje korelácie medzi prvým faktorom a každou premennou: náklady na poukážku (-.400), pohodlie komplexu (.251), teplota vzduchu (.932), teplota vody(0,956). Druhý stĺpec predstavuje korelácie medzi druhým faktorom a každou premennou: náklady na poukážku (.900), pohodlie komplexu(-947), teplota vzduchu (.348), teplota vody(0,286). Faktor sa interpretuje na základe premenných, ktoré s ním silne súvisia (tj. Majú vysoké zaťaženie). Prvý faktor je teda hlavne „klimatický“ ( teplota vzduchu a vody), zatiaľ čo druhá „ekonomická“ ( náklady na prehliadku a pohodlie komplexu).

Pri interpretácii týchto faktorov je potrebné venovať pozornosť skutočnosti, že premenné s vysokým zaťažením pre prvý faktor ( teplota vzduchu a teplota vody), sú navzájom pozitívne prepojené, zatiaľ čo premenné s vysokým zaťažením pre druhý faktor ( náklady na poukážku a pohodlie komplexu), sú navzájom negatívne prepojené (od lacného letoviska nemožno očakávať veľké pohodlie). Prvý faktor sa nazýva unipolárny (všetky premenné sú zoskupené na jednom póle) a druhý je bipolárne(premenné sa rozdelia do dvoch skupín, čo znamená opačne - dva póly). Premenné s faktoriálnymi zaťaženiami so znamienkom plus tvoria kladný pól a tie so znamienkom mínus - záporný pól. V takom prípade názvy pólov „kladný“ a „negatívny“ pri interpretácii faktora nemajú hodnotiaci význam „zlý“ a „dobrý“. K výberu znamienka dôjde počas výpočtov náhodne. Ortogonálna rotácia

Rotácia sa zvyčajne aplikuje po rozdelení, aby sa maximalizovali vysoké korelácie a minimalizovali tie nízke. Existuje veľa spôsobov rotácie, ale najčastejšie sa používa rotácia varimax, čo je postup maximalizácie odchýlok. Táto rotácia maximalizuje rozptyl zaťaženia faktora, čím sa vysoké zaťaženie zvyšuje vyššie a nižšie zaťaženie pre každý faktor. Tento cieľ sa dosahuje použitím transformačné matice Λ:

Transformačná matica je matica sínusov a kosínusov uhla Ψ, ktorý sa má otáčať. (Preto názov transformácie - otočiť sa, pretože z geometrického hľadiska sa osi otáčajú okolo počiatku faktorového priestoru.) Po vykonaní rotácie a získaní matice faktorových zaťažení po rotácii je možné analyzovať sériu ďalších indikátorov (pozri tabuľku 4). Všeobecnosť premennej je rozptyl vypočítaný pomocou faktorových zaťažení. Toto je kvadratická viacnásobná korelácia premennej predpovedanej faktoriálnym modelom. Všeobecnosť sa počíta ako súčet druhých mocnín faktorového zaťaženia (FCS) pre premennú vo všetkých faktoroch. Tabuľka 4 spoločné znaky pre náklady na prehliadku sa rovná (-,086) 2 + (0,981) 2 = 0,970, t. j. 97% odchýlky náklady na prehliadku sa vysvetľuje faktormi 1 a 2.

Zlomok rozptylu faktora pre všetky premenné je SKN pre faktor vydelený počtom premenných (v prípade ortogonálnej rotácie) 7 ... Pre prvý faktor je podiel odchýlky:

[(-.086)2+(-.071)2+(.994)2+(.997)2]/4 = 1.994/4 = .50,

to znamená, že prvý faktor vysvetľuje 50% rozptylu premenných. Druhý faktor vysvetľuje 48% rozptylu premenných a (z dôvodu ortogonality rotácie) oba faktory spoločne vysvetľujú 98% rozptylu premenných.

Vzťah medzi faktorovým zaťažením, komunitami, SKN,
rozptyl a kovariancia ortogonálnych faktorov po rotácii

Spoločenstvá ( h2)

Cena poukážky

∑a2=.970

Úroveň pohodlia

∑a2=.960

Teplota vzduchu

∑a2=.989

Teplota vody

∑a2=.996

∑a2=1.994

∑a2=1.919

Percento odchýlky

Zlomok kovariancie

Podiel rozptylu riešenia vysvetlený faktorom je pomer kovariancia je SKN pre faktor vydelený súčtom všeobecností (súčet SKN za premenné). Prvý faktor vysvetľuje 51% variancie riešenia (1,994 / 3,915); druhá - 49% (1,919 / 3,915); dva faktory spolu vysvetľujú všetky kovariancie.

Eigenval - odráža hodnotu rozptylu zodpovedajúceho počtu faktorov. Ako cvičenie odporúčame vypísať všetky tieto vzorce, aby ste získali vypočítané hodnoty pre premenné. Napríklad pre prvého respondenta:

1.23 = -.086(1.12) + .981(-1.16)

1.05 = -.072(1.12) - .978(-1.16)

1.08 = .994(1.12) + .027(-1.16)

1.16 = .997(1.12) - .040(-1.16)

Alebo v algebraickej podobe:

Z náklady na prehliadku = a 11F 1 + a 12F 2

Z pohodlie komplexu = a 2l F 1 + a 22F 2

Z teplota vzduchu = a 31F 1 + a 32F 2

Z teplota vody = a 41F 1 + a 42F 2

Čím väčšie je zaťaženie, tým väčšiu istotu môžeme predpokladať, že premenná určuje faktor. Comrie a Lee ( Comrey, Lee, 1992) naznačujú, že zaťaženia väčšie ako 0,71 (vysvetľuje 50% odchýlky) sú vynikajúce, 0% odchýlky) sú veľmi dobré, 0%) sú dobré, 0%) sú uspokojivé a 0,32 (vysvetľuje 10% odchýlky) rozptyl) sú slabé.

Predpokladajme, že robíte (trochu „hlúpu“) štúdiu, v ktorej meriate výšku sto ľudí v palcoch a centimetroch. Máte teda dve premenné. Ak chcete ďalej skúmať napríklad vplyv rôznych doplnkov výživy na rast, budete ich používať naďalej oboje premenné? Pravdepodobne nie, pretože výška je jednou z charakteristík človeka, bez ohľadu na to, v akých jednotkách sa meria.

Závislosť medzi premennými je možné zistiť pomocou rozptylové pozemky... Regresná priamka získaná prispôsobením poskytuje grafické znázornenie vzťahu. Ak definujete novú premennú na základe regresnej priamky zobrazenej v tomto diagrame, potom bude táto premenná obsahovať najvýznamnejšie znaky oboch premenných. Takže ste v skutočnosti znížili počet premenných a nahradili ste dve jednou. Všimnite si, že nový faktor (premenná) je v skutočnosti lineárnou kombináciou dvoch pôvodných premenných.

Úvod do faktorovej analýzy

V posledných rokoch našla faktorová analýza svoje uplatnenie u širokého spektra výskumných pracovníkov, najmä vďaka vývoju vysokorýchlostných počítačov a štatistických softvérových balíkov (napríklad DATATEXT, BMD, OSIRIS, SAS a SPSS). To sa dotklo aj veľkej skupiny nematematicky vyškolených používateľov, ktorí sa napriek tomu zaujímali o využitie potenciálu faktorovej analýzy pri výskume (Harman, 1976; Horst, 1965; Lawley a Maxswel, 1971; Mulaik, 1972).

Faktorová analýza predpokladá, že študované premenné sú lineárnou kombináciou niektorých skrytých (latentných) nepozorovateľných faktorov. Inými slovami, existuje systém faktorov a systém študovaných premenných. Určitý vzťah medzi týmito dvoma systémami umožňuje prostredníctvom faktorovej analýzy, berúc do úvahy existujúci vzťah, vyvodiť závery o študovaných premenných (faktoroch). Logickou podstatou tejto závislosti je, že kauzálny systém faktorov (systém nezávislých a závislých premenných) má vždy jedinečný korelačný systém študovaných premenných, a nie naopak. Iba za prísne obmedzených podmienok kladených na faktorovú analýzu je možné jednoznačne interpretovať kauzálne štruktúry faktormi pre prítomnosť korelácie medzi študovanými premennými. Okrem toho existujú problémy iného charakteru. Napríklad pri zhromažďovaní empirických údajov je možné robiť rôzne druhy chýb a nepresností, čo zase sťažuje prácu na identifikácii skrytých nepozorovateľných parametrov a ich ďalšom štúdiu.

Čo je to faktorová analýza? Faktorová analýza sa odvoláva na rôzne štatistické techniky, ktorých hlavnou úlohou je reprezentovať súbor študovaných znakov v podobe skráteného systému hypotetických premenných. Faktorová analýza je výskumná empirická metóda, ktorá sa primárne nachádza v sociálnych a psychologických disciplínach.

Ako príklad použitia faktorovej analýzy môžeme považovať štúdium osobnostných vlastností pomocou psychologické testy... Vlastnosti osobnosti sa nehodia na priame meranie, možno ich hodnotiť iba na základe správania človeka, odpovedí na určité otázky atď. Na vysvetlenie zhromaždených empirických údajov sú ich výsledky podrobené faktorovej analýze, ktorá nám umožňuje identifikovať tie osobné vlastnosti, ktoré ovplyvnili správanie subjektov v experimentoch.

Prvou etapou faktorovej analýzy je spravidla výber nových funkcií, ktoré sú lineárnymi kombináciami predchádzajúcich a „pohlcujú“ väčšinu celkovej variability pozorovaných údajov, a preto prenášajú väčšinu informácií obsiahnutých v analýze. počiatočné pozorovania. Spravidla sa to robí pomocou metóda hlavných komponentov, aj keď sa niekedy používajú iné techniky (napríklad metóda hlavných faktorov, metóda maximálnej pravdepodobnosti).

    Analýza hlavných komponentov je štatistická technika, ktorá umožňuje transformovať pôvodné premenné na ich lineárne kombinácie (GeorgH.Dunteman). Cieľom metódy je získať redukovaný systém počiatočných údajov, ktorý je oveľa ľahšie pochopiteľný a ďalšie štatistické spracovanie. Tento prístup navrhol Pearson (1901) a nezávisle ho vyvinul Hotelling (1933). Autor sa pri práci s touto metódou snažil minimalizovať použitie maticovej algebry.

Hlavným cieľom analýzy hlavných komponentov je izolovať primárne faktory a určiť minimálny počet bežných faktorov, ktoré uspokojivo reprodukujú korelácie medzi študovanými premennými. Výsledkom tohto kroku je matica faktorov faktorového zaťaženia, ktoré sú v ortogonálnom prípade korelačnými koeficientmi medzi premennými a faktormi. Pri určovaní počtu faktorov, ktoré sa majú rozlíšiť, sa použije nasledujúce kritérium: vyberú sa iba faktory s vlastnými hodnotami väčšími ako zadaná konštanta (spravidla jeden).

Faktory získané metódou hlavných komponentov sa však obvykle nedajú dostatočne vizuálne interpretovať. Ďalším krokom vo faktorovej analýze je preto transformácia (rotácia) faktorov tak, aby sa uľahčila ich interpretácia. Rotácia faktory spočíva v nájdení najjednoduchšej faktorovej štruktúry, to znamená takej varianty posudzovania zaťaženia faktora a zvyškových odchýlok, ktorá umožňuje zmysluplne interpretovať všeobecné faktory a zaťaženia.

    Vedci najčastejšie používajú metódu varimax ako rotačnú metódu. Toto je metóda, ktorá umožňuje na jednej strane minimalizáciou šírenia štvorcov záťaží pre každý faktor získať zjednodušenú štruktúru faktora zvýšením veľkého a znížením malého zaťaženia faktora na druhej strane.

Hlavné ciele faktorovej analýzy sú teda:

    zníženie počet premenných (redukcia dát);

    definícia štruktúry vzťahy medzi premennými, t.j. klasifikácia premenných.

Faktorová analýza sa preto používa buď ako metóda redukcie údajov, alebo ako klasifikačná metóda.

Praktické príklady a tipy na použitie faktorovej analýzy pozri Stevens (1986); podrobnejší popis poskytujú Cooley a Lohnes (1971); Harman (Harman, 1976); Kim a Mueller (1978a, 1978b); Lawley a Maxwell (1971); Lindeman, Merenda and Gold (1980); Morrison (1967) a Mulaik (1972). Interpretáciu sekundárnych faktorov v hierarchickej faktorovej analýze ako alternatívu k tradičnej rotácii faktorov uvádza Wherry (1984).

Úvahy o príprave údajov pre aplikáciu

faktorová analýza

Zvážme niekoľko otázok a krátkych odpovedí ako súčasť použitia faktorovej analýzy.

    Akú úroveň merania vyžaduje faktorová analýza alebo inými slovami, v ktorej stupnici merania by sa mali údaje uvádzať pre faktorovú analýzu?

Faktorová analýza vyžaduje, aby boli premenné prezentované na intervalovej škále (Stevens, 1946) a zodpovedali normálnemu rozdeleniu. Táto požiadavka tiež predpokladá, že ako vstupy sa používajú kovariančné alebo korelačné matice.

    Mal by sa výskumný pracovník vyhnúť použitiu faktorovej analýzy, keď je metrický základ premenných nepresný, t.j. sú údaje uvádzané v poradovej stupnici?

Nie je to potrebné. Mnoho premenných, predstavujúcich napríklad merania názorov subjektov na veľký počet testov, nemá presne stanovený metrický základ. Všeobecne sa však predpokladá, že veľa „radových premenných“ môže obsahovať číselné hodnoty, ktoré neskresľujú a dokonca zachovávajú základné vlastnosti skúmaného znaku. Úlohy výskumníka: a) správne určiť počet reflexne rozlíšených rádov (úrovní); b) vziať do úvahy, že súčet pripustených skreslení bude zahrnutý do korelačnej matice, ktorá je základom vstupných údajov faktorovej analýzy; c) korelačné koeficienty sú zafixované ako „ordinálne“ skreslenia v meraniach (Labovitz, 1967, 1970; Kim, 1975).

Dlhý čas sa verilo, že číselným hodnotám presne radových kategórií sú priradené skreslenia. To je však nerozumné, pretože metrické hodnoty sú počas experimentu možné skresliť, aj keď sú minimálne. Pri faktorovej analýze výsledky závisia od možného predpokladu chýb získaných v procese merania, nie od ich pôvodu a korelácie s údajmi určitého typu váh.

    Je možné použiť faktorovú analýzu pre nominálne (dichotomické) premenné?

Mnoho vedcov tvrdí, že je veľmi výhodné používať faktorovú analýzu pre nominálne premenné. Po prvé, dichotomické hodnoty (hodnoty rovnajúce sa „0“ a „1“) vylučujú výber iných ako nich. Po druhé, vo výsledku je korelačný koeficient ekvivalentom Pearsonovho korelačného koeficientu, ktorý slúži ako číselná hodnota premennej na faktorovú analýzu.

Na túto otázku však neexistuje jednoznačne pozitívna odpoveď. Dichotomické premenné je ťažké vyjadriť v rámci modelu analytických faktorov: každá premenná má hodnotu hmotnostného zaťaženia najmenej dvoch hlavných faktorov - všeobecného a špecifického (Kim, Muller). Aj keď majú tieto faktory dva významy (čo je v reálnych faktoriálových modeloch dosť zriedkavé), potom by konečné výsledky v sledovaných premenných mali obsahovať minimálne štyri rôzne hodnoty, ktoré zase oprávňujú nejednotnosť v používaní nominálnych premenných. Faktorová analýza týchto premenných sa preto používa na získanie množstva heuristických kritérií.

    Koľko premenných by malo byť pre každý hypoteticky zostavený faktor?

Predpokladá sa, že pre každý faktor by mali existovať najmenej tri premenné. Táto požiadavka je ale vynechaná, ak sa na potvrdenie hypotézy použije faktorová analýza. Vedci sa všeobecne zhodujú na tom, že je potrebné mať najmenej dvakrát toľko premenných ako faktorov.

Ešte jeden bod týkajúci sa tejto otázky. Čím väčšia je veľkosť vzorky, tým spoľahlivejšia je hodnota kritéria. CHI-námestie. Výsledky sa považujú za štatisticky významné, ak vzorka obsahuje najmenej 51 pozorovaní. Takto:

N-n-150, (3,33)

kde N je veľkosť vzorky (počet meraní),

n je počet premenných (Lawley, Maxwell, 1971).

Je to samozrejme iba všeobecné pravidlo.

    Čo znamená znamenie faktorového načítania?

Samotné označenie nie je významné a neexistuje spôsob, ako posúdiť významnosť vzťahu medzi premennou a faktorom. Znaky premenných zahrnutých do faktora však majú špecifický význam v porovnaní so znakmi iných premenných. Rôzne znaky jednoducho znamenajú, že premenné sú spojené s faktorom v opačných smeroch.

Napríklad podľa výsledkov faktorovej analýzy sa zistilo, že pre dvojicu kvalít otvorené-zatvorené(Ketellov multivariačný dotazník) existujú kladné a záporné hmotnostné zaťaženia. Potom sa hovorí, že podiel na kvalite otvorené, vo vybranom faktore je viac ako podiel kvality zatvorené.

Hlavné komponenty a faktorová analýza

    Faktorová analýza ako metóda redukcie dát

Predpokladajme, že existuje (trochu „hlúpa“) štúdia, ktorá meria výšku sto ľudí v metroch a centimetroch. Existujú teda dve premenné. Ak by ste ďalej skúmali napríklad vplyv rôznych doplnkov výživy na rast, bolo by vhodné ich užívať oboje premenné? Asi nie, pretože výška je jednou z charakteristík človeka, bez ohľadu na to, v akých jednotkách sa meria.

Predpokladajme, že meriate spokojnosť ľudí so životom pomocou dotazníka, ktorý obsahuje rôzne položky. Napríklad sú položené nasledujúce otázky: sú ľudia spokojní so svojim koníčkom (položka 1) a ako intenzívne sa im venujú (položka 2)? Výsledky sú prevedené tak, aby priemerné odpovede (napríklad pre spokojnosť) zodpovedali hodnote 100, zatiaľ čo nižšie a vyššie hodnoty sú umiestnené pod a nad priemernými odpoveďami. Dve premenné (odpovede na dve rôzne položky) navzájom korelujú. Z vysokej korelácie týchto dvoch premenných možno vyvodiť záver, že dve položky dotazníka sú nadbytočné. To zase umožňuje kombinovať tieto dve premenné do jedného faktora.

Nová premenná (faktor) bude obsahovať najvýznamnejšie vlastnosti oboch premenných. Takže v skutočnosti bol pôvodný počet premenných znížený a dve premenné boli nahradené jednou. Všimnite si, že nový faktor (premenná) je v skutočnosti lineárnou kombináciou dvoch pôvodných premenných.

Príklad, v ktorom sú dve korelované premenné spojené do jedného faktora, ukazuje hlavnú myšlienku faktorovej analýzy alebo presnejšie analýzy hlavných zložiek. Rozšírenie príkladu s dvoma premennými na väčší počet premenných sťažuje výpočty, ale zostáva v platnosti základný princíp reprezentácie dvoch alebo viacerých závislých premenných ako jedného faktora.

    Metóda hlavných komponentov

Analýza hlavných komponentov je metóda redukcie alebo redukcie dát, t.j. znížením počtu premenných. Vzniká prirodzená otázka: koľko faktorov treba rozlišovať? Upozorňujeme, že v procese postupného výberu faktorov zahŕňajú čoraz menšiu variabilitu. Rozhodnutie o tom, kedy sa faktoringový postup zastaví, závisí hlavne od pohľadu, čo sa považuje za malú „náhodnú“ variabilitu. Toto rozhodnutie je dosť svojvoľné, ale existuje niekoľko odporúčaní, ktoré vám umožnia racionálne zvoliť počet faktorov (pozri časť Vlastné hodnoty a počet významných faktorov).

V prípade, že existujú viac ako dve premenné, možno ich považovať za definíciu trojrozmerného „priestoru“ rovnakým spôsobom, akým dve premenné definujú rovinu. Ak existujú tri premenné, potom je možné zostaviť trojrozmerný bodový graf (pozri obrázok 3.10).

Ryža. 3.10. 3D bodové vykreslenie objektu

V prípade viac ako troch premenných je nemožné reprezentovať body na rozptylovom diagrame, logika otáčania osí s cieľom maximalizovať rozptyl nového faktora však zostáva rovnaká.

Po nájdení riadku, pre ktorý je odchýlka maximálna, okolo neho zostane určitý rozptyl údajov a je prirodzené postup opakovať. V analýze hlavných komponentov sa deje presne toto: po prvom faktore zvýraznené to znamená, že po nakreslení prvého riadku sa určí ďalší riadok, aby sa maximalizovala zvyšková variácia (šírenie údajov okolo prvého riadku) atď. Faktory sú teda postupne zvýrazňované jeden po druhom. Pretože každý nasledujúci faktor je určený tak, aby sa maximalizovala variabilita zostávajúca od tých predchádzajúcich, ukázalo sa, že faktory sú navzájom nezávislé (nekorelované alebo kolmý).

    Vlastné hodnoty a počet významných faktorov

Pozrime sa na niektoré zo štandardných výsledkov analýzy hlavných komponentov. Pri opakovaných výpočtoch sú identifikované faktory s menšou a menšou odchýlkou. Pre jednoduchosť prezentácie sa predpokladá, že práca sa zvyčajne začína maticou, v ktorej sú odchýlky všetkých premenných rovné 1,0. Preto sa celková odchýlka rovná počtu premenných. Napríklad, ak existuje 10 premenných a odchýlka každej z nich je 1, potom najväčšia variabilita, ktorú je možné potenciálne izolovať, je 10-krát 1.

Predpokladajme, že štúdia spokojnosti so životom obsahuje 10 položiek na meranie rôznych aspektov spokojnosti s domácim životom a prácou. Rozptyl vysvetlený postupnými faktormi je uvedený v tabuľke 3.14:

Tabuľka 3.14

Tabuľka vlastných čísel

ANALÝZA STATISTICKÝCH FAKTOROV

Vlastné hodnoty (factor.sta) Výber: Hlavné komponenty

Význam

Vlastné hodnoty

% celková odchýlka

Kumulatívne. vlastné. význam

Kumulatívne. %

V druhom stĺpci tabuľky 3.14. (Vlastné hodnoty) predstavuje sa variancia nového, práve vybraného faktora. V treťom stĺpci je pre každý faktor uvedené percento celkového rozptylu (v tomto príklade 10) pre každý faktor. Ako vidíte, prvý faktor (hodnota 1) vysvetľuje 61 percent z celkového rozptylu, faktor 2 (hodnota 2) vysvetľuje 18 percent atď. Štvrtý stĺpec obsahuje kumulatívnu odchýlku.

Takže odchýlky pridelené faktormi sú pomenované vlastné hodnoty... Tento názov pochádza z použitej metódy výpočtu.

Keď viete, koľko variácií každý faktor identifikoval, môžete sa vrátiť k otázke, koľko faktorov by sa malo zachovať. Ako bolo uvedené vyššie, toto rozhodnutie má svojvoľnú povahu. Existuje však niekoľko bežne používaných pokynov, ktorých dodržiavanie v praxi dáva najlepšie výsledky.

Kritériá identifikácie faktorov

    Kaiserovo kritérium. Najskôr sa vyberú iba tie faktory, ktorých vlastné hodnoty sú väčšie ako 1. V podstate to znamená, že ak faktor nerozlišuje odchýlku ekvivalentnú aspoň s odchýlkou ​​jednej premennej, potom sa vynechá. Toto kritérium navrhol Kaiser (1960) a je najbežnejšie používané. Vo vyššie uvedenom príklade (pozri tabuľku 3.14) by sa na základe tohto kritéria mali zachovať iba 2 faktory (dve hlavné zložky).

    Kritérium sutiny je grafická metóda, ktorú propagoval Cattell (1966). Umožňuje vám vykresliť vlastné hodnoty ako jednoduchý graf:

Ryža. 3. 11. Kritérium sutiny

Obidve kritériá podrobne študovali Browne (1968), Cattell a Jaspers (1967), Hakstian, Rogers, Cattell (1982), Lynn (Linn, 1968), Tucker, Koopman a Lynn. (Tucker, Koopman, Linn, 1969) ). Cattel navrhol nájsť na grafe miesto, kde sa pokles vlastných čísel zľava doprava čo najviac spomaľuje. Predpokladá sa, že napravo od tohto bodu sa nachádza iba „faktoriálny tál“ („tál“ je geologický výraz pre kamenné zvyšky hromadiace sa v dolnej časti skalnatého svahu). V súlade s týmto kritériom možno v uvažovanom príklade ponechať 2 alebo 3 faktory.

Ktoré kritérium by sa malo v praxi uprednostniť? Teoreticky je možné charakteristiky vypočítať generovaním náhodných údajov pre konkrétny počet faktorov. Potom môžete zistiť, či bol pomocou použitého kritéria nájdený dostatočne presný počet významných faktorov alebo nie. Pri použití tejto všeobecnej metódy je prvým kritériom ( Kaiserovo kritérium) niekedy zachováva príliš veľa faktorov, zatiaľ čo druhé kritérium ( kritérium sutiny) niekedy si zachováva príliš málo faktorov; obe kritériá sú však za bežných podmienok, keď existuje relatívne málo faktorov a veľa premenných, celkom dobré.

V praxi vyvstáva dôležitá ďalšia otázka, a to: kedy je možné získané riešenie zmysluplne interpretovať. Preto sa zvyčajne skúma niekoľko riešení s viac alebo menej faktormi a potom sa vyberie jedno z najsmysluplnejších. Táto otázka sa bude ďalej posudzovať z hľadiska rotácie faktorov.

    Spoločenstiev

V jazyku faktorovej analýzy sa zlomok rozptylu jednotlivej premennej patriacej k spoločným faktorom (a zdieľanej s inými premennými) nazýva komunita... Preto ďalšou prácou, ktorej musí výskumný pracovník pri aplikácii tohto modelu čeliť, je posúdiť spoločné prvky pre každú premennú, t. podiel odchýlky, ktorý je spoločný pre všetky položky. Potom podiel rozptylu každá položka, za ktorú je zodpovedný, sa rovná celkovej variancii zodpovedajúcej všetkým premenným mínus všeobecnosť (Harman, Jones, 1966).

    Hlavné faktory a hlavné zložky

Termín faktorová analýza zahŕňa analýzu hlavných komponentov aj analýzu hlavných faktorov. Predpokladá sa, že vo všeobecnosti je známe, koľko faktorov by sa malo zdôrazniť. Môžete zistiť (1) význam faktorov, (2) či je možné ich interpretovať primeraným spôsobom, a (3) ako na to. Na ilustráciu toho, ako sa to dá, sa robí „naopak“, to znamená, že sa začína nejakou zmysluplnou štruktúrou a potom sa sleduje, ako to ovplyvňuje výsledky.

Hlavný rozdiel medzi týmito dvoma modelmi faktorovej analýzy je v tom, že pri analýze hlavných komponentov sa predpokladá, že všetko variabilita premenných, zatiaľ čo pri analýze hlavných faktorov sa používa iba variabilita premennej, ktorá je spoločná pre iné premenné.

Vo väčšine prípadov vedú tieto dve metódy k veľmi podobným výsledkom. Ako technika redukcie dát sa však často uprednostňuje analýza hlavných komponentov, zatiaľ čo analýza hlavných faktorov sa najlepšie používa na stanovenie štruktúry údajov.

Faktorová analýza ako metóda klasifikácie údajov

    Korelačná matica

Prvá etapa faktorovej analýzy zahŕňa výpočet korelačnej matice (v prípade normálneho rozdelenia vzorky). Vráťme sa k príkladu spokojnosti a zvážme korelačnú maticu pre premenné týkajúce sa spokojnosti v práci aj doma.

ANALÝZA FAKTOROV

Myšlienka faktorovej analýzy

Pri štúdiu zložitých objektov, javov, systémov sú faktory, ktoré určujú vlastnosti týchto objektov, veľmi často nemožné priamo zmerať a niekedy nie je známy ani ich počet a význam. Na meranie však môžu byť k dispozícii aj iné množstvá, v závislosti na tom či onom smere od faktorov, ktoré nás zaujímajú. Navyše, keď sa vplyv neznámeho záujmového faktora prejaví vo viacerých merateľných znakoch alebo vlastnostiach objektu, tieto znaky môžu odhaliť vzájomný úzky vzťah a celkový počet faktorov môže byť oveľa menší ako počet nameraných premenné.

Na identifikáciu faktorov, ktoré určujú merané vlastnosti objektov, sa používajú metódy faktorovej analýzy.

Ako príklad použitia faktorovej analýzy je možné poukázať na štúdium osobnostných čŕt na základe psychologických testov. Rysy osobnosti sa nehodia na priame meranie. Môžu byť hodnotené iba podľa správania človeka alebo podľa povahy odpovedí na otázky. Na vysvetlenie výsledkov experimentov sú podrobené faktorovej analýze, ktorá nám umožňuje identifikovať tie osobné vlastnosti, ktoré ovplyvňujú správanie jednotlivca.
Rôzne metódy faktorovej analýzy vychádzajú z nasledujúcej hypotézy: sledované alebo merané parametre sú iba nepriamymi charakteristikami skúmaného objektu, v skutočnosti existujú interné (skryté, latentné, nie priamo pozorované) parametre a vlastnosti, ktorých počet je malé a ktoré určujú hodnoty sledovaných parametrov. Tieto interné parametre sa zvyčajne nazývajú faktory.

Účelom faktorovej analýzy je sústrediť počiatočné informácie, vyjadrujúce veľké množstvo uvažovaných znakov, prostredníctvom menšieho počtu priestrannejších vnútorných charakteristík javu, ktoré však nemožno priamo zmerať.

Zistilo sa, že izolácia a následné pozorovanie úrovne bežných faktorov umožňuje zistiť stavy objektu pred zlyhaním vo veľmi skorých štádiách vývoja chyby. Faktorová analýza umožňuje sledovať stabilitu korelácií medzi jednotlivými parametrami. Sú to korelácie medzi parametrami, ako aj medzi parametrami a všeobecnými faktormi, ktoré obsahujú hlavné diagnostické informácie o procesoch. Použitie nástrojov balíka Statistica pri vykonávaní faktorovej analýzy eliminuje potrebu ďalších výpočtových nástrojov a robí analýzu jasnou a zrozumiteľnou pre používateľa.

Výsledky faktorovej analýzy budú úspešné, ak bude možné interpretovať identifikované faktory na základe významu ukazovateľov charakterizujúcich tieto faktory. Táto fáza práce je veľmi zodpovedná; vyžaduje si jasné pochopenie zmysluplného významu ukazovateľov, ktoré sú zahrnuté do analýzy a na základe ktorých sú faktory identifikované. Pri predbežnom starostlivom výbere ukazovateľov pre faktorovú analýzu by sa preto mal človek riadiť ich významom, a nie túžbou zahrnúť do analýzy čo najviac z nich.

Podstata faktorovej analýzy

Tu uvádzam niekoľko základných ustanovení o faktorovej analýze. Nech pre maticu NS v nameraných parametroch objektu je kovariančná (korelačná) matica C., kde R- počet parametrov, n- počet pozorovaní. Lineárnou transformáciou X=QY+U môžete zmenšiť rozmer pôvodného faktorového priestoru NS vyrovnať Y., kde R"<<R... To zodpovedá transformácii bodu charakterizujúceho stav objektu do j-dimenzionálny priestor, do nového priestoru dimenzií s nižšou dimenziou R". Je zrejmé, že geometrická blízkosť dvoch alebo súboru bodov v novom faktoriálnom priestore znamená stabilitu stavu objektu."

Matica Y. obsahuje nepozorovateľné faktory, čo sú v podstate hyperparametre charakterizujúce najbežnejšie vlastnosti analyzovaného objektu. Bežné faktory sa najčastejšie vyberajú ako štatisticky nezávislé, čo uľahčuje ich fyzickú interpretáciu. Vektor pozorovaných znakov NS dáva zmysel dôsledkom zmeny týchto hyperparametrov.

Matica U pozostáva zo zvyškových faktorov, ktoré zahŕňajú hlavne chyby merania X(i). Obdĺžniková matica Q obsahuje faktorové zaťaženia, ktoré určujú lineárny vzťah medzi znakmi a hyperparametrami.
Faktorové zaťaženia sú hodnoty korelačných koeficientov každej z počiatočných charakteristík s každým z identifikovaných faktorov. Čím užší je vzťah tejto vlastnosti k uvažovanému faktoru, tým vyššia je hodnota faktorového zaťaženia. Pozitívne znamenie zaťaženia faktorom naznačuje priamy (a negatívny znak - inverzný) vzťah tohto znaku s faktorom.

Údaje o zaťaženiach faktora teda umožňujú formulovať závery o súbore počiatočných charakteristík odrážajúcich konkrétny faktor a o relatívnej váhe jednotlivej charakteristiky v štruktúre každého faktora.

Model faktorovej analýzy je podobný viacrozmernej regresii a analýze variančných modelov. Zásadný rozdiel medzi modelom faktorovej analýzy je v tom, že vektor Y sú nepozorovateľné faktory, zatiaľ čo v regresnej analýze sú to registrované parametre. Na pravej strane rovnice (8.1) sú neznáme matica faktorových zaťažení Q a matica hodnôt bežných faktorov Y.

Na nájdenie matice faktorových zaťažení použite rovnicu QQ t = S - V, kde Q t je transponovaná matica Q, V je kovariančná matica zvyškových faktorov U, t.j. ... Rovnica je riešená iteráciami so zadaním nulovej aproximácie kovariančnej matice V (0). Po nájdení matice faktorových zaťažení Q sa pomocou rovnice vypočítajú všeobecné faktory (hyperparametre)
Y = (Q tV -1) Q -1 Q t V -1 X

Balík štatistických analýz Statistica umožňuje v interaktívnom režime vypočítať maticu zaťaženia faktorov, ako aj hodnoty niekoľkých preddefinovaných hlavných faktorov, najčastejšie dvoch - podľa prvých dvoch hlavných zložiek počiatočnej matice parametrov.

Faktorová analýza v systéme Statistica

Uvažujme o postupnosti vykonávania faktorovej analýzy na príklade spracovania výsledkov dotazníkového prieskumu zamestnancov podniku. Je potrebné určiť hlavné faktory, ktoré určujú kvalitu pracovného života.

V prvej fáze je potrebné zvoliť premenné pre faktorovú analýzu. Pomocou korelačnej analýzy sa výskumník snaží identifikovať vzťah študovaných znakov, čo mu zase dáva možnosť vybrať kompletnú a neredundantnú sadu znakov kombináciou silne korelovaných znakov.

Ak sa vykoná faktorová analýza pre všetky premenné, potom výsledky nemusia byť úplne objektívne, pretože niektoré premenné sú určené inými údajmi a nemôžu byť regulované zamestnancami príslušnej organizácie.

Aby sme pochopili, ktoré ukazovatele by sa mali vylúčiť, zostrojíme v Štatistike maticu korelačných koeficientov na základe dostupných údajov: Statistics / Basic Statistics / Correlation Matrices / Ok. V úvodnom okne tohto postupu Product-Moment a Partial Correlations (obr. 4.3) sa na výpočet štvorcovej matice používa tlačidlo zoznamu jednej premennej. Vyberte všetky premenné (vyberte všetky), Ok, súhrn. Dostaneme korelačnú maticu.

Ak sa korelačný koeficient zmení v rozmedzí od 0,7 do 1, znamená to silnú koreláciu ukazovateľov. V takom prípade možno vylúčiť jednu vysoko korelovanú premennú. Naopak, ak je korelačný koeficient malý, môžete premennú vylúčiť, pretože k súčtu nepridáva nič. V našom prípade neexistuje silná korelácia medzi ľubovoľnými premennými a pre celú skupinu premenných sa vykoná faktorová analýza.

Ak chcete spustiť faktorovú analýzu, musíte zavolať modul Štatistika / Mnohorozmerné exploratívne techniky (viacrozmerné výskumné metódy) / Faktorová analýza (faktorová analýza). Na obrazovke sa zobrazí okno modulu Faktorová analýza.



Na analýzu vyberte všetky premenné tabuľky; Premenné: vyberte všetky, ok. Riadok vstupného súboru označuje nespracované údaje. V module sú k dispozícii dva typy zdrojových údajov - nespracované údaje a korelačná matica - korelačná matica.

Sekcia odstránenia MD špecifikuje, ako spracovať chýbajúce hodnoty:
* Casewise - spôsob, ako vylúčiť chýbajúce hodnoty (predvolene);
* Pairwise - párovým spôsobom vylúčiť chýbajúce hodnoty;
* Stredná substitúcia - nahradenie strednej hodnoty namiesto chýbajúcich hodnôt.
Prípadom Case way je to, že v tabuľke, ktorá obsahuje údaje, sú ignorované všetky riadky, ktoré majú aspoň jednu chýbajúcu hodnotu. To platí pre všetky premenné. Metóda Pairwise ignoruje chýbajúce hodnoty nie pre všetky premenné, ale iba pre vybraný pár.

Vyberme spôsob riešenia chýbajúcich hodnôt Casewise.

Statistica spracuje chýbajúce hodnoty uvedeným spôsobom, vypočíta korelačnú maticu a ponúkne výber z niekoľkých metód faktorovej analýzy.

Po kliknutí na tlačidlo OK sa zobrazí okno Definovať metódu extrakcie faktora.

Horná časť okna je informačná. Hovorí sa v ňom, že s chýbajúcimi hodnotami sa pracovalo pomocou metódy Casewise. Bolo spracovaných 17 pozorovaní a 17 pozorovaní bolo prijatých pre ďalšie výpočty. Korelačná matica sa počíta pre 7 premenných. Spodná časť okna obsahuje 3 karty: Rýchla, Pokročilá, Popisné.

Karta Popisné má dve tlačidlá:
1 - zobraziť korelácie, prostriedky a štandardné odchýlky;
2- Vytvorte viacnásobnú regresiu.

Kliknutím na prvé tlačidlo môžete vidieť stredné a štandardné odchýlky, korelácie, kovariancie, vytvárať rôzne grafy a histogramy.

Na karte Spresnenie vľavo vyberte metódu extrakcie faktorovej analýzy: Hlavné komponenty. Na pravej strane vyberte maximálny počet faktorov (2). Nastavený je buď maximálny počet faktorov (max. Počet faktorov), alebo minimálna vlastná hodnota: 1 (vlastná hodnota).

Kliknite na Ok a Statistica urobí výpočty rýchlo. Zobrazí sa okno Výsledky analýzy faktora. Ako už bolo spomenuté, výsledky faktorovej analýzy sú vyjadrené súborom faktorových zaťažení. Preto budeme ďalej pracovať s kartou Načítania.

Horná časť okna je informačná:
Počet premenných: 7;
Metóda (metóda identifikácie faktorov): Hlavné komponenty;
Log (10) determinant korelačnej matice: –1,6248;
Počet získaných faktorov: 2;
Vlastné hodnoty: 3,39786 a 1,19130.
V dolnej časti okna sa nachádzajú funkčné tlačidlá, ktoré umožňujú komplexné prezeranie výsledkov analýzy, numericky aj graficky.
Rotácia faktorov - rotácia faktorov, v tomto rozbaľovacom okne môžete zvoliť rôzne rotácie osí. Otočením súradnicového systému možno získať množinu riešení, z ktorých je potrebné zvoliť interpretované riešenie.

Existujú rôzne metódy rotácie súradníc vesmíru. Statistica ponúka osem takýchto metód uvedených v module Faktorová analýza. Napríklad metóda varimax zodpovedá transformácii súradníc: rotácii, ktorá maximalizuje rozptyl. V metóde varimax sa získa zjednodušený popis stĺpcov faktorovej matice, pričom sa všetky hodnoty znížia na 1 alebo 0. V tomto prípade sa uvažuje s rozptylom štvorcov zaťaženia faktora. Faktorová matica získaná metódou rotácie varimax je invariantnejšia, pokiaľ ide o výber rôznych súborov premenných.

Cieľom rotácie metódou quartimax je podobné zjednodušenie iba vo vzťahu k riadkom faktorovej matice. Equimax zaujíma medzipolohu? rotačné faktory touto metódou sa súčasne pokúšajú zjednodušiť stĺpce aj riadky. Uvažované rotačné metódy sa týkajú ortogonálnych rotácií, t.j. výsledkom sú nekorelované faktory. Metódy priamej rotácie oblimin a promax odkazujú na šikmé rotácie, ktorých výsledkom sú korelované faktory. Pojem? Normalizovaný? v názvoch metód naznačuje, že faktorové zaťaženia sú normalizované, to znamená, že sú vydelené druhou odmocninou zodpovedajúcej odchýlky.

Zo všetkých navrhovaných metód sa najskôr pozrieme na výsledok analýzy bez rotácie súradnicového systému - Nerotovaný. Ak sa ukáže, že získaný výsledok je interpretovateľný a vyhovuje nám, môžeme sa nad tým zastaviť. Ak nie, môžete osi otáčať a zobraziť ďalšie riešenia.

Kliknite na tlačidlo „Načítanie faktora“ a pozrite si numerické načítanie faktorových načítaní.



Pripomeňme, že zaťaženia faktormi sú hodnoty korelačných koeficientov každej z premenných s každým z identifikovaných faktorov.

Hodnota faktorového zaťaženia vyššia ako 0,7 ukazuje, že tento znak alebo premenná úzko súvisia s uvažovaným faktorom. Čím užší je vzťah tejto vlastnosti k uvažovanému faktoru, tým vyššia je hodnota faktorového zaťaženia. Pozitívne znamenie zaťaženia faktorom naznačuje priamy (a negatívny znak - inverzný) vzťah medzi touto vlastnosťou a faktorom.
Takže z tabuľky faktoriálnych zaťažení boli identifikované dva faktory. Prvá definuje RSD - pocit sociálnej pohody. Zvyšok premenných je spôsobený druhým faktorom.

Riadok Expl. Var (obr. 8.5) ukazuje rozptyl pre konkrétny faktor. Linka Prp. Totl ukazuje podiel odchýlky pripísateľný prvému a druhému faktoru. V dôsledku toho prvý faktor predstavuje 48,5% z celkového rozptylu a druhý faktor - 17,0% z celkového rozptylu, zvyšok pripadá na ďalšie nezohľadnené faktory. Výsledkom je, že dva identifikované faktory vysvetľujú 65,5% celkovej odchýlky.



Tu tiež vidíme dve skupiny faktorov - OSB a zvyšok súboru premenných, z ktorých vyniká ŽSR - túžba zmeniť zamestnanie. Zdá sa, že má zmysel túto túžbu dôkladnejšie preskúmať na základe zhromažďovania ďalších údajov.

Výber a spresnenie počtu faktorov

Keď viete, koľko variácií každý faktor identifikoval, môžete sa vrátiť k otázke, koľko faktorov by sa malo zachovať. Zo svojej podstaty je toto rozhodnutie svojvoľné. Existuje však niekoľko spoločných pokynov, ktorých dodržiavanie v praxi prináša najlepšie výsledky.

Počet bežných faktorov (hyperparametrov) sa stanoví výpočtom vlastných čísel (obr. 8.7) matice X v module faktorovej analýzy. Urobíte to tak, že na karte Vysvetlená odchýlka (obr. 8.4) kliknete na tlačidlo Vykreslenie sute.


Maximálny počet bežných faktorov sa môže rovnať počtu vlastných čísel matice parametrov. Ale s nárastom počtu faktorov sa významne zvyšujú ťažkosti s ich fyzickou interpretáciou.

Najskôr môžete vybrať iba faktory s vlastnými hodnotami väčšími ako 1. V podstate to znamená, že ak faktor nevyberie odchýlku ekvivalentnú aspoň s odchýlkou ​​jednej premennej, potom sa vynechá. Toto je najbežnejšie používané kritérium. Vo vyššie uvedenom príklade by sa na základe tohto kritéria mali zachovať iba 2 faktory (dve hlavné zložky).

Na grafe nájdete miesto, kde sa pokles vlastných čísel zľava doprava čo najviac spomaľuje. Predpokladá sa, že napravo od tohto bodu sa nachádza iba „faktoriálny tál“. V súlade s týmto kritériom možno v príklade ponechať 2 alebo 3 faktory.
Obr. vidno, že tretí faktor nepatrne zvyšuje podiel na celkovej odchýlke.

Faktorová analýza parametrov umožňuje v ranom štádiu zistiť narušenie pracovného procesu (výskyt poruchy) na rôznych objektoch, ktoré si často nemožno všimnúť priamym pozorovaním parametrov. Vysvetľuje to skutočnosť, že k narušeniu korelácií medzi parametrami dochádza oveľa skôr ako k zmene jedného parametra. Takéto skreslenie korelácií umožňuje včas detekovať faktorovú analýzu parametrov. K tomu stačí mať pole registrovaných parametrov.

Je možné poskytnúť všeobecné odporúčania týkajúce sa použitia faktorovej analýzy bez ohľadu na predmetnú oblasť.
* Každý faktor musí mať najmenej dva merané parametre.
* Počet meraní parametrov musí byť väčší ako počet premenných.
* Počet faktorov by sa mal odôvodniť na základe fyzikálnej interpretácie procesu.
* Vždy by ste sa mali snažiť zabezpečiť, aby počet faktorov bol oveľa menší ako počet premenných.

Kritérium Kaiser si niekedy zachováva príliš veľa faktorov, zatiaľ čo kritérium sutín si niekedy zachováva príliš málo faktorov. Obidve kritériá sú však celkom dobré za normálnych podmienok, keď existuje relatívne málo faktorov a veľa premenných. V praxi je dôležitejšou otázkou, kedy je možné výsledné riešenie interpretovať. Preto sa zvyčajne skúma niekoľko riešení s viac alebo menej faktormi a potom sa vyberie jedno z najvýznamnejších.

Priestor pôvodných prvkov by mal byť zastúpený v homogénnych meracích škálach, pretože to umožňuje pri výpočte použitie korelačných matíc. V opačnom prípade nastáva problém „váh“ rôznych parametrov, čo vedie k nutnosti použitia kovariančných matíc pri výpočte. Preto sa pri zmene počtu funkcií môže objaviť ďalší problém s opakovateľnosťou výsledkov faktorovej analýzy. Je potrebné poznamenať, že tento problém je v balíku Statistica jednoducho vyriešený prechodom na štandardizovanú formu reprezentácie parametrov. V tomto prípade sa všetky parametre stávajú rovnocennými v miere ich spojitosti s procesmi v objekte výskumu.

Zle podmienené matice

Ak sú v počiatočnom súbore údajov nadbytočné premenné a neboli eliminované korelačnou analýzou, nemožno inverznú maticu (8.3) vypočítať. Napríklad, ak je premenná súčtom dvoch ďalších premenných vybraných pre túto analýzu, potom nie je možné invertovať korelačnú maticu pre túto množinu premenných a nemožno v zásade vykonať faktorovú analýzu. V praxi sa to stáva, keď sa pokúšame aplikovať faktorovú analýzu na súbor vysoko závislých premenných, čo sa niekedy stane napríklad pri spracovaní dotazníkov. Potom môžete umelo znížiť všetky korelácie v matici pridaním malej konštanty k diagonálnym prvkom matice a potom ju štandardizovať. Výsledkom tohto postupu je zvyčajne matica, ktorú je možné prevrátiť, a preto je možné na ňu použiť faktorovú analýzu. Tento postup navyše neovplyvňuje súbor faktorov, odhady sú však menej presné.

Faktorové a regresné modelovanie stavovo premenných systémov

Systém s premenlivými stavmi (SPS) je systém, ktorého odozva závisí nielen od vstupnej akcie, ale aj od zovšeobecneného parametra časovej konštanty, ktorý určuje stav. Variabilný zosilňovač alebo zoslabovač? toto je príklad najjednoduchšieho PCA, v ktorom je možné podľa niektorého zákona diskrétne alebo plynulo meniť prenosový koeficient. Štúdia SPS sa zvyčajne vykonáva pre linearizované modely, v ktorých sa prechodný proces spojený so zmenou parametra stavu považuje za úplný.

Najrozšírenejšie sú zoslabovače vyrobené na báze spojenia v tvare L, T a U v sérii a v paralelne zapojených diódach. Odpor diód pod vplyvom riadiaceho prúdu sa môže meniť v širokom rozmedzí, čo umožňuje meniť frekvenčnú charakteristiku a útlm v ceste. Nezávislosť fázového posuvu pri regulácii tlmenia v takýchto tlmičoch sa dosahuje pomocou reaktívnych obvodov zahrnutých v základnej konštrukcii. Je zrejmé, že s rôznym pomerom odporov paralelných a sériových diód možno dosiahnuť rovnakú úroveň tlmenia vloženia. Zmena fázového posuvu bude ale iná.

Poďme preskúmať možnosť zjednodušenia automatizovaného návrhu atenuátorov, čo vylučuje dvojitú optimalizáciu korekčných obvodov a parametrov riadených prvkov. Ako vyšetrovaný PCA použijeme elektricky riadený útlm, ktorého ekvivalentný obvod je znázornený na obr. 8.8. Minimálna úroveň útlmu je poskytnutá v prípade nízkeho odporu prvku Rs a veľkého odporu prvku Rp. Keď sa zvyšuje odpor prvku Rs a klesá odpor prvku Rp, zvyšuje sa zavedený útlm.

Závislosti zmeny fázového posuvu od frekvencie a útlmu pre obvod bez korekcie a s korekciou sú znázornené na obr. 8,9 a 8,10. V korigovanom útlme v rozsahu útlmu 1,3-7,7 dB a vo frekvenčnom pásme 0,01–4,0 GHz sa dosiahla zmena fázového posunu najviac o 0,2 °. V atenuátore bez korekcie dosahuje zmena fázového posuvu v rovnakom frekvenčnom pásme a rozsahu tlmenia 3 °. Fázový posun sa teda v dôsledku korekcie zníži takmer o 15-krát.


Parametre korekcie a riadenia budeme považovať za nezávislé premenné alebo faktory ovplyvňujúce útlm a zmenu fázového posuvu. To umožňuje pomocou systému Statistica vykonať faktoriálnu a regresnú analýzu SPS s cieľom stanoviť fyzikálne zákonitosti medzi parametrami obvodu a jednotlivými charakteristikami, ako aj zjednodušiť hľadanie optimálnych parametrov obvodu.

Počiatočné údaje boli tvorené nasledovne. Pre korekčné parametre a riadiace odpory odlišné od optimálnych hore a dole na frekvenčnej mriežke 0,01–4 GHz sa vypočítal útlm inzercie a zmena fázového posuvu.

Metódy štatistického modelovania, najmä faktorová a regresná analýza, ktoré sa predtým nepoužívali na návrh diskrétnych zariadení s premenlivými stavmi, nám umožňujú identifikovať fyzikálne zákony fungovania prvkov systému. To prispieva k vytvoreniu štruktúry zariadenia na základe daného kritéria optimality. Táto časť predovšetkým považovala fázovo invariantný zoslabovač za typický príklad systému so stavovými premennými. Identifikácia a interpretácia faktorových zaťažení ovplyvňujúcich rôzne študované charakteristiky umožňuje zmeniť tradičnú metodiku a výrazne zjednodušiť hľadanie korekčných parametrov a kontrolných parametrov.

Zistilo sa, že použitie štatistického prístupu k navrhovaniu takýchto zariadení je oprávnené tak na hodnotenie fyziky ich činnosti, ako aj na zdôvodnenie schematických diagramov. Štatistické modelovanie môže významne znížiť množstvo experimentálneho výskumu.

výsledky

  • Pozorovanie spoločných faktorov a zodpovedajúcich zaťažení faktorov je nevyhnutnou identifikáciou vnútorných vzorcov procesov.
  • Na stanovenie kritických hodnôt kontrolovaných vzdialeností medzi zaťaženiami faktorov je potrebné akumulovať a zovšeobecniť výsledky faktorovej analýzy pre procesy rovnakého typu.
  • Uplatnenie faktorovej analýzy sa neobmedzuje iba na fyzikálne vlastnosti procesov. Faktorová analýza je výkonná metóda monitorovania procesov a je použiteľná na návrh systémov na rôzne účely.

Fungovanie každého sociálno-ekonomického systému (do ktorého prevádzkový podnik patrí) prebieha v podmienkach komplexnej interakcie komplexu vnútorných a vonkajších faktorov. Faktor- to je dôvod, hybná sila každého procesu alebo javu, ktorý určuje jeho povahu alebo jednu z hlavných čŕt.

Faktorová analýza je pochopená metodika komplexného a systematického štúdia a merania vplyvu faktorov na hodnotu efektívnych ukazovateľov.

Všeobecne platí, že nasledujúce hlavné etapy (úlohy) faktorová analýza:

    Stanovenie cieľa analýzy.

    Výber faktorov, ktoré určujú skúmané ukazovatele výkonu.

    Klasifikácia a systematizácia faktorov s cieľom poskytnúť integrovaný a systematický prístup k štúdiu ich vplyvu na výsledky hospodárskej činnosti.

    Stanovenie formy závislosti medzi faktormi a ukazovateľmi výkonnosti.

    Modelovanie vzťahu medzi ukazovateľmi výkonnosti a faktormi.

    Výpočet vplyvu faktorov a hodnotenie úlohy každého z nich pri zmene hodnoty efektívneho ukazovateľa.

Práca s faktorovým modelom (jeho praktické využitie pre riadenie ekonomických procesov).

Inými slovami, metóda úloha- prechod od skutočne veľkého počtu znakov alebo dôvodov, ktoré určujú pozorovanú variabilitu, k malému počtu najdôležitejších premenných (faktorov) s minimálnou stratou informácií (metódy, ktoré sú si vo svojej podstate podobné, ale nie v matematickom aparáte - analýza komponentov , kanonická analýza atď.).

Metóda vznikla a pôvodne sa rozvíjala v úlohách psychológie a antropológie (na prelome 19. a 20. storočia), v súčasnosti je však oblasť jej aplikácie oveľa širšia.

Účel faktorovej analýzy

Faktorová analýza- stanovenie vplyvu faktorov na výsledok - je jedným z najsilnejších metodických rozhodnutí pri analýze ekonomických aktivít spoločností pre rozhodovanie. Pre vodcov - ďalší argument, ďalší „uhol pohľadu“.

Realizovateľnosť použitia faktorovej analýzy

Ako viete, môžete analyzovať všetko donekonečna. V prvej etape sa odporúča vykonať analýzu odchýlok a tam, kde je to potrebné a opodstatnené, použiť metódu faktorovej analýzy. V mnohých prípadoch stačí jednoduchá analýza odchýlok, aby sme pochopili, že odchýlka je „kritická“ a keď nie je vôbec potrebné poznať mieru jej vplyvu.

Faktory sa delia na interný a externý, podľa toho, či sú ovplyvňované činnosťami tohto podniku alebo nie. Analýza sa zameriava na interné faktory, ktoré môže podnik ovplyvniť.

Faktory sa dajú rozdeliť na cieľ,- nezávislé od vôle a želaní ľudí a - subjektívne, ovplyvnená činnosťou právnických a fyzických osôb.

Podľa prevalencie sú faktory rozdelené do všeobecných a konkrétnych. Spoločné faktory pôsobia vo všetkých odvetviach hospodárstva. Špecifické faktory pôsobia v konkrétnom priemysle alebo konkrétnom podniku.

Druhy faktorovej analýzy

Existujú nasledujúce typy faktorovej analýzy:

1) Deterministický (funkčný) - efektívny ukazovateľ sa uvádza vo forme produktu, kvocientu alebo algebraického súčtu faktorov.

2) Stochastické (korelácia) - vzťah medzi efektívnymi a faktorovými ukazovateľmi je neúplný alebo pravdepodobný.

3) Priame (deduktívne) - od všeobecného po konkrétne.

4) Reverzný (indukčný) - od konkrétneho po všeobecný.

5) Jednostupňové a viacstupňové.

6) Statické a dynamické.

7) Spätné a výhľadové.

V závislosti od typu faktorového modelu existujú dva hlavné typy faktorovej analýzy - deterministický a stochastický.

Deterministická faktorová analýza je metodika na štúdium vplyvu faktorov, ktorých prepojenie s efektívnym indikátorom má funkčný charakter, to znamená, keď sa efektívny indikátor faktorového modelu predstavuje ako produkt, kvocient alebo algebraický súčet faktorov .

Tento typ faktorovej analýzy je najbežnejší, pretože je veľmi jednoduchý na použitie (v porovnaní so stochastickou analýzou) a umožňuje vám pochopiť logiku hlavných faktorov rozvoja podniku, kvantifikovať ich vplyv, pochopiť, ktoré faktory a v ktorých aký pomer je možné a treba zmeniť, aby sa zvýšila efektívnosť výroby.

Deterministická faktorová analýza má pomerne prísnu postupnosť postupov:

1. konštrukcia ekonomicky spoľahlivého modelu deterministického faktora;

2. voľba metódy faktorovej analýzy a príprava podmienok na jej vykonávanie;

3. implementácia postupov počítania pre analýzu modelu;

Základné metódy analýzy deterministických faktorov

Metóda substitúcie reťazca; Metóda absolútnych rozdielov; Metóda relatívnych rozdielov; Integrálna metóda; Logaritmická metóda.

Stochastická analýza je technika štúdia faktorov, ktorých spojenie s efektívnym indikátorom je na rozdiel od funkčného neúplné, pravdepodobnostné (korelácia). Podstatou stochastickej metódy je meranie vplyvu stochastických závislostí s neurčitými a približnými faktormi. Stochastická metóda je vhodné uchádzať sa o ekonomický výskum s neúplnou (pravdepodobnostnou) koreláciou: napríklad o marketingové problémy. Ak pri funkčnej (úplnej) závislosti so zmenou argumentu dôjde vždy k zodpovedajúcej zmene funkcie, potom s korelačným spojením môže zmena argumentu dať niekoľko hodnôt zvýšenia funkcie, v závislosti od na kombinácii ďalších faktorov, ktoré určujú tento ukazovateľ. Napríklad produktivita práce na rovnakej úrovni pomeru kapitálu a práce nemusí byť v rôznych podnikoch rovnaká. Závisí to od optimálnej kombinácie ďalších faktorov ovplyvňujúcich tento ukazovateľ.

Stochastické modelovanie je do istej miery doplnkom a prehĺbením deterministickej faktorovej analýzy. Pri faktorovej analýze sa tieto modely používajú pre tri hlavné dôvodov:

Je potrebné študovať vplyv faktorov, pre ktoré nie je možné zostaviť rigidne deterministický model faktorov (napríklad úroveň finančnej páky);

Je potrebné študovať vplyv komplexných faktorov, ktoré sa nedajú kombinovať v rovnakom rigidne určenom modeli;

Je potrebné študovať vplyv komplexných faktorov, ktoré nie je možné vyjadriť jedným kvantitatívnym ukazovateľom (napríklad úroveň vedecko-technického pokroku).

Je tiež potrebné rozlišovať statický a dynamický faktorová analýza. Prvý typ sa používa pri štúdiu vplyvu faktorov na ukazovatele výkonnosti k príslušnému dátumu. Ďalším typom je technika štúdia kauzálnych vzťahov v dynamike.

Nakoniec môže byť faktorová analýza spätne,- ktorá skúma dôvody zvýšenia výkonnostných ukazovateľov za posledné obdobia a - nádejný, ktorá skúma správanie faktorov a ukazovatele výkonnosti v perspektíve.

Faktorová analýza môže byť jednostupňová a viacstupňová... Prvý typ sa používa na štúdium faktorov iba jednej úrovne (jednej úrovne) podriadenosti bez ich podrobného rozpisu do ich jednotlivých častí. Napríklad, . Pri viacstupňovej faktorovej analýze sú faktory a a b podrobne rozpracované do svojich základných prvkov, aby bolo možné študovať ich správanie. V podrobnostiach o faktoroch je možné pokračovať ďalej. V tomto prípade sa študuje vplyv faktorov rôznych úrovní podriadenosti.

Je tiež potrebné rozlišovať medzi statickou a dynamickou faktorovou analýzou.... Prvý typ sa používa pri štúdiu vplyvu faktorov na ukazovatele výkonnosti k príslušnému dátumu. Ďalším typom je technika štúdia kauzálnych vzťahov v dynamike.

Faktorová analýza zisku vám umožňuje posúdiť vplyv každého faktora osobitne na finančný výsledok ako celok. Prečítajte si, ako to vykonať, a tiež si stiahnite metodiku.

Podstata faktorovej analýzy

Podstatou faktoriálnej metódy je určiť vplyv každého faktora individuálne na výsledok ako celok. To je dosť ťažké urobiť, pretože faktory sa navzájom ovplyvňujú, a ak faktor nie je kvantitatívny (napríklad služba), potom jeho váhu odhadne odborník, čo v celej analýze zanechá stopu subjektivity. Ak je navyše príliš veľa faktorov ovplyvňujúcich výsledok, údaje nemožno spracovať a vypočítať bez špeciálnych programov matematického modelovania.


Jedným z najdôležitejších finančných ukazovateľov podniku je zisk. V rámci faktorovej analýzy je lepšie analyzovať ziskové marže, pri ktorých neexistujú fixné náklady alebo zisk z predaja.

Dôvody zmien zistíte pomocou modelu Excel

Stiahnite si hotový model v programe Excel. Pomôže vám zistiť, ako objem predaja, cena a štruktúra predaja ovplyvnili výnosy.

Faktorová analýza metódou reťazových substitúcií

Pri faktorovej analýze ekonómovia zvyčajne používajú metódu reťazových substitúcií, avšak matematicky je táto metóda nesprávna a prináša vysoko skreslené výsledky, ktoré sa výrazne líšia v závislosti od toho, ktoré premenné sú nahradené ako prvé a ktoré potom (napríklad v tabuľke 1).

stôl 1... Analýza výnosov v závislosti od ceny a množstva predaných výrobkov

Základný rok

Tento rok

Zvýšenie výnosov

Príjmy
B 0

Príjmy
B 0

Na úkor
ceny
V str

Kvôli množstvu
V q

možnosť 1

P 1 Q 0 -P 0 Q 0

P 1 Q 1 - P 1 Q 0

B 1 -B 0

Možnosť 2

P 1 Q 1 -P 0 Q 1

P 0 Q 1 -P 0 Q 0

B 1 -B 0

V prvej možnosti sa príjmy z ceny zvýšili o 500 rubľov a v druhej o 600 rubľov; príjmy z dôvodu množstva v prvom sa zvýšili o 300 rubľov a v druhom iba o 200 rubľov. Výsledky sa teda významne líšia v závislosti od poradia substitúcie. ...

Faktory ovplyvňujúce konečný výsledok môžete správnejšie rozložiť v závislosti od marže (Nat) a počtu predajov (množstvo) (pozri obrázok 1).

Obrázok 1

Vzorec pre rast zisku v dôsledku marže: P nat = ∆ Nat * (Number (tech) + Number (base)) / 2

Vzorec pre rast zisku v dôsledku množstva: počet P = ∆ množstvo * (Nat (technológia) + Nat (základ)) / 2

Príklad dvojfaktorovej analýzy

Zvážte príklad v tabuľke 2.

tabuľka 2... Príklad dvojfaktorovej analýzy výnosov

Základný rok

Tento rok

Zvýšenie výnosov

Príjmy
B 0

Príjmy
B 0

Kvôli marži
V str

množstvo
V q

∆ P (Q 1 + Q 0) / 2

∆ Q (P 1 + P 0) / 2

B 1 -B 0

Produkt „A“

Získali sme priemerné hodnoty medzi variantmi substitúcií reťazca (pozri tabuľku 1).

Trojfaktorový model pre analýzu zisku

Trojfaktorový model je oveľa komplikovanejší ako dvojfaktorový model (obrázok 2).

Obrázok 2


Vzorec použitý na určenie vplyvu každého faktora v 3-faktorovom modeli (napríklad prirážka, množstvo, nomenklatúra) na celkový výsledok je podobný ako vzorec v dvojfaktorovom modeli, ale je zložitejší.

P nat = ∆Nat * ((Number (tech) * Nom (tech) + Number (base) * Nom (base)) / 2 - ∆Kol * ∆Nom / 6)

Počet P = ∆Col * ((Nat (tech) * Nom (tech) + Nat (base) * Nom (base)) / 2 - ∆Nat * ∆Nom / 6)

P nom = ∆Nom * ((Nat (tech) * Kol (tech) + Nat (base) * Kol (base)) / 2 - ∆Nat * ∆Col / 6)

Príklad analýzy

V tabuľke sme uviedli príklad použitia trojfaktorového modelu.

Tabuľka 3... Príklad výpočtu príjmu pomocou trojfaktorového modelu

Minulý rok

Tento rok

Príjmové faktory

Nomenklatúra

∆ Q ((N 1 P 1 + N 0 P 0) / 2 -
- ∆ N ∆ P / 6)

∆ P ((N 1 Q 1 + N 0 Q 0) / 2 -
- ∆ N ∆ Q / 6)

∆ N ((Q 1 P 1 + Q 0 P 0) / 2 -
- ∆ Q ∆ P / 6)

Ak sa pozrieme na výsledky analýzy výnosov faktorovou metódou, potom došlo k najväčšiemu nárastu výnosov z dôvodu zvýšenia cien. Ceny sa zvýšili o (15/10 - 1) * 100% = 50%, ďalším dôležitým bolo zvýšenie v rozmedzí od 3 do 4 jednotiek - tempo rastu (4/3 - 1) * 100% = 33% a na poslednom mieste „množstvo“, ktoré sa zvýšilo iba o (120 / 100–1) * 100% = 20%. Faktory teda ovplyvňujú zisk úmerne s rýchlosťou rastu.

Štvorfaktorový model

Pre funkciu tvaru Pr = Kol av * Nom * (Cena - Seb) bohužiaľ neexistujú jednoduché vzorce na výpočet vplyvu každého jednotlivého faktora na indikátor.

Pr - zisk;

Col av - priemerné množstvo na jednotku položky;

Nom - počet skladových položiek;

Cena - cena;

.

Existuje metóda výpočtu založená na Lagrangeovej vete o konečných prírastkoch pomocou diferenciálneho a integrálneho počtu, je však taká zložitá a namáhavá, že ju v reálnom živote prakticky nemožno použiť.

Preto na izoláciu každého jednotlivého faktora sa najskôr vypočítajú všeobecnejšie faktory pomocou obvyklého dvojfaktorového modelu a potom rovnakým spôsobom aj ich zložky.

Všeobecný vzorec zisku: Pr = množstvo * Nat (Nat - prirážka k jednotke výrobkov). Podľa toho určujeme vplyv dvoch faktorov: množstva a marže. Počet predaných výrobkov zase závisí od nomenklatúry a priemerne odbytu za položku.

Dostaneme Quantity = Kol av * Nom. A marža závisí od ceny a nákladov, t.j. Nat = Cena - Seb. Vplyv nákladovej ceny na zmenu zisku závisí zase od množstva predaných výrobkov a od zmeny samotnej nákladovej ceny.

Potrebujeme teda osobitne určiť vplyv 4 faktorov na zmenu zisku: Množstvo, Cena, Seb, Nom, pomocou 4 rovníc:

  1. Pr = počet * nat
  2. Množstvo = Kol av * Nom
  3. Zatr = množstvo * Seb.
  4. Exp = množstvo * cena

Príklad analýzy štvorfaktorového modelu

Pozrime sa na príklad. Počiatočné údaje a výpočty v tabuľke

Tabuľka 4... Príklad analýzy zisku pomocou 4-faktorového modelu

Minulý rok

Počet (st)
Q (st 0)

Zisk
P 0

Q 0 * (P 0-0)

∑Q 0 P 0 / ∑Q 0

∑Q 0 P 0 / ∑Q 0

Tento rok

Počet (st)
Q (st 1)

Q 1 * (P 1-C 1)

Súčty a vážené priemery

∑Q 1 P 1 / ∑Q 1

∑Q 1 P 1 / ∑Q 1

Vplyv faktora na zmenu zisku

Žiadne M
N ∆

Číslo
Q ∆

Počet (st)
Q (porovnaj) ∆

cena
P ∆

Nat
H ∆

∆N * (Q (av 0) + Q (av 1)) / 2
* (H 1 + H 0) / 2

∆Q * (H 1 + H 0) / 2

∆Q (porovnaj) * (N 1 + N 0) / 2

* (H 1 + H 0) / 2

∆P * (Q 1 + Q 0) / 2

∆С * (Q 1 + Q 0) / 2

∆H * (Q 1 + Q 0) / 2

Súčty a vážené priemery

Poznámka: čísla v tabuľke programu Excel sa môžu líšiť o niekoľko jednotiek od údajov v textovom popise, pretože v tabuľke sú zaokrúhlené na desatiny.

1. Najskôr pomocou dvojfaktorového modelu (popísaného na samom začiatku) rozkladáme zmenu zisku na kvantitatívny a maržový faktor. Toto sú faktory prvého rádu.

Pr = počet * nat

Počet ∆ = ∆Q * (H 1 + H 0) / 2 = (220 - 180) * (3,9 + 4,7) / 2 = 172

Nat ∆ = ∆H * (Q 1 + Q 0) / 2 = (4,7 - 3,9) * (220 + 180) / 2 = 168

Šek: ∆Пр = Kol ∆ + Nat ∆ = 172 + 168 = 340

2. Vypočítame závislosť na parametri nákladov. Za týmto účelom rozdelíme náklady na množstvo a náklady podľa rovnakého vzorca, ale so znamienkom mínus, pretože náklady znižujú zisk.

Cena = množstvo * seb

Ceb∆ = - ∆C * (Q1 + Q0) / 2 = - (7,2 - 6,4) * (180 + 220) / 2 = -147

3. Vypočítame závislosť na cene. Za týmto účelom rozdelíme príjem na množstvo a cenu pomocou rovnakého vzorca.

Exp = množstvo * cena

Cena∆ = ∆P * (Q1 + Q0) / 2 = (11,9 - 10,3) * (220 + 180) / 2 = 315

Šek: Nat∆ = Cena∆ - Seb∆ = 315 - 147 = 168

4. Vypočítame vplyv položky na zisk. Za týmto účelom rozložíme počet predaných produktov na počet jednotiek v rozsahu a priemerné množstvo na jednotku v rozsahu. Určíme teda pomer faktora množstva a naturálnej nomenklatúry. Potom vynásobíme údaje získané priemernou ročnou prirážkou a prevedieme ich na ruble.

Množstvo = Nom * Množstvo (St)

Nom ∆ = ∆N * (Q (av 0) + Q (av 1)) / 2 * (H 1 + H 0) / 2 = (3 - 2) (73 + 90) / 2 * (4,7 + 3,9) = 352

Počet (priem.) = ∆Q (priem.) * (N 1 + N 0) / 2 * (H 1 + H 0) / 2 = (73 - 90) * (2 + 3) / 2 * (4,7 + 3,9) = -180

Kontrola: Množstvo ∆ = Nom ∆ + Množstvo (porovnaj) = 352-180 = 172

Vyššie uvedená štvorfaktorová analýza ukázala, že zisk sa v porovnaní s minulým rokom zvýšil kvôli:

  • zvýšenie cien o 315 tisíc rubľov;
  • zmeny v nomenklatúre o 352 tisíc rubľov.

A znížené z dôvodu:

  • rast nákladov o 147 tisíc rubľov;
  • pokles počtu predajov o 180 tisíc rubľov.

Mohlo by sa to javiť ako paradox: celkový počet predaných kusov v súčasnom roku v porovnaní s predchádzajúcim rokom vzrástol o 40 kusov, avšak faktor množstva vykazuje negatívny výsledok. Je to tak preto, lebo rast tržieb bol spôsobený nárastom položiek v nomenklatúre. Ak vlani boli iba 2, tak tento rok pribudla ešte jedna. Zároveň sa z hľadiska množstva predal tovar „B“ vo vykazovanom roku za 20 kusov. menej ako v predchádzajúcom.

To naznačuje, že produkt „C“ uvedený v novom roku čiastočne nahradil produkt „B“, ale prilákal nových kupujúcich, ktorých produkt „B“ nemal. Ak produkt „B“ v budúcom roku naďalej stráca svoju pozíciu, je možné ho zo sortimentu odstrániť.

Pokiaľ ide o ceny, ich nárast o (11,9 / 10,3 - 1) * 100% = 15,5% nemal výrazný vplyv na predaj všeobecne. Súdiac podľa produktu „A“, ktorý nebol ovplyvnený štrukturálnymi zmenami v sortimente, potom sa jeho tržby zvýšili o 20%, a to aj napriek zvýšeniu ceny o 33%. To znamená, že rast cien nie je pre firmu kritický.

S nákladovou cenou je všetko jasné: vzrástla a zisk sa znížil.

Faktorová analýza zisku z predaja

Evgeny Shagin, Finančný riaditeľ spoločnosti RusCherMet Management Company

Ak chcete vykonať faktorovú analýzu, musíte:

  • zvoliť základňu pre analýzu - tržby z predaja, zisk;
  • vyberte faktory, ktorých vplyv je potrebné posúdiť. Podľa zvolenej analytickej základne to môžu byť: objem predaja, nákladová cena, prevádzkové náklady, prevádzkové príjmy, úroky z pôžičky, dane;
  • posúdiť vplyv každého faktora na konečný ukazovateľ. V základnom výpočte za predchádzajúce obdobie nahraďte hodnotu vybraného faktora z vykazovaného obdobia a upravte konečný ukazovateľ s prihliadnutím na tieto zmeny;
  • určiť vplyv faktora. Od získanej strednej hodnoty odhadovaného ukazovateľa odčítajte jeho skutočnú hodnotu za predchádzajúce obdobie. Ak je číslo kladné, zmena faktora mala pozitívny vplyv, negatívny - negatívny.

Ukážka faktorovej analýzy zisku z predaja

Pozrime sa na príklad. V správe o finančných výsledkoch spoločnosti Alpha za predchádzajúce obdobie nahraďme hodnotu objemu predaja za súčasné obdobie (571 513 512 rubľov namiesto 488 473 087 rubľov), všetky ostatné ukazovatele zostanú rovnaké (pozri tabuľku 5). Vďaka tomu sa čistý zisk zvýšil o 83 040 425 rubľov. (116 049 828 rubľov - 33 009 403 rubľov). To znamená, že ak by sa spoločnosti v predchádzajúcom období podarilo predať výrobky za rovnaké množstvo ako v tomto, potom by sa jej čistý zisk zvýšil len o týchto 83 040 425 rubľov.

Tabuľka 5... Faktorová analýza zisku podľa objemu predaja

Register

Predchádzajúce obdobie, trieť.

so substitúciou
význam
faktor z
prúd
obdobie

Objem predaja

Hrubý zisk

Prevádzkové náklady

Prevadzkovy zisk

Úroky z pôžičky

Zisk pred zdanením

Čistý zisk

1 Hodnota objemu predaja za súčasné obdobie.

2 Ukazovateľ sa prepočítava s prihliadnutím na úpravu objemu predaja

Pri použití podobnej schémy môžete posúdiť vplyv každého faktora a prepočítať čistý zisk. Konečné výsledky je možné zhrnúť do jednej tabuľky (pozri tabuľku 6).

Tabuľka 6... Vplyv faktorov na zisk, rubľov

Objem predaja

Náklady na predaný tovar, služby

Prevádzkové náklady

Neprevádzkové príjmy / výdavky

Úroky z pôžičky

Celkom

32 244 671

Ako vidno z tabuľky 6, najväčší vplyv v analyzovanom období mal rast tržieb (83 040 425 rubľov). Súčet vplyvu všetkých faktorov sa zhoduje so skutočnou zmenou zisku za posledné obdobie. Preto môžeme konštatovať, že výsledky analýzy sú správne.

Záver

Na záver by som chcel pochopiť: s čím potrebujete porovnať zisk pri faktorovej analýze? S posledným rokom, so základným rokom, s konkurenciou, s plánom? Ako pochopiť, či podnik tento rok fungoval dobre alebo nie? Napríklad podnik zdvojnásobil svoj zisk za bežný rok, zdá sa, že je to vynikajúci výsledok! Lenže v tomto čase vykonali konkurenti technickú prestavbu podniku a od budúceho roku vylúčia tých šťastných z trhu. A ak porovnáte s konkurenciou, potom je ich príjem menší, pretože namiesto povedzme reklamy alebo rozšírenia sortimentu investovali do modernizácie. Všetko teda závisí od cieľov a plánov podniku. Z toho vyplýva, že je potrebné najskôr porovnať skutočný zisk s plánovaným.