Számítsa ki a kovarianciát

Szerző: Judy Howell
A Teremtés Dátuma: 2 Július 2021
Frissítés Dátuma: 1 Július 2024
Anonim
Számítsa ki a kovarianciát - Tanácsok
Számítsa ki a kovarianciát - Tanácsok

Tartalom

A kovariancia egy statisztikai számítás, amely átláthatóbbá teszi a két adatkészlet közötti kapcsolatot. Tegyük fel például, hogy az antropológusok egy populáció magasságát és súlyát vizsgálják egy adott kultúrán belül. A vizsgálatban résztvevő személyek esetében a magasság és a súly pár adat (x, y) segítségével jeleníthető meg. Ezeket az értékeket standard képletben lehet felhasználni a kovariancia viszony kiszámításához. Ez a cikk először az adatkészlet kovarianciájának meghatározására vonatkozó számításokat ismerteti. Ezután az eredmény meghatározásának két másik automatizált módját tárgyaljuk.

Lépni

1. módszer a 4-ből: Számítsa ki a kovarianciát kézzel a standard képlet segítségével

  1. Ismerje meg a kovariancia általános képletét és annak részeit. A kovariancia kiszámításának standard képlete a Σ(xénxÁtl)(yényÁtl)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Konstruálja az adattáblát. Mielőtt elkezdené, hasznos összegyűjteni adatait. Hozzon létre egy öt oszlopból álló táblázatot. Minden oszlopot az alábbiak szerint kell deklarálnia:
    • x{ displaystyle x}Számítsa ki az x adatpont átlagát. Ez a minta adatkészlet 9 számot tartalmaz. Az átlag megtalálásához adjuk össze őket, és osszuk el az összeget 9-vel. Ez az eredmény 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Ha ezt elosztjuk 9-tel, akkor az átlagot 4.89. Ezt az értéket fogja használni x (avg) értékként a következő számításokhoz.
    • Számítsa ki az y adatpontok átlagát. Ennek az y oszlopnak szintén tartalmaznia kell 9 adatpontot, amelyek egybeesnek az x adatponttal. Határozza meg ezek átlagát. Ennél a minta adatkészletnél ez 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49 lesz. Ezt az összeget elosztva 9-vel 5,44-es átlagot kapunk. Az 5.44 értéket fogja használni y (avg) értékeként a következő számításokhoz.
    • Számítsa ki az értékeket (xénxÁtl){ displaystyle (x_ {i} -x _ { text {avg}})}Számítsa ki az értékeket (yényÁtl){ displaystyle (y_ {i} -y _ { text {avg}})}Számítsa ki az egyes adatsorok termékeit. Az utolsó oszlop sorait úgy tölti ki, hogy megszorozza az előző két oszlopban kiszámított számokat (xénxÁtl){ displaystyle (x_ {i} -x _ { text {avg}})}Keresse meg az értékek összegét az utolsó oszlopban. Itt jön be a Σ szimbólum. Az összes eddigi számítás elvégzése után adja hozzá az eredményeket. Ehhez a mintaadatkészlethez most kilenc értéket kell megadnia az utolsó oszlopban. Adja össze ezt a kilenc számot. Nagyon figyeljen arra, hogy egy szám pozitív vagy negatív.
      • Ennek a mintaadatkészletnek az összege -64,57 legyen. Írja ezt az összeget az oszlop aljára. Ez a standard kovariancia képlet számlálójának értéke.
    • Számítsa ki a kovariancia képlet nevezőjét! A standard kovariancia képlet számlálója az imént kiszámított érték. A nevezőt (n-1) jelöli, és eggyel kevesebb, mint az adatkészlet adatpárjainak száma.
      • Ebben a példaproblémában kilenc adatpár van, tehát n értéke 9. Ezért az (n-1) értéke egyenlő 8-val.
    • Osszuk el a számlálót a nevezővel. A kovariancia kiszámításának utolsó lépése a számláló felosztása, Σ(xénxÁtl)(yényÁtl){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Figyelje meg az ismétlődő számításokat. A kovariancia olyan számítás, amelyet néhányszor kézzel kell elvégeznie, hogy megértse az eredmény jelentését. Ha azonban rutinszerűen a kovarianciát fogja használni az adatok értelmezéséhez, akkor gyorsabb és automatizáltabb módszerre van szüksége az eredmények eléréséhez. Mostanra észrevehette, hogy a mindössze kilenc adópárból álló viszonylag kis adatsorunkkal a számítások két átlagból, tizennyolc külön kivonásból, kilenc szorzásból, egy összeadásból és végül egy másik osztásból álltak. Ez 31 viszonylag kis számítás a megoldás megtalálásához. Útja során fennáll annak a veszélye, hogy hiányoznak a negatív jelek, vagy az eredményeket helytelenül másolja, így a válasz már nem helyes.
    • Hozzon létre egy munkalapot a kovariancia kiszámításához. Ha ismeri az Excel programot (vagy egy másik számítási programot), könnyen létrehozhat egy táblázatot a kovariancia meghatározására. Címkézze fel az öt oszlop fejlécét, ahogy kézzel tette a számításokhoz: x, y, (x (i) -x (avg)), (y (i) -y (avg)) és Product.
      • A névadás egyszerűsítése érdekében hívja a harmadik oszlopot valami "x különbség", a negyedik oszlop "y különbség" kifejezésre, amennyiben emlékszik az adatok jelentésére.
      • Ha a táblázat a munkalap bal felső sarkában kezdődik, akkor az A1 cellát x címkével látjuk el, míg a többi címke az E1 celláig folytatódik.
    • Adja meg az adatpontokat. Írja be az adatértékeket a két x és y oszlopba. Ne feledje, hogy az adatpontok sorrendje számít, ezért minden y-t meg kell egyeznie az x megfelelő értékével.
      • Az x értékek az A2 cellában kezdődnek és a szükséges adatpontok számáig folytatódnak.
      • Az y értékek a B2 cellában kezdődnek, és a szükséges adatpontok számáig tartanak.
    • Határozza meg az x és y értékek átlagát. Az Excel nagyon gyorsan kiszámolja az átlagokat. Az egyes adatoszlopok alatti első üres cellába írja be a képletet = ÁTLAG (A2: A ___). Töltse ki az üres helyet az utolsó adatpontnak megfelelő cella számával.
      • Például, ha 100 adatpontja van, akkor az A2 – A101 cellák kitöltődnek, így a cellába írja be: = ÁTLAG (A2: A101).
      • Az y adatokhoz írja be az = ÁTLAG (B2: B101) képletet.
      • Ne feledje, hogy az Excel egyik képlete "=" jellel kezdődik.
    • Írja be az oszlop képletét (x (i) -x (avg)). A C2 cellába írja be az első kivonás kiszámításához szükséges képletet. Ez a képlet a következő lesz: = A2 -___. Töltse ki az üres helyet a cella címével, amely tartalmazza az x adatok átlagát.
      • Például a 100 adatpont közül az átlag az A103 cellában lesz, tehát a képlete a következő lesz: = A2-A103.
    • Ismételje meg az (y (i) -y (avg)) adatpontok képletét. Ugyanezt a példát követve belép a D2 cellába. A képlet a következő lesz: = B2-B103.
    • Írja be a "Termék" oszlop képletét. Az ötödik oszlopba írja be az E2 cellába a képletet a két előző sejt szorzatának kiszámításához. Ez lesz: = C2 * D2.
    • Másolja a képleteket a táblázat kitöltéséhez. Eddig csak a 2. sor első néhány adatpontját programozta be. Az egérrel jelölje meg a C2, D2 és E2 cellákat. Vigye a kurzort a jobb alsó sarokban lévő kis dobozra, amíg meg nem jelenik a pluszjel. Kattintson és tartsa lenyomva az egérgombot, és húzza lefelé az egérmutatót a kijelölés kibővítéséhez és a teljes adattábla kitöltéséhez. Ez a lépés automatikusan átmásolja a három képletet a C2, D2 és E2 cellákból az egész táblázatba. A táblázatot automatikusan ki kell tölteni az összes számítással.
    • Programozza be az utolsó oszlop összegét. Szüksége van a "Termék" oszlop tételeinek összegére. Az oszlop utolsó adatpontja alatti üres cellába írja be a következő képletet: = SUM (E2: E ___). Töltse ki az üres helyet az utolsó adatpont cellacímével.
      • A 100 adatponttal rendelkező példában ez a képlet az E103 cellába kerül. Típus: = SUM (E2: E102).
    • Határozza meg a kovarianciát. Az Excel is elvégezheti a végső számítást az Ön számára. Példánkban az E103 cellában található utolsó számítás a kovariancia képlet számlálóját jelenti. Közvetlenül a cella alá írja be a következő képletet: = E103 / ___. Töltse ki az üres helyet a rendelkezésére álló adatpontok számával. Példánkban ez 100. Az eredmény az adatok kovarianciája.

3/4 módszer: Online kovariancia számológépek használata

  1. A kovariancia számológépek keresése az interneten. Különböző iskoláknak, vállalatoknak vagy más forrásoknak vannak olyan webhelyeik, amelyek nagyon könnyen kiszámolják az Ön számára a kovariancia értékeket. Használja a "kovariancia kalkulátor" keresési kifejezést a keresőben.
  2. Adja meg adatait. Gondosan olvassa el a weboldalon található utasításokat, hogy megbizonyosodjon arról, hogy helyesen adta-e meg az információkat. Fontos, hogy az adatpárjaid rendben legyenek, különben a létrehozott eredmény helytelen kovariancia lesz. A weboldalak különböző stílusúak az adatbevitelhez.
    • Például a http://ncalculators.com/statistics/covariance-calculator.htm weboldalon található egy vízszintes mező az x értékek beviteléhez, és egy második vízszintes mező az y értékek beviteléhez. Az adatokat vesszővel elválasztva kell megadni. Így a cikkben korábban kiszámított x adatsort 1,3,2,5,8,7,12,2,4-ként kell megadni. Az y adatok 8,6,9,4,3,3,2,7,7.
    • Egy másik webhelyen, a https://www.thecalculator.co/math/Covariance-Calculator-705.html címen, meg kell adnia az x adatokat az első mezőbe. Az adatok függőlegesen kerülnek bevitelre, soronként egy tétellel. Ezért a webhely bejegyzése a következőképpen néz ki:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Számolja ki az eredményeket. Ezeknek az online számításoknak az a vonzó vonása, hogy az adatok megadása után általában csak a "Számítás" gombra kell kattintania, és az eredmények automatikusan megjelennek. A legtöbb webhely megadja az x (avg), y (avg) és n közbenső számítását.

4/4 módszer: A kovariancia eredményeinek értelmezése

  1. Keressen pozitív vagy negatív kapcsolatot. A kovariancia egyetlen statisztikai szám, amely az egyik és a másik adatsor közötti kapcsolatot jelzi. A bevezetőben említett példában megmérik a magasságot és a súlyt. Arra számíthat, hogy az emberek növekedésével a súlyuk is megnő, ami pozitív kovariancia-nézethez vezet. Egy másik példa: Tegyük fel, hogy olyan adatokat gyűjtenek, amelyek jelzik a golfozás óráinak számát és az elért pontszámot. Ebben az esetben negatív kovariancia várható, ami azt jelenti, hogy az edzésórák számának növekedésével a golf pontszáma csökken. (A golfban jobb az alacsonyabb pontszám).
    • Vegyük figyelembe a fent kiszámított mintaadatkészletet. Az ebből adódó kovariancia -8,07. A mínuszjel azt jelenti, hogy az x értékek növekedésével az y értékek általában csökkennek. Néhány értéket megnézve láthatja, hogy ez igaz. Például az 1 és 2 x értékei megfelelnek a 7, 8 és 9 y értékeknek. A 8 és 12 x értékek kapcsolódnak a 3, illetve 2 y értékeihez .
  2. Értelmezze a kovariancia nagyságát. Ha a kovariancia pontszám nagy, akár nagy pozitív, akár nagy negatív szám, akkor ezt két erősen összekapcsolt adatelemként értelmezheti, akár pozitív, akár negatív módon.
    • A mintadatkészlet -8,07 kovarianciája meglehetősen nagy. Vegye figyelembe, hogy az adatok 1 és 12 között mozognak. Tehát a 8 meglehetősen nagy szám. Ez elég szoros kapcsolatot jelez az x és y adatkészletek között.
  3. Értse meg a kapcsolat hiányát. Ha az eredménye 0-val egyenlő vagy nagyon közeli kovariancia, akkor arra a következtetésre juthat, hogy az adatpontok nincsenek kapcsolatban. Vagyis az egyik érték növekedése a másik érték növekedését eredményezheti, de nem feltétlenül. A két kifejezés szinte véletlenszerűen kapcsolódik egymáshoz.
    • Tegyük fel, hogy a cipő méretét viszonyítja a vizsga fokozatokhoz. Mivel nagyon sok tényező befolyásolja a hallgató vizsgajegyzetét, 0-hoz közeli kovariancia-pontszám várható. Ez azt jelzi, hogy a két érték között szinte nincs kapcsolat.
  4. Tekintse meg grafikusan a kapcsolatot. A kovariancia vizuális megértése érdekében ábrázolhatja adatpontjait egy x, y grafikonon. Amikor ezt megteszi, elég könnyen látnia kell, hogy a pontok, bár nem éppen egyenes vonalban, inkább átlós vonalban, balról fentről jobbra lent haladnak. Ez a negatív kovariancia leírása. Láthatja azt is, hogy a kovariancia értéke -8,07. Ez elég nagy szám az adatpontokhoz képest. A magas szám arra utal, hogy a kovariancia meglehetősen erős, amire az adatpontok lineáris alakjából következtethet.
    • Ennek újbóli átéléséhez olvassa el a pontok rajzolásáról szóló cikkeket a wikiHow koordinátarendszerében.

Figyelmeztetések

  • A kovariancia korlátozottan alkalmazható a statisztikákban. Gyakran lépés a korrelációs együtthatók vagy más fogalmak kiszámítása felé. Vigyázzon a kovariancia-pontszámon alapuló túl merész értelmezésekre.