A variancia kiszámításának módjai

Szerző: Robert Simon
A Teremtés Dátuma: 21 Június 2021
Frissítés Dátuma: 1 Július 2024
Anonim
A variancia kiszámításának módjai - Tippek
A variancia kiszámításának módjai - Tippek

Tartalom

A variancia az adatkészlet szétszórtságát méri. Nagyon hasznos statisztikai modellek felépítésében: az alacsony szórás jelezheti, hogy véletlenszerű hibát vagy zajt ír le az adatok mögöttes viszonya helyett. Ezzel a cikkel a wikiHow megtanítja a szórás kiszámítására.

Lépések

1/2 módszer: Számítsa ki a minta szórását

  1. Írja meg a mintaadatkészletet. A legtöbb esetben a statisztikusok csak az általuk vizsgált populáció egy mintájára vagy részhalmazára vonatkoznak. Például ahelyett, hogy általános elemzést végezne "az összes németországi autó költségéről", egy statisztikus megtalálhatja néhány ezer autó véletlenszerű mintájának költségeit. Ez a statisztikus felhasználhatja ezt a mintát, hogy jó becslést kapjon a németországi autóköltségekről. Valószínűbb azonban, hogy nem fog pontosan egyezni a tényleges számokkal.
    • Például: A kávéházban napi eladott muffinok számának elemzése során véletlenszerű hatnapos mintát vett, és a következő eredményeket kapta: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Ez egy minta, nem egy populáció, mert nincsenek adatai a bolt nyitva tartásának minden napjáról.
    • Ha minden Adatpontok a masterben, kérjük, lépjen az alábbi módszerre.

  2. Írja le a minta variancia képletét. Az adatkészlet szórása jelzi az adatpontok szóródásának mértékét. Minél közelebb van a szórás a nullához, annál közelebb vannak csoportosítva az adatpontok. Ha mintaadatkészletekkel dolgozik, használja a következő képletet a variancia kiszámításához:
    • = /(n - 1)
    • a variancia. A varianciát mindig négyzetegységekben számolják.
    • értéket képvisel az adatkészletben.
    • Az sum, azaz "összeg", azt mondja, hogy kiszámolja az egyes paramétereket a következő paraméterekhez, majd adja hozzá őket.
    • x̅ a minta átlaga.
    • n az adatpontok száma.

  3. Számítsa ki a minta átlagát. Az x̅ vagy az „x-horizontal” szimbólum a minta átlagának jelzésére szolgál. Számítson úgy, mint bármely átlagban: adja össze az összes adatpontot, és ossza el a pontok számával.
    • Például: Először adja össze az adatpontokat: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Ezután ossza el az eredményt az adatpontok számával, ez esetben hat: 84 ÷ 6 = 14.
      Minta átlag = x̅ = 14.
    • A középértékre gondolhat, mint az adatok "középpontjára". Ha az adatok középre kerülnek, akkor a szórás alacsony. Ha messze vannak az átlagtól, akkor nagy a szórás.

  4. Minden adatpontból vonjuk le az átlagot. Itt az ideje, hogy kiszámoljuk - x -, ahol az adathalmaz minden egyes pontja található. Minden eredmény jelzi az egyes megfelelő pontok átlagától való eltérést, vagy leegyszerűsítve a távolságot az átlagtól.
    • Például:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x = 9 - 14 = -5
      - x = 13-14 = -1
    • Nagyon egyszerű ellenőrizni a számításokat, mert az eredményeknek nullára kell összegezniük, mert az átlag definíciója szerint a negatív eredmények (az átlagtól a kis számokig terjedő távolság) a pozitív eredmények (távolság az átlagtól a nagyobb számig) teljesen megszűnnek.
  5. Az összes eredmény négyzete. Amint azt fentebb megjegyeztük, az aktuális eltérési lista (- x̅) értéke nulla. Ez azt jelenti, hogy az "átlagos eltérés" is mindig nulla lesz, és az adatok szétszóródásáról semmit sem lehet mondani. A probléma megoldásához megkeressük az egyes eltérések négyzetét. Ennek köszönhetően mind pozitív számok, a negatív és a pozitív értékek már nem mondják le egymást, és nulla értéket adnak az összegnek.
    • Például:
      (- x)
      - x)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Mostantól (- x̅) van a minta minden adatpontjára.
  6. Keresse meg a négyzetes értékek összegét. Itt az ideje, hogy kiszámoljuk a képlet teljes számlálóját: ∑. A nagy cikló, requires megköveteli, hogy minden értékhez adja hozzá a következő elemértéket. A (- x () értéket kiszámította a minta minden értékéhez, így csak annyit kell tennie, hogy csak összeadja az eredményeket.
    • Például: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Osszuk el n - 1 értékkel, ahol n az adatpontok száma. Régen, a minta varianciájának kiszámításakor a statisztikusok csak n-vel osztottak. Ez a felosztás megadja a négyzeteltérés átlagát, amely pontosan megegyezik az adott minta varianciájával. Ne feledje azonban, hogy a minta csak egy nagyobb populáció becslése. Ha újabb véletlenszerű mintát vesz, és ugyanazt a számítást hajtja végre, akkor más eredményt kap. Mint kiderült, n helyett n-vel osztva n helyett jobban becsülhetjük a nagyobb populáció varianciáját - ami valóban érdekel. Ez a korrekció annyira gyakori, hogy ma már a minta variancia elfogadott meghatározása.
    • Például: A mintában hat adatpont van, tehát n = 6.
      Minta szórás = 33,2
  8. A variancia és a szórás megértése. Vegye figyelembe, hogy mivel a képletben vannak erők, a varianciát az eredeti adatok egységeinek négyzetében mérjük. Ez vizuálisan zavaró. Ehelyett gyakran a szórás elég hasznos. De nincs értelme erőfeszítéseket pazarolni, mivel a szórást a variancia négyzetgyöke határozza meg. Ezért a minta varianciáját kifejezésekben írják, a minta szórását pedig.
    • Például a fenti minta szórása = s = √33,2 = 5,76.
    hirdetés

2/2 módszer: Számítsa ki a populáció varianciáját

  1. A törzsadatkészlettel kezdve. A "népesség" kifejezés az összes releváns megfigyelésre utal. Például, ha a hanoi lakosok életkorát kutatja, akkor a teljes népességbe beletartozik a Hanoiban élő összes személy életkora. Általában táblázatot hozna létre egy ilyen nagy adatkészlethez, de itt van egy kisebb példa adatkészlet:
    • Például: Az akvárium helyiségében pontosan hat akvárium található. Ez a hat tartály a következő számú halat tartalmazza:





  2. Írja le a teljes variancia képletét. Mivel egy populáció tartalmazza az összes szükséges adatot, ez a képlet adja meg a populáció pontos szórását. A statisztikusok a minta varianciától (ami csak becslés) megkülönböztetésére más változókat használnak:
    • σ = /n
    • σ = minta variancia. Ez a rendesen négyzet alakú kolbász. A varianciát négyzetegységekben mérjük.
    • egy elemet képvisel az adatkészletben.
    • A ∑ elemet minden értékhez kiszámítják, majd összeadják.
    • μ a teljes átlag.
    • n a populáció adatpontjainak száma.
  3. Keresse meg a népesség átlagát. Egy populáció elemzésekor a μ ("mu") szimbólum a számtani átlagot jelenti. Az átlag megtalálásához összesítse az összes adatpontot, majd ossza el a pontok számával.
    • Gondolhat arra, hogy "átlag", de légy óvatos, mert a szónak sok matematikai meghatározása van.
    • Például: átlagérték = μ = = 10,5
  4. Minden adatpontból vonjuk le az átlagot. Az átlaghoz közelebb eső adatpontok nullához közelebb vannak. Ismételje meg az összes adatpont kivonási problémáját, és valószínűleg érezni fogja az adatok szétszóródását.
    • Például:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Jelölje be az egyes táblákat. Ezen a ponton az előző lépésből származó eredmények negatívak, mások pozitívak lesznek.Ha izomorf vonalon jeleníti meg az adatokat, akkor ez a két elem az átlagtól balra és jobbra jelöli a számokat. Ez nem lenne hasznos a variancia kiszámításában, mivel ez a két csoport kizárja egymást. Ehelyett jelölje be mindet, hogy pozitívak legyenek.
    • Például:
      (- μ) minden egyes értékre én 1-től 6-ig tart:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Keresse meg az eredmények átlagát. Mostantól minden adatponthoz tartozik egy érték, amely (nem közvetlenül) kapcsolatban áll azzal, hogy az adott adatpont milyen messze van az átlagtól. Átlag, ha összeadjuk őket, és elosztjuk a rendelkezésünkre álló értékek számával.
    • Például:
      Általános variancia = 24,25
  7. Kapcsolattartó recept. Ha nem biztos abban, hogy ez hogyan illeszkedik a módszer elején vázolt képlethez, írja le kézzel az egész problémát, és ne rövidítse:
    • Miután megtalálta a különbséget az átlagtól és a négyzetből, megkapja (- μ), (- μ) és így tovább (- μ) -ig, hol van az utolsó adatpont. az adatkészletben.
    • Ezen értékek átlagának megtalálásához adjuk össze és osszuk el n-vel: ((- μ) + (- μ) + ... + (- μ)) / n
    • Miután a számlálót sigmoid jelöléssel átírta, meg kell /n, képlet variancia.
    hirdetés

Tanács

  • Mivel a varianciát nehéz értelmezni, ezt az értéket gyakran kiszámítják a standard eltérés megállapításának kiindulópontjaként.
  • A nevezőben az "n-1" helyett az "n" helyett egy Bessel-korrekciónak nevezett technika. A minta csak egy teljes populáció becslése, és a minta átlaga bizonyos becsléssel illeszkedik ehhez a becsléshez. Ez a korrekció kiküszöböli a fenti torzítást. Arra vonatkozik, hogy ha n - 1 adatpontot számolnak fel, az utolsó th pontot n konstans volt, mert csak bizonyos értékeket használtunk a minta átlagának (x̅) kiszámításához a variancia képletben.