Hogyan kell kiszámítani a kibocsátást

Szerző: Janice Evans
A Teremtés Dátuma: 23 Július 2021
Frissítés Dátuma: 1 Július 2024
Anonim
Hogyan kell kiszámítani a kibocsátást - Társadalom
Hogyan kell kiszámítani a kibocsátást - Társadalom

Tartalom

A statisztikákban a kiugró értékek olyan értékek, amelyek élesen különböznek a gyűjtött adatkészlet többi értékétől. A kiugró értékek anomáliákat jelezhetnek az adatelosztásban vagy a mérési hibákban, ezért a kiugró értékeket gyakran kizárják az adatkészletből. Ha kiküszöböli a kiugró értékeket az adatkészletből, váratlan vagy pontosabb következtetésekre juthat. Ezért ki kell tudni számítani és megbecsülni a kiugró értékeket a statisztikák megfelelő megértésének biztosítása érdekében.

Lépések

  1. 1 Tanulja meg felismerni a potenciális eltéréseket. A potenciális kiugró értékeket meg kell határozni, mielőtt kizárják a kiugró értékeket az adatkészletből. A kiugró értékek olyan értékek, amelyek nagyon eltérnek az adatkészlet legtöbb értékétől; más szóval, a kiugró értékek kívül esnek a legtöbb érték trendjén. Ez könnyen megtalálható az érték táblázatokban vagy (különösen) a grafikonokban. Ha az adatkészlet értékeit ábrázoljuk, akkor a kiugró értékek messze állnak a legtöbb más értéktől. Ha például az értékek nagy része egyenesre esik, akkor a kiugró értékek az ilyen egyenes mindkét oldalán találhatók.
    • Vegyünk például egy adatkészletet, amely a helyiség 12 különböző objektumának hőmérsékletét ábrázolja. Ha 11 tárgy megközelítőleg 70 fokos, de a tizenkettedik objektum (esetleg kemence) 300 fokos, akkor az értékek gyors áttekintése azt jelezheti, hogy a kemence valószínűleg lefúj.
  2. 2 Rendezze az adatokat növekvő sorrendbe. A kiugró értékek meghatározásának első lépése az adathalmaz mediánjának kiszámítása. Ez a feladat nagymértékben leegyszerűsödik, ha az adatkészlet értékei növekvő sorrendben (a legkisebbtől a legnagyobbig) vannak elrendezve.
    • Folytatva a fenti példát, fontolja meg a következő adathalmazt, amely több objektum hőmérsékletét ábrázolja: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ezt a készletet az alábbiak szerint kell megrendelni: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Számítsa ki az adathalmaz mediánját. Az adathalmaz mediánja az adathalmaz közepén lévő érték. Ha az adatkészlet páratlan számú értéket tartalmaz, a medián az az érték, amely előtt és utána ugyanannyi érték található az adatkészletben. De ha az adatkészlet páros értékeket tartalmaz, akkor meg kell találnia a két átlag számtani átlagát. Ne feledje, hogy a kiugró értékek kiszámításakor a mediánt általában Q2 -nek nevezik, mivel a Q1 és Q3, az alsó és felső kvartilis között helyezkedik el, amelyeket később határozunk meg.
    • Ne féljen páros értékű adatkészletekkel dolgozni- a két átlag számtani átlaga olyan szám lesz, amely nem szerepel az adatkészletben; ez normális. De ha a két középérték azonos szám, akkor a számtani átlag megegyezik ezzel a számmal; ez is a dolgok sorrendjében van.
    • A fenti példában a középső 2 érték 70 és 71, tehát a medián ((70 + 71) / 2) = 70,5.
  4. 4 Számítsa ki az alsó kvartiliset. Ez az érték, amelyet Q1 -nek neveznek, alatta van az adathalmaz értékeinek 25% -a. Más szóval, ez az értékek fele a mediánig. Ha a medián előtt páros számú érték található az adatkészletben, meg kell találnia a két átlag számtani átlagát a Q1 kiszámításához (ez hasonló a medián kiszámításához).
    • Példánkban 6 érték található a medián után és 6 érték- előtte. Ez azt jelenti, hogy az alsó kvartilis kiszámításához meg kell találnunk a medián előtt álló hat érték két átlagának számtani átlagát. Itt az átlagértékek 70 és 70. Így Q1 = ((70 + 70) / 2) = 70.
  5. 5 Számítsa ki a felső kvartilit. Ez az érték, amelyet Q3 -nak neveznek, meghaladja az adathalmaz értékeinek 25% -át. A Q3 kiszámításának folyamata hasonló a Q1 számítási folyamathoz, de itt a medián utáni értékeket vesszük figyelembe.
    • A fenti példában a hat két átlaga a medián után 71 és 72. Tehát Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Számítsa ki az interkvartilis tartományt. A Q1 és Q3 kiszámítása után meg kell találni az értékek közötti távolságot. Ehhez vonja le a Q1 -et a Q3 -ból. Az interkvartilis tartomány értéke rendkívül fontos azon értékek határainak meghatározásához, amelyek nem kívülállók.
    • Példánkban Q1 = 70 és Q3 = 71,5. Az interkvartilis tartomány 71,5 - 70 = 1,5.
    • Vegye figyelembe, hogy ez vonatkozik a negatív Q1 és Q3 értékekre is. Például, ha Q1 = -70, akkor az interkvartilis tartomány 71,5 -(-70) = 141,5.
  7. 7 Keresse meg az adathalmaz értékeinek "belső határait". A kiugró értékeket az értékek elemzésével határozzák meg- függetlenül attól, hogy az úgynevezett "belső határok" és "külső határok" közé esnek-e. A „belső határokon” kívül eső értékeket „kisebb kiugrónak”, míg a „külső határokon” kívüli értékeket „jelentős kiugrónak” minősítik. A belső határok megtalálásához meg kell szorozni az interkvartilis tartományt 1,5 -tel; az eredményt hozzá kell adni a Q3 -hoz, és ki kell vonni a Q1 -ből. A talált két szám az adathalmaz belső határa.
    • Példánkban az interkvartilis tartomány (71,5 - 70) = 1,5. Továbbá: 1,5 * 1,5 = 2,25. Ezt a számot hozzá kell adni a Q3 -hoz, és el kell vonni a Q1 -ből, hogy megtaláljuk a belső határokat:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Így a belső határok 67,75 és 73,75.
    • Példánkban csak a kemence hőmérséklete - 300 fok - esik ezeken a határokon kívül, és jelentéktelen kibocsátásnak tekinthető. De ne vonja le a következtetéseket - meg kell határoznunk, hogy ez a hőmérséklet jelentős kiugró érték.
  8. 8 Keresse meg az adathalmaz "külső határait". Ez ugyanúgy történik, mint a belső határoknál, azzal a különbséggel, hogy az interkvartilis tartományt 1,5 helyett 3 -mal szorozzuk. Az eredményt hozzá kell adni a Q3 -hoz, és ki kell vonni a Q1 -ből. A talált két szám az adatkészlet külső határa.
    • Példánkban szorozzuk meg az interkvartilis tartományt 3: 1,5 * 3 = 4,5 -tel. Számítsa ki a külső határokat:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Tehát a külső határok 65,5 és 76.
    • Minden olyan érték, amely kívül esik a külső határokon, jelentős kibocsátásnak minősül. Példánkban a kemence 300 fokos hőmérséklete jelentős lefújásnak minősül.
  9. 9 Minőségi becsléssel határozza meg, hogy a kiugró értékeket ki kell -e zárni az adatkészletből. A fent leírt módszer lehetővé teszi annak meghatározását, hogy egyes értékek kiugróak (kisebbek vagy szignifikánsak). Tévedés ne essék - a kiugrónak minősített érték csak kivételként „jelölt”, vagyis nem kell kizárnia. A kiugró ok oka a fő tényező, amely befolyásolja a kiugró érték kizárásáról szóló döntést. Általában a hibákból (mérések, felvételek stb.) Eredő kiugró értékeket ki kell zárni. Másrészt a nem hibákkal, hanem új információkkal vagy trendekkel járó kiugró értékek általában az adathalmazban maradnak.
    • Ugyanilyen fontos értékelni a kiugró értékek hatását az adathalmaz mediánjára (akár torzítják, akár nem). Ez különösen akkor fontos, ha következtetéseket von le egy adathalmaz mediánjából.
    • Példánkban rendkívül valószínűtlen, hogy a sütő felmelegszik 300 fokos hőmérsékletre (kivéve, ha figyelembe vesszük a természetes anomáliákat). Ezért arra lehet következtetni (nagy biztonsággal), hogy az ilyen hőmérséklet olyan mérési hiba, amelyet ki kell zárni az adatkészletből. Továbbá, ha nem zárja ki a kiugró értéket, akkor az adathalmaz mediánja (69 + 69 + 70 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 fok, de ha kizárja a kiugró értéket, a medián (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 fok lesz.
      • A kiugró értékek általában emberi hibák következményei, ezért a kiugró értékeket ki kell zárni az adatkészletekből.
  10. 10 Ismerje meg az adathalmazban maradt (néha) kiugró értékek fontosságát. Néhány kiugró értéket ki kell zárni az adatkészletből, mivel azok hibákból és technikai problémákból származnak; egyéb kiugró értékeket hagyni kell az adatkészletben. Ha például a kiugró érték nem hiba eredménye, és / vagy új megértést nyújt a vizsgált jelenségről, akkor azt ki kell hagyni az adatkészletben. A tudományos kísérletek különösen érzékenyek a kiugró értékekre - ha tévesen kiküszöbölnek egy kiugró értéket, akkor lemaradhatnak valamilyen új trendről vagy felfedezésről.
    • Például kifejlesztünk egy új gyógyszert a halak méretének növelésére a halászatban. A régi adatkészletet fogjuk használni ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), de ezúttal minden érték a hal súlyát (grammban) jelöli lenyelés után kísérleti gyógyszer. Más szóval, az első gyógyszer a halak súlyának 71 g -ig történő növekedéséhez vezet, a második gyógyszer - 70 g -ig stb. Ebben a helyzetben a 300 jelentős kiugró érték, de nem zárhatjuk ki; ha feltételezzük, hogy nem voltak mérési hibák, akkor az ilyen kiugró érték jelentős siker a kísérletben. A gyógyszer, amely a hal súlyát 300 grammra növelte, sokkal jobban működik, mint más gyógyszerek; így a 300 a legfontosabb érték az adathalmazban.

Tippek

  • Ha eltéréseket talál, próbálja megmagyarázni jelenlétüket, mielőtt kizárja őket az adatkészletből. Mérési hibákat vagy eloszlási anomáliákat jelezhetnek.

Mire van szükséged

  • Számológép