Turgude reegel Selgitus, rakendused ja näited



The Sturges reegel on kriteerium, mida kasutatakse klasside või intervallide arvu määramiseks, mis on vajalikud statistiliste andmete kogumi graafiliseks esitamiseks. Seda reeglit väljendas 1926. aastal saksa matemaatik Herbert Sturges.

Sturges pakkus välja lihtsa meetodi, mis põhineb proovide arvul x, mis võimaldas leida klasside arvu ja nende vahemiku amplituudi. Sturgese reeglit kasutatakse laialdaselt, eriti statistikavaldkonnas, eriti sagedus histogrammide loomiseks.

Indeks

  • 1 Selgitus
  • 2 Rakendused
  • 3 Näide
  • 4 Viited

Selgitus

Sturgese reegel on empiiriline meetod, mida kasutatakse laialdaselt kirjeldavas statistikas, et määrata kindlaks klasside arv, mis peab esinema sagedus-histogrammis, et klassifitseerida proovi või populatsiooni esindavad andmed..

Põhimõtteliselt määrab see reegel graafiliste konteinerite, sageduste histogrammide laiuse.

Oma reegli kehtestamiseks pidas Herbert Sturges ideaalset sagedusdiagrammi, mis koosneb K-intervallidest, kus i-i intervall sisaldab teatud arvu proove (i = 0, ... k - 1), mida esindab:

See proovide arv on antud mitmel viisil, kuidas komplekti alamhulka saab ekstraheerida; see tähendab binomiaalse koefitsiendiga, väljendatuna järgmiselt:

Väljendi lihtsustamiseks rakendas ta võrrandi mõlemas osas logaritmide omadusi:

Seega selgitas Sturges, et optimaalne intervallide arv k on antud väljendiga:

Seda võib väljendada ka järgmiselt:

Selles väljendis:

- k on klasside arv.

- N on proovi vaatluste koguarv.

- Logi on baasi 10 tavaline logaritm.

Näiteks selleks, et teha sagedus histogrammi, mis väljendab juhuslikku valimit 142 lapse kõrgusest, on jaotuste intervallide või klasside arv:

k = 1 + 3,322 * logi10 (N)

k = 1 + 3,322* log (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Seega on jaotus kaheksa intervalliga.

Intervallide arvu peaks alati esindama täisarvudena. Kui väärtus on kümnendkohane, tuleb teha lähima täisarvu ligikaudne arv.

Rakendused

Sturgese reeglit rakendatakse peamiselt statistikas, kuna see võimaldab teha sageduste jaotuse klasside (k) arvu arvutamise teel, samuti nende iga pikkuse, mida tuntakse ka amplituudina.

Amplituud on klassi ülemise ja alumise piiri erinevus, jagatuna klasside arvuga ja väljendatakse:

On palju empiirilisi reegleid, mis võimaldavad teha sagedusjaotuse. Samas kasutatakse tavaliselt Sturgese reeglit, kuna see vastab klasside arvule, mis on tavaliselt vahemikus 5 kuni 15.

Sel viisil arvestage väärtust, mis esindab piisavalt proovi või populatsiooni; see tähendab, et ühtlustamine ei esinda äärmuslikke rühmi, samuti ei tööta see liigse arvu klassidega, mis ei võimalda proovi kokku võtta.

Näide

Vastavalt antud andmetele on vaja läbi viia sagedus histogramm, mis vastab vanuses, mis on saadud kohaliku jõusaali harjutusi tegevate meeste uuringus..

Intervallide määramiseks peate teadma, milline on valimi suurus või vaatluste arv; sellisel juhul on teil 30.

Seejärel kohaldatakse reeglit Sturges:

k = 1 + 3,322 * logi10 (N)

k = 1 + 3,322* log (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 intervalli.

Intervallide arvu põhjal saab arvutada nende amplituudi; see tähendab, et iga sagedus histogrammil oleva riba laius:

Alumist piiri peetakse andmete madalaimaks väärtuseks ja ülemine piir on kõrgeim väärtus. Ülemise ja alumise piiri vahe on muutuja (R) vahemik või tee..

Tabelist leiame, et ülemine piir on 46 ja alumine piir 13; sel viisil on iga klassi amplituud:

Vahemikud koosnevad ülemisest ja alumisest piirist. Nende intervallide määramiseks alustage loendamist alampiirist, lisades sellele reegli (6) poolt määratud amplituudi järgmiselt:

Seejärel arvutatakse absoluutne sagedus, et määrata igale intervallile vastavate meeste arv; sel juhul on:

- Intervall 1: 13 - 18 = 9

- Intervall 2: 19 - 24 = 9

- Intervall 3: 25 - 30 = 5

- Intervall 4: 31 - 36 = 2

- Intervall 5: 37 - 42 = 2

- Intervall 6: 43 - 48 = 3

Iga klassi absoluutse sageduse lisamisel peab see olema võrdne proovi koguarvuga; antud juhul 30.

Seejärel arvutatakse iga intervalli suhteline sagedus, jagades selle intervalli absoluutse sageduse vaatluste koguarvuga:

- Intervall 1: fi = 9 ÷ 30 = 0,30

- Intervall 2: fi = 9 ÷ 30 = 0,30

- Intervall 3: fi = 5 ÷ 30 = 0,1666

- Intervall 4: fi = 2 ÷ 30 = 0,0666

- Intervall 5: fi = 2 ÷ 30 = 0,0666

- Intervall 4: fi = 3 ÷ 30 = 0,10

Seejärel saate koostada tabeli, mis kajastab andmeid ja ka diagrammi suhtelise sageduse põhjal saadud intervallide suhtes, nagu on näha järgmistest piltidest:

Sel viisil lubab Sturgese reegel määrata klasside või intervallide arvu, milles proovi saab jagada, et võtta kokku andmete näidis tabelite ja graafikute ettevalmistamise kaudu..

Viited

  1. Alfonso Urquía, M. V. (2013). Diskreetsete sündmuste modelleerimine ja simuleerimine. UNED,.
  2. Altman Naomi, M. K. (2015). "Lihtne lineaarne regressioon." Loodusmeetodid .
  3. Antúnez, R. J. (2014). Statistika hariduses. Digitaalne UNID.
  4. Fox, J. (1997). Rakendatud regressioonianalüüs, lineaarsed mudelid ja nendega seotud meetodid. SAGE väljaanded.
  5. Humberto Llinás Solano, C. R. (2005). Kirjeldav statistika ja tõenäosusjaotused. Põhjamaade ülikool.
  6. Panteleeva, O. V. (2005). Tõenäosuse ja statistika alused.
  7. O. Kuehl, M. O. (2001). Eksperimentide kavandamine: projekteerimise ja uuringute analüüsi statistilised põhimõtted. Thomsoni toimetajad.