Null at alternatibong hypotheses. Mga istatistikal na hypotheses at pamantayan Pamantayan sa pagsubok ng hypothesis

Sa batayan ng mga datos na nakolekta sa mga pag-aaral sa istatistika, pagkatapos ng kanilang pagproseso, ang mga konklusyon ay iginuhit tungkol sa mga pinag-aralan na phenomena. Ang mga konklusyon na ito ay ginawa sa pamamagitan ng paglalagay ng pasulong at pagsubok ng mga istatistikal na hypotheses.

Istatistikong hypothesis anumang pahayag tungkol sa anyo o katangian ng distribusyon ng mga random na variable na naobserbahan sa eksperimento ay tinatawag. Ang mga istatistikal na hypotheses ay sinusuri sa pamamagitan ng mga istatistikal na pamamaraan.

Ang hypothesis na susuriin ay tinatawag pangunahing (zero) at ipinapahiwatig H 0 . Bilang karagdagan sa zero, mayroon din alternatibong (kumpetensyang) hypothesis H 1, negating ang pangunahing . Kaya, bilang resulta ng pagsubok, isa at isa lamang sa mga hypotheses ang tatanggapin , at ang pangalawa ay tatanggihan.

Mga uri ng error. Ang iniharap na hypothesis ay nasubok sa batayan ng isang pag-aaral ng isang sample na nakuha mula sa pangkalahatang populasyon. Dahil sa randomness ng sample, ang pagsubok ay hindi palaging nakakakuha ng tamang konklusyon. Sa kasong ito, maaaring mangyari ang mga sumusunod na sitwasyon:
1. Ang pangunahing hypothesis ay totoo at ito ay tinatanggap.
2. Ang pangunahing hypothesis ay totoo, ngunit ito ay tinanggihan.
3. Ang pangunahing hypothesis ay hindi totoo at ito ay tinanggihan.
4. Ang pangunahing hypothesis ay hindi totoo, ngunit ito ay tinatanggap.
Sa kaso 2, ang isa ay nagsasalita ng pagkakamali ng unang uri, sa huling kaso ito ay pagkakamali ng pangalawang uri.
Kaya, para sa ilang mga sample, ang tamang desisyon ay ginawa, at para sa iba, ang mali. Ang desisyon ay ginawa ayon sa halaga ng ilang sampling function, na tinatawag istatistikal na katangian, istatistikal na pamantayan o simple lang mga istatistika. Ang hanay ng mga halaga ng istatistikang ito ay maaaring hatiin sa dalawang hindi magkakapatong na subset:

  • H 0 ay tinatanggap (hindi tinanggihan), tinatawag lugar ng pagtanggap ng hypothesis (pinahihintulutang lugar);
  • subset ng mga halaga ng istatistika kung saan ang hypothesis H 0 ay tinanggihan (rejected) at ang hypothesis ay tinatanggap H 1 ang tinatawag kritikal na lugar.

Mga konklusyon:

  1. pamantayan ay tinatawag na random variable K , na nagpapahintulot sa iyo na tanggapin o tanggihan ang null hypothesis H0 .
  2. Kapag sinusuri ang mga hypotheses, maaaring gumawa ng mga error ng 2 uri.
    Type I error ay tanggihan ang hypothesis H 0 kung ito ay totoo ("laktawan ang target"). Ang posibilidad ng paggawa ng Type I error ay tinutukoy ng α at tinatawag lebel ng kahalagahan. Kadalasan sa pagsasanay ay ipinapalagay na α = 0.05 o α = 0.01.
    Uri II error ay ang hypothesis na H0 ay tinatanggap kung ito ay mali ("false positive"). Ang posibilidad ng ganitong uri ng error ay tinutukoy ng β.

Pag-uuri ng hypothesis

Pangunahing hypothesis H 0 tungkol sa halaga ng hindi kilalang parameter q ng pamamahagi ay karaniwang ganito:
H 0: q \u003d q 0.
Kumpetisyon ng hypothesis H Maaaring ganito ang hitsura ng 1:
H 1: q < q 0 , H 1:q> q 0 o H 1: qq 0 .
Alinsunod dito, lumalabas ito kaliwang bahagi, kanang bahagi o bilateral mga kritikal na lugar. Mga hangganan ng mga kritikal na rehiyon ( kritikal na mga punto) ay tinutukoy mula sa mga talahanayan ng pamamahagi ng mga nauugnay na istatistika.

Kapag sinusubukan ang isang hypothesis, makatwirang bawasan ang posibilidad na makagawa ng mga maling desisyon. Pinahihintulutang Uri I Error Probability karaniwang tinutukoy a at tinawag lebel ng kahalagahan. Karaniwang maliit ang halaga nito ( 0,1, 0,05, 0,01, 0,001 ...). Ngunit ang pagbaba sa posibilidad ng isang uri 1 na error ay humahantong sa isang pagtaas sa posibilidad ng isang uri 2 na error ( b), ibig sabihin. ang pagnanais na tanggapin lamang ang mga totoong hypotheses ay nagdudulot ng pagtaas sa bilang ng mga tinanggihang tamang hypotheses. Samakatuwid, ang pagpili ng antas ng kahalagahan ay tinutukoy ng kahalagahan ng problemang ibinabanta at ang kalubhaan ng mga kahihinatnan ng isang maling desisyon.
Ang pagsubok sa isang istatistikal na hypothesis ay binubuo ng mga sumusunod na hakbang:
1) kahulugan ng mga hypotheses H 0 at H 1 ;
2) pagpili ng mga istatistika at pagtatalaga ng antas ng kahalagahan;
3) kahulugan ng mga kritikal na puntos K cr at kritikal na lugar;
4) pagkalkula ng halaga ng mga istatistika mula sa sample K ex;
5) paghahambing ng halaga ng istatistika sa kritikal na rehiyon ( K cr at K ex);
6) paggawa ng desisyon: kung ang halaga ng istatistika ay hindi kasama sa kritikal na rehiyon, kung gayon ang hypothesis ay tinatanggap H 0 at tanggihan ang hypothesis H 1 , at kung ito ay pumasok sa kritikal na rehiyon, ang hypothesis ay tinatanggihan H 0 at tinanggap ang hypothesis H isa. Kasabay nito, ang mga resulta ng pagsubok sa istatistikal na hypothesis ay dapat bigyang-kahulugan bilang mga sumusunod: kung ang hypothesis ay tinanggap H 1 , pagkatapos ay maaari nating isaalang-alang ito na napatunayan, at kung tatanggapin natin ang hypothesis H 0 , pagkatapos ay kinikilala na hindi ito sumasalungat sa mga resulta ng mga obserbasyon. Gayunpaman, ang ari-arian na ito, kasama ng H 0 ay maaaring may iba pang mga hypotheses.

Pag-uuri ng Pagsusulit sa Hypothesis

Isaalang-alang pa natin ang ilang iba't ibang istatistikal na hypotheses at mekanismo para sa pagsubok sa kanila.
ako) Hypothesis ng General Mean ng Normal Distribution na may Hindi Alam na Variance. Ipinapalagay namin na ang pangkalahatang populasyon ay may normal na distribusyon, ang ibig sabihin at pagkakaiba nito ay hindi alam, ngunit may dahilan upang maniwala na ang pangkalahatang average ay katumbas ng isang . Sa antas ng kabuluhan ng α, kinakailangang subukan ang hypothesis H 0: x=a. Bilang kahalili, maaaring gamitin ang isa sa tatlong hypotheses na tinalakay sa itaas. Sa kasong ito, ang istatistika ay isang random na variable , na mayroong distribusyon ng Mag-aaral na may n– 1 antas ng kalayaan. Ang katumbas na pang-eksperimentong (naobserbahan) na halaga ay tinutukoy t ex t cr H 1: x >a ito ay matatagpuan sa pamamagitan ng antas ng kahalagahan α at ang bilang ng mga antas ng kalayaan n– 1. Kung t ex < t cr H 1: x ≠a ang kritikal na halaga ay matatagpuan mula sa antas ng kahalagahan α / 2 at ang parehong bilang ng mga antas ng kalayaan. Ang null hypothesis ay tinatanggap kung | t dating | II) Ang hypothesis ng pagkakapantay-pantay ng dalawang paraan ng arbitrarily distributed pangkalahatang populasyon (malaking independent sample). Sa antas ng kabuluhan ng α, kinakailangang subukan ang hypothesis H 0:x≠y. Kung ang dami ng parehong mga sample ay malaki, maaari nating ipagpalagay na ang ibig sabihin ng sample ay may normal na distribusyon, at ang kanilang mga pagkakaiba ay kilala. Sa kasong ito, ang isang random na variable ay maaaring gamitin bilang isang istatistika
,
pagkakaroon ng normal na distribusyon, at M(Z) = 0, D(Z) = 1. Natutukoy ang katumbas na pang-eksperimentong halaga z ex. Mula sa talahanayan ng Laplace function, ang kritikal na halaga ay matatagpuan z cr. Sa ilalim ng alternatibong hypothesis H 1: x >y ito ay matatagpuan mula sa kundisyon F(z cr) = 0,5 – a. Kung ang z ex< z кр , pagkatapos ay ang null hypothesis ay tinatanggap, kung hindi, ito ay tinanggihan. Sa ilalim ng alternatibong hypothesis H 1: x ≠ y ang kritikal na halaga ay matatagpuan mula sa kundisyon F(z cr) = 0.5×(1 – a). Ang null hypothesis ay tinatanggap kung | z dating |< z кр .

III) Ang hypothesis ng pagkakapantay-pantay ng dalawang paraan ng karaniwang distributed na pangkalahatang populasyon, ang mga pagkakaiba-iba nito ay hindi alam at pareho (maliit na independiyenteng mga sample). Sa antas ng kahalagahan ng α, kinakailangang subukan ang pangunahing hypothesis H 0: x=y . Bilang isang istatistika, gumagamit kami ng isang random na variable
,
na mayroong distribusyon ng Mag-aaral na may ( n x + n– 2) antas ng kalayaan. Natutukoy ang katumbas na pang-eksperimentong halaga t ex. Mula sa talahanayan ng mga kritikal na punto ng pamamahagi ng Mag-aaral, ang kritikal na halaga ay matatagpuan t cr. Ang lahat ay nalulutas katulad ng hypothesis (I).

IV) Ang hypothesis ng pagkakapantay-pantay ng dalawang variance ng mga normal na distributed na populasyon. Sa kasong ito, sa antas ng kahalagahan a kailangang subukan ang hypothesis H 0: D(X) = D(Y). Ang istatistika ay isang random na variable , na mayroong Fisher-Snedecor distribution na may f 1 = n b– 1 at f 2 = n m- 1 degree ng kalayaan (S 2 b - malaking pagkakaiba, ang dami ng sample nito n b). Ang katumbas na pang-eksperimentong (naobserbahan) na halaga ay tinutukoy F ex. kritikal na halaga F cr sa ilalim ng alternatibong hypothesis H 1: D(X) > D(Y) ay matatagpuan mula sa talahanayan ng mga kritikal na punto ng pamamahagi ng Fisher-Snedecor ayon sa antas ng kahalagahan a at ang bilang ng mga antas ng kalayaan f 1 at f 2. Ang null hypothesis ay tinatanggap kung F ex < F cr.

Pagtuturo. Para sa pagkalkula, dapat mong tukuyin ang dimensyon ng source data.

V) Ang hypothesis ng pagkakapantay-pantay ng ilang pagkakaiba-iba ng mga normal na distributed na populasyon sa mga sample na may parehong laki. Sa kasong ito, sa antas ng kahalagahan a kailangang subukan ang hypothesis H 0: D(X 1) = D(X 2) = …= D(Xl). Ang istatistika ay isang random na variable , na mayroong pamamahagi ng Cochran na may mga antas ng kalayaan f = n– 1 at l (n- ang laki ng bawat sample, l ay ang bilang ng mga sample). Ang hypothesis na ito ay nasubok sa parehong paraan tulad ng nauna. Ginagamit ang talahanayan ng mga kritikal na punto ng pamamahagi ng Cochran.

vi) Hypothesis tungkol sa kahalagahan ng ugnayan. Sa kasong ito, sa antas ng kahalagahan a kailangang subukan ang hypothesis H 0: r= 0. (Kung ang koepisyent ng ugnayan ay katumbas ng zero, kung gayon ang mga katumbas na dami ay hindi nauugnay sa isa't isa). Sa kasong ito, ang istatistika ay isang random na variable
,
pagkakaroon ng isang Student's distribution na may f = n– 2 antas ng kalayaan. Ang pagpapatunay ng hypothesis na ito ay isinasagawa katulad ng pagpapatunay ng hypothesis (I).

Pagtuturo. Tukuyin ang dami ng source data.

VII) Hypothesis tungkol sa halaga ng posibilidad ng paglitaw ng isang kaganapan. Sapat na malaking bilang ng n mga independiyenteng pagsubok kung saan ang kaganapan PERO nangyari m minsan. May dahilan upang maniwala na ang posibilidad na mangyari ang kaganapang ito sa isang pagsubok ay katumbas ng p 0. Kinakailangan sa antas ng kahalagahan a subukan ang hypothesis na ang posibilidad ng isang kaganapan PERO katumbas ng hypothetical na posibilidad p 0. (Dahil ang probabilidad ay tinatantya ng relatibong dalas, ang nasubok na hypothesis ay maaaring iba-iba ang formula: ang naobserbahang kamag-anak na dalas at ang hypothetical na posibilidad ay malaki ang pagkakaiba o hindi).
Ang bilang ng mga pagsubok ay medyo malaki, kaya ang relatibong dalas ng kaganapan PERO ipinamahagi ayon sa normal na batas. Kung totoo ang null hypothesis, ang inaasahang halaga nito ay p 0, at ang pagkakaiba . Alinsunod dito, bilang isang istatistika, pumili kami ng isang random na variable
,
na ibinahagi nang humigit-kumulang ayon sa normal na batas na may zero mathematical expectation at unit variance. Ang hypothesis na ito ay nasubok sa eksaktong parehong paraan tulad ng sa kaso (I).

Pagtuturo. Para sa pagkalkula, dapat mong punan ang paunang data.

Dahil ang mga istatistika bilang isang paraan ng pananaliksik ay tumatalakay sa data kung saan ang mga pattern ng interes ng mananaliksik ay binaluktot ng iba't ibang random na salik, karamihan sa mga istatistikal na kalkulasyon ay sinasamahan ng pagsubok ng ilang mga pagpapalagay o hypotheses tungkol sa pinagmulan ng mga datos na ito.

Pedagogical hypothesis (pang-agham na hypothesis isang pahayag tungkol sa kalamangan ng isang paraan o iba pa) ay isinalin sa wika ng istatistikal na agham sa proseso ng istatistikal na pagsusuri at muling binabalangkas sa hindi bababa sa dalawang istatistikal na hypotheses.

Mayroong dalawang uri ng hypotheses: ang unang uri - naglalarawan hypotheses na naglalarawan ng mga sanhi at posibleng kahihinatnan. Ang pangalawang uri - nagpapaliwanag : nagbibigay ang mga ito ng paliwanag sa mga posibleng kahihinatnan ng ilang mga dahilan, at nailalarawan din ang mga kondisyon kung saan ang mga kahihinatnan na ito ay kinakailangang sundin, ibig sabihin, ito ay ipinaliwanag sa pamamagitan ng kung anong mga kadahilanan at kundisyon ang magiging kahihinatnan na ito. Ang mga mapaglarawang hypotheses ay walang foresight, habang ang mga explanatory hypotheses ay mayroon. Ang mga paliwanag na hypotheses ay humahantong sa mga mananaliksik na ipalagay ang pagkakaroon ng ilang mga regular na ugnayan sa pagitan ng mga phenomena, salik at kundisyon.

Ang mga hypotheses sa pedagogical na pananaliksik ay maaaring magmungkahi na ang isa sa mga paraan (o isang grupo ng mga ito) ay magiging mas epektibo kaysa sa iba pang paraan. Dito, hypothetically, ang isang pagpapalagay ay ginawa tungkol sa paghahambing na pagiging epektibo ng mga paraan, pamamaraan, pamamaraan, anyo ng edukasyon.

Ang isang mas mataas na antas ng hypothetical prediction ay ang hypothesize ng may-akda ng pag-aaral na ang ilang sistema ng mga panukala ay hindi lamang magiging mas mahusay kaysa sa isa pa, ngunit sa ilang posibleng mga sistema ay tila pinakamainam sa mga tuntunin ng ilang pamantayan. Ang ganitong haka-haka ay nangangailangan ng mas mahigpit at samakatuwid ay mas detalyadong patunay.

Kulaichev A.P. Mga pamamaraan at tool para sa pagsusuri ng data sa kapaligiran ng Windows. Ed. Ika-3, binago. at karagdagang - M: InKo, 1999, pp. 129-131

Sikolohikal-pedagogical na diksyunaryo para sa mga guro at pinuno ng mga institusyong pang-edukasyon. - Rostov-n / D: Phoenix, 1998, p. 92

Ang sample na data na nakuha sa mga pag-aaral ay palaging limitado at higit sa lahat ay random. Iyon ang dahilan kung bakit ginagamit ang mga istatistika ng matematika upang pag-aralan ang naturang data, na ginagawang posible na gawing pangkalahatan ang mga pattern na nakuha sa sample at i-extend ang mga ito sa buong pangkalahatang populasyon.

Muli naming binibigyang-diin na ang data na nakuha bilang resulta ng eksperimento sa anumang sample ay nagsisilbing batayan para sa paghatol sa pangkalahatang populasyon. Gayunpaman, dahil sa pagkilos ng mga random na probabilistikong dahilan, ang pagtatantya ng mga parameter ng pangkalahatang populasyon, na ginawa batay sa eksperimental (pumipili) na data, ay palaging sasamahan ng isang error, at samakatuwid ang mga naturang pagtatantya ay dapat ituring bilang haka-haka, at hindi bilang mga huling pahayag.

Bilang G.V. Sukhodolsky: "Ang isang istatistikal na hypothesis ay karaniwang nauunawaan bilang isang pormal na pagpapalagay na ang pagkakatulad (o pagkakaiba) ng ilang parametric o functional na mga katangian ay random o, sa kabaligtaran, hindi random." Katulad Ang mga pagpapalagay tungkol sa mga katangian at parameter ng pangkalahatang populasyon, ang pagkakaiba sa pagitan ng mga sample o ang relasyon sa pagitan ng mga tampok ay tinatawag na statistical hypotheses.

Ang kakanyahan ng pagsubok sa isang istatistikal na hypothesis ay upang matukoy kung ang pang-eksperimentong data at ang hypothesis na iniharap ay pare-pareho, pinapayagan bang iugnay ang pagkakaiba sa pagitan ng hypothesis at ang resulta ng istatistikal na pagsusuri ng eksperimentong data sa mga random na dahilan? Kaya, ang istatistikal na hypothesis ay isang siyentipikong hypothesis na nagpapahintulot sa istatistikal na pagsubok, at ang matematikal na istatistika ay isang siyentipikong disiplina, na ang gawain ay ang siyentipikong batay sa pagsusuri ng mga istatistikal na hypotheses.

Kapag sinusuri ang mga istatistikal na hypotheses, dalawang konsepto ang ginagamit: ang tinatawag na null (notation H 0) at isang alternatibong hypothesis (notation H 1).

Kapag inihambing ang mga pamamahagi, ipinapalagay na null hypothesis H 0 ay isang pagkakatulad hypothesis, at alternatibo H 1 - pagkakaiba ng hypothesis. Kaya, ang pagpapatibay ng null hypothesis H 0 ay nagpapahiwatig ng kawalan ng mga pagkakaiba, at ang hypothesis H 1 ay nagpapahiwatig ng pagkakaroon ng mga pagkakaiba.

Halimbawa, dalawang sample ang kinukuha mula sa mga normal na distributed na populasyon at tayo ay nahaharap sa gawain ng paghahambing ng mga sample na ito. Ang isang sample ay may mga parameter at σ 1 , at ang iba pang mga parameter at σ 2 . Null hypothesis H 0 nanggaling sa palagay na = at σ 1 = σ 2 , iyon ay, ang pagkakaiba sa pagitan ng dalawang average =0 at ang pagkakaiba ng dalawang standard deviations σ 1 σ 2 ,=0 (kaya ang pangalan ng hypothesis - null).

Pagtanggap ng alternatibong hypothesis H 1 ay nagpapahiwatig ng pagkakaroon ng mga pagkakaiba at nagpapatuloy mula sa pagpapalagay na ≠0 at σ 1 σ 2 ,≠0.


Kadalasan, tinatawag ang alternatibong hypothesis pang-eksperimentong hypothesis, kung ang pag-aaral ay naglalayong patunayan ang pagkakaroon ng mga pagkakaiba sa pagitan ng mga sample. Kung nais patunayan ng mananaliksik ang kawalan ng mga pagkakaiba, kung gayon ang null hypothesis ay ang experimental hypothesis.

Kapag naghahambing ng mga sample, ang mga alternatibong istatistikal na hypotheses ay maaaring itinuro o hindi itinuro.

Kung napansin namin na sa isang sample ang mga indibidwal na halaga ng mga paksa para sa anumang katangian ay mas mataas, at sa isa pa - mas mababa, pagkatapos ay upang suriin ang mga pagkakaiba sa pagitan ng mga sample, bumalangkas kami. direksyong hypothesis . Kung gusto nating patunayan na ang mas malinaw na mga pagbabago ay naganap sa isang grupo sa ilalim ng impluwensya ng ilang mga pang-eksperimentong impluwensya, kinakailangan din na bumalangkas ng nakadirekta na hypothesis. Pormal, ito ay nakasulat bilang H 1: Lumampas ang x 1 sa x 2. Ang null hypothesis ay ganito ang hitsura: H 0: x 1 ay hindi lalampas sa x 2.

Kung gusto naming patunayan na ang mga form ng pamamahagi ay iba, pagkatapos ay bumalangkas kami hindi nakadirekta hypotheses . Pormal, isinulat ang mga ito bilang H 1: Iba ang x 1 sa x 2. Null hypothesis H 0: Ang x 1 ay kapareho ng x 2.

Sa pangkalahatan, kapag tinatanggap o tinatanggihan ang mga hypotheses, iba't ibang mga opsyon ang posible.

Kapag sinusubukan ang isang hypothesis, ang pang-eksperimentong data ay maaaring sumalungat sa hypothesis H 0, pagkatapos ang hypothesis na ito ay tinanggihan. Kung hindi, i.e. kung ang pang-eksperimentong data ay pare-pareho sa hypothesis H 0, hindi ito tinatanggihan. Kadalasan sa ganitong mga kaso sinasabi na ang hypothesis H 0 ay tinatanggap (bagaman ang pagbabalangkas na ito ay hindi ganap na tumpak, ngunit ito ay malawakang ginagamit). Ipinapakita nito na ang istatistikal na pagsubok ng mga hypotheses batay sa eksperimental, pumipiling data ay hindi maiiwasang nauugnay sa panganib (probability) ng paggawa ng maling desisyon. Sa kasong ito, posible ang mga error ng dalawang uri. Type I error nangyayari kapag ang desisyon ay ginawa upang tanggihan ang hypothesis H 0 , bagaman sa katotohanan ito ay lumalabas na totoo. Uri II error ay magaganap kapag ang isang desisyon ay ginawa na huwag tanggihan ang hypothesis H 0 , bagaman sa katotohanan ito ay magiging mali. Malinaw, ang mga tamang konklusyon ay maaari ding makuha sa dalawang kaso. Ang nasa itaas ay maaaring ipakita sa anyo ng talahanayan 25.

5. Pangunahing problema ng mga inilapat na istatistika - paglalarawan ng data, pagtatantya at pagsubok ng mga hypotheses

Mga Pangunahing Konsepto na Ginamit sa Pagsusuri sa Hypothesis

Statistical hypothesis - anumang pagpapalagay tungkol sa hindi kilalang distribusyon ng mga random na variable (mga elemento). Narito ang mga pormulasyon ng ilang statistical hypotheses:

1. Ang mga resulta ng mga obserbasyon ay may normal na distribusyon na may zero na inaasahan sa matematika.
2. Ang mga resulta ng mga obserbasyon ay may function ng pamamahagi N(0,1).
3. Ang mga resulta ng mga obserbasyon ay may normal na distribusyon.
4. Ang mga resulta ng mga obserbasyon sa dalawang independiyenteng sample ay may parehong normal na distribusyon.
5. Ang mga resulta ng mga obserbasyon sa dalawang independyenteng mga sample ay may parehong distribusyon.

May mga null at alternatibong hypotheses. Ang null hypothesis ay ang hypothesis na susuriin. Ang alternatibong hypothesis ay ang bawat wastong hypothesis maliban sa null hypothesis. Ang null hypothesis ay H 0 , alternatibo - H 1(mula sa Hypothesis - "hypothesis" (Ingles)).

Ang pagpili ng isa o isa pang null o alternatibong hypotheses ay tinutukoy ng mga inilapat na gawain na kinakaharap ng manager, ekonomista, engineer, researcher. Isaalang-alang ang mga halimbawa.

Halimbawa 11. Hayaang ang null hypothesis ay hypothesis 2 mula sa listahan sa itaas, at ang alternatibong hypothesis ay hypothesis 1. Nangangahulugan ito na ang totoong sitwasyon ay inilalarawan ng isang probabilistikong modelo, ayon sa kung saan ang mga resulta ng mga obserbasyon ay isinasaalang-alang bilang mga pagsasakatuparan ng mga independiyenteng magkaparehong distributed na mga random na variable na may function ng pamamahagi N(0,σ), kung saan ang parameter na σ ay hindi alam ng statistician. Sa modelong ito, ang null hypothesis ay nakasulat tulad ng sumusunod:

H 0: σ = 1,

at isang alternatibo tulad nito:

H 1: σ ≠ 1.

Halimbawa 12. Hayaang ang null hypothesis ay hypothesis 2 pa rin mula sa listahan sa itaas, at ang alternatibong hypothesis ay hypothesis 3 mula sa parehong listahan. Pagkatapos, sa isang probabilistikong modelo ng isang sitwasyon sa pamamahala, pang-ekonomiya, o produksyon, ipinapalagay na ang mga resulta ng mga obserbasyon ay bumubuo ng isang sample mula sa isang normal na distribusyon. N(m, σ) para sa ilang mga halaga m at σ. Ang mga hypotheses ay nakasulat tulad nito:

H 0: m= 0, σ = 1

(ang parehong mga parameter ay kumukuha ng mga nakapirming halaga);

H 1: m≠ 0 at/o σ ≠ 1

(i.e. alinman m≠ 0, o σ ≠ 1, o pareho m≠ 0, at σ ≠ 1).

Halimbawa 13 Hayaan H Ang 0 ay hypothesis 1 mula sa listahan sa itaas, at H 1 - hypothesis 3 mula sa parehong listahan. Kung gayon ang probabilistikong modelo ay pareho sa halimbawa 12,

H 0: m= 0, σ ay arbitrary;

H 1: m≠ 0, σ ay arbitrary.

Halimbawa 14 Hayaan H 0 ay hypothesis 2 mula sa listahan sa itaas, at ayon sa H 1 mga resulta ng pagmamasid ay may function ng pamamahagi F(x), hindi tumutugma sa karaniwang normal na distribution function F(x). Pagkatapos

H 0: F(x) = F(x) para sa lahat X(isinulat bilang F(x) ≡ F(x));

H 1: F(x 0) ≠ F (x 0) sa ilang mga x 0(i.e. hindi totoo yan F(x) ≡ F(x)).

Tandaan. Narito ang ≡ ay ang tanda ng magkatulad na pagkakataon ng mga pag-andar (i.e., pagkakataon para sa lahat ng posibleng halaga ng argumento X).

Halimbawa 15 Hayaan H 0 ay hypothesis 3 mula sa listahan sa itaas, at ayon sa H 1 mga resulta ng pagmamasid ay may function ng pamamahagi F(x), hindi pagiging normal. Pagkatapos

Para sa ilang m, σ;

H 1: para sa alinman m, σ meron x 0 = x 0(m, σ) ganoon .

Halimbawa 16 Hayaan H 0 - hypothesis 4 mula sa listahan sa itaas, ayon sa probabilistic model, dalawang sample ang kinukuha mula sa mga populasyon na may mga function ng pamamahagi F(x) at G(x), na normal na may mga parameter m 1 , σ 1 at m 2 , σ 2 ayon sa pagkakabanggit, at H 1 - pagtanggi H 0 . Pagkatapos

H 0: m 1 = m 2 , σ 1 = σ 2 , at m 1 at σ 1 ay arbitrary;

H 1: m 1 ≠ m 2 at/o σ 1 ≠ σ 2 .

Halimbawa 17. Hayaan, sa ilalim ng mga kondisyon ng Halimbawa 16, ito ay karagdagang kilala na σ 1 = σ 2 . Pagkatapos

H 0: m 1 = m 2 , σ > 0, at m 1 at σ ay arbitrary;

H 1: m 1 ≠ m 2 , σ > 0.

Halimbawa 18. Hayaan H 0 - hypothesis 5 mula sa listahan sa itaas, ayon sa probabilistikong modelo, dalawang sample ang nakuha mula sa mga populasyon na may mga function ng pamamahagi F(x) at G(x) ayon sa pagkakabanggit, at H 1 - pagtanggi H 0 . Pagkatapos

H 0: F(x) G(x) , saan F(x)

H 1: F(x) at G(x) ay mga di-makatwirang function ng pamamahagi, at

F(x) G(x) kasama ang ilan X.

Halimbawa 19. Hayaan, sa mga kondisyon ng Halimbawa 17, ito ay karagdagang ipinapalagay na ang pamamahagi ay gumagana F(x) at G(x) naiiba lamang sa shift, i.e. G(x) = F(x- a) sa ilang mga a. Pagkatapos

H 0: F(x) G(x) ,

saan F(x) ay isang arbitrary na function ng pamamahagi;

H 1: G(x) = F(x- a), isang ≠ 0,

saan F(x) ay isang arbitrary na function ng pamamahagi.

Halimbawa 20. Hayaan, sa mga kundisyon ng Halimbawa 14, alam din na ayon sa probabilistikong modelo ng sitwasyon F(x) ay isang normal na distribution function na may unit variance, i.e. may porma N(m, isa). Pagkatapos

H 0: m = 0 (mga. F(x) = F(x)

para sa lahat X); (isinulat bilang F(x) ≡ F(x));

H 1: m 0

(i.e. hindi totoo yan F(x) ≡ F(x)).

Halimbawa 21. Sa istatistikal na regulasyon ng teknolohikal, pang-ekonomiya, pamamahala o iba pang mga proseso, isaalang-alang ang isang sample na kinuha mula sa isang populasyon na may normal na distribusyon at alam na pagkakaiba, at mga hypotheses.

H 0: m = m 0 ,

H 1: m= m 1 ,

kung saan ang halaga ng parameter m = m 0 tumutugma sa itinatag na kurso ng proseso, at ang paglipat sa m= m 1 nagpapahiwatig ng pagkasira.

Halimbawa 22. Gamit ang kontrol sa pagtanggap ng istatistika, ang bilang ng mga may sira na unit ng produkto sa sample ay sumusunod sa isang hypergeometric distribution, ang hindi alam na parameter ay p = D/ N ay ang antas ng depekto, kung saan N- ang dami ng batch ng mga produkto, D- ang kabuuang bilang ng mga may sira na unit sa batch. Ginagamit sa regulasyon, teknikal at komersyal na dokumentasyon (mga pamantayan, mga kontrata ng supply, atbp.), ang mga plano sa pagkontrol ay kadalasang naglalayong subukan ang isang hypothesis

H 0: p < AQL

H 1: p > LQ,

saan AQL - antas ng pagtanggap ng depekto, LQ ay ang antas ng depekto ng mga depekto (malinaw, AQL < LQ).

Halimbawa 23. Bilang mga tagapagpahiwatig ng katatagan ng isang teknolohikal, pang-ekonomiya, pamamahala o iba pang proseso, ang isang bilang ng mga katangian ng mga pamamahagi ng mga kinokontrol na tagapagpahiwatig ay ginagamit, sa partikular, ang koepisyent ng pagkakaiba-iba. v = σ/ M(X). Kailangang subukan ang null hypothesis

H 0: v < v 0

sa ilalim ng alternatibong hypothesis

H 1: v > v 0 ,

saan v 0 ay ilang paunang natukoy na halaga ng hangganan.

Halimbawa 24. Hayaang ang probabilistikong modelo ng dalawang sample ay kapareho ng sa Halimbawa 18, sabihin natin ang mga inaasahan sa matematika ng mga resulta ng mga obserbasyon sa una at pangalawang sample M(X) at M(Sa) ayon sa pagkakabanggit. Sa ilang sitwasyon, sinusuri ang null hypothesis

H 0: M(X) = M(Y)

laban sa alternatibong hypothesis

H 1: M(X) ≠ M(Y).

Halimbawa 25. Sa itaas ay napansin namin ang malaking kahalagahan sa mga istatistika ng matematika ng mga function ng pamamahagi na simetriko na may paggalang sa 0. Kapag sinusuri ang simetrya

H 0: F(- x) = 1 – F(x) para sa lahat x, kung hindi F arbitraryo;

H 1: F(- x 0 ) ≠ 1 – F(x 0 ) sa ilang mga x 0 , kung hindi F arbitraryo.

Sa probabilistic-statistical na mga paraan ng paggawa ng desisyon, maraming iba pang mga pormulasyon ng mga problema para sa pagsubok ng statistical hypotheses ay ginagamit din. Ang ilan sa mga ito ay tinalakay sa ibaba.

Ang tiyak na gawain ng pagsubok ng istatistikal na hypothesis ay ganap na inilalarawan kung ang mga null at alternatibong hypothesis ay ibinigay. Ang pagpili ng isang paraan para sa pagsubok ng istatistikal na hypothesis, ang mga katangian at katangian ng mga pamamaraan ay tinutukoy ng parehong null at alternatibong hypothesis. Upang subukan ang parehong null hypothesis sa ilalim ng iba't ibang alternatibong hypothesis, sa pangkalahatan, iba't ibang mga pamamaraan ang dapat gamitin. Kaya, sa mga halimbawa 14 at 20, ang null hypothesis ay pareho, habang ang mga alternatibo ay iba. Samakatuwid, sa mga kundisyon ng halimbawa 14, ang mga pamamaraan na nakabatay sa mga pamantayan sa akma na may parametric na pamilya (uri ng Kolmogorov o uri ng omega-square) ay dapat gamitin, at sa mga kondisyon ng halimbawa 20, mga pamamaraan batay sa pagsusulit ng Mag-aaral o pagsubok sa Cramer-Welch. Kung, sa mga kondisyon ng halimbawa 14, ang pamantayan ng Mag-aaral ay ginamit, hindi nito malulutas ang mga gawaing itinakda. Kung, sa mga kondisyon ng Halimbawa 20, gumamit kami ng Kolmogorov-type na goodness-of-fit na pagsubok, kung gayon, sa kabaligtaran, malulutas nito ang mga gawaing itinakda, bagaman, marahil, mas masahol pa kaysa sa pamantayan ng Estudyante na espesyal na inangkop para sa kasong ito.

Kapag nagpoproseso ng totoong data, ang tamang pagpili ng mga hypotheses ay napakahalaga. H 0 at H isa. Ang mga pagpapalagay na ginawa, tulad ng normalidad ng pamamahagi, ay dapat na maingat na bigyang-katwiran, lalo na sa pamamagitan ng istatistikal na pamamaraan. Tandaan na sa karamihan ng mga partikular na inilapat na setting, ang distribusyon ng mga resulta ng pagmamasid ay iba sa normal.

Ang isang sitwasyon ay madalas na lumitaw kapag ang anyo ng null hypothesis ay sumusunod mula sa pagbabalangkas ng inilapat na problema, at ang anyo ng alternatibong hypothesis ay hindi malinaw. Sa ganitong mga kaso, dapat isaalang-alang ng isa ang isang alternatibong hypothesis ng pinaka-pangkalahatang anyo at gumamit ng mga pamamaraan na malulutas ang problema para sa lahat ng posible H isa. Sa partikular, kapag sinusuri ang hypothesis 2 (mula sa listahan sa itaas) bilang null, dapat gamitin ng isa bilang alternatibong hypothesis H 1 mula sa halimbawa 14, at hindi mula sa halimbawa 20, kung walang mga espesyal na katwiran para sa normalidad ng pamamahagi ng mga resulta ng mga obserbasyon sa ilalim ng alternatibong hypothesis.

Nakaraang

Ang pagbabalangkas ng mga hypotheses ay nag-systematize ng mga pagpapalagay ng mananaliksik at inilalahad ang mga ito sa isang malinaw, maigsi na paraan. Ang desisyon na kailangang gawin ng mananaliksik ay may kinalaman sa katotohanan o kamalian ng istatistikal na hypothesis. Mayroong dalawang uri ng hypotheses: siyentipiko at istatistika. Siyentipiko Ang hypothesis ay isang iminungkahing solusyon sa isang problema (nakasaad bilang isang theorem). Istatistika Ang hypothesis ay isang pahayag lamang tungkol sa hindi kilalang parameter ng pangkalahatang populasyon (pag-aari ng isang random na variable o kaganapan), na binuo upang subukan ang pagiging maaasahan ng isang relasyon at maaaring ma-verify laban sa mga kilalang sample na istatistika (mga resulta ng pananaliksik, magagamit na empirical data ).

Ang mga statistic hypotheses ay nahahati sa null at alternative, directional at non-directional. Null hypothesis (H 0) ito ay isang hypothesis tungkol sa kawalan ng mga pagkakaiba, kawalan ng impluwensya ng isang kadahilanan, kawalan ng epekto, atbp.. Ito ang dapat na pabulaanan kung tayo ay nahaharap sa tungkuling patunayan ang kahalagahan ng mga pagkakaiba. Alternatibong hypothesis (H 1) ito ay isang hypothesis tungkol sa kahalagahan ng mga pagkakaiba. Ito ang dapat na mapapatunayan, kaya naman kung minsan ay tinatawag itong experimental o working hypothesis.

kanyang sarili ang pamamaraan para sa pagproseso ng nakuhang dami ng data, na binubuo sa pagkalkula ng ilang istatistikal na katangian at mga pagtatantya na nagpapahintulot sa pagsubok sa null hypothesis, ay tinatawag na statistical analysis.

Ang mga null at alternatibong hypotheses ay maaaring itinuro o hindi itinuro. Ang hypothesis ay tinatawag nakadirekta kung naglalaman ito ng indikasyon ng direksyon ng mga pagkakaiba. Ang ganitong mga hypotheses ay dapat na mabuo, halimbawa, kung sakaling sa isa sa mga grupo ang mga indibidwal na halaga ng mga paksa para sa anumang katangian ay mas mataas, at sa iba pang mas mababa, o kinakailangan upang patunayan na sa isa sa mga grupo. sa ilalim ng impluwensya ng anumang pang-eksperimentong mga impluwensyang mas malinaw na mga pagbabago kaysa sa ibang grupo. Ang hypothesis ay tinatawag hindi nakadirekta, kung ang mga salita nito ay ipinapalagay lamang ang kahulugan ng mga pagkakaiba o hindi pagkakaiba (nang hindi nagpapahiwatig ng direksyon ng mga pagkakaiba). Halimbawa, kung kinakailangan upang patunayan, sa dalawang magkaibang grupo ang mga anyo ng pamamahagi ng isang katangian ay naiiba.

Mga halimbawa ng pagbabalangkas ng mga hypotheses.

Ang paraan na ginagamit upang magpasya sa bisa ng isang istatistikal na hypothesis ay tinatawag pagsubok ng hypothesis. Ang pangunahing prinsipyo ng pagsusuri ng hypothesis ay ang null hypothesis ay inilalagay sa harap. H 0, upang subukang pabulaanan ito at sa gayon ay kumpirmahin ang alternatibong hypothesis H 1 .

Kapag sinusuri ang anumang istatistikal na hypothesis, ang desisyon ng mananaliksik ay hindi kailanman ginawa nang may katiyakan, dahil palaging may panganib na makagawa ng maling desisyon.

Kadalasan ang mga sample na ginamit ay maliit at sa mga kasong ito ang posibilidad ng error ay maaaring maging makabuluhan. May tinatawag na antas ng kumpiyansa (significance level) pagkakaiba. Ito ang posibilidad na ang mga pagkakaiba ay itinuturing na makabuluhan, ngunit sila ay talagang random. Iyon ay, ito ay ang posibilidad na tanggihan ang null hypothesis habang ito ay totoo.

Kapag ang mga pagkakaiba ay sinabing makabuluhan sa 5% na antas ng kahalagahan, o sa p£0.05, ang ibig sabihin ay ang posibilidad na ang mga ito ay hindi makabuluhan pagkatapos ng lahat ay 0.05 (ang pinakamababang antas ng istatistikal na kahalagahan). Kung ang isang pagkakaiba ay nakasaad na makabuluhan sa 1% na antas ng kahalagahan, o sa p£0.01, nangangahulugan ito na ang posibilidad na hindi ito makabuluhan pagkatapos ng lahat ay 0.01 (isang sapat na antas ng istatistikal na kahalagahan). Kung ang isang pagkakaiba ay nakasaad na makabuluhan sa 0.1% na antas ng kahalagahan, o sa p£0.001, nangangahulugan ito na ang posibilidad na hindi ito makabuluhan ay 0.001 (ang pinakamataas na antas ng istatistikal na kahalagahan).

Ang tuntunin ng pagtanggi H 0 at pagtanggap H 1:

Kung ang empirical na halaga ng criterion ay katumbas o lumampas sa kritikal na halaga na katumbas ng p £ 0.05, kung gayon H 0 tinanggihan, ngunit hindi pa tiyak na tinatanggap H 1.

Kung ang empirical na halaga ng criterion ay katumbas o lumampas sa kritikal na halaga na katumbas ng p £ 0.01, kung gayon H 0 tinanggihan tinanggap H 1.

Upang mailarawan ang panuntunan ng desisyon, maaari mong gamitin ang tinatawag na "significance axis".

Kung ang antas ng kumpiyansa ay hindi lalampas, kung gayon maaari itong ituring na malamang na ang ipinahayag na pagkakaiba ay talagang sumasalamin sa estado ng mga gawain sa populasyon. Para sa bawat pamamaraan ng istatistika, ang antas na ito ay matatagpuan sa mga talahanayan ng pamamahagi ng mga kritikal na halaga ng kaukulang pamantayan.

T - Ang pamantayan ng mag-aaral

Ito ay isang parametric na paraan na ginagamit upang subukan ang mga hypotheses tungkol sa bisa ng pagkakaiba sa mga paraan kapag sinusuri ang dami ng data sa mga populasyon na may normal na distribusyon at may parehong pagkakaiba. Ito ay mahusay na naaangkop sa kaso ng paghahambing ng mga halaga ng average na random na mga halaga ng sinusukat na katangian sa kontrol at mga eksperimentong grupo, sa iba't ibang pangkat ng kasarian at edad, mga pangkat na may iba pang magkakaibang katangian.

Ang isang kinakailangan para sa applicability ng mga parametric na pamamaraan, kabilang ang Student's t-test, upang patunayan ang statistical hypotheses ay ang pagpapailalim ng empirical distribution ng pinag-aralan na katangian sa normal na distribution law..

Ang pamamaraan ng mag-aaral ay iba para sa mga independyente at umaasa na mga sample.

Independent ang mga sample ay nakukuha sa pamamagitan ng pag-aaral ng dalawang magkaibang grupo ng mga paksa (halimbawa, control at experimental group). Upang umaasa Kasama sa mga sample, halimbawa, ang mga resulta ng parehong pangkat ng mga paksa bago at pagkatapos ng pagkakalantad sa independent variable.

Ang nasubok na hypothesis H 0 ay ang pagkakaiba sa pagitan ng mga paraan ng dalawang sample ay katumbas ng zero ( = 0), sa madaling salita, ito ang hypothesis tungkol sa pagkakapantay-pantay ng mga paraan (). Ang alternatibong hypothesis H 1 ay ang pagkakaibang ito ay hindi zero ( ¹ 0) o may pagkakaiba sa sample na ibig sabihin ().

Kailan mga independiyenteng sample upang pag-aralan ang pagkakaiba sa mga paraan, ginagamit ang pormula: para sa n 1 , n 2 > 30

at pormula para sa n 1, n 2< 30, где

Arithmetic mean ng unang sample;

Arithmetic mean ng pangalawang sample;

s 1 - standard deviation para sa unang sample;

s 2 - standard deviation para sa pangalawang sample;

Ang n 1 at n 2 ay ang bilang ng mga elemento sa una at pangalawang sample.

Upang mahanap ang kritikal na halaga ng t, tinutukoy namin ang bilang ng mga antas ng kalayaan:

n \u003d n 1 - 1 + n 2 - 1 \u003d (n 1 + n 2) - 2 \u003d n - 2.

Kung |t emp | > t cr, pagkatapos ay itinatapon namin ang null hypothesis at tinatanggap ang alternatibo, iyon ay, itinuturing naming maaasahan ang pagkakaiba sa mga average. Kung |t emp |< t кр, то разница средних недостоверна.

Kailan umaasa na mga sample ang sumusunod na formula ay ginagamit upang matukoy ang pagiging maaasahan ng pagkakaiba sa mga paraan: , saan

d– ang pagkakaiba sa pagitan ng mga resulta sa bawat pares (х i – y i);

å d ay ang kabuuan ng mga bahagyang pagkakaibang ito;

å d2 ay ang kabuuan ng mga parisukat na bahagyang pagkakaiba;

n ay ang bilang ng mga pares ng data.

Ang bilang ng mga antas ng kalayaan sa kaso ng mga umaasang sample upang matukoy ang t criterion ay magiging katumbas ng n = n - 1.

Mayroong iba pang mga istatistikal na pamantayan para sa pagsubok ng mga hypotheses, parehong parametric at non-parametric. Halimbawa, isang mathematical-statistical criterion na nagpapahintulot sa isa na hatulan ang mga pagkakatulad at pagkakaiba sa mga dispersion ng mga random na variable ay tinatawag na Fisher criterion.

Pagsusuri ng ugnayan

Sa pinaka-pangkalahatang anyo nito, ang kahulugan ng "kaugnayan" ay tumutukoy sa isang relasyon sa isa't isa. Bagaman, ang pagsasalita tungkol sa ugnayan, ang mga terminong "kaugnayan" at "pagdepende sa ugnayan" ay ginagamit din, na kadalasang ginagamit bilang mga kasingkahulugan.

Sa ilalim ugnayan maunawaan ang mga pinag-ugnay na pagbabago ng dalawa o higit pang mga tampok, i.e. ang pagkakaiba-iba ng isang katangian ay nasa ilang pagkakatugma sa pagkakaiba-iba ng iba.

Pagdepende sa ugnayan ay ang mga pagbabago na ginagawa ng mga halaga ng isang tampok sa posibilidad ng paglitaw ng iba't ibang mga halaga ng isa pang tampok.

Kaya, ang mga pare-parehong pagbabago sa mga katangian at isang ugnayan sa pagitan ng mga ito na sumasalamin dito ay maaaring magpahiwatig na hindi ang pag-asa ng mga katangiang ito sa isa't isa, ngunit ang pag-asa ng parehong mga katangiang ito sa ilang ikatlong katangian o kumbinasyon ng mga katangian na hindi isinasaalang-alang sa pag-aaral.