Regressiya tenglamasi. Ko'p regressiya tenglamasi

Regressiya tahlili - bu parametrning bir yoki bir nechta mustaqil o'zgaruvchilarga bog'liqligini ko'rsatishga imkon beruvchi statistik tadqiqot usuli. Kompyuterdan oldingi davrda, ayniqsa, katta hajmdagi ma'lumotlar haqida gap ketganda, undan foydalanish juda qiyin edi. Bugungi kunda Excelda regressiyani qanday yaratishni o'rganganingizdan so'ng, siz bir necha daqiqada murakkab statistik muammolarni hal qilishingiz mumkin. Quyida iqtisodiyot sohasidan aniq misollar keltirilgan.

Regressiya turlari

Ushbu tushunchaning o'zi 1886 yilda matematikaga kiritilgan. Regressiya sodir bo'ladi:

  • chiziqli;
  • parabolik;
  • quvvat;
  • eksponentsial;
  • giperbolik;
  • ko'rgazmali;
  • logarifmik.

1-misol

6 ta sanoat korxonasida nafaqaga chiqqan jamoa a'zolari sonining o'rtacha ish haqiga bog'liqligini aniqlash muammosini ko'rib chiqing.

Vazifa. Oltita korxonada o‘rtacha oylik ish haqi va o‘z xohishi bilan ketgan xodimlar sonini tahlil qildik. Jadval shaklida bizda:

Ketgan odamlar soni

Ish haqi

30 000 rubl

35 000 rubl

40 000 rubl

45 000 rubl

50 000 rubl

55 000 rubl

60 000 rubl

6 ta korxonada nafaqaga chiqqan ishchilar sonining o'rtacha ish haqiga bog'liqligini aniqlash muammosi uchun regressiya modeli Y = a 0 + a 1 x 1 +…+a k x k tenglama ko'rinishiga ega, bu erda x i - ta'sir qiluvchi o'zgaruvchilar. , a i - regressiya koeffitsientlari, a k - omillar soni.

Ushbu vazifa uchun Y - ketgan xodimlarning ko'rsatkichi, ta'sir etuvchi omil esa ish haqi bo'lib, biz uni X bilan belgilaymiz.

"Excel" elektron jadvalining imkoniyatlaridan foydalanish

Excelda regressiya tahlilidan oldin mavjud jadval ma'lumotlariga o'rnatilgan funktsiyalarni qo'llash kerak. Biroq, bu maqsadlar uchun juda foydali qo'shimcha "Tahlil asboblar to'plami" dan foydalanish yaxshiroqdir. Uni faollashtirish uchun sizga kerak:

  • "Fayl" yorlig'idan "Tanlovlar" bo'limiga o'ting;
  • ochilgan oynada "Qo'shimchalar" qatorini tanlang;
  • "Boshqarish" qatorining o'ng tomonidagi pastki qismida joylashgan "O'tish" tugmasini bosing;
  • "Tahlil paketi" nomining yonidagi katakchani belgilang va "OK" tugmasini bosib harakatlaringizni tasdiqlang.

Har bir narsa to'g'ri bajarilgan bo'lsa, Excel ish varag'i ustida joylashgan Ma'lumotlar yorlig'ining o'ng tomonida kerakli tugma paydo bo'ladi.

Excelda

Endi bizda ekonometrik hisob-kitoblarni amalga oshirish uchun barcha kerakli virtual vositalar mavjud, biz muammoni hal qilishni boshlashimiz mumkin. Buning uchun:

  • "Ma'lumotlarni tahlil qilish" tugmasini bosing;
  • ochilgan oynada "Regressiya" tugmasini bosing;
  • paydo bo'lgan yorliqda Y (ishdan bo'shatilgan xodimlar soni) va X (ularning ish haqi) uchun qiymatlar oralig'ini kiriting;
  • "Ok" tugmasini bosish orqali harakatlarimizni tasdiqlaymiz.

Natijada, dastur avtomatik ravishda elektron jadvalning yangi varag'ini regressiya tahlili ma'lumotlari bilan to'ldiradi. Eslatma! Excel bu maqsadda siz tanlagan joyni qo'lda o'rnatish imkoniyatiga ega. Masalan, bu Y va X qiymatlari joylashgan bir xil varaq yoki hatto bunday ma'lumotlarni saqlash uchun maxsus mo'ljallangan yangi ish kitobi bo'lishi mumkin.

R-kvadrat uchun regressiya natijalarini tahlil qilish

Excelda ko'rib chiqilayotgan misol ma'lumotlarini qayta ishlash jarayonida olingan ma'lumotlar quyidagicha ko'rinadi:

Avvalo, siz R kvadratining qiymatiga e'tibor berishingiz kerak. Bu determinatsiya koeffitsienti. Ushbu misolda R-kvadrat = 0,755 (75,5%), ya'ni modelning hisoblangan parametrlari ko'rib chiqilayotgan parametrlar orasidagi munosabatni 75,5% ga tushuntiradi. Determinatsiya koeffitsientining qiymati qanchalik baland bo'lsa, ma'lum bir vazifa uchun tanlangan model qanchalik qo'llaniladi. R-kvadrat qiymati 0,8 dan yuqori bo'lgan haqiqiy vaziyatni to'g'ri tasvirlaydi, deb ishoniladi. Agar R-kvadrat bo'lsa<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Nisbiy tahlil

64.1428 raqami, agar biz ko'rib chiqayotgan modeldagi barcha xi o'zgaruvchilari nolga teng bo'lsa, Y ning qiymati qanday bo'lishini ko'rsatadi. Boshqacha qilib aytganda, tahlil qilinayotgan parametrning qiymatiga ma'lum bir modelda tavsiflanmagan boshqa omillar ham ta'sir qiladi, deb bahslashish mumkin.

Keyingi koeffitsient -0,16285, B18 katakchasida joylashgan, X o'zgaruvchisining Y ga ta'sirining og'irligini ko'rsatadi. Bu ko'rib chiqilayotgan model doirasidagi xodimlarning o'rtacha oylik ish haqi -0,16285 og'irlikdagi ishdan bo'shaganlar soniga ta'sir qiladi, ya'ni. uning ta'sir darajasi umuman kichik. "-" belgisi koeffitsientning salbiy qiymatga ega ekanligini ko'rsatadi. Bu aniq, chunki korxonada ish haqi qancha yuqori bo'lsa, shunchalik kam odam mehnat shartnomasini bekor qilish yoki ishdan bo'shatish istagini bildirishini hamma biladi.

Ko'p regressiya

Ushbu atama shaklning bir nechta mustaqil o'zgaruvchilari bilan bog'lanish tenglamasini anglatadi:

y \u003d f (x 1 + x 2 + ... x m) + e, bu erda y - samarali xususiyat (qaram o'zgaruvchi) va x 1 , x 2 , ... x m - omil omillari (mustaqil o'zgaruvchilar).

Parametrni baholash

Ko'p regressiya (MR) uchun u eng kichik kvadratlar usuli (OLS) yordamida amalga oshiriladi. Y = a + b 1 x 1 +…+b m x m + e ko‘rinishdagi chiziqli tenglamalar uchun biz normal tenglamalar tizimini tuzamiz (pastga qarang).

Usulning printsipini tushunish uchun ikki faktorli ishni ko'rib chiqing. Keyin formula bilan tasvirlangan vaziyatga egamiz

Bu erdan biz olamiz:

bu erda s - indeksda aks ettirilgan mos keladigan xususiyatning dispersiyasi.

LSM standartlashtiriladigan shkalada MP tenglamasiga qo'llaniladi. Bunday holda, biz tenglamani olamiz:

bu erda t y , t x 1, … t xm - o'rtacha qiymatlari 0 bo'lgan standartlashtirilgan o'zgaruvchilar; b i - standartlashtirilgan regressiya koeffitsientlari, standart og'ish esa 1 ga teng.

E'tibor bering, bu holda barcha b i normallashtirilgan va markazlashtirilgan deb o'rnatiladi, shuning uchun ularni bir-biri bilan taqqoslash to'g'ri va joiz deb hisoblanadi. Bundan tashqari, omillarni filtrlash, bi ning eng kichik qiymatlariga ega bo'lganlarni tashlash odatiy holdir.

Chiziqli regressiya tenglamasidan foydalanish masalasi

Aytaylik, so'nggi 8 oy ichida ma'lum bir N mahsulotining narx dinamikasi jadvali mavjud. Uning partiyasini 1850 rubl / t narxda sotib olishning maqsadga muvofiqligi to'g'risida qaror qabul qilish kerak.

oy raqami

oy nomi

N buyumning narxi

Tonna uchun 1750 rubl

Bir tonna uchun 1755 rubl

Bir tonna uchun 1767 rubl

Bir tonna uchun 1760 rubl

Bir tonna uchun 1770 rubl

Bir tonna uchun 1790 rubl

Bir tonna uchun 1810 rubl

Tonna uchun 1840 rubl

Excel elektron jadvalidagi ushbu muammoni hal qilish uchun yuqoridagi misoldan ma'lum bo'lgan Ma'lumotlarni tahlil qilish vositasidan foydalanishingiz kerak. Keyinchalik, "Regressiya" bo'limini tanlang va parametrlarni o'rnating. Shuni esda tutish kerakki, "Kirish oralig'i Y" maydoniga qaram o'zgaruvchi uchun qiymatlar oralig'i (bu holda yilning ma'lum oylarida mahsulot narxi) kiritilishi kerak va "Kirish" bo'limiga interval X" - mustaqil o'zgaruvchi uchun (oy raqami). "Ok" tugmasini bosish orqali harakatni tasdiqlang. Yangi varaqda (agar shunday ko'rsatilgan bo'lsa), biz regressiya uchun ma'lumotlarni olamiz.

Ularga asoslanib, y=ax+b ko'rinishdagi chiziqli tenglamani tuzamiz, bu erda a va b parametrlari oy raqami nomi va koeffitsientlari va "Y-kesishmasi" qatoridan olingan qator koeffitsientlari. regressiya tahlili natijalari bilan varaq. Shunday qilib, 3-masala uchun chiziqli regressiya tenglamasi (LE) quyidagicha yoziladi:

Mahsulot narxi N = 11.714* oy raqami + 1727.54.

yoki algebraik yozuvda

y = 11,714 x + 1727,54

Natijalarni tahlil qilish

Olingan chiziqli regressiya tenglamasi adekvat yoki yo'qligini aniqlash uchun ko'p korrelyatsiya koeffitsientlari (MCC) va aniqlash koeffitsientlari, shuningdek, Fisher va Student testlari qo'llaniladi. Regressiya natijalari bilan Excel jadvalida ular mos ravishda bir nechta R, R-kvadrat, F-statistik va t-statistik nomlar ostida paydo bo'ladi.

KMC R mustaqil va qaram o'zgaruvchilar o'rtasidagi ehtimollik munosabatlarining mustahkamligini baholash imkonini beradi. Uning yuqori qiymati "Oy soni" va "1 tonna uchun rublda N tovar narxi" o'zgaruvchilari o'rtasida etarlicha kuchli munosabatni ko'rsatadi. Biroq, bu munosabatlarning tabiati noma'lumligicha qolmoqda.

R 2 (RI) aniqlash koeffitsientining kvadrati umumiy tarqalish ulushining raqamli xarakteristikasi bo'lib, eksperimental ma'lumotlarning qaysi qismining tarqalishini ko'rsatadi, ya'ni. qaram o'zgaruvchining qiymatlari chiziqli regressiya tenglamasiga mos keladi. Ko'rib chiqilayotgan masalada bu qiymat 84,8% ga teng, ya'ni olingan SD tomonidan statistik ma'lumotlar yuqori darajada aniqlik bilan tavsiflanadi.

F-statistika, Fisher testi deb ham ataladi, chiziqli munosabatlarning ahamiyatini baholash, uning mavjudligi haqidagi gipotezani rad etish yoki tasdiqlash uchun ishlatiladi.

(Talaba mezoni) chiziqli munosabatlarning noma'lum yoki erkin muddati bilan koeffitsientning ahamiyatini baholashga yordam beradi. Agar t-mezonning qiymati > t cr bo'lsa, chiziqli tenglamaning erkin hadining ahamiyatsizligi haqidagi gipoteza rad etiladi.

Erkin a'zo uchun ko'rib chiqilayotgan muammoda Excel vositalaridan foydalangan holda, t = 169.20903 va p = 2.89E-12, ya'ni bizda erkin a'zoning ahamiyatsizligi haqidagi to'g'ri gipoteza bo'lish ehtimoli nolga teng ekanligi aniqlandi. rad etilgan. Koeffitsient uchun noma'lum t=5,79405, va p=0,001158. Boshqacha qilib aytganda, noma'lum uchun koeffitsientning ahamiyatsizligi haqidagi to'g'ri farazni rad etish ehtimoli 0,12% ni tashkil qiladi.

Shunday qilib, natijada olingan chiziqli regressiya tenglamasi adekvat ekanligini ta'kidlash mumkin.

Aktsiyalar paketini sotib olishning maqsadga muvofiqligi muammosi

Excelda bir nechta regressiya bir xil ma'lumotlarni tahlil qilish vositasi yordamida amalga oshiriladi. Muayyan qo'llaniladigan muammoni ko'rib chiqing.

NNN rahbariyati MMM SA ning 20% ​​ulushini sotib olishning maqsadga muvofiqligi to'g'risida qaror qabul qilishi kerak. Paket (QK) qiymati 70 million AQSH dollarini tashkil etadi. NNN mutaxassislari shunga o'xshash operatsiyalar bo'yicha ma'lumotlarni to'plashdi. Aktsiyalar paketining qiymatini millionlab AQSh dollarida ifodalangan quyidagi parametrlar bo'yicha baholashga qaror qilindi:

  • kreditorlik qarzlari (VK);
  • yillik aylanma (VO);
  • debitorlik qarzlari (VD);
  • asosiy vositalarning qiymati (SOF).

Bundan tashqari, korxonaning ish haqi bo'yicha qarzdorligi (V3 P) ming AQSH dollari parametridan foydalaniladi.

Excel elektron jadvalidan foydalangan holda yechim

Avvalo, siz dastlabki ma'lumotlar jadvalini yaratishingiz kerak. Bu shunday ko'rinadi:

  • "Ma'lumotlarni tahlil qilish" oynasiga qo'ng'iroq qiling;
  • "Regressiya" bo'limini tanlang;
  • "Kirish oralig'i Y" maydoniga G ustunidan qaram o'zgaruvchilar qiymatlari oralig'ini kiriting;
  • "Kirish oralig'i X" oynasining o'ng tomonidagi qizil o'q bilan belgini bosing va varaqdagi B, C, D, F ustunlaridan barcha qiymatlar oralig'ini tanlang.

"Yangi ish varag'i" ni tanlang va "OK" tugmasini bosing.

Berilgan muammo uchun regressiya tahlilini oling.

Natijalar va xulosalarni tekshirish

Excel elektron jadval varag'ida yuqorida keltirilgan yaxlitlangan ma'lumotlardan "biz to'playmiz", regressiya tenglamasi:

SP \u003d 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265,844.

Ko'proq tanish matematik shaklda uni quyidagicha yozish mumkin:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

"MMM" OAJ uchun ma'lumotlar jadvalda keltirilgan:

Ularni regressiya tenglamasiga almashtirsak, ular 64,72 million AQSh dollarini tashkil qiladi. Bu shuni anglatadiki, MMM AJ aktsiyalarini sotib olmaslik kerak, chunki ularning qiymati 70 million AQSH dollari ancha oshirib yuborilgan.

Ko'rib turganingizdek, Excel elektron jadvalidan va regressiya tenglamasidan foydalanish juda aniq bitimning maqsadga muvofiqligi to'g'risida xabardor qaror qabul qilish imkonini berdi.

Endi siz regressiya nima ekanligini bilasiz. Yuqorida muhokama qilingan Exceldagi misollar ekonometriya sohasidagi amaliy masalalarni hal qilishga yordam beradi.

Regressiya va korrelyatsion tahlil - statistik tadqiqot usullari. Bu parametrning bir yoki bir nechta mustaqil o'zgaruvchilarga bog'liqligini ko'rsatishning eng keng tarqalgan usullari.

Quyida, aniq amaliy misollardan foydalanib, iqtisodchilar orasida juda mashhur bo'lgan ushbu ikkita tahlilni ko'rib chiqamiz. Ularni birlashtirganda natijalarni olish misolini ham keltiramiz.

Excelda regressiya tahlili

Ba'zi qiymatlarning (mustaqil, mustaqil) qaram o'zgaruvchiga ta'sirini ko'rsatadi. Masalan, iqtisodiy faol aholi soni qanday korxonalar soniga, ish haqiga va boshqa parametrlarga bog'liq. Yoki: xorijiy investitsiyalar, energiya narxlari va boshqalar YaIM darajasiga qanday ta'sir qiladi.

Tahlil natijasi sizga ustuvorlik berishga imkon beradi. Va asosiy omillarga asoslanib, ustuvor yo'nalishlarni rivojlantirishni bashorat qilish, rejalashtirish, boshqaruv qarorlarini qabul qilish.

Regressiya sodir bo'ladi:

  • chiziqli (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • eksponensial (y = a * exp(bx));
  • quvvat (y = a*x^b);
  • giperbolik (y = b/x + a);
  • logarifmik (y = b * 1n(x) + a);
  • eksponentsial (y = a * b^x).

Excelda regressiya modelini yaratish va natijalarni sharhlash misolini ko'rib chiqing. Regressiyaning chiziqli turini olaylik.

Vazifa. 6 ta korxona bo‘yicha o‘rtacha oylik ish haqi va ishdan ketgan xodimlar soni tahlil qilindi. Pensiyaga chiqqan xodimlar sonining o'rtacha ish haqiga bog'liqligini aniqlash kerak.

Chiziqli regressiya modeli quyidagi shaklga ega:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Bu erda a - regressiya koeffitsientlari, x - ta'sir qiluvchi o'zgaruvchilar va k - omillar soni.

Bizning misolimizda Y - ishdan bo'shatilgan ishchilar ko'rsatkichi. Ta'sir etuvchi omil - bu ish haqi (x).

Excelda chiziqli regressiya modelining parametrlarini hisoblash uchun ishlatilishi mumkin bo'lgan o'rnatilgan funktsiyalar mavjud. Ammo Analysis ToolPak plaginlari buni tezroq bajaradi.

Kuchli tahliliy vositani faollashtiring:

Faollashtirilgandan so'ng, plagin Ma'lumotlar yorlig'ida mavjud bo'ladi.

Endi biz to'g'ridan-to'g'ri regressiya tahlili bilan shug'ullanamiz.



Avvalo, biz R-kvadrat va koeffitsientlarga e'tibor beramiz.

R-kvadrat - determinatsiya koeffitsienti. Bizning misolimizda u 0,755 yoki 75,5% ni tashkil qiladi. Bu shuni anglatadiki, modelning hisoblangan parametrlari o'rganilayotgan parametrlar orasidagi bog'liqlikni 75,5% ga tushuntiradi. Determinatsiya koeffitsienti qanchalik yuqori bo'lsa, model shunchalik yaxshi bo'ladi. Yaxshi - 0,8 dan yuqori. Yomon - 0,5 dan kam (bunday tahlilni oqilona deb hisoblash qiyin). Bizning misolimizda - "yomon emas".

64.1428 koeffitsienti ko'rib chiqilayotgan modeldagi barcha o'zgaruvchilar 0 ga teng bo'lsa Y qanday bo'lishini ko'rsatadi. Ya'ni modelda tavsiflanmagan boshqa omillar ham tahlil qilinayotgan parametr qiymatiga ta'sir qiladi.

-0,16285 koeffitsienti X o'zgaruvchisining Y bo'yicha og'irligini ko'rsatadi. Ya'ni, ushbu model doirasidagi o'rtacha oylik ish haqi -0,16285 og'irlikdagi ishdan bo'shaganlar soniga ta'sir qiladi (bu kichik ta'sir darajasi). "-" belgisi salbiy ta'sirni ko'rsatadi: ish haqi qanchalik yuqori bo'lsa, ishdan bo'shatish shunchalik kam bo'ladi. Qaysi adolatli.



Excelda korrelyatsiya tahlili

Korrelyatsiya tahlili bir yoki ikkita namunadagi ko'rsatkichlar o'rtasida bog'liqlik mavjudligini aniqlashga yordam beradi. Masalan, mashinaning ishlash muddati va ta'mirlash xarajatlari, uskunaning narxi va ishlash muddati, bolalarning bo'yi va vazni va boshqalar.

Agar munosabatlar mavjud bo'lsa, unda bir parametrning o'sishi ikkinchisining o'sishiga (ijobiy korrelyatsiya) yoki kamayishiga (salbiy) olib keladimi. Korrelyatsiya tahlili tahlilchiga bir ko'rsatkichning qiymati boshqasining mumkin bo'lgan qiymatini bashorat qila oladimi yoki yo'qligini aniqlashga yordam beradi.

Korrelyatsiya koeffitsienti r bilan belgilanadi. +1 dan -1 gacha o'zgaradi. Turli sohalar uchun korrelyatsiyalarning tasnifi har xil bo'ladi. Koeffitsient qiymati 0 bo'lsa, namunalar o'rtasida chiziqli bog'liqlik yo'q.

Korrelyatsiya koeffitsientini topish uchun Exceldan qanday foydalanishni ko'rib chiqing.

CORREL funksiyasi juftlashgan koeffitsientlarni topish uchun ishlatiladi.

Vazifa: stanokning ish vaqti va unga texnik xizmat ko'rsatish xarajatlari o'rtasida bog'liqlik mavjudligini aniqlang.

Kursorni istalgan katakchaga qo'ying va fx tugmasini bosing.

  1. "Statistika" toifasida CORREL funksiyasini tanlang.
  2. Argument "1-massiv" - qiymatlarning birinchi diapazoni - mashinaning vaqti: A2: A14.
  3. Argument "2-massiv" - qiymatlarning ikkinchi diapazoni - ta'mirlash narxi: B2: B14. OK tugmasini bosing.

Ulanish turini aniqlash uchun siz koeffitsientning mutlaq soniga qarashingiz kerak (har bir faoliyat sohasi o'z shkalasiga ega).

Bir nechta parametrlarni (2 dan ortiq) korrelyatsion tahlil qilish uchun "Ma'lumotlarni tahlil qilish" ("Analiz paketi" qo'shimchasi) dan foydalanish qulayroqdir. Ro'yxatda siz korrelyatsiyani tanlashingiz va massivni belgilashingiz kerak. Hammasi.

Olingan koeffitsientlar korrelyatsiya matritsasida ko'rsatiladi. Bu kabi:

Korrelyatsiya-regressiya tahlili

Amalda, bu ikki usul ko'pincha birgalikda qo'llaniladi.

Misol:


Endi regressiya tahlili ma'lumotlari ko'rinadi.

Ko'pgina ekonometrik modellarni yaratishda regressiya tahlili yotadi, ular orasida xarajatlarni baholash modellari ham bo'lishi kerak. Baholash modellarini yaratish uchun ushbu usuldan foydalanish mumkin, agar analoglar soni (taqqoslash mumkin bo'lgan ob'ektlar) va xarajat omillari soni (taqqoslash elementlari) bir-biri bilan quyidagicha bog'liq bo'lsa: P> (5 -g-10) x Kimga, bular. xarajat omillaridan 5-10 barobar ko'p analoglar bo'lishi kerak. Ma'lumotlar miqdori va omillar sonining nisbati bo'yicha bir xil talab boshqa vazifalar uchun ham qo'llaniladi: ob'ektning narxi va iste'mol parametrlari o'rtasidagi munosabatni o'rnatish; tuzatuvchi indekslarni hisoblash tartibini asoslash; narx tendentsiyalarini aniqlashtirish; eskirish va ta'sir etuvchi omillarning o'zgarishi o'rtasidagi munosabatni o'rnatish; xarajat standartlarini hisoblash uchun bog'liqliklarni olish va boshqalar. Ushbu talabning bajarilishi tasodifiy o'zgaruvchilarning normal taqsimlanishi talabini qondirmaydigan ma'lumotlar namunasi bilan ishlash ehtimolini kamaytirish uchun zarurdir.

Regressiya munosabatlari faqat bir yoki bir nechta omil o'zgaruvchilarining o'zgarishi natijasida olingan o'zgaruvchining o'rtacha tendentsiyasini aks ettiradi, masalan, joylashuv, xonalar soni, maydon, qavat va boshqalar. Bu regressiya munosabatlari va funktsional munosabatlar o'rtasidagi farq bo'lib, unda olingan o'zgaruvchining qiymati omil o'zgaruvchilarning berilgan qiymati uchun qat'iy belgilangan.

Regressiya munosabatlarining mavjudligi / natijada da va omil o'zgaruvchilari x p ..., x k(omillar) bu bog'liqlik nafaqat tanlangan omil o'zgaruvchilarning ta'siri bilan, balki o'zgaruvchilarning ta'siri bilan ham aniqlanishini ko'rsatadi, ularning ba'zilari umuman noma'lum, boshqalari esa baholanmaydi va hisobga olinmaydi:

Hisobga olinmagan o'zgaruvchilarning ta'siri ushbu tenglamaning ikkinchi hadi bilan belgilanadi ?, bu taxminiy xato deb ataladi.

Regressiyaga bog'liqlikning quyidagi turlari mavjud:

  • ? juftlashgan regressiya - ikki o'zgaruvchi (natijaviy va faktorial) o'rtasidagi munosabat;
  • ? ko'p regressiya - bir natija o'zgaruvchiga va tadqiqotga kiritilgan ikki yoki undan ortiq omil o'zgaruvchilarga bog'liqligi.

Regressiya tahlilining asosiy vazifasi o'zgaruvchilar (juftlashgan regressiyada) va ko'p o'zgaruvchilar (ko'p regressiyada) o'rtasidagi munosabatlarning yaqinligini miqdoriy jihatdan aniqlashdir. O'zaro bog'liqlikning mustahkamligi korrelyatsiya koeffitsienti bilan belgilanadi.

Regressiya tahlilidan foydalanish o'rganilayotgan ko'rsatkichga asosiy omillarning (gedonik xususiyatlar) ta'sirining qonuniyatini ularning jami va ularning har biri alohida aniqlash imkonini beradi. Matematik statistika usuli sifatida regressiya tahlili yordamida, birinchidan, natijaviy (istalgan) o'zgaruvchining faktoriallarga analitik bog'liqlik shaklini topish va tavsiflash, ikkinchidan, ularning yaqinligini baholash mumkin. bu qaramlik.

Birinchi masalani yechish orqali matematik regressiya modeli olinadi, uning yordamida keyinchalik berilgan omil qiymatlari uchun kerakli ko'rsatkich hisoblab chiqiladi. Ikkinchi masalani hal qilish hisoblangan natijaning ishonchliligini aniqlash imkonini beradi.

Shunday qilib, regressiya tahlilini natijaviy va omil o'zgaruvchilari o'rtasidagi munosabatlar shaklining yaqinligi, yo'nalishi va analitik ifodasini o'lchash uchun mo'ljallangan rasmiy (matematik) protseduralar to'plami sifatida belgilash mumkin, ya'ni. Bunday tahlilning natijasi shaklning tarkibiy va miqdoriy jihatdan aniqlangan statistik modeli bo'lishi kerak:

Qayerda y - natijada paydo bo'lgan o'zgaruvchining o'rtacha qiymati (kerakli ko'rsatkich, masalan, xarajat, ijara, kapitallashuv darajasi) ustidan P uning kuzatuvlari; x - omil o'zgaruvchisining qiymati (/-th xarajat omili); Kimga - omil o'zgaruvchilar soni.

Funktsiya f(x l ,...,x lc), hosil boʻlgan oʻzgaruvchining faktoriallarga bogʻliqligini tavsiflovchi regressiya tenglamasi (funksiyasi) deyiladi. "Regressiya" atamasi (regressiya (lat.) - orqaga chekinish, biror narsaga qaytish) usulning shakllanish bosqichida hal qilingan aniq vazifalardan birining o'ziga xos xususiyatlari bilan bog'liq bo'lib, hozirgi vaqtda uning butun mohiyatini aks ettirmaydi. usuli, lekin foydalanishda davom etmoqda.

Regressiya tahlili odatda quyidagi bosqichlarni o'z ichiga oladi:

  • ? bir hil ob'ektlar namunasini shakllantirish va bu ob'ektlar haqida dastlabki ma'lumotlarni yig'ish;
  • ? natijaviy o'zgaruvchiga ta'sir qiluvchi asosiy omillarni tanlash;
  • ? yordamida namunaning normalligini tekshirish X 2 yoki binomial mezon;
  • ? aloqa shakli haqidagi gipotezani qabul qilish;
  • ? matematik ma'lumotlarni qayta ishlash;
  • ? regressiya modelini olish;
  • ? uning statistik ko'rsatkichlarini baholash;
  • ? regressiya modeli yordamida tekshirish hisob-kitoblari;
  • ? natijalarni tahlil qilish.

Belgilangan operatsiyalar ketma-ketligi ham omil o'zgaruvchisi va bitta natijaviy o'zgaruvchi o'rtasidagi juft munosabatlarni, ham natijaviy o'zgaruvchi va bir nechta omil o'zgaruvchilari o'rtasidagi ko'p munosabatlarni o'rganishda amalga oshiriladi.

Regressiya tahlilidan foydalanish dastlabki ma'lumotlarga ma'lum talablarni qo'yadi:

  • ? ob'ektlarning statistik namunasi funktsional va konstruktiv-texnologik jihatdan bir hil bo'lishi kerak;
  • ? juda ko'p;
  • ? o'rganilayotgan xarajat ko'rsatkichi - natijada paydo bo'lgan o'zgaruvchi (narx, tannarx, xarajatlar) - tanlovdagi barcha ob'ektlar uchun uni hisoblash uchun bir xil shartlarga tushirilishi kerak;
  • ? omil o'zgaruvchilari etarlicha aniq o'lchanishi kerak;
  • ? omil o'zgaruvchilari mustaqil yoki minimal bog'liq bo'lishi kerak.

Tanlovning bir xilligi va to'liqligiga qo'yiladigan talablar ziddiyatli: ob'ektlarni tanlash ularning bir xilligiga qarab qanchalik qat'iy amalga oshirilsa, namuna shunchalik kichikroq bo'ladi va aksincha, namunani kattalashtirish uchun ob'ektlarni kiritish kerak. bir-biriga unchalik o'xshamaydi.

Bir hil ob'ektlar guruhi uchun ma'lumotlar to'plangandan so'ng, ular nazariy regressiya chizig'i ko'rinishidagi natijaviy va omil o'zgaruvchilari o'rtasidagi munosabatlar shaklini o'rnatish uchun tahlil qilinadi. Nazariy regressiya chizig'ini topish jarayoni taxminiy egri chiziqni oqilona tanlash va uning tenglamasi koeffitsientlarini hisoblashdan iborat. Regressiya chizig'i - matematik funktsiya yordamida o'rganilayotgan bog'liqlikning umumiy tendentsiyasini tavsiflovchi va yon omillar ta'siridan tartibsiz, tasodifiy chegaralarni tekislaydigan silliq egri chiziq (muayyan holatda, to'g'ri chiziq).

Baholash topshiriqlarida juftlashgan regressiya bog'liqliklarini ko'rsatish uchun ko'pincha quyidagi funktsiyalar qo'llaniladi: chiziqli - y - a 0 + ars + s kuch - y - aj&i + c ko'rgazmali - y - chiziqli eksponensial - y - a 0 + ar * + s. Bu yerga - e hisobga olinmagan tasodifiy omillarning ta'siridan kelib chiqqan taxminiy xato.

Bu funksiyalarda y natijaviy o‘zgaruvchidir; x - omil o'zgaruvchisi (omil); A 0 , a r a 2 - regressiya modeli parametrlari, regressiya koeffitsientlari.

Chiziqli eksponensial model shaklning gibrid modellari deb ataladigan sinfga tegishli:

Qayerda

qaerda x (i = 1, /) - omillar qiymatlari;

b t (i = 0, /) regressiya tenglamasining koeffitsientlari.

Ushbu tenglamada komponentlar A, B Va Z baholanayotgan aktivning alohida tarkibiy qismlarining qiymatiga mos keladi, masalan, er uchastkasining qiymati va obodonlashtirish xarajatlari va parametr Q keng tarqalgan. U joylashuv kabi umumiy ta'sir qiluvchi omil bo'yicha baholanayotgan aktivning barcha komponentlari qiymatini moslashtirish uchun mo'ljallangan.

Tegishli koeffitsientlar darajasida bo'lgan omillarning qiymatlari ikkilik o'zgaruvchilardir (0 yoki 1). Daraja asosidagi omillar diskret yoki uzluksiz o'zgaruvchilardir.

Ko'paytirish belgisi koeffitsientlari bilan bog'liq omillar ham uzluksiz yoki diskretdir.

Spetsifikatsiya, qoida tariqasida, empirik yondashuv yordamida amalga oshiriladi va ikki bosqichni o'z ichiga oladi:

  • ? regressiya maydonining nuqtalarini grafikda chizish;
  • ? mumkin bo'lgan yaqinlashuvchi egri chiziq turini grafik (vizual) tahlil qilish.

Regressiya egri chizig'ining turini har doim ham darhol tanlab bo'lmaydi. Uni aniqlash uchun regressiya maydonining nuqtalari dastlabki ma'lumotlarga ko'ra birinchi navbatda grafikda chiziladi. Keyin nuqtalarning holati bo'ylab vizual ravishda chiziq chiziladi, ulanishning sifat naqshini aniqlashga harakat qilinadi: bir xil o'sish yoki bir xil pasayish, dinamika tezligining oshishi (pasayishi) bilan o'sish (kamayish), unga silliq yondashish. ma'lum bir daraja.

Ushbu empirik yondashuv o'rganilayotgan omillarning iqtisodiy va jismoniy tabiati va ularning o'zaro ta'siri haqidagi allaqachon ma'lum bo'lgan g'oyalardan boshlab, mantiqiy tahlil bilan to'ldiriladi.

Masalan, ma'lumki, natijada paydo bo'ladigan o'zgaruvchilar - iqtisodiy ko'rsatkichlar (narxlar, ijara haqi) bir qator omillar o'zgaruvchilari - narx hosil qiluvchi omillarga (aholi punkti markazidan masofa, hudud va boshqalar) bog'liqliklari chiziqli emas. , va ular kuchli, eksponensial yoki kvadratik funktsiya bilan aniq tasvirlanishi mumkin. Ammo omillarning kichik diapazonlari bilan maqbul natijalarni chiziqli funktsiya yordamida ham olish mumkin.

Agar biron bir funktsiyani darhol ishonchli tanlashning iloji bo'lmasa, u holda ikkita yoki uchta funktsiya tanlanadi, ularning parametrlari hisoblab chiqiladi, so'ngra ulanishning mustahkamligi uchun tegishli mezonlardan foydalanib, funksiya nihoyat tanlanadi.

Nazariy jihatdan egri chiziq shaklini topishning regressiya jarayoni deyiladi spetsifikatsiya model va uning koeffitsientlari - kalibrlash modellar.

Agar natijada y o'zgaruvchisi bir nechta omil o'zgaruvchilarga (omillarga) bog'liq ekanligi aniqlansa x ( , x 2 , ..., x k, keyin ular ko'p regressiya modelini yaratishga murojaat qilishadi. Odatda, bir nechta aloqaning uchta shakli qo'llaniladi: chiziqli - y - a 0 + a x x x + a^x 2 + ... + a k x k, ko'rgazmali - y - a 0 a*i a x t- a x b, kuch - y - a 0 x x ix 2 a 2. .x^ yoki ularning birikmalari.

Eksponensial va eksponensial funksiyalar ko'proq universaldir, chunki ular baholashda o'rganilgan bog'liqliklarning aksariyati bo'lgan chiziqli bo'lmagan munosabatlarga yaqinlashadi. Bundan tashqari, ular ob'ektlarni baholashda va ommaviy baholash uchun statistik modellashtirish usulida va tuzatish omillarini belgilashda individual baholashda to'g'ridan-to'g'ri taqqoslash usulida qo'llanilishi mumkin.

Kalibrlash bosqichida regressiya modelining parametrlari eng kichik kvadratlar usuli bilan hisoblanadi, uning mohiyati shundan iboratki, natijada olingan o'zgaruvchining hisoblangan qiymatlarining kvadratik og'ishlarining yig'indisi. da., ya'ni. Tanlangan munosabatlar tenglamasi bo'yicha hisoblangan haqiqiy qiymatlardan minimal bo'lishi kerak:

j) qiymatlari (. va y. ma'lum, shuning uchun Q faqat tenglamaning koeffitsientlarining funksiyasidir. Minimalni topish uchun S qisman hosilalarni oling Q tenglamaning koeffitsientlari bo'yicha va ularni nolga tenglashtiring:

Natijada, biz normal tenglamalar tizimini olamiz, ularning soni kerakli regressiya tenglamasining aniqlangan koeffitsientlari soniga teng.

Faraz qilaylik, chiziqli tenglamaning koeffitsientlarini topishimiz kerak y - a 0 + ars. Kvadrat og'ishlar yig'indisi:

/=1

Funktsiyani farqlash Q noma'lum koeffitsientlar bo'yicha a 0 va qisman hosilalarni nolga tenglashtiring:

O'zgarishlardan so'ng biz quyidagilarni olamiz:

Qayerda P - asl haqiqiy qiymatlar soni da ular (analoglar soni).

Regressiya tenglamasining koeffitsientlarini hisoblashning yuqoridagi tartibi chiziqli bo'lmagan bog'liqliklar uchun ham qo'llaniladi, agar bu bog'liqliklar chiziqli bo'lishi mumkin bo'lsa, ya'ni. o'zgaruvchilarning o'zgarishi yordamida chiziqli shaklga keltiring. Logarifm olingandan so'ng kuch va ko'rsatkichli funktsiyalar va o'zgaruvchilarning tegishli o'zgarishi chiziqli shaklga ega bo'ladi. Masalan, logarifm olingandan keyin quvvat funktsiyasi quyidagi shaklni oladi: y \u003d 1n 0 +a x 1ph. O'zgaruvchilar o'zgargandan keyin Y- In y, L 0 - In va № X- X da biz chiziqli funktsiyani olamiz

Y=A0 + cijX, ularning koeffitsientlari yuqorida ko'rsatilgandek topiladi.

Ko'p regressiya modelining koeffitsientlarini hisoblash uchun eng kichik kvadratlar usuli ham qo'llaniladi. Shunday qilib, ikkita o'zgaruvchili chiziqli funktsiyani hisoblash uchun normal tenglamalar tizimi Xj Va x 2 bir qator o'zgarishlardan so'ng, u quyidagicha ko'rinadi:

Odatda bu tenglamalar tizimi chiziqli algebra usullari yordamida echiladi. Bir nechta eksponensial funktsiya logarifmlarni olish va o'zgaruvchilarni juftlashgan eksponensial funktsiya kabi o'zgartirish orqali chiziqli ko'rinishga keltiriladi.

Gibrid modellardan foydalanganda ketma-ket yaqinlashish usulining raqamli protseduralari yordamida bir nechta regressiya koeffitsientlari topiladi.

Bir nechta regressiya tenglamalaridan yakuniy tanlovni amalga oshirish uchun korrelyatsiya koeffitsienti, dispersiya va o'zgarish koeffitsienti bilan o'lchanadigan ulanishning zichligi uchun har bir tenglamani tekshirish kerak. Baholash uchun siz Student va Fisher mezonlaridan ham foydalanishingiz mumkin. Bog'lanishning qattiqligi qanchalik katta bo'lsa, egri chiziqni ochib beradi, boshqa barcha narsalar teng bo'lgan afzalroqdir.

Agar bunday sinf muammosi hal qilinayotgan bo'lsa, xarajat ko'rsatkichining xarajat omillariga bog'liqligini aniqlash zarur bo'lganda, iloji boricha ko'proq ta'sir etuvchi omillarni hisobga olish va shu bilan yanada aniqroq ko'p regressiya modelini yaratish istagi. tushunarli. Biroq, ikkita ob'ektiv cheklovlar omillar sonining kengayishiga to'sqinlik qiladi. Birinchidan, bir nechta regressiya modelini yaratish juftlashgan modelni qurishdan ko'ra ko'proq ob'ektlar namunasini talab qiladi. Namunadagi ob'ektlar soni sonidan oshib ketishi odatda qabul qilinadi P omillar, kamida 5-10 marta. Bundan kelib chiqadiki, uchta ta'sir etuvchi omilga ega modelni qurish uchun turli xil omillar qiymatlari to'plamiga ega bo'lgan taxminan 20 ta ob'ektdan namuna to'plash kerak. Ikkinchidan, model uchun tanlangan omillar qiymat ko'rsatkichiga ta'sirida bir-biridan etarlicha mustaqil bo'lishi kerak. Buni ta'minlash oson emas, chunki namuna odatda bir oilaga mansub ob'ektlarni birlashtiradi, bunda ob'ektdan ob'ektga ko'plab omillar muntazam ravishda o'zgaradi.

Regressiya modellarining sifati odatda quyidagi statistika yordamida tekshiriladi.

Regressiya tenglamasining standart og'ishi xatosi (baholash xatosi):

Qayerda P - namuna hajmi (analoglar soni);

Kimga - omillar soni (xarajat omillari);

Regressiya tenglamasi bilan izohlanmagan xato (3.2-rasm);

y. - olingan o'zgaruvchining haqiqiy qiymati (masalan, xarajat); y t - olingan o'zgaruvchining hisoblangan qiymati.

Bu ko'rsatkich ham deyiladi standart baholash xatosi (RMS xatosi). Rasmda nuqtalar namunaning o'ziga xos qiymatlarini ko'rsatadi, belgi namunaning o'rtacha qiymatlari chizig'ini ko'rsatadi, eğimli chiziqli nuqta - regressiya chizig'i.


Guruch. 3.2.

Baholash xatosining standart og'ishi y ning haqiqiy qiymatlarining tegishli hisoblangan qiymatlardan og'ish miqdorini o'lchaydi. da( , regressiya modeli yordamida olingan. Agar model qurilgan namuna normal taqsimot qonuniga bo'ysunsa, u holda haqiqiy qiymatlarning 68% ni ta'kidlash mumkin. da oralig'ida da ± &e regressiya chizig'idan va 95% - diapazonda da ± 2d e. Bu ko'rsatkich qulay, chunki o'lchov birliklari sg? o'lchov birliklarini moslashtiring da,. Shu munosabat bilan, u baholash jarayonida olingan natijaning to'g'riligini ko'rsatish uchun ishlatilishi mumkin. Misol uchun, qiymat sertifikatida siz bozor qiymatining regressiya modeli yordamida olinganligini ko'rsatishingiz mumkin V dan 95% gacha bo'lgan ehtimollik bilan (V-2d,.) oldin (da + 2ds).

Olingan o'zgaruvchining o'zgarish koeffitsienti:

Qayerda y - hosil bo'lgan o'zgaruvchining o'rtacha qiymati (3.2-rasm).

Regressiya tahlilida variatsiya koeffitsienti var natijaning standart og'ishi bo'lib, natija o'zgaruvchisining o'rtacha foizida ifodalanadi. O'zgaruvchanlik koeffitsienti natijada paydo bo'lgan regressiya modelining bashoratli fazilatlari uchun mezon bo'lib xizmat qilishi mumkin: qiymat qanchalik kichik bo'lsa. var, modelning bashoratli sifatlari qanchalik yuqori bo'lsa. Variatsiya koeffitsientidan foydalanish &e ko'rsatkichidan afzalroq, chunki u nisbiy ko'rsatkichdir. Ushbu ko'rsatkichdan amaliy foydalanishda o'zgaruvchanlik koeffitsienti 33% dan oshadigan modeldan foydalanmaslik tavsiya qilinishi mumkin, chunki bu holda bu namunalar normal taqsimot qonuniga bo'ysunadi deb aytish mumkin emas.

Aniqlash koeffitsienti (ko'p korrelyatsiya koeffitsienti kvadrati):

Ushbu ko'rsatkich natijada olingan regressiya modelining umumiy sifatini tahlil qilish uchun ishlatiladi. Bu modelga kiritilgan barcha omil o'zgaruvchilari ta'siridan kelib chiqadigan o'zgaruvchining o'zgarishining necha foizini ko'rsatadi. Aniqlash koeffitsienti har doim noldan birgacha bo'lgan oraliqda joylashgan. Determinatsiya koeffitsientining qiymati birlikka qanchalik yaqin bo'lsa, model dastlabki ma'lumotlar seriyasini shunchalik yaxshi tasvirlaydi. Determinatsiya koeffitsienti boshqa yo'l bilan ifodalanishi mumkin:

Bu xato regressiya modeli bilan izohlanadi,

A - tushunarsiz xato

regressiya modeli. Iqtisodiy nuqtai nazardan, bu mezon regressiya tenglamasi bilan narx o'zgarishining necha foizi tushuntirilganligini aniqlash imkonini beradi.

Ko'rsatkichni aniq qabul qilish chegarasi R2 barcha holatlar uchun aniqlab bo'lmaydi. Namuna hajmini ham, tenglamaning mazmunli talqinini ham hisobga olish kerak. Qoida tariqasida, bir xil turdagi ob'ektlar to'g'risidagi ma'lumotlarni o'rganishda, taxminan bir vaqtning o'zida olingan qiymat R2 0,6-0,7 darajadan oshmaydi. Agar barcha bashorat xatolar nolga teng bo'lsa, ya'ni. natijaviy va omil o'zgaruvchilar o'rtasidagi munosabatlar funktsional bo'lsa, u holda R2 =1.

Tuzatilgan aniqlash koeffitsienti:

Tuzatilgan determinatsiya koeffitsientini joriy etish zarurati omillar sonining ko'payishi bilan izohlanadi. Kimga odatiy aniqlash koeffitsienti deyarli har doim oshadi, lekin erkinlik darajalari soni kamayadi (n - k- 1). Kiritilgan sozlash har doim qiymatni pasaytiradi R2, chunki (P - 1) > (n-dan -gacha) 1). Natijada, qiymat R 2 CKOf) hatto salbiy bo'lishi mumkin. Bu qiymat degan ma'noni anglatadi R2 tuzatishdan oldin nolga yaqin edi va o'zgaruvchining regressiya tenglamasi bilan izohlangan dispersiya nisbati da juda kichik.

Tuzatilgan determinatsiya koeffitsienti qiymatida bir-biridan farq qiluvchi, lekin bir xil darajada yaxshi boshqa sifat mezonlariga ega bo'lgan regressiya modellarining ikkita variantidan tuzatilgan aniqlash koeffitsientining katta qiymatiga ega variant afzalroqdir. Determinatsiya koeffitsienti tuzatilmaydi, agar (n - k): k> 20.

Fisher nisbati:

Ushbu mezon aniqlash koeffitsientining ahamiyatini baholash uchun ishlatiladi. Kvadratlarning qoldiq yig'indisi ma'lum xarajatlar qiymatlarining regressiyasidan foydalangan holda bashorat qilish xatosi o'lchovidir da.. Uni kvadratlarning regressiya yig'indisi bilan taqqoslash regressiyaga bog'liqlik natijani o'rtacha qiymatdan necha marta yaxshiroq bashorat qilishini ko'rsatadi. da. Kritik qiymatlar jadvali mavjud F R Numeratorning erkinlik darajalari soniga qarab Fisher koeffitsienti - Kimga, maxraj v 2 = p - k- 1 va ahamiyatlilik darajasi a. Fisher mezonining hisoblangan qiymati bo'lsa F R jadval qiymatidan kattaroq bo'lsa, u holda determinatsiya koeffitsientining ahamiyatsizligi haqidagi gipoteza, ya'ni. regressiya tenglamasiga kiritilgan munosabatlar va haqiqatda mavjud bo'lganlar o'rtasidagi nomuvofiqlik haqida, ehtimollik bilan p = 1 - a rad etiladi.

O'rtacha taxminiy xato(o'rtacha foizli og'ish) olingan o'zgaruvchining haqiqiy va hisoblangan qiymatlari o'rtasidagi foiz sifatida ifodalangan o'rtacha nisbiy farq sifatida hisoblanadi:

Ushbu indikatorning qiymati qanchalik past bo'lsa, modelning bashoratli sifati shunchalik yaxshi bo'ladi. Ushbu indikatorning qiymati 7% dan yuqori bo'lmaganda, ular modelning yuqori aniqligini ko'rsatadi. Agar 8 > 15%, modelning qoniqarsiz aniqligini ko'rsatadi.

Regressiya koeffitsientining standart xatosi:

bu yerda (/I) -1 .- matritsaning diagonal elementi (X G X) ~ 1 dan - omillar soni;

X- omil o'zgaruvchilari qiymatlari matritsasi:

X7- omil o'zgaruvchilar qiymatlarining transpozitsiyalangan matritsasi;

(JL) _| matritsaga teskari matritsadir.

Har bir regressiya koeffitsienti uchun bu ballar qanchalik kichik bo'lsa, tegishli regressiya koeffitsientini baholash shunchalik ishonchli bo'ladi.

Talaba testi (t-statistika):

Bu mezon berilgan regressiya koeffitsienti hisobiga bog'lanishning ishonchlilik (ahamiyatlilik) darajasini o'lchash imkonini beradi. Hisoblangan qiymat bo'lsa t. jadval qiymatidan kattaroq

t av , qaerda v - p - k - 1 - erkinlik darajalari soni, keyin bu koeffitsient statistik jihatdan ahamiyatsiz degan gipoteza (100 - a)% ehtimollik bilan rad etiladi. /-tarqatishning maxsus jadvallari mavjud bo'lib, ular mezonning kritik qiymatini berilgan ahamiyatga ega a darajasi va erkinlik darajalari soni bo'yicha aniqlash imkonini beradi. a ning eng ko'p ishlatiladigan qiymati 5% ni tashkil qiladi.

Multikollinearlik, ya'ni. omil o'zgaruvchilari orasidagi o'zaro munosabatlarning ta'siri ularning cheklangan soni bilan qanoatlanish zarurligiga olib keladi. Agar bu e'tiborga olinmasa, unda siz mantiqsiz regressiya modeliga ega bo'lishingiz mumkin. Multikollinearlikning salbiy ta'sirini oldini olish uchun ko'p regressiya modelini yaratishdan oldin juft korrelyatsiya koeffitsientlari hisoblanadi. rxjxj tanlangan o'zgaruvchilar orasida X. Va X

Bu yerga XjX; - ikki omil o'zgaruvchisi mahsulotining o'rtacha qiymati;

XjXj- ikki omilli o'zgaruvchilarning o'rtacha qiymatlari mahsuloti;

X omil o'zgaruvchisining dispersiyasini baholash.

Ikki o'zgaruvchi, agar ularning juft korrelyatsiya koeffitsienti mutlaq qiymatda 0,8 dan qat'iy katta bo'lsa, regressiv bog'liqlik (ya'ni, kollinear) deb hisoblanadi. Bunday holda, ushbu o'zgaruvchilarning har qandayini hisobga olishdan chiqarib tashlash kerak.

Olingan regressiya modellarini iqtisodiy tahlil qilish imkoniyatlarini kengaytirish maqsadida o'rtacha qiymatlardan foydalaniladi elastiklik koeffitsientlari, formula bilan aniqlanadi:

Qayerda Xj- mos keladigan omil o'zgaruvchisining o'rtacha qiymati;

y - olingan o'zgaruvchining o'rtacha qiymati; a men - mos keladigan omil o'zgaruvchisi uchun regressiya koeffitsienti.

Elastiklik koeffitsienti omil o'zgaruvchisi 1% ga o'zgarganda, natijada olingan o'zgaruvchining qiymati o'rtacha necha foizga o'zgarishini ko'rsatadi, ya'ni. hosil bo'lgan o'zgaruvchi omil o'zgaruvchisi o'zgarishiga qanday ta'sir qiladi. Masalan, kv.m.ning narxi qanday. shahar markazidan uzoqda joylashgan kvartiraning m maydoni.

Muayyan regressiya koeffitsientining ahamiyatini tahlil qilish nuqtai nazaridan smeta foydalidir. xususiy determinatsiya koeffitsienti:

Natijadagi farqning taxmini bu erda

o'zgaruvchan. Bu koeffitsient regressiya tenglamasiga kiritilgan /-chi omil o'zgaruvchining o'zgarishi bilan olingan o'zgaruvchining necha foiz o'zgarishi bilan izohlanishini ko'rsatadi.

  • Gedonik xususiyatlar deganda ob'ektning xaridor va sotuvchilar nuqtai nazaridan uning foydali (qimmatli) xususiyatlarini aks ettiruvchi xususiyatlari tushuniladi.

Regressiya tahlilining maqsadi - qaram o'zgaruvchi va bitta (juftlik regressiya tahlili) yoki undan ko'p (bir nechta) mustaqil o'zgaruvchilar o'rtasidagi munosabatni o'lchashdir. Mustaqil o'zgaruvchilar omilli, izohlovchi, aniqlovchi, regressor va bashorat qiluvchilar deb ham ataladi.

Bog'liq o'zgaruvchi ba'zan aniqlangan, tushuntirilgan yoki "javob" o'zgaruvchisi deb ataladi. Empirik tadqiqotlarda regressiya tahlilining nihoyatda keng qo‘llanilishi uning farazlarni tekshirish uchun qulay vosita ekanligi bilangina bog‘liq emas. Regressiya, ayniqsa ko'p regressiya - samarali modellashtirish va prognozlash usuli.

Keling, regressiya tahlili bilan ishlash tamoyillarini soddaroq - juftlik usuli bilan tushuntirishni boshlaylik.

Juftlik regressiya tahlili

Regressiya tahlilini qo'llashda birinchi qadamlar korrelyatsiya koeffitsientini hisoblash doirasida biz olgan qadamlar bilan deyarli bir xil bo'ladi. Pearson usuli yordamida korrelyatsion tahlil samaradorligining uchta asosiy sharti - o'zgaruvchilarning normal taqsimlanishi, o'zgaruvchilarning intervalli o'lchovi, o'zgaruvchilar orasidagi chiziqli bog'liqlik ko'p regressiya uchun ham dolzarbdir. Shunga ko'ra, birinchi bosqichda tarqalish chizmalari tuziladi, o'zgaruvchilarning statistik va tavsifiy tahlili o'tkaziladi va regressiya chizig'i hisoblanadi. Korrelyatsiya tahlili doirasida bo'lgani kabi, regressiya chiziqlari eng kichik kvadratlar usuli yordamida quriladi.

Ma'lumotlarni tahlil qilishning ikkita usuli o'rtasidagi farqni aniqroq ko'rsatish uchun "SPS qo'llab-quvvatlash" va "qishloq aholisi ulushi" o'zgaruvchilari bilan ko'rib chiqilgan misolga murojaat qilaylik. Asl ma'lumotlar bir xil. Tarqalish chizmalarining farqi shundan iboratki, regressiya tahlilida qaram o'zgaruvchini chizish to'g'ri bo'ladi - bizning holatlarimizda Y o'qi bo'ylab "SPS qo'llab-quvvatlashi", korrelyatsiya tahlilida esa bu muhim emas. Chiqib ketishlarni tozalashdan so'ng, tarqalish sxemasi quyidagicha ko'rinadi:

Regressiya tahlilining asosiy g'oyasi shundan iboratki, o'zgaruvchilar uchun umumiy tendentsiyaga ega bo'lgan holda - regressiya chizig'i ko'rinishida - mustaqil qiymatlarga ega bo'lgan qaram o'zgaruvchining qiymatini taxmin qilish mumkin.

Oddiy matematik chiziqli funksiyani tasavvur qilaylik. Evklid fazosidagi har qanday chiziq quyidagi formula bilan tavsiflanishi mumkin:

bu erda a - y o'qi bo'ylab ofsetni ko'rsatadigan doimiy; b - chiziqning burchagini aniqlaydigan koeffitsient.

Nishab va konstantani bilgan holda, har qanday x uchun y qiymatini hisoblash (bashorat qilish) mumkin.

Ushbu eng oddiy funktsiya regressiya tahlili modelining asosini tashkil etdi, biz y qiymatini aniq emas, balki ma'lum bir ishonch oralig'ida bashorat qilamiz, ya'ni. taxminan.

Konstanta regressiya chizig'i va y o'qining kesishish nuqtasidir (statistik paketlarda odatda "kesishuvchi" deb ataladigan F-kesishmasi). SPS uchun ovoz berish misolimizda uning yaxlitlangan qiymati 10,55 bo'ladi. Nishab koeffitsienti b taxminan -0,1 ga teng bo'ladi (korrelyatsiya tahlilida bo'lgani kabi, belgi munosabatlar turini ko'rsatadi - to'g'ridan-to'g'ri yoki teskari). Shunday qilib, olingan model SP C = -0,1 x Sel kabi ko'rinadi. Biz. + 10.55.

Shunday qilib, qishloq aholisining ulushi 47% bo'lgan "Adigeya Respublikasi" uchun taxmin qilingan qiymat 5,63 ni tashkil qiladi:

ATP \u003d -0,10 x 47 + 10,55 \u003d 5,63.

Asl va bashorat qilingan qiymatlar o'rtasidagi farq qoldiq deb ataladi (biz bu atama - statistika uchun asosiy - favqulodda vaziyatlar jadvallarini tahlil qilishda allaqachon duch kelganmiz). Shunday qilib, Adigeya Respublikasi uchun qolgan 3,92 - 5,63 = -1,71 bo'ladi. Qolgan modul qiymati qanchalik katta bo'lsa, qiymat shunchalik yaxshi bashorat qilingan bo'lmaydi.

Biz barcha holatlar uchun taxmin qilingan qiymatlar va qoldiqlarni hisoblaymiz:
Bo‘lyapti Shanba. Biz. Rahmat

(asl)

Rahmat

(bashorat qilingan)

Qolgan
Adigeya Respublikasi 47 3,92 5,63 -1,71 -
Oltoy Respublikasi 76 5,4 2,59 2,81
Boshqirdiston Respublikasi 36 6,04 6,78 -0,74
Buryatiya Respublikasi 41 8,36 6,25 2,11
Dog'iston Respublikasi 59 1,22 4,37 -3,15
Ingushetiya Respublikasi 59 0,38 4,37 3,99
Va hokazo.

Dastlabki va bashorat qilingan qiymatlar nisbatini tahlil qilish, natijada olingan modelning sifatini, uning bashorat qilish qobiliyatini baholashga xizmat qiladi. Regressiya statistikasining asosiy ko'rsatkichlaridan biri bu ko'p korrelyatsiya koeffitsienti R - bog'liq o'zgaruvchining dastlabki va taxmin qilingan qiymatlari o'rtasidagi korrelyatsiya koeffitsienti. Juftlangan regressiya tahlilida u bog'liq va mustaqil o'zgaruvchi o'rtasidagi odatiy Pearson korrelyatsiya koeffitsientiga teng, bizning holatlarimizda - 0,63. Ko'p R ni mazmunli talqin qilish uchun uni determinatsiya koeffitsientiga aylantirish kerak. Bu xuddi korrelyatsiya tahlilida bo'lgani kabi amalga oshiriladi - kvadrat. Determinatsiya koeffitsienti R-kvadrat (R 2) mustaqil (mustaqil) o'zgaruvchilar bilan izohlangan bog'liq o'zgaruvchidagi o'zgarishlar ulushini ko'rsatadi.

Bizning holatda, R 2 = 0,39 (0,63 2); bu shuni anglatadiki, "qishloq aholisining nisbati" o'zgaruvchisi "CPSni qo'llab-quvvatlash" o'zgaruvchisidagi o'zgarishlarning taxminan 40% ni tushuntiradi. Determinatsiya koeffitsientining qiymati qanchalik katta bo'lsa, modelning sifati shunchalik yuqori bo'ladi.

Model sifatining yana bir ko'rsatkichi - bu taxminning standart xatosi. Bu nuqtalarning regressiya chizig'i atrofida qanchalik "tarqalganligi" o'lchovidir. Intervalli o'zgaruvchilar uchun dispersiya o'lchovi standart og'ishdir. Shunga ko'ra, baholashning standart xatosi qoldiqlarni taqsimlashning standart og'ishidir. Uning qiymati qanchalik baland bo'lsa, tarqalish qanchalik katta bo'lsa va model yomonroq bo'ladi. Bizning holatlarimizda standart xato 2.18 ni tashkil qiladi. Aynan shu miqdor bo'yicha bizning modelimiz "SPS support" o'zgaruvchisining qiymatini bashorat qilishda "o'rtacha xato qiladi".

Regressiya statistikasi dispersiyani tahlil qilishni ham o'z ichiga oladi. Uning yordami bilan biz quyidagilarni aniqlaymiz: 1) bog'liq o'zgaruvchining o'zgarishi (tarqalishi) ning qaysi nisbati mustaqil o'zgaruvchi bilan izohlanadi; 2) bog'liq o'zgaruvchining dispersiyasining qaysi qismi qoldiqlarga to'g'ri keladi (tushunmagan qism); 3) bu ikki qiymatning nisbati qanday (/ "-nisbati). Dispersiya statistikasi namunaviy tadqiqotlar uchun ayniqsa muhimdir - bu umumiy populyatsiyadagi mustaqil va bog'liq o'zgaruvchilar o'rtasidagi munosabat qanchalik ehtimolligini ko'rsatadi. Biroq , uzluksiz tadqiqotlar uchun (bizning misolimizda bo'lgani kabi), tadqiqot Bu holda, aniqlangan statistik naqsh tasodifiy holatlarning tasodifiyligi bilan bog'liqmi yoki yo'qmi, tekshirilayotgan aholi joylashgan sharoitlar majmuasi uchun qanchalik xarakterli ekanligi tekshiriladi. , ya'ni olingan natija qandaydir kengroq umumiy agregat uchun to'g'ri emas, balki uning muntazamlik darajasi, tasodifiy ta'sirlardan ozod ekanligi aniqlandi.

Bizning holatda, dispersiya statistikasini tahlil qilish quyidagicha:

SS df XONIM F ma'nosi
Regress. 258,77 1,00 258,77 54,29 0.000000001
Qolgan 395,59 83,00 L,11
Jami 654,36

54,29 F nisbati 0,0000000001 darajasida muhim. Shunga ko'ra, biz nol gipotezani ishonch bilan rad etishimiz mumkin (biz topgan munosabatlar tasodifiy).

Shunga o'xshash funktsiya t mezoni bilan amalga oshiriladi, lekin regressiya koeffitsientlariga (burchak va F-kesishishlar) nisbatan. / mezonidan foydalanib, biz umumiy populyatsiyadagi regressiya koeffitsientlari nolga teng degan gipotezani tekshiramiz. Bizning holatda, biz yana nol gipotezani ishonch bilan rad etishimiz mumkin.

Ko'p regressiya tahlili

Ko'p regressiya modeli juftlik regressiya modeli bilan deyarli bir xil; yagona farq shundaki, bir nechta mustaqil o'zgaruvchilar chiziqli funktsiyaga ketma-ket kiritilgan:

Y = b1X1 + b2X2 + …+ bpXp + a.

Agar ikkitadan ortiq mustaqil o'zgaruvchilar mavjud bo'lsa, biz ularning o'zaro bog'liqligini vizual ravishda tasvirlay olmaymiz, shuning uchun ko'p regressiya juftlik regressiga qaraganda kamroq "ko'rinadi". Ikkita mustaqil o'zgaruvchi mavjud bo'lganda, ma'lumotlarni 3D scatterplotda ko'rsatish foydali bo'lishi mumkin. Professional statistik dasturiy ta'minot paketlarida (masalan, Statistica) uch o'lchovli diagrammani aylantirish imkoniyati mavjud bo'lib, bu ma'lumotlar strukturasini yaxshi vizual tasvirlash imkonini beradi.

Ko'p regressiya bilan ishlaganda, juftlik regressiyasidan farqli o'laroq, tahlil algoritmini aniqlash kerak. Standart algoritm yakuniy regressiya modelidagi barcha mavjud bashorat qiluvchilarni o'z ichiga oladi. Bosqichma-bosqich algoritm mustaqil o'zgaruvchilarning tushuntirish "og'irligi" asosida ketma-ket kiritilishini (chiqib chiqarilishini) nazarda tutadi. Ko'p mustaqil o'zgaruvchilar mavjud bo'lganda bosqichli usul yaxshi; u ochiqchasiga zaif bashorat qiluvchilar modelini "tozalaydi", uni yanada ixcham va ixcham qiladi.

Ko'p regressiyaning to'g'riligi uchun qo'shimcha shart (interval, normallik va chiziqlilik bilan birga) multikollinearlikning yo'qligi - mustaqil o'zgaruvchilar o'rtasida kuchli korrelyatsiya mavjudligi.

Ko'p regressiya statistikasining talqini biz juftlik regressiyasi uchun ko'rib chiqqan barcha elementlarni o'z ichiga oladi. Bundan tashqari, ko'p regressiya tahlili statistikasida boshqa muhim komponentlar mavjud.

Biz Rossiya hududlarida saylov faolligi darajasidagi farqlarni tushuntiruvchi gipotezalarni sinab ko'rish misolida ko'p regressiya bilan ishni ko'rsatamiz. Maxsus empirik tadqiqotlar shuni ko'rsatdiki, saylovchilarning faolligiga quyidagilar ta'sir qiladi:

Milliy omil ("Rossiya aholisi" o'zgaruvchisi; Rossiya Federatsiyasining ta'sis sub'ektlarida rus aholisining ulushi sifatida ishlaydi). Taxminlarga ko'ra, Rossiya aholisi ulushining ko'payishi saylovchilarning faolligining pasayishiga olib keladi;

Urbanizatsiya omili (o'zgaruvchan "shahar aholisi"; Rossiya Federatsiyasining ta'sis ob'ektlarida shahar aholisining ulushi sifatida faoliyat ko'rsatgan holda, biz korrelyatsiya tahlilining bir qismi sifatida ushbu omil bilan ishlaganmiz). Taxminlarga ko'ra, shahar aholisi ulushining ortishi ham saylovchilarning faolligining pasayishiga olib keladi.

Bog'liq o'zgaruvchi - "saylov faolligining intensivligi" ("faol") 1995 yildan 2003 yilgacha bo'lgan federal saylovlarda mintaqalar bo'yicha o'rtacha ishtirok etish ma'lumotlari orqali ishlaydi. Ikki mustaqil va bitta qaram o'zgaruvchi uchun dastlabki ma'lumotlar jadvali quyidagi shaklga ega bo'ladi. :

Bo‘lyapti O'zgaruvchilar
Aktivlar. Gor. Biz. Rus. Biz.
Adigeya Respublikasi 64,92 53 68
Oltoy Respublikasi 68,60 24 60
Buryatiya Respublikasi 60,75 59 70
Dog'iston Respublikasi 79,92 41 9
Ingushetiya Respublikasi 75,05 41 23
Qalmog'iston Respublikasi 68,52 39 37
Qorachay-Cherkes Respublikasi 66,68 44 42
Kareliya Respublikasi 61,70 73 73
Komi Respublikasi 59,60 74 57
Mari El Respublikasi 65,19 62 47

Va hokazo. (Emissiyalarni tozalashdan keyin 88 ta holatdan 83 tasi qolgan)

Modelning sifatini tavsiflovchi statistika:

1. Bir nechta R = 0,62; L-kvadrat = 0,38. Shu sababli, milliy omil va urbanizatsiya omili birgalikda "saylov faolligi" o'zgaruvchanligidagi o'zgarishlarning taxminan 38% ni tushuntiradi.

2. O'rtacha xatolik 3,38 ni tashkil qiladi. Shunday qilib, "o'rtacha" tuzilgan model saylovchilarning ishtiroki darajasini bashorat qilishda noto'g'ri.

3. Tushuntirilgan va tushuntirilmagan o'zgarishlarning /l-nisbati 0,000000003 darajasida 25,2 ga teng. Ochilgan munosabatlarning tasodifiyligi haqidagi nol gipoteza rad etiladi.

4. "Shahar aholisi" va "Rossiya aholisi" o'zgaruvchilarining doimiy va regressiya koeffitsientlari uchun mezon / 0,0000001 darajasida muhim; 0,00005 va 0,007. Koeffitsientlarning tasodifiyligi haqidagi nol gipoteza rad etiladi.

Bog'liq o'zgaruvchining boshlang'ich va bashorat qilingan qiymatlari nisbatini tahlil qilishda qo'shimcha foydali statistik ma'lumotlar Mahalanobis masofasi va Kuk masofasi hisoblanadi. Birinchisi, ishning o'ziga xosligi o'lchovidir (ma'lum bir holat uchun barcha mustaqil o'zgaruvchilar qiymatlarining kombinatsiyasi bir vaqtning o'zida barcha mustaqil o'zgaruvchilar uchun o'rtacha qiymatdan qanchalik og'ishini ko'rsatadi). Ikkinchisi, ishning ta'sirining o'lchovidir. Turli kuzatuvlar regressiya chizig'ining qiyaligiga turli yo'llar bilan ta'sir qiladi va Kuk masofasidan foydalanib, siz ularni ushbu ko'rsatkich bo'yicha taqqoslashingiz mumkin. Bu cheklovchilarni tozalashda foydalidir (chiqib ketishni haddan tashqari ta'sirli holat deb hisoblash mumkin).

Bizning misolimizda Dog'iston noyob va ta'sirli holatlardan biridir.

Bo‘lyapti Boshlang'ich

qiymatlar

Predska

qiymatlar

Qolgan Masofa

Mahalanobis

Masofa
Adigeya 64,92 66,33 -1,40 0,69 0,00
Oltoy Respublikasi 68,60 69.91 -1,31 6,80 0,01
Buryatiya Respublikasi 60,75 65,56 -4,81 0,23 0,01
Dog'iston Respublikasi 79,92 71,01 8,91 10,57 0,44
Ingushetiya Respublikasi 75,05 70,21 4,84 6,73 0,08
Qalmog'iston Respublikasi 68,52 69,59 -1,07 4,20 0,00

Haqiqiy regressiya modeli quyidagi parametrlarga ega: Y-kesish (doimiy) = 75,99; b (Hor. Sat.) \u003d -0,1; b (rus. nas.) = -0,06. Yakuniy formula:

Faol, = -0,1 x Hor. sat.n+- 0,06 x Rus. sat.n + 75.99.

61 koeffitsienti qiymatiga asoslangan bashorat qiluvchilarning "tushuntirish kuchi" ni solishtirish mumkinmi. Bu holda, ha, chunki har ikkala mustaqil o'zgaruvchi ham bir xil foiz formatiga ega. Biroq, ko'pincha, ko'p regressiya turli shkalalarda o'lchanadigan o'zgaruvchilar bilan shug'ullanadi (masalan, rubldagi daromad darajasi va yillardagi yosh). Shuning uchun umumiy holatda o'zgaruvchilarning bashorat qilish imkoniyatlarini regressiya koeffitsienti bilan taqqoslash noto'g'ri. Ko'p regressiya statistikasida bu maqsad uchun har bir mustaqil o'zgaruvchi uchun alohida hisoblangan maxsus beta koeffitsienti (B) mavjud. Bu omil va javobning qisman (boshqa barcha bashorat qiluvchilarning ta'sirini hisobga olgan holda hisoblangan) korrelyatsiya koeffitsienti bo'lib, omilning javob qiymatlarini bashorat qilishdagi mustaqil hissasini ko'rsatadi. Juftlik regressiya tahlilida beta koeffitsienti tushunarli ravishda qaram va mustaqil o'zgaruvchi o'rtasidagi juft korrelyatsiya koeffitsientiga teng.

Bizning misolimizda beta (Hor. nas.) = -0,43, beta (ruscha nas.) = -0,28. Shunday qilib, ikkala omil ham elektoral faollik darajasiga salbiy ta'sir ko'rsatadi, shu bilan birga urbanizatsiya omilining ahamiyati milliy omilning ahamiyatidan sezilarli darajada yuqori. Ikkala omilning birgalikdagi ta'siri "saylov faolligi" o'zgaruvchisidagi o'zgarishlarning taxminan 38% ni aniqlaydi (L-kvadrat qiymatiga qarang).

O'qish davomida talabalar ko'pincha turli xil tenglamalarga duch kelishadi. Ulardan biri - regressiya tenglamasi - ushbu maqolada ko'rib chiqiladi. Ushbu turdagi tenglama matematik parametrlar orasidagi bog'lanish xususiyatlarini tavsiflash uchun maxsus qo'llaniladi. Tenglikning bu turi statistika va ekonometriyada qo'llaniladi.

Regressiya ta'rifi

Matematikada regressiya deganda ma'lumotlar to'plamining o'rtacha qiymatining boshqa miqdorning qiymatlariga bog'liqligini tavsiflovchi ma'lum miqdor tushuniladi. Regressiya tenglamasi ma'lum bir xususiyatning funktsiyasi sifatida boshqa xususiyatning o'rtacha qiymatini ko'rsatadi. Regressiya funktsiyasi y \u003d x oddiy tenglama ko'rinishiga ega, unda y bog'liq o'zgaruvchi rolini o'ynaydi va x mustaqil o'zgaruvchidir (xususiyat omili). Aslida regressiya y = f (x) shaklida ifodalanadi.

O'zgaruvchilar o'rtasidagi munosabatlarning turlari qanday

Umuman olganda, munosabatlarning ikki qarama-qarshi turi farqlanadi: korrelyatsiya va regressiya.

Birinchisi shartli o'zgaruvchilarning tengligi bilan tavsiflanadi. Bunday holda, qaysi o'zgaruvchining boshqasiga bog'liqligi aniq ma'lum emas.

Agar o'zgaruvchilar o'rtasida tenglik bo'lmasa va shartlar qaysi o'zgaruvchining tushuntirish va qaysi bog'liqligini aytsa, ikkinchi turdagi bog'lanish mavjudligi haqida gapirish mumkin. Chiziqli regressiya tenglamasini qurish uchun qanday turdagi munosabatlar kuzatilayotganligini aniqlash kerak bo'ladi.

Regressiya turlari

Bugungi kunga kelib regressiyaning 7 xil turi mavjud: giperbolik, chiziqli, ko'p, chiziqli bo'lmagan, juftlik, teskari, logarifmik chiziqli.

Giperbolik, chiziqli va logarifmik

Lineer regressiya tenglamasi statistikada tenglamaning parametrlarini aniq tushuntirish uchun ishlatiladi. y = c + m * x + E ga o'xshaydi. Giperbolik tenglama muntazam giperbola y \u003d c + m / x + E ko'rinishiga ega. Logarifmik chiziqli tenglama logarifmik funktsiyadan foydalangan holda munosabatni ifodalaydi: In y \u003d In c + m * In x + In E.

Ko'p va chiziqli bo'lmagan

Regressiyaning yana ikkita murakkab turi ko'p va chiziqli bo'lmagan. Ko'p regressiya tenglamasi y \u003d f (x 1, x 2 ... x c) + E funktsiyasi bilan ifodalanadi. Bunday vaziyatda y bog'liq o'zgaruvchi va x tushuntirish o'zgaruvchisidir. E o'zgaruvchisi stokastik bo'lib, tenglamadagi boshqa omillarning ta'sirini o'z ichiga oladi. Chiziqli bo'lmagan regressiya tenglamasi biroz mos kelmaydi. Bir tomondan, hisobga olingan ko'rsatkichlarga nisbatan, u chiziqli emas, ikkinchi tomondan, ko'rsatkichlarni baholash rolida chiziqli.

Teskari va juft regressiyalar

Teskari funktsiya chiziqli shaklga aylantirilishi kerak bo'lgan funktsiyadir. Eng an'anaviy amaliy dasturlarda u y \u003d 1 / c + m * x + E funksiyasi ko'rinishiga ega. Juftlangan regressiya tenglamasi y = f(x) + E funksiyasi sifatida ma’lumotlar o‘rtasidagi munosabatni ko‘rsatadi. Xuddi boshqa tenglamalar singari, y ham x ga bog‘liq va E stokastik parametrdir.

Korrelyatsiya tushunchasi

Bu ikki hodisa yoki jarayon o'rtasida bog'liqlik mavjudligini ko'rsatadigan ko'rsatkichdir. Aloqaning mustahkamligi korrelyatsiya koeffitsienti sifatida ifodalanadi. Uning qiymati [-1;+1] oralig'ida o'zgarib turadi. Salbiy ko'rsatkich teskari aloqa mavjudligini, ijobiy ko'rsatkich to'g'ridan-to'g'ri ekanligini ko'rsatadi. Agar koeffitsient 0 ga teng qiymatni qabul qilsa, unda hech qanday bog'liqlik yo'q. Qiymat 1 ga qanchalik yaqin bo'lsa - parametrlar o'rtasidagi bog'liqlik qanchalik kuchli bo'lsa, 0 ga yaqinroq - zaifroq.

Usullari

Korrelyatsiya parametrik usullari munosabatlarning mustahkamligini baholashi mumkin. Oddiy taqsimot qonuniga bo'ysunadigan parametrlarni o'rganish uchun ular taqsimot baholari asosida qo'llaniladi.

Chiziqli regressiya tenglamasining parametrlari bog'liqlik turini, regressiya tenglamasining funktsiyasini aniqlash va tanlangan munosabatlar formulasining ko'rsatkichlarini baholash uchun zarurdir. Korrelyatsiya maydoni munosabatlarni aniqlash usuli sifatida ishlatiladi. Buning uchun barcha mavjud ma'lumotlar grafik ko'rinishda ifodalanishi kerak. To'rtburchaklar ikki o'lchovli koordinatalar tizimida barcha ma'lum ma'lumotlar chizilgan bo'lishi kerak. Korrelyatsiya maydoni shunday shakllanadi. Ta'riflovchi omilning qiymati abscissa bo'ylab, qaram omilning qiymatlari esa ordinat bo'ylab belgilanadi. Parametrlar o'rtasida funksional bog'liqlik mavjud bo'lsa, ular chiziq shaklida joylashgan.

Agar bunday ma'lumotlarning korrelyatsiya koeffitsienti 30% dan kam bo'lsa, biz ulanishning deyarli to'liq yo'qligi haqida gapirishimiz mumkin. Agar u 30% dan 70% gacha bo'lsa, bu o'rtacha zichlikdagi bog'lanishlar mavjudligini ko'rsatadi. 100% ko'rsatkich funktsional ulanishning dalilidir.

Chiziqli bo'lmagan regressiya tenglamasi, xuddi chiziqli kabi, korrelyatsiya indeksi (R) bilan to'ldirilishi kerak.

Ko'p regressiya uchun korrelyatsiya

Determinatsiya koeffitsienti ko'p korrelyatsiya kvadratining ko'rsatkichidir. U taqdim etilgan ko'rsatkichlar to'plamining o'rganilayotgan belgi bilan bog'liqligi haqida gapiradi. Parametrlarning natijaga ta'sirining tabiati haqida ham gapirish mumkin. Ko'p regressiya tenglamasi ushbu ko'rsatkich yordamida baholanadi.

Ko'p korrelyatsiya indeksini hisoblash uchun uning indeksini hisoblash kerak.

Eng kichik kvadrat usuli

Bu usul regressiya omillarini baholash usulidir. Uning mohiyati omilning funktsiyaga bog'liqligi tufayli olingan kvadrat og'ishlar yig'indisini minimallashtirishdan iborat.

Juftlangan chiziqli regressiya tenglamasini shunday usul yordamida baholash mumkin. Ushbu turdagi tenglamalar juft chiziqli munosabatlarning ko'rsatkichlari o'rtasida aniqlanganda qo'llaniladi.

Tenglama variantlari

Chiziqli regressiya funktsiyasining har bir parametri o'ziga xos ma'noga ega. Juftlangan chiziqli regressiya tenglamasi ikkita parametrni o'z ichiga oladi: c va m.. Parametr t y funksiyaning yakuniy ko'rsatkichining o'rtacha o'zgarishini ko'rsatadi, x o'zgaruvchisi bitta shartli birlikka kamayishi (o'sish) sharti bilan. Agar x o'zgaruvchisi nolga teng bo'lsa, u holda funktsiya c parametriga teng bo'ladi. Agar x o'zgaruvchisi nolga teng bo'lmasa, u holda c omil iqtisodiy ma'noga ega emas. Funksiyaga faqat c omil oldidagi belgi ta'sir qiladi. Agar minus bo'lsa, unda omilga nisbatan natijaning sekin o'zgarishi haqida aytishimiz mumkin. Agar ortiqcha bo'lsa, bu natijaning tezlashtirilgan o'zgarishini ko'rsatadi.

Regressiya tenglamasining qiymatini o'zgartiruvchi har bir parametr tenglama orqali ifodalanishi mumkin. Masalan, c omil c = y - mx ko'rinishga ega.

Guruhlangan ma'lumotlar

Vazifaning shunday shartlari mavjudki, unda barcha ma'lumotlar x atributiga ko'ra guruhlanadi, lekin shu bilan birga, ma'lum bir guruh uchun bog'liq ko'rsatkichning mos keladigan o'rtacha qiymatlari ko'rsatiladi. Bunday holda, o'rtacha qiymatlar indikatorning x ga bog'liqligini tavsiflaydi. Shunday qilib, guruhlangan ma'lumotlar regressiya tenglamasini topishga yordam beradi. U munosabatlar tahlili sifatida ishlatiladi. Biroq, bu usul o'zining kamchiliklariga ega. Afsuski, o'rtacha ko'rsatkichlar ko'pincha tashqi tebranishlarga duchor bo'ladi. Bu tebranishlar munosabatlar naqshlarining aksi emas, ular shunchaki uning "shovqinini" niqoblaydi. O'rtachalar chiziqli regressiya tenglamasidan ko'ra yomonroq munosabatlar naqshlarini ko'rsatadi. Biroq, ular tenglamani topish uchun asos sifatida ishlatilishi mumkin. Muayyan populyatsiyaning hajmini mos keladigan o'rtacha ko'rsatkichga ko'paytirish orqali siz guruh ichidagi y ning yig'indisini olishingiz mumkin. Keyinchalik, siz barcha olingan miqdorlarni nokaut qilishingiz va yakuniy ko'rsatkichni topishingiz kerak y. Xy yig'indisi ko'rsatkichi bilan hisob-kitob qilish biroz qiyinroq. Agar intervallar kichik bo'lsa, shartli ravishda barcha birliklar (guruh ichidagi) uchun x ko'rsatkichini bir xil qabul qilishimiz mumkin. X va y ko‘paytmalarining yig‘indisini topish uchun uni y yig‘indisiga ko‘paytiring. Keyinchalik, barcha summalar bir-biriga uriladi va umumiy xy yig'indisi olinadi.

Ko'p juftlik tenglamalari regressiyasi: munosabatlarning ahamiyatini baholash

Yuqorida aytib o'tilganidek, ko'p regressiya y \u003d f (x 1, x 2, ..., x m) + E ko'rinishidagi funktsiyaga ega. Ko'pincha bunday tenglama tovarlarga bo'lgan talab va taklif, sotib olingan aktsiyalar bo'yicha foiz daromadlari, ishlab chiqarish xarajatlari funktsiyasining sabablari va turlarini o'rganish uchun ishlatiladi. Bundan tashqari, u turli xil makroiqtisodiy tadqiqotlar va hisob-kitoblarda faol qo'llaniladi, ammo mikroiqtisodiyot darajasida bu tenglama biroz kamroq qo'llaniladi.

Ko'p regressiyaning asosiy vazifasi har bir omilning alohida va ularning jamiligida modellashtiriladigan ko'rsatkich va uning koeffitsientlariga qanday ta'sir qilishini aniqlash uchun katta hajmdagi ma'lumotlarni o'z ichiga olgan ma'lumotlar modelini yaratishdir. Regressiya tenglamasi turli qiymatlarni qabul qilishi mumkin. Bunday holda, munosabatlarni baholash uchun odatda ikki turdagi funktsiyalar qo'llaniladi: chiziqli va chiziqli bo'lmagan.

Chiziqli funktsiya shunday munosabat ko'rinishida tasvirlangan: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Bunda a2, a m lar «sof» regressiya koeffitsientlari hisoblanadi. Ular y parametrining o'rtacha o'zgarishini har bir mos keladigan x parametrning bir birlikka o'zgarishi (kamayishi yoki ortishi) bilan, boshqa ko'rsatkichlarning barqaror qiymati sharti bilan tavsiflash uchun zarurdir.

Nochiziqli tenglamalar, masalan, y=ax 1 b1 x 2 b2 ...x m bm quvvat funksiyasi shakliga ega. Bunda b 1, b 2 ..... b m ko'rsatkichlari egiluvchanlik koeffitsientlari deyiladi, ular tegishli ko'rsatkich x 1% ga oshishi (kamayishi) bilan natija qanday o'zgarishini (qancha% ga) ko'rsatadi. va boshqa omillarning barqaror ko'rsatkichi bilan.

Ko'p regressiyani qurishda qanday omillarni hisobga olish kerak

Ko'p regressiyani to'g'ri qurish uchun qaysi omillarga alohida e'tibor berish kerakligini aniqlash kerak.

Iqtisodiy omillar va modellashtirilgan munosabatlar o'rtasidagi munosabatlarning mohiyatini biroz tushunish kerak. Kiritilgan omillar quyidagi mezonlarga javob berishi kerak:

  • O'lchanadigan bo'lishi kerak. Ob'ektning sifatini tavsiflovchi omildan foydalanish uchun har qanday holatda, unga miqdoriy shakl berilishi kerak.
  • Faktorlarning o'zaro bog'liqligi yoki funktsional aloqasi bo'lmasligi kerak. Bunday harakatlar ko'pincha qaytarilmas oqibatlarga olib keladi - oddiy tenglamalar tizimi shartsiz bo'lib qoladi va bu uning ishonchsizligi va noaniq baholarini keltirib chiqaradi.
  • Katta korrelyatsiya ko'rsatkichi bo'lsa, indikatorning yakuniy natijasiga omillarning izolyatsiya qilingan ta'sirini aniqlashning hech qanday usuli yo'q, shuning uchun koeffitsientlar izohlanmaydi.

Qurilish usullari

Tenglama uchun omillarni qanday tanlash mumkinligini tushuntirishning juda ko'p usullari va usullari mavjud. Biroq, bu usullarning barchasi korrelyatsiya indeksidan foydalangan holda koeffitsientlarni tanlashga asoslangan. Ular orasida:

  • Cheklash usuli.
  • Usulni yoqish.
  • Bosqichli regressiya tahlili.

Birinchi usul jami to'plamdan barcha koeffitsientlarni saralashni o'z ichiga oladi. Ikkinchi usul ko'plab qo'shimcha omillarni kiritishni o'z ichiga oladi. Xo'sh, uchinchisi, tenglamaga ilgari qo'llaniladigan omillarni yo'q qilish. Ushbu usullarning har biri mavjud bo'lish huquqiga ega. Ularning ijobiy va salbiy tomonlari bor, lekin ular keraksiz ko'rsatkichlarni tekshirish masalasini o'zlari hal qilishlari mumkin. Qoida tariqasida, har bir individual usul bilan olingan natijalar juda yaqin.

Ko'p o'lchovli tahlil usullari

Faktorlarni aniqlashning bunday usullari o'zaro bog'liq xususiyatlarning individual birikmalarini hisobga olishga asoslangan. Bularga diskriminant tahlili, naqshni aniqlash, asosiy komponentlar tahlili va klaster tahlili kiradi. Bundan tashqari, omil tahlili ham mavjud, ammo u komponent usulini ishlab chiqish natijasida paydo bo'ldi. Ularning barchasi muayyan sharoitlarda, ma'lum shartlar va omillar ostida qo'llaniladi.