Статистик загварчлал: арга, тайлбар, хэрэглээ

Агуулгын хүснэгт:

Статистик загварчлал: арга, тайлбар, хэрэглээ
Статистик загварчлал: арга, тайлбар, хэрэглээ
Anonim

Статистикийн загварчлалд тусгагдсан таамаглалууд нь магадлалын багцыг тодорхойлдог бөгөөд тэдгээрийн зарим нь тархалтыг хангалттай ойролцоолсон гэж үздэг. Тодорхойлолтоос тодорхой өгөгдлийн багцыг сонгоно. Статистик загварчлалд хамаарах магадлалын тархалт нь статистик загваруудыг бусад, статистик бус, математик загваруудаас ялгаж өгдөг.

Image
Image

Математиктай холбогдох

Шинжлэх ухааны энэхүү арга нь үндсэндээ математикт үндэслэсэн. Системийн статистик загварчлалыг ихэвчлэн нэг буюу хэд хэдэн санамсаргүй хэмжигдэхүүн, магадгүй бусад санамсаргүй бус хэмжигдэхүүнтэй холбоотой математик тэгшитгэлээр өгдөг. Тиймээс статистик загвар нь "онолын албан ёсны төлөөлөл" юм (Херманн Адер, Кеннет Болленээс иш татсан).

Бүх статистик таамаглалын тестүүд болон бүх статистик тооцоог статистик загвараас гаргаж авсан. Ерөнхийдөө статистик загварууд нь статистикийн дүгнэлтийн үндэс суурь болдог.

Статистикийн аргуудзагварчлал

Албан бусаар статистикийн загварыг тодорхой шинж чанартай статистикийн таамаглал (эсвэл статистикийн таамаглалын багц) гэж үзэж болно: энэ таамаглал нь аливаа үйл явдлын магадлалыг тооцоолох боломжийг бидэнд олгодог. Жишээ болгон энгийн зургаан талт шоо авч үзье. Бид ясны талаарх хоёр өөр статистик таамаглалыг судлах болно.

Эхний статистик таамаглал нь статистик загварыг бүрдүүлдэг, учир нь бид зөвхөн нэг таамаглалаар аливаа үйл явдлын магадлалыг тооцоолж чадна. Альтернатив статистик таамаглал нь статистикийн загвар болохгүй, учир нь бид зөвхөн нэг таамаглалаар үйл явдал бүрийн магадлалыг тооцоолж чадахгүй.

Ердийн статистик загвар
Ердийн статистик загвар

Дээрх жишээн дээр эхний таамаглалаар үйл явдлын магадлалыг тооцоолоход хялбар байдаг. Гэсэн хэдий ч бусад зарим жишээн дээр тооцоолол нь төвөгтэй эсвэл бүр боломжгүй байж болно (жишээлбэл, энэ нь олон сая жилийн тооцоолол шаарддаг). Статистикийн загварыг бүрдүүлдэг таамаглалын хувьд энэ хүндрэлийг хүлээн зөвшөөрөх боломжтой: тооцоог хийх нь практикт хэрэгжих шаардлагагүй, зөвхөн онолын хувьд боломжтой.

Загваруудын жишээ

Манайд жигд тархсан хүүхдүүдтэй сургуулийн сурагчид бий гэж бодъё. Хүүхдийн өндөр нь наснаас хамааралтай байх болно: жишээлбэл, хүүхэд 7 настай гэдгийг мэдэх үед энэ нь хүүхдийн 5 фут өндөр (ойролцоогоор 152 см) байх магадлалд нөлөөлдөг. Бид энэ харилцааг шугаман регрессийн загварт албан ёсны болгож болно, жишээ нь: өсөлт=b0 + b1agei+ εi, энд b0 нь огтлолцол, b1 нь өсөлтийн таамаглалыг олж авах үед насыг үржүүлэх параметр, εi нь алдааны нэр томъёо юм. Энэ нь өндрийг насаар зарим алдаатай таамаглаж байна гэсэн үг.

Хүчинтэй загвар нь бүх өгөгдлийн цэгтэй тохирч байх ёстой. Тиймээс шулуун шугам (heighti=b0 + b1agei) нь өгөгдлийн загварын тэгшитгэл байж чадахгүй - хэрэв энэ нь бүх өгөгдлийн цэгүүдтэй яг таарахгүй бол, өөрөөр хэлбэл бүх өгөгдлийн цэгүүд шугаман дээр төгс оршдог. Загварын бүх өгөгдлийн цэгт тохирохын тулд εi алдааны томъёог тэгшитгэлд оруулах ёстой.

жендэрийн статистик
жендэрийн статистик

Статистикийн дүгнэлт гаргахын тулд эхлээд εi-ийн магадлалын зарим тархалтыг тооцох хэрэгтэй. Жишээлбэл, εi-ийн тархалт нь тэг дундажтай Гауссын тархалт гэж бид үзэж болно. Энэ тохиолдолд загвар нь b0, b1 болон Гауссын тархалтын дисперс гэсэн 3 параметртэй байна.

Ерөнхий тайлбар

Статистик загвар нь математик загварын тусгай анги юм. Статистикийн загвар нь бусад математик загваруудаас ялгагдах зүйл нь тодорхойгүй байдаг. Энэ нь статистик мэдээллийг загварчлахад хэрэглэгддэг. Иймд математикийн тэгшитгэлээр тодорхойлогдсон статистик загварт зарим хувьсагчид тодорхой утгагүй, харин магадлалын тархалттай байдаг; өөрөөр хэлбэл, зарим хувьсагч нь стохастик байна. Дээрх жишээнд ε нь стохастик хувьсагч юм; энэ хувьсагчгүйгээр загвар байсантодорхойлогч байх болно.

Загварлаж буй физик үйл явц нь детерминист шинж чанартай байсан ч статистикийн загваруудыг статистикийн шинжилгээ, загварчлалд ихэвчлэн ашигладаг. Жишээлбэл, зоос шидэх нь зарчмын хувьд тодорхойлогч үйл явц юм; гэхдээ энэ нь ихэвчлэн стохастик байдлаар загварчлагдсан байдаг (Бернулли процессоор).

дулааралтын статистик
дулааралтын статистик

Параметрийн загвар

Параметрийн загварууд нь хамгийн түгээмэл хэрэглэгддэг статистик загварууд юм. Хагас параметрийн болон параметрийн бус загваруудын талаар Сэр Дэвид Кокс хэлэхдээ: "Тэд ерөнхийдөө тархалтын бүтэц, хэлбэрийн талаархи цөөн таамаглалыг агуулдаг боловч ихэвчлэн бие даасан байдлын хүчтэй таамаглалуудыг агуулдаг." Бусад бүх дурдсан загваруудын нэгэн адил тэдгээрийг математик загварчлалын статистик аргад ихэвчлэн ашигладаг.

Олон түвшний загвар

Олон түвшний загварууд (мөн шаталсан шугаман загвар, үүрлэсэн өгөгдлийн загвар, холимог загвар, санамсаргүй коэффициент, санамсаргүй эффектийн загвар, санамсаргүй параметрийн загвар эсвэл хуваалттай загвар гэгддэг) нь нэгээс илүү түвшинд өөрчлөгддөг статистик параметрийн загварууд юм. Жишээ нь, сурагчдын амжилтын загвар нь сурагчдад зориулсан хэмжигдэхүүн, мөн оюутнуудыг бүлэглэсэн анги танхимд зориулсан хэмжүүрүүд юм. Эдгээр загваруудыг шугаман загваруудын ерөнхий ойлголт (ялангуяа шугаман регресс) гэж үзэж болох боловч тэдгээрийг шугаман бус загварт ч мөн өргөтгөж болно. Эдгээр загварууд болсонХангалттай тооцоолох хүчин чадал, програм хангамж бэлэн болсон үед илүү алдартай болсон.

Сегментийн статистик
Сегментийн статистик

Олон түвшний загварууд нь оролцогчдын өгөгдлийг нэгээс олон түвшинд (жишээ нь, үүрлэсэн өгөгдөл) зохион байгуулдаг судалгааны төслүүдэд ялангуяа тохиромжтой. Шинжилгээний нэгж нь ихэвчлэн контекст/нийт нэгж (дээд түвшинд) дотор байрласан хувь хүмүүс (доод түвшинд) байдаг. Олон түвшний загваруудын хамгийн бага түвшний өгөгдлүүд нь ихэвчлэн хувь хүн байдаг ч хувь хүмүүсийн давтан хэмжилтийг бас авч үзэж болно. Тиймээс олон түвшний загварууд нь нэг хувьсах эсвэл олон хувьсагчтай давтан хэмжилтийн шинжилгээнд өөр төрлийн дүн шинжилгээ хийх боломжийг олгодог. Өсөлтийн муруй дахь хувь хүний ялгааг авч үзэж болно. Нэмж дурдахад олон түвшний загваруудыг ANCOVA-ийн өөр хувилбар болгон ашиглаж болох бөгөөд эмчилгээний ялгааг шалгахын өмнө хамааралтай хувьсагчийн оноог ковариацын хувьд (жишээлбэл, хувь хүний ялгаа) тохируулдаг. Олон түвшний загварууд нь ANCOVA-д шаардагдах жигд регрессийн налууг тооцохгүйгээр эдгээр туршилтуудыг шинжлэх боломжтой.

Олон түвшний загваруудыг олон түвшний өгөгдөлд ашиглаж болно, гэхдээ хоёр түвшний загвар нь хамгийн түгээмэл бөгөөд энэ нийтлэлийн үлдсэн хэсэг нь эдгээрт анхаарлаа хандуулдаг. Хамаарах хувьсагчийг шинжилгээний хамгийн доод түвшинд шалгах хэрэгтэй.

Агаар мандлын даралтын график
Агаар мандлын даралтын график

Загвар сонголт

Загвар сонголтстатистик загварчлалын хүрээнд хийгдсэн өгөгдөлд өгөгдсөн нэр дэвшигчдийн загвараас сонгох ажил юм. Хамгийн энгийн тохиолдолд аль хэдийн байгаа мэдээллийн багцыг авч үздэг. Гэсэн хэдий ч, уг даалгавар нь цуглуулсан өгөгдөл нь загвар сонгох даалгаварт тохирсон байхын тулд туршилтыг зохион бүтээхтэй холбоотой байж болно. Урьдчилан таамаглах эсвэл тайлбарлах чадвартай ижил төстэй загваруудыг авч үзвэл хамгийн энгийн загвар нь хамгийн сайн сонголт байх магадлалтай (Оккамын сахлын машин).

Кониши & Китагава хэлэхдээ "Ихэнх статистик дүгнэлтийн асуудлыг статистик загварчлалтай холбоотой асуудлууд гэж үзэж болно." Үүнтэй адилаар Кокс хэлэхдээ, "Сэдвийн материалыг статистик загварт хэрхэн хөрвүүлэх нь ихэвчлэн шинжилгээний хамгийн чухал хэсэг байдаг."

Загвар сонголт гэдэг нь тодорхойгүй байдлын үед шийдвэр гаргах эсвэл оновчтой болгох зорилгоор олон тооны тооцооллын загвараас цөөн тооны төлөөлөх загварыг сонгох асуудлыг мөн хэлж болно.

График загвар

График загвар буюу магадлалын график загвар (PGM) эсвэл бүтэцлэгдсэн магадлалын загвар нь график нь санамсаргүй хэмжигдэхүүнүүдийн хоорондын нөхцөлт хамаарлын бүтцийг илэрхийлдэг магадлалын загвар юм. Тэдгээрийг магадлалын онол, статистик (ялангуяа Байезийн статистик) болон машин сурахад ихэвчлэн ашигладаг.

График бүхий статистик загвар
График бүхий статистик загвар

Эконометрик загварууд

Эконометрик загварууд нь статистикийн загварууд юмэконометрик. Эконометрик загвар нь эдийн засгийн тодорхой үзэгдэлтэй холбоотой янз бүрийн эдийн засгийн хэмжигдэхүүнүүдийн хооронд байдаг гэж үздэг статистикийн харилцааг тодорхойлдог. Эконометрик загварыг тодорхой бус байдлыг харгалзан үзсэн детерминист эдийн засгийн загвараас эсвэл өөрөө стохастик эдийн засгийн загвараас гаргаж авч болно. Гэхдээ ямар нэгэн эдийн засгийн онолтой холбоогүй эконометрик загваруудыг ашиглах боломжтой.

Зөвлөмж болгож буй: