Статистикийн загвар нь зарим түүврийн өгөгдлийг үүсгэх талаархи олон янзын таамаглалыг агуулсан математикийн төсөөлөл юм. Энэ нэр томьёог ихэвчлэн маш оновчтой хэлбэрээр илэрхийлдэг.
Статистик загварт илэрхийлсэн таамаглалууд нь магадлалын хуваарилалтын багцыг харуулж байна. Тэдгээрийн ихэнх нь тодорхой мэдээллийн багцыг гаргаж авсан тархалтыг зөв тооцоолох зорилготой юм. Статистикийн загварт хамаарах магадлалын тархалт нь проекцийг бусад математикийн өөрчлөлтүүдээс ялгаж өгдөг.
Ерөнхий төсөөлөл
Математик загвар нь тодорхой ойлголт, хэллэг ашиглан системийн дүрслэл юм. Эдгээр нь байгалийн шинжлэх ухаан (физик, биологи, газрын шинжлэх ухаан, хими гэх мэт) болон инженерийн салбарууд (компьютерийн шинжлэх ухаан, цахилгааны инженер гэх мэт), нийгмийн шинжлэх ухаанд (эдийн засаг, сэтгэл судлал, социологи, улс төрийн шинжлэх ухаан гэх мэт) хамаарна.
Загвар нь системийг тайлбарлахад тусалнаТөрөл бүрийн бүрэлдэхүүн хэсгүүдийн нөлөөг судалж, зан төлөвийг урьдчилан таамаглах.
Математик загварууд нь динамик систем, статистик төсөөлөл, дифференциал тэгшитгэл эсвэл тоглоомын онолын параметр зэрэг олон хэлбэртэй байж болно. Эдгээр болон бусад төрлүүд нь давхцаж болох бөгөөд энэ загвар нь олон хийсвэр бүтцийг агуулдаг. Ерөнхийдөө математикийн төсөөлөлд логик бүрэлдэхүүн хэсгүүдийг багтааж болно. Ихэнх тохиолдолд шинжлэх ухааны салбарын чанар нь онолын хувьд боловсруулсан математик загварууд нь давтан туршилтын үр дүнтэй хэр нийцэж байгаагаас хамаардаг. Онолын үйл явц болон туршилтын хэмжилтийн хооронд тохирохгүй байх нь илүү сайн онол боловсруулахад чухал ахиц дэвшилд хүргэдэг.
Физикийн шинжлэх ухаанд уламжлалт математик загварт дараах олон тооны элементүүд багтдаг:
- Хяналтын тэгшитгэл.
- Нэмэлт дэд загварууд.
- Тэгшитгэлийг тодорхойлох.
- Бүрдүүлэгч тэгшитгэл.
- Таамаглал ба хязгаарлалт.
- Анхны болон хилийн нөхцөл.
- Сонгодог хязгаарлалт ба кинематик тэгшитгэл.
Формула
Статистикийн загвар нь дүрмээр бол нэг буюу хэд хэдэн санамсаргүй хэмжигдэхүүн, магадгүй бусад байгалийн гаралтай хувьсагчдыг нэгтгэсэн математик тэгшитгэлээр тогтоогддог. Үүнтэй адилаар проекцийг "үзэл баримтлалын албан ёсны ойлголт" гэж үздэг.
Бүх статистик таамаглалыг шалгах болон статистикийн үнэлгээг математик загвараас авдаг.
Танилцуулга
Албан бусаар статистик загварыг тодорхой шинж чанартай таамаглал (эсвэл таамаглалын багц) гэж үзэж болно: энэ нь аливаа үйл явдлын магадлалыг тооцоолох боломжийг олгодог. Жишээ болгон энгийн зургаан талт шоо авч үзье. Ясны талаарх хоёр өөр статистик таамаглалыг судлах шаардлагатай.
Эхний таамаглал:
Шоо бүрийн хувьд тоонуудын аль нэгийг (1, 2, 3, 4, 5, 6) авах магадлал: 1/6.
Энэ таамаглалаас бид шоо хоёулангийнх нь магадлалыг тооцоолж болно: 1:1/6×1/6=1/36.
Ерөнхийдөө та аливаа үйл явдлын магадлалыг тооцоолж болно. Гэсэн хэдий ч өөр ямар нэгэн чухал бус үйл явдлын магадлалыг тооцоолох боломжгүй гэдгийг ойлгох хэрэгтэй.
Зөвхөн эхний дүгнэлт нь статистик математик загварыг цуглуулдаг: учир нь зөвхөн нэг таамаглалаар үйлдэл бүрийн магадлалыг тодорхойлох боломжтой.
Дээрх жишээнд анхан шатны зөвшөөрөлтэйгөөр үйл явдлын магадлалыг тодорхойлоход хялбар байдаг. Бусад зарим жишээнүүдийн хувьд тооцоолол нь хэцүү эсвэл бүр бодитой бус байж болно (жишээлбэл, олон жилийн тооцоо шаардлагатай байж болно). Статистик шинжилгээний загвар зохион бүтээж буй хүний хувьд ийм нарийн төвөгтэй байдлыг хүлээн зөвшөөрөх боломжгүй гэж үздэг: тооцооллыг хэрэгжүүлэх нь практикт боломжгүй, онолын хувьд боломжгүй байх ёсгүй.
Албан ёсны тодорхойлолт
Математикийн хувьд системийн статистик загварыг ихэвчлэн хос (S, P) гэж үздэг бөгөөд S ньболомжит ажиглалтын багц, өөрөөр хэлбэл түүврийн орон зай, P нь S дээрх магадлалын тархалтын багц юм.
Энэ тодорхойлолтын зөн совин нь дараах байдалтай байна. Тодорхой өгөгдөл үүсгэх процессоос үүдэлтэй "үнэн" магадлалын тархалт байна гэж таамаглаж байна.
Тохируулах
Загварын параметрүүдийг өөрөө тодорхойлдог. Параметржуулалт нь янз бүрийн тархалтыг бий болгохын тулд ерөнхийдөө өөр утгыг шаарддаг, жишээлбэл
барих ёстой (өөрөөр хэлбэл тарилгатай байх ёстой). Шаардлагыг хангасан параметржуулалтыг тодорхойлох боломжтой гэж хэлнэ.
Жишээ
Өөр өөр насны хэдэн оюутан байна гэж бодъё. Хүүхдийн өндөр нь төрсөн онтой нь холбоотой байх болно: жишээлбэл, сургуулийн сурагч 7 настай байх үед энэ нь өсөлтийн магадлалд нөлөөлдөг бөгөөд ингэснээр хүн 3 см-ээс өндөр байх болно.
Та энэ хандлагыг шулуун шугамын регрессийн загвар болгон албан ёсны болгож болно, жишээ нь: өндөр i=b 0 + b 1agei + εi, b 0 нь огтлолцол, b 1 нь хэдэн насны параметр юм өндрийн хяналтыг авах үед үржүүлдэг. Энэ бол алдааны нэр томъёо юм. Энэ нь өндрийг тодорхой алдаатай насаар таамагласан гэж үздэг.
Хүчинтэй маягт нь бүх мэдээллийн цэгтэй тохирч байх ёстой. Тиймээс шулуун шугаман чиглэл (i=b 0 + b 1agei түвшин) нь өгөгдлийн загварт тэгшитгэл болж чадахгүй - хэрэв энэ нь бүх цэгүүдэд тодорхой хариулт өгөхгүй бол. өөрөөр хэлбэлямар ч тохиолдолд бүх мэдээлэл шугаман дээр өө сэвгүй оршдог. Маягт нь мэдээллийн бүх зүйлтэй яг таарч байхын тулд εi алдааны хэмжээг тэгшитгэлд оруулах ёстой.
Статистикийн дүгнэлт гаргахын тулд эхлээд ε i-ийн магадлалын зарим тархалтыг тооцох хэрэгтэй. Жишээлбэл, ε i-ийн тархалт нь тэг дундажтай Гауссын хэлбэртэй байна гэж үзэж болно. Энэ тохиолдолд загвар нь b 0, b 1 болон Гауссын тархалтын дисперс гэсэн 3 параметртэй байна.
Та загварыг албан ёсоор (S, P) гэж зааж өгч болно.
Энэ жишээнд загварыг S-г зааж өгсөн тул P-ийн талаар зарим таамаглал дэвшүүлж болно. Хоёр сонголт байна:
Энэ өсөлтийг насны шугаман функцээр ойролцоогоор тодорхойлж болно;
Ойролцоогоор алдаанууд нь Гауссын доторх байдлаар тархсан байна.
Ерөнхий тайлбар
Загварын статистик үзүүлэлтүүд нь математик проекцын тусгай анги юм. Нэг төрөл зүйл нөгөөгөөсөө юугаараа ялгаатай вэ? Тиймээс статистикийн загвар нь тодорхой бус байдаг. Тиймээс, математикийн тэгшитгэлээс ялгаатай нь тодорхой хувьсагч нь тодорхой утгатай байдаггүй, харин боломжийн хуваарилалттай байдаг. Өөрөөр хэлбэл хувьсагчдыг стохастик гэж үздэг. Дээрх жишээнд ε нь стохастик хувьсагч юм. Үүнгүйгээр төсөөлөл нь тодорхой болох байсан.
Материаллаг үйл явцыг тодорхойлогч гэж үзсэн ч статистик загвар бүтээх нь ихэвчлэн ашиглагддаг. Жишээлбэл, зоос шидэх нь зарчмын хувьд урьдчилан тодорхойлсон үйлдэл юм. Гэсэн хэдий ч энэ нь ихэнх тохиолдолд стохастик байдлаар загварчлагдсан хэвээр байна (Бернулли процессоор).
Кониши, Китагава нарын хэлснээр статистик загварт гурван зорилго бий:
- Таамаглал.
- Мэдээллийн олборлолт.
- Стохастик бүтцийн тодорхойлолт.
Төсөлийн хэмжээ
Статистикийн таамаглалын загвар байгаа гэж бодъё, Хэрэв O хязгаарлагдмал хэмжээстэй бол загварыг параметр гэж нэрлэдэг. Шийдэлд та
гэж бичих ёстой.
энд k нь эерэг бүхэл тоо (R нь аливаа бодит тоог илэрхийлдэг). Энд k-г загварын хэмжээс гэнэ.
Жишээ нь бид бүх өгөгдөл нь нэг хувьсагч Гауссын тархалтаас гаралтай гэж үзэж болно:
Энэ жишээнд k-ийн хэмжээ 2 байна.
Мөн өөр нэг жишээ болгон өгөгдөл нь (x, y) цэгүүдээс бүрдэх бөгөөд тэдгээр нь Гауссын үлдэгдэлтэй (тэг дундажтай) шулуун шугамаар тархсан гэж үзэж болно. Дараа нь статистик эдийн засгийн загварын хэмжээс нь 3-тай тэнцүү байна: шугамын огтлолцол, түүний налуу ба үлдэгдлийн тархалтын дисперс. Геометрийн хувьд шулуун шугам нь 1 хэмжээтэй байдаг гэдгийг тэмдэглэх нь зүйтэй.
Хэдийгээр дээрх утга нь техникийн хувьд k хэмжигдэхүүнтэй цорын ганц параметр боловч заримдаа k ялгаатай утгыг агуулсан гэж үздэг. Жишээлбэл, нэг хэмжээст Гауссын тархалттай бол O нь 2 хэмжээтэй цорын ганц параметр боловч заримдаа хоёрыг агуулна гэж үздэг.хувь хүний параметр - дундаж утга ба стандарт хазайлт.
О утгын багц хязгааргүй хэмжээст байвал статистик процессын загвар нь параметрийн бус байна. Мөн хязгаарлагдмал хэмжээст ба хязгааргүй хэмжээст параметрүүдтэй бол хагас параметрт байна. Албан ёсоор хэрэв k нь O хэмжигдэхүүн, n нь түүврийн тоо бол хагас параметрт болон параметргүй загварт
байна.
тэгвэл загвар нь хагас параметрт байна. Үгүй бол проекц нь параметрийн бус байна.
Параметрийн загварууд нь хамгийн түгээмэл хэрэглэгддэг статистик юм. Хагас параметрийн болон параметрийн бус төсөөллийн талаар Сэр Дэвид Кокс хэлэхдээ:
"Ерөнхийдөө тэдгээр нь бүтэц, тархалтын хэлбэрийн талаархи хамгийн цөөн таамаглалыг агуулдаг боловч бие даасан байдлын талаархи хүчирхэг онолуудыг агуулдаг."
Үндсэн загварууд
Тэдгээрийг олон түвшний төсөөлөлтэй андуурч болохгүй.
Эхнийх нь параметрт хязгаарлалт тавих замаар эхнийх нь хоёр дахь руу хөрвүүлэгдэх боломжтой бол статистикийн хоёр загварыг үүрлэсэн болно. Жишээлбэл, бүх Гауссын тархалтын багц нь тэг дундаж тархалтын үүрлэсэн багцтай:
Өөрөөр хэлбэл, тэг дундажтай тархалтыг авахын тулд бүх Гауссын тархалтын багц дахь дундажийг хязгаарлах хэрэгтэй. Хоёрдахь жишээ болгон y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) квадрат загварт y=суулгагдсан шугаман загвар байна. b 0 + b 1 x + ε, ε ~ N (0,σ 2) - өөрөөр хэлбэл b2 нь 0-тэй тэнцүү байна.
Эдгээр жишээнүүдийн аль алинд нь эхний загвар нь хоёр дахь загвараас өндөр хэмжээсттэй байна. Энэ нь ихэвчлэн тохиолддог, гэхдээ үргэлж тийм байдаггүй. Өөр нэг жишээ бол 2 хэмжигдэхүүнтэй эерэг дундажтай Гауссын тархалтын багц юм.
Загваруудын харьцуулалт
Үүнийг үүсгэсэн процессоос үүдэлтэй ажиглагдсан өгөгдлийн суурь нь "үнэн" магадлалын тархалт байна гэж таамаглаж байна.
Мөн түүнчлэн загваруудыг хайгуулын шинжилгээ эсвэл баталгаажуулалтыг ашиглан өөр хоорондоо харьцуулж болно. Хайгуулын шинжилгээнд янз бүрийн загваруудыг боловсруулж, тэдгээр нь тус бүр нь өгөгдлийг хэр сайн дүрсэлж байгааг үнэлдэг. Баталгаажуулах шинжилгээнд өмнө нь боловсруулсан таамаглалыг анхны хувилбартай харьцуулдаг. Үүний нийтлэг шалгуурт P 2, Байесийн хүчин зүйл болон харьцангуй магадлал орно.
Кониши, Китагава нарын бодол
“Статистикийн математик загварын ихэнх асуудлыг урьдчилан таамаглах асуултууд гэж үзэж болно. Тэдгээрийг ихэвчлэн хэд хэдэн хүчин зүйлийн харьцуулалт хэлбэрээр томъёолдог."
Цаашилбал, Сэр Дэвид Кокс хэлэхдээ: "Сэдвийн орчуулгын хувьд статистик загвар дахь асуудал нь шинжилгээний хамгийн чухал хэсэг байдаг."