Статистикийн таамаглалыг шалгах шалгуур, арга, жишээ

Агуулгын хүснэгт:

Статистикийн таамаглалыг шалгах шалгуур, арга, жишээ
Статистикийн таамаглалыг шалгах шалгуур, арга, жишээ
Anonim

Таамаглалыг шалгах нь статистикийн зайлшгүй шаардлагатай процедур юм. Таамаглалын тест нь түүвэр мэдээллээр аль мэдэгдлийг хамгийн сайн дэмжиж байгааг тодорхойлохын тулд бие биенээ үгүйсгэдэг хоёр мэдэгдлийг үнэлдэг. Хэрэв илэрцийг статистикийн хувьд ач холбогдолтой гэж үзвэл энэ нь таамаглалын шалгалттай холбоотой.

Баталгаажуулах аргууд

Статистикийн таамаглалыг шалгах аргууд нь статистикийн шинжилгээний аргууд юм. Ихэвчлэн хоёр багц статистикийг харьцуулж, эсвэл түүвэрлэсэн өгөгдлийн багцыг оновчтой загвараас синтетик өгөгдлийн багцтай харьцуулдаг. Өгөгдлийг шинэ утга санааг нэмэх үүднээс тайлбарлах ёстой. Та эцсийн үр дүнгийн тодорхой бүтцийг таамаглаж, статистикийн аргуудыг ашиглан таамаглалыг батлах эсвэл үгүйсгэх замаар тэдгээрийг тайлбарлаж болно. Таамаглалыг таамаглал гэж нэрлэдэг бөгөөд энэ зорилгоор ашигласан статистикийн тестүүдийг статистик таамаглал гэж нэрлэдэг.

H0 ба H1 таамаглал

Үндсэн хоёр зүйл байнатаамаглалыг статистикийн туршилтын тухай ойлголтууд - "үндсэн эсвэл тэг таамаглал" ба "өөр хувилбар" гэж нэрлэгддэг. Тэднийг Нейман-Пирсоны таамаглал гэж бас нэрлэдэг. Статистикийн тестийн таамаглалыг тэг таамаглал, үндсэн таамаглал эсвэл товчоор Н0 гэж нэрлэдэг. Үүнийг ихэвчлэн анхдагч таамаглал эсвэл юу ч өөрчлөгдөөгүй гэсэн таамаглал гэж нэрлэдэг. Туршилтын таамаглалын зөрчлийг ихэвчлэн эхний таамаглал, өөр таамаглал эсвэл H1 гэж нэрлэдэг. H1 нь бусад таамаглалын товчлол, учир нь бидний мэдэж байгаа зүйл бол H0 өгөгдлийг устгаж болно.

тэг таамаглалын тест
тэг таамаглалын тест

Үгүй таамаглалыг үгүйсгэх эсвэл үгүйсгэхээс өмнө туршилтын үр дүнг тайлбарлах шаардлагатай. Хэрэв өгөгдлийн багц хоорондын хамаарал нь босго магадлал - ач холбогдлын түвшний дагуу тэг таамаглалыг хэрэгжүүлэх магадлал багатай бол харьцуулалтыг статистикийн ач холбогдолтой гэж үзнэ. Статистикийн таамаглалыг шалгахад тохиромжтой байдлын шалгуурууд бас байдаг. Энэ нь үл мэдэгдэх тархалтын хуультай холбоотой таамаглалыг шалгах шалгуурын нэр юм. Энэ нь эмпирик болон онолын тархалтын зөрүүг илэрхийлэх тоон үзүүлэлт юм.

Статистик таамаглалыг шалгах журам, шалгуур

Хамгийн түгээмэл таамаглал сонгох аргууд нь Акайке мэдээллийн шалгуур эсвэл Байезийн коэффициент дээр суурилдаг. Статистикийн таамаглалыг шалгах нь дүгнэлт ба Байезийн дүгнэлтийн аль алиных нь гол арга техник боловч хоёр төрөл нь мэдэгдэхүйц ялгаатай байдаг. Статистик таамаглалын тестүүдбуруу дефолт эсвэл тэг таамаглалыг буруугаар шийдэх магадлалыг хянадаг процедурыг тодорхойлох. Уг процедур нь ажиллах магадлал хэр зэрэг дээр суурилдаг. Буруу шийдвэр гаргах магадлал нь тэг таамаглал үнэн байх магадлал бөгөөд өөр өөр таамаглал байхгүй байх магадлал юм. Тест нь үнэн эсвэл худал эсэхийг харуулах боломжгүй.

Статистикийн таамаглалыг шалгах арга
Статистикийн таамаглалыг шалгах арга

Шийдвэрийн онолын альтернатив аргууд

Шийдвэрийн онолын альтернатив аргууд байдаг бөгөөд үүнд тэг болон эхний таамаглалыг илүү тэнцүү түвшинд авч үздэг. Байесын онол гэх мэт шийдвэр гаргах бусад аргууд нь нэг хоосон таамаглал дээр төвлөрөхөөс илүүтэйгээр бүх боломжит буруу шийдвэрийн үр дагаврыг тэнцвэржүүлэхийг оролддог. Таамаглалуудын аль нь зөв болохыг шийдэх хэд хэдэн өөр аргууд нь өгөгдөлд үндэслэсэн бөгөөд тэдгээрийн аль нь хүссэн шинж чанартай байдаг. Гэхдээ таамаглалыг шалгах нь шинжлэх ухааны олон салбарт өгөгдөлд дүн шинжилгээ хийх давамгайлах арга юм.

Статистик таамаглалыг шалгах

Нэг багц үр дүн нь нөгөө багцаас ялгаатай байвал та статистик таамаглалыг шалгах эсвэл статистик таамаглалыг шалгахад найдах ёстой. Тэдний тайлбар нь p-утга ба чухал утгыг зөв ойлгохыг шаарддаг. Ач холбогдолын түвшнээс үл хамааран тестүүд алдаатай хэвээр байдгийг ойлгох нь чухал юм. Тиймээс дүгнэлт буруу байж магадгүй.

Туршилтын үйл явц нь дараахаас бүрдэнэолон алхам:

  1. Судалгаанд зориулж анхны таамаглалыг үүсгэж байна.
  2. Холбогдох тэг болон өөр таамаглалуудыг зааж өгсөн.
  3. Тестийн түүврийн талаарх статистик таамаглалыг тайлбарлана.
  4. Аль тест тохиромжтойг тодорхойлох.
  5. Үндсэн таамаглалыг үгүйсгэх ач холбогдлын түвшин болон магадлалын босгыг сонгоно уу.
  6. Тэг таамаглалыг шалгах статистикийн тархалт нь тэг таамаглалыг үгүйсгэх боломжит утгыг харуулдаг.
  7. Тооцоо хийж байна.
  8. Өөр хувилбарын төлөө тэг таамаглалыг үгүйсгэх эсвэл хүлээн зөвшөөрөх шийдвэр гаргасан.

P-утга ашигладаг өөр хувилбар байна.

Статистикийн таамаглалыг шалгах жишээ
Статистикийн таамаглалыг шалгах жишээ

Ач холбогдлын тест

Цэвэр өгөгдөл тайлбаргүйгээр практикт ашиггүй. Статистикийн хувьд өгөгдлийн талаар асуулт асуух, үр дүнг тайлбарлах үед хариултын үнэн зөв, магадлалыг баталгаажуулахын тулд статистикийн аргыг ашигладаг. Статистикийн таамаглалыг шалгахдаа энэ ангиллын аргуудыг статистикийн тест буюу ач холбогдлын тест гэж нэрлэдэг. "Таамаглал" гэсэн нэр томъёо нь таамаглал, онолыг судалдаг шинжлэх ухааны аргуудыг санагдуулдаг. Статистикийн хувьд таамаглалыг шалгахад өгөгдсөн таамаглалд өгөгдсөн хэмжигдэхүүн гарч ирдэг. Энэ нь таамаг үнэн эсвэл зөрчил гаргасан эсэхийг тайлбарлах боломжийг танд олгоно.

Тестийн статистик тайлбар

Таамаглалын тестүүдСудалгааны ямар үр дүн нь урьдчилан тодорхойлсон ач холбогдлын хувьд тэг таамаглалыг үгүйсгэхэд хүргэж болохыг тодорхойлоход ашигладаг. Статистикийн таамаглалын тестийн үр дүнг тайлбарлах ёстой бөгөөд ингэснээр үргэлжлүүлэн ажиллах боломжтой болно. Статистикийн таамаглалыг шалгах шалгуурын хоёр нийтлэг хэлбэр байдаг. Эдгээр нь p-утга ба чухал утгууд юм. Сонгосон шалгуураас хамааран олж авсан үр дүнг өөрөөр тайлбарлах ёстой.

p-утга гэж юу вэ

Гарцыг p-утгыг тайлбарлах үед статистикийн ач холбогдолтой гэж тодорхойлсон. Үнэн хэрэгтээ энэ үзүүлэлт нь тэг таамаглалыг үгүйсгэсэн тохиолдолд алдаа гарах магадлалыг хэлнэ. Өөрөөр хэлбэл, туршилтын үр дүнг тайлбарлах, тоон үзүүлэлтийг гаргахад ашиглаж болох утгыг нэрлэх, тэг таамаглалыг үгүйсгэхэд алдаа гарах магадлалыг тодорхойлоход ашиглаж болно. Жишээлбэл, та түүвэр өгөгдлүүд дээр хэвийн байдлын тест хийж, хэт давсан гарах магадлал бага байгааг олж мэдэх боломжтой. Гэсэн хэдий ч тэг таамаглалыг үгүйсгэх шаардлагагүй. Статистик таамаглалын тест нь p-утгыг буцаана. Энэ нь p-ийн утгыг ач холбогдлын түвшин гэж нэрлэгддэг урьдчилан тогтоосон босго утгатай харьцуулах замаар хийгддэг.

Тэг таамаглалын статистикийн туршилт
Тэг таамаглалын статистикийн туршилт

Ач холбогдлын түвшин

Ач холбогдлын түвшинг ихэвчлэн Грекийн жижиг үсгээр "альфа" гэж бичдэг. Альфа-д хэрэглэгддэг ерөнхий утга нь 5% буюу 0.05. Альфа утга бага байх нь тэг таамаглалын илүү найдвартай тайлбарыг харуулж байна. p-утгыг харьцуулнаурьдчилан сонгосон альфа утга. Хэрэв p-утга нь альфа-аас бага байвал үр дүн нь статистикийн хувьд чухал юм. Ач холбогдлын түвшинг нэгээс хасах замаар урвуу болгож болно. Үүнийг ажигласан түүврийн өгөгдөлд өгсөн таамаглалын итгэлийн түвшинг тодорхойлохын тулд хийдэг. Статистикийн таамаглалыг шалгах энэ аргыг ашиглах үед P-утга нь магадлал юм. Энэ нь статистикийн тестийн үр дүнг тайлбарлах явцад үнэн худал гэдгийг мэдэхгүй гэсэн үг.

Статистик таамаглалыг шалгах онол

Тэг таамаглалыг няцаах нь магадлалыг харуулсан хангалттай статистик нотолгоо байна гэсэн үг. Тэгэхгүй бол няцаах статистик тоо байхгүй гэсэн үг. Статистикийн тестийг тэг таамаглалыг үгүйсгэх, хүлээн зөвшөөрөх гэсэн хоёр талт байдлаар бодож болно. Тэг таамаглалыг статистикийн аргаар шалгахын аюул нь хэрэв хүлээн зөвшөөрвөл энэ нь үнэн мэт санагдаж магадгүй юм. Үүний оронд үүнийг үгүйсгэх хангалттай статистик нотолгоо байхгүй тул тэг таамаглалыг үгүйсгээгүй гэж хэлэх нь илүү зөв байх болно.

Тохиромжтой шалгуур үзүүлэлтийг шалгадаг статистик таамаглал
Тохиромжтой шалгуур үзүүлэлтийг шалгадаг статистик таамаглал

Энэ мөч нь ихэвчлэн шинэхэн нэмэлтүүдийг төөрөлдүүлдэг. Ийм тохиолдолд үр дүн нь магадлал өндөртэй, тэг таамаглалыг хүлээн зөвшөөрсөн ч алдаа гарах магадлал бага байдгийг өөртөө сануулах нь чухал.

Үнэн эсвэл худал таамаглал

p-ийн утгыг тайлбарлах нь тэг гэсэн үг биш юмтаамаглал нь үнэн эсвэл худал. Энэ нь эмпирик өгөгдөл болон сонгосон статистик тест дээр үндэслэн статистикийн ач холбогдлын тодорхой түвшинд тэг таамаглалыг үгүйсгэх, үгүйсгэхгүй гэсэн сонголт хийгдсэн гэсэн үг юм. Тиймээс p-утгыг статистикийн туршилтанд суулгасан урьдчилан тодорхойлсон таамаглалын дагуу өгсөн өгөгдлийн магадлал гэж үзэж болно. p-утга нь тэг таамаглал үнэн бол өгөгдлийн түүврийг ажиглах магадлалын хэмжүүр юм.

Чухал үнэ цэнийн тайлбар

Зарим тестүүд х. буцаж ирдэггүй. Үүний оронд тэд чухал утгуудын жагсаалтыг гаргаж болно. Ийм судалгааны үр дүнг ижил төстэй байдлаар тайлбарладаг. Урьдчилан тодорхойлсон ач холбогдлын түвшинтэй нэг p-утгыг харьцуулахын оронд туршилтын статистикийг чухал утгатай харьцуулна. Хэрэв энэ нь бага болвол тэг таамаглалыг үгүйсгэх боломжгүй байсан гэсэн үг юм. Хэрэв түүнээс их эсвэл тэнцүү бол тэг таамаглалыг үгүйсгэх ёстой. Статистикийн таамаглалыг шалгах алгоритмын утга ба түүний үр дүнгийн тайлбар нь p-утгатай төстэй юм. Сонгосон ач холбогдлын түвшин нь өгөгдөлд өгөгдсөн туршилтын үндсэн таамаглалыг үгүйсгэх эсвэл үгүйсгэхгүй байх магадлалын шийдвэр юм.

Статистикийн тестийн алдаа

Статистик таамаглалын тестийн тайлбар нь магадлал юм. Статистикийн таамаглалыг шалгах ажил нь үнэн эсвэл худал мэдэгдлийг олох явдал биш юм. Туршилтын нотлох баримт нь алдаатай байж болно. Жишээлбэл, хэрэв альфа нь 5% байсан бол энэ нь ихэнх хэсэг нь 20-ийн 1 гэсэн үг юмтэг таамаглал нь алдаагаар няцаагдах болно. Эсвэл өгөгдлийн дээж дэх статистикийн чимээ шуугианаас болж тийм биш байх болно. Энэ цэгийг авч үзвэл тэг таамаглалыг үгүйсгэх жижиг p утга нь худал эсвэл алдаа гарсан гэсэн үг юм. Хэрэв ийм төрлийн алдаа гарвал үр дүнг худал эерэг гэж нэрлэдэг. Мөн ийм алдаа нь статистикийн таамаглалыг шалгахдаа эхний төрлийн алдаа юм. Нөгөө талаас, хэрэв p-утга нь тэг таамаглалыг үгүйсгэх хангалттай том бол энэ нь үнэн гэсэн үг юм. Эсвэл буруу байна, мөн алдаа гаргасан учир магадлал багатай үйл явдал болсон. Энэ төрлийн алдааг худал сөрөг гэж нэрлэдэг.

Тэг таамаглалын статистикийн туршилт
Тэг таамаглалын статистикийн туршилт

Алдаа гарах магадлал

Статистикийн таамаглалыг шалгахдаа эдгээр төрлийн алдаа гаргах боломж байсаар байна. Хуурамч мэдээлэл эсвэл худал дүгнэлт гаргах магадлал өндөр. Эдгээр алдаануудын аль нэгнийх нь магадлалыг багасгах ач холбогдлын түвшинг сонгох нь хамгийн тохиромжтой. Жишээлбэл, тэг таамаглалыг статистикийн аргаар шалгах нь маш бага түвшний ач холбогдолтой байж болно. Шинжлэх ухааны олон салбарт 0.05, 0.01 зэрэг ач холбогдлын түвшин түгээмэл байдаг ч хамгийн түгээмэл хэрэглэгддэг ач холбогдлын түвшин нь 310^-7 буюу 0.0000003. Үүнийг ихэвчлэн “5-сигма” гэж нэрлэдэг. Энэ нь туршилтын бие даасан давталтын 3.5 сая тутамд 1 байх магадлалтай санамсаргүй байдлаар дүгнэлт хийсэн гэсэн үг юм. Статистикийн таамаглалыг шалгах жишээнүүд ихэвчлэн ийм алдаатай байдаг. Энэ нь бас бие даасан үр дүнтэй байх нь чухал шалтгаан юм.баталгаажуулалт.

Статистикийн баталгаажуулалтыг ашиглах жишээ

Практикт таамаглалыг шалгах хэд хэдэн нийтлэг жишээ байдаг. Хамгийн алдартай нь "Цайны амталгаа" гэж нэрлэгддэг. Биометрийн шинжлэх ухааныг үндэслэгч Роберт Фишерийн хамтран зүтгэгч, доктор Муриэль Бристол үүнийг эхлээд аяга цай эсвэл сүүнд нэмсэн эсэхийг баттай хэлж чадна гэж мэдэгджээ. Фишер түүнд санамсаргүй байдлаар найман аяга (төрөл бүрийн дөрөв) өгөхийг санал болгов. Туршилтын статистик нь энгийн байсан: аяга сонгох амжилтын тоог тоолох. Чухал бүс нь ердийн магадлалын шалгуурт (< 5%; 70-д 1 ≈ 1.4%) үндэслэсэн байж магадгүй 4-өөс цорын ганц амжилт байсан. Фишер өөр таамаглал дэвшүүлэх шаардлагагүй гэж үзсэн. Хатагтай аяга бүрийг зөв тодорхойлсон нь статистикийн ач холбогдолтой үр дүн гэж үзсэн. Энэ туршлага нь Фишерийн "Статистикийн арга зүй судлаачдад зориулсан" номыг гаргахад хүргэсэн.

Шүүгдэгчийн жишээ

Шүүгдэгчийг гэм буруутай нь нотлогдох хүртэл гэм буруугүйд тооцдог эрүүгийн шүүхтэй харьцуулах статистикийн шүүн таслах ажиллагаа. Прокурор шүүгдэгчийн гэм бурууг нотлохыг оролддог. Зөвхөн яллах хангалттай нотлох баримт байгаа үед л шүүгдэгчийг гэм буруутайд тооцож болно. Процедурын эхэнд “Шүүгдэгч буруугүй”, “Шүүгдэгч буруутай” гэсэн хоёр таамаг дэвшүүлж байна. Гэм буруугүй гэсэн таамаглалыг гэм буруугүй шүүгдэгчийг буруутгахыг хүсэхгүй байгаа тул алдаа гарах магадлал маш бага үед л үгүйсгэж болно. Ийм алдааг I төрлийн алдаа гэж нэрлэдэг ба түүний илрэлховор хяналттай. Энэхүү тэгш бус зан үйлийн үр дүнд II төрлийн алдаа, тухайлбал гэмт этгээдийг цагаатгах нь илүү түгээмэл байдаг.

Статистикийн баталгаажуулалтын жишээнүүд
Статистикийн баталгаажуулалтын жишээнүүд

Статистик нь их хэмжээний өгөгдөлд дүн шинжилгээ хийхэд хэрэгтэй. Энэ нь шинжлэх ухааны онол байхгүй байсан ч дүгнэлтийг зөвтгөж болох таамаглалыг шалгахад адил хамаарна. Цайны амталгааны жишээн дээр сүүнд сүү асгах, сүүнд цай хийх хоёрын хооронд ямар ч ялгаа байхгүй нь "илэрхий" байсан.

Таамаглалыг шалгах бодит практик хэрэглээ нь:

  • эрчүүд эмэгтэйчүүдээс илүү хар дарсан зүүд зүүдэлдэг эсэхийг шалгах;
  • баримт бичгийн хамаарал;
  • Бүтэн сар зан төлөвт үзүүлэх нөлөөг үнэлэх;
  • цуурай ашиглан сарьсан багваахай шавьж илрүүлэх хязгаарыг тодорхойлох;
  • тамхинаас гарах хамгийн сайн арга замыг сонгох;
  • Бампер наалт нь автомашин эзэмшигчийн зан байдлыг илэрхийлж байгаа эсэхийг шалгаж байна.

Статистикийн таамаглалыг шалгах нь ерөнхий статистик болон статистик дүгнэлт гаргахад чухал үүрэг гүйцэтгэдэг. Шинжлэх ухааны аргын гол цөмд үнэ цэнийн туршилтыг урьдчилан таамагласан үнэ цэнэ ба туршилтын үр дүнгийн уламжлалт харьцуулалтыг орлуулах зорилгоор ашигладаг. Онол нь зөвхөн харилцааны шинж тэмдгийг урьдчилан таамаглах чадвартай бол чиглүүлсэн таамаглалын тестийг зөвхөн статистикийн ач холбогдолтой үр дүн нь онолыг дэмжих байдлаар тохируулж болно. Үнэлгээний онолын энэ хэлбэр нь хамгийн хатуу юмтаамаглалыг шалгахыг шүүмжилсэн.

Зөвлөмж болгож буй: