Логистик регресс: загвар ба арга

Агуулгын хүснэгт:

Логистик регресс: загвар ба арга
Логистик регресс: загвар ба арга
Anonim

Судалгаанд оролцогчдыг зорилтот ангиллаар нь тодорхой ялгах шаардлагатай үед логистик регресс болон ялгаварлан гадуурхах шинжилгээний аргуудыг ашигладаг. Энэ тохиолдолд бүлгүүдийг өөрсдөө нэг хувилбарт параметрийн түвшингээр төлөөлдөг. Логистик регрессийн загварыг нарийвчлан авч үзээд яагаад хэрэгтэй байгааг олж мэдье.

логистик регресс
логистик регресс

Ерөнхий мэдээлэл

Логистик регрессийг ашигладаг асуудлын нэг жишээ бол судалгаанд оролцогчдыг гич авдаг, авдаггүй бүлэгт ангилсан явдал юм. Нийгэм-хүн ам зүйн шинж чанарын дагуу ялгах ажлыг гүйцэтгэдэг. Үүнд, ялангуяа нас, хүйс, хамаатан садны тоо, орлого гэх мэт орно. Үйл ажиллагаанд ялгах шалгуур, хувьсагч байдаг. Сүүлийнх нь үнэндээ хариулагчдыг хуваах ёстой зорилтот ангиллыг кодлодог.

Нюансууд

Логистик регрессийг ашигладаг тохиолдлын хүрээ нь ялгаварлан гадуурхах шинжилгээнээс хамаагүй нарийссан гэдгийг хэлэх хэрэгтэй. Үүнтэй холбогдуулан сүүлийнхийг ялгах бүх нийтийн арга болгон ашиглахыг авч үзэж байнаилүүд үздэг. Түүнчлэн, шинжээчид ялгаварлан гадуурхах шинжилгээгээр ангиллын судалгааг эхлүүлэхийг зөвлөж байна. Зөвхөн үр дүн нь тодорхойгүй байгаа тохиолдолд л логистик регрессийг ашиглаж болно. Энэ хэрэгцээ нь хэд хэдэн хүчин зүйлээс үүдэлтэй. Логистик регрессийг бие даасан болон хамааралтай хувьсагчдын төрлийг тодорхой ойлгох үед ашигладаг. Үүний дагуу 3 боломжит процедурын аль нэгийг сонгосон. Дискриминант шинжилгээнд судлаач үргэлж нэг статик үйлдлийг авч үздэг. Үүнд ямар ч төрлийн масштабтай нэг хамааралтай ба хэд хэдэн бие даасан категори хувьсагч багтана.

Үзсэн тоо

Логистик регрессийг ашигладаг статистикийн судалгааны ажил нь тодорхой хариулагчийг тодорхой бүлэгт хуваарилах магадлалыг тодорхойлох явдал юм. Тодорхой параметрийн дагуу ялгах ажлыг гүйцэтгэдэг. Практикт нэг буюу хэд хэдэн бие даасан хүчин зүйлийн утгын дагуу судалгаанд оролцогчдыг хоёр бүлэгт ангилах боломжтой. Энэ тохиолдолд хоёртын логистик регресс явагдана. Мөн заасан параметрүүдийг хоёроос дээш бүлэгт хуваах үед ашиглаж болно. Ийм нөхцөлд олон гишүүнт логистик регресс явагдана. Үр дүнгийн бүлгүүдийг нэг хувьсагчийн түвшинд илэрхийлнэ.

логистик регресс
логистик регресс

Жишээ

Москвагийн захын хороололд газар худалдаж авах саналыг сонирхож байна уу гэсэн асуултад хариулагчдын хариулт байгаа гэж бодъё. Сонголтууд нь "үгүй"мөн тийм. Боломжит худалдан авагчдын шийдвэрт ямар хүчин зүйл давамгайлж байгааг олж мэдэх шаардлагатай. Үүнийг хийхийн тулд хариулагчдаас нутаг дэвсгэрийн дэд бүтэц, нийслэл хүртэлх зай, талбайн хэмжээ, орон сууцны барилга байгаа эсэх / байхгүй гэх мэт асуултуудыг асуудаг. Хоёртын регрессийг ашиглан хуваарилах боломжтой. судалгаанд оролцогчдыг хоёр бүлэгт хуваадаг. Эхнийх нь худалдан авах сонирхолтой хүмүүсийг багтаах болно - боломжит худалдан авагчид, хоёрдугаарт, ийм саналыг сонирхдоггүй хүмүүс. Судалгаанд хамрагдагч бүрийн хувьд нэг буюу өөр ангилалд хамаарах магадлалыг тооцно.

Харьцуулсан шинж чанар

Дээрх хоёр сонголтын ялгаа нь өөр өөр бүлгийн тоо, хамааралтай болон бие даасан хувьсагчийн төрөл юм. Жишээлбэл, хоёртын регрессийн хувьд дихотомийн хүчин зүйлийн нэг буюу хэд хэдэн бие даасан нөхцлөөс хамаарах хамаарлыг судалдаг. Түүнээс гадна, сүүлийнх нь ямар ч төрлийн масштабтай байж болно. Олон гишүүнт регрессийг энэ ангиллын хувилбарын хувилбар гэж үздэг. Үүнд 2-оос дээш бүлэг хамааралтай хувьсагчдад хамаарна. Бие даасан хүчин зүйлс нь дарааллын эсвэл нэрлэсэн хуваарьтай байх ёстой.

Spss дахь логистик регресс

11-12-р статистикийн багцад шинжилгээний шинэ хувилбар гарсан - ordinal. Энэ аргыг хамааралтай хүчин зүйл нь ижил нэртэй (ординаль) хуваарьт хамаарах тохиолдолд ашигладаг. Энэ тохиолдолд бие даасан хувьсагчдыг нэг тодорхой төрлөөс сонгоно. Тэдгээр нь дарааллын эсвэл нэрлэсэн байх ёстой. Хэд хэдэн ангилалд ангиллыг хамгийн их гэж үздэгнийтийн. Энэ аргыг логистик регрессийг ашигладаг бүх судалгаанд ашиглаж болно. Гэсэн хэдий ч загварын чанарыг сайжруулах цорын ганц арга бол бүх гурван аргыг ашиглах явдал юм.

хангалттай чанарын шалгалт, логистикийн регресс
хангалттай чанарын шалгалт, логистикийн регресс

Эхлэх ангилал

Өмнө нь статистикийн багцад дараалсан масштабтай хамааралтай хүчин зүйлсийн тусгай шинжилгээ хийх ердийн боломж байгаагүй гэдгийг хэлэх хэрэгтэй. 2-оос дээш бүлэгтэй бүх хувьсагчийн хувьд олон нэрлэсэн хувилбарыг ашигласан. Харьцангуй саяхан нэвтэрсэн ординаль шинжилгээ нь хэд хэдэн онцлогтой. Тэд масштабын онцлогийг харгалзан үздэг. Үүний зэрэгцээ, сургалтын хэрэглэгдэхүүнд дараалсан логистик регрессийг ихэвчлэн тусдаа арга гэж үздэггүй. Энэ нь дараахтай холбоотой юм: дарааллын шинжилгээ нь олон гишүүнтээс мэдэгдэхүйц давуу талтай байдаггүй. Судлаач дараалсан болон нэрлэсэн хамааралтай хувьсагчийн аль алиных нь хамт сүүлийнхийг ашиглаж болно. Үүний зэрэгцээ ангиллын процессууд нь бие биенээсээ бараг ялгаатай байдаггүй. Энэ нь дарааллын шинжилгээ хийхэд хүндрэл учруулахгүй гэсэн үг.

Шинжилгээний сонголт

Энгийн тохиолдлыг авч үзье - хоёртын регресс. Маркетингийн судалгааны явцад нийслэлийн тодорхой их сургуулийн төгсөгчдийн эрэлт хэрэгцээг үнэлдэг гэж бодъё. Санал асуулгад хариулагчдаас дараах асуултуудыг тавьсан:

  1. Та ажилтай юу? (ql).
  2. Төгссөн жилээ оруулна уу (q 21).
  3. Дундаж нь хэд вэтөгсөлтийн оноо (дундаж).
  4. Хүйс (q22).

Логистик регресс нь ql хувьсагчид aver, q 21 ба q 22 бие даасан хүчин зүйлсийн нөлөөллийг үнэлнэ. Энгийнээр хэлбэл, шинжилгээний зорилго нь мэргэжил, төгссөн жил, голч дүн зэрэгт үндэслэн төгсөгчдийн ажлын байрыг тодорхойлоход оршино.

логистикийн сигмоид регрессийн үзүүлэлт
логистикийн сигмоид регрессийн үзүүлэлт

Логистик регресс

Хоёртын регресс ашиглан параметрүүдийг тохируулахын тулд Analyze►Regression►Binary Logistic цэсийг ашиглана уу. Логистик регрессийн цонхноос зүүн талд байгаа хувьсагчдын жагсаалтаас хамааралтай хүчин зүйлийг сонгоно. Энэ бол ql. Энэ хувьсагчийг Dependent талбарт оруулах ёстой. Үүний дараа бие даасан хүчин зүйлсийг Covariates графикт оруулах шаардлагатай - q 21, q 22, aver. Дараа нь та тэдгээрийг шинжилгээндээ хэрхэн оруулахаа сонгох хэрэгтэй. Хэрэв бие даасан хүчин зүйлсийн тоо 2-оос дээш байвал анхдагчаар тохируулагдсан бүх хувьсагчдыг нэгэн зэрэг нэвтрүүлэх аргыг ашигладаг, гэхдээ алхам алхмаар. Хамгийн алдартай арга бол Backward:LR. Сонгох товчийг ашигласнаар та судалгаанд бүх оролцогчдыг оруулахгүй, зөвхөн тодорхой зорилтот ангиллыг оруулах боломжтой.

Категорийн хувьсагчдыг тодорхойлох

Бие даасан хувьсагчийн аль нэг нь 2-оос дээш ангилалтай нэрлэсэн үед Категорийн товчлуурыг ашиглах хэрэгтэй. Ийм нөхцөлд "Категорийн хувьсагчдыг тодорхойлох" цонхны "Категорийн хувьсах хэмжигдэхүүн" хэсэгт яг ийм параметрийг байрлуулна. Энэ жишээнд ийм хувьсагч байхгүй байна. Үүний дараа унадаг жагсаалтад Contrast-ийг дагаж мөрдөөрэйхазайлтыг сонгоод Өөрчлөх товчийг дарна уу. Үүний үр дүнд нэрлэсэн хүчин зүйл бүрээс хэд хэдэн хамааралтай хувьсагч бий болно. Тэдний тоо нь эхний нөхцөлийн ангиллын тоотой тохирч байна.

Шинэ хувьсагчдыг хадгалах

Судалгааны үндсэн харилцах цонхны Хадгалах товчийг ашиглан шинэ параметрүүдийг үүсгэнэ. Тэд регрессийн процесст тооцсон үзүүлэлтүүдийг агуулна. Ялангуяа та дараахыг тодорхойлсон хувьсагчдыг үүсгэж болно:

  1. Тодорхой ангиллын ангилалд хамаарах (Бүлгийн гишүүнчлэл).
  2. Судалгааны бүлэг тус бүрт хариулагч хуваарилах магадлал (Магадлал).

Сонголт товчийг ашиглах үед судлаач ямар ч чухал сонголт авахгүй. Үүний дагуу үүнийг үл тоомсорлож болно. "OK" товчийг дарсны дараа шинжилгээний үр дүн үндсэн цонхонд гарч ирнэ.

логистик регрессийн коэффициент
логистик регрессийн коэффициент

Хангалт ба логистикийн регрессийн чанарын шалгалт

Загварын коэффициентүүдийн Omnibus Tests хүснэгтийг авч үзье. Энэ нь загварын ойролцоо чанарын шинжилгээний үр дүнг харуулдаг. Алхам алхмаар сонголт хийсэн тул та сүүлийн шатны үр дүнг харах хэрэгтэй (2-р шат). Ач холбогдол өндөртэй дараагийн шат руу шилжих үед Хи-квадрат үзүүлэлтийн өсөлт илэрсэн тохиолдолд эерэг үр дүнг тооцно (Sig. < 0.05). Загварын чанарыг Загварын мөрөнд үнэлдэг. Хэрэв сөрөг утгыг олж авсан боловч энэ нь загварын ерөнхий материаллаг байдлын хувьд чухал ач холбогдолтой гэж тооцогддоггүй бол сүүлчийнхпрактикт тохиромжтой гэж үзэж болно.

Хүснэгт

Загварын хураангуй нь бүтээгдсэн загвараар (R квадрат индекс) тодорхойлсон нийт дисперсийн индексийг тооцоолох боломжтой болгодог. Нагелкерийн утгыг ашиглахыг зөвлөж байна. Nagelkerke R Square параметр нь 0.50-аас дээш байвал эерэг үзүүлэлт гэж үзэж болно. Үүний дараа ангиллын үр дүнг үнэлж, судалж буй нэг буюу өөр ангилалд хамаарах бодит үзүүлэлтүүдийг регрессийн загварт үндэслэн таамагласан үзүүлэлтүүдтэй харьцуулна. Үүний тулд ангиллын хүснэгтийг ашигладаг. Энэ нь мөн авч үзэж буй бүлэг тус бүрийн ялгах зөв байдлын талаар дүгнэлт гаргах боломжийг бидэнд олгодог.

логистик регрессийн загвар
логистик регрессийн загвар

Дараах хүснэгтэд дүн шинжилгээнд оруулсан бие даасан хүчин зүйлсийн статистикийн ач холбогдол, түүнчлэн стандарт бус логистикийн регрессийн коэффициент бүрийг олж мэдэх боломжийг олгож байна. Эдгээр үзүүлэлтүүд дээр үндэслэн түүвэрт хамрагдсан хариулагч бүр тодорхой бүлэгт хамаарах эсэхийг таамаглах боломжтой. Хадгалах товчийг ашиглан та шинэ хувьсагч оруулах боломжтой. Эдгээр нь тодорхой ангиллын ангилалд хамаарах мэдээлэл (Таамагласан ангилал) болон эдгээр бүлэгт багтах магадлал (Таамагласан магадлалын гишүүнчлэл) зэргийг агуулна. "OK" товчийг дарсны дараа тооцооллын үр дүн олон гишүүнт логистик регрессийн үндсэн цонхонд гарч ирнэ.

Судлаачдад чухал үзүүлэлтүүдийг агуулсан эхний хүснэгт нь Загвар тохируулах мэдээлэл юм. Статистикийн өндөр түвшний ач холбогдол нь өндөр чанарыг илтгэнэпрактик асуудлыг шийдвэрлэхэд загварыг ашиглахад тохиромжтой байдал. Өөр нэг чухал хүснэгт бол Pseudo R-Square юм. Энэ нь дүн шинжилгээнд сонгосон бие даасан хувьсагчид тодорхойлогддог хамааралтай хүчин зүйл дэх нийт дисперсийн эзлэх хувийг тооцоолох боломжийг танд олгоно. Магадлалын харьцааны тестийн хүснэгтийн дагуу бид сүүлийнх нь статистикийн ач холбогдлын талаар дүгнэлт хийж болно. Параметрийн тооцоолол нь стандарт бус коэффициентийг тусгасан болно. Тэдгээрийг тэгшитгэлийг бий болгоход ашигладаг. Түүнчлэн хувьсагчдын хослол бүрийн хувьд тэдгээрийн хамааралтай хүчин зүйлд үзүүлэх нөлөөллийн статистик ач холбогдлыг тодорхойлсон. Үүний зэрэгцээ маркетингийн судалгаанд оролцогчдыг тус тусад нь бус, харин зорилтот бүлгийн нэг хэсэг болгон ангиллаар нь ялгах шаардлагатай болдог. Үүний тулд Ажиглагдсан болон Урьдчилан таамагласан давтамжийн хүснэгтийг ашиглана.

Практик хэрэглүүр

Үзэж буй шинжилгээний аргыг худалдаачдын ажилд өргөн ашигладаг. 1991 онд логистикийн сигмоид регрессийн үзүүлэлтийг боловсруулсан. Энэ нь боломжит үнийг "хэт халахаас" өмнө урьдчилан таамаглахад хялбар, үр дүнтэй хэрэгсэл юм. Шалгуур үзүүлэлтийг хоёр зэрэгцээ шугамаар үүсгэсэн суваг хэлбэрээр график дээр харуулав. Тэд чиг хандлагаас ижил зайд байрладаг. Коридорын өргөн нь зөвхөн хугацаанаас хамаарна. Энэ үзүүлэлтийг валютын хосоос эхлээд үнэт металл хүртэл бараг бүх хөрөнгөтэй ажиллахад ашигладаг.

spss дахь логистик регресс
spss дахь логистик регресс

Практикт хэрэглүүрийг ашиглах 2 үндсэн стратеги боловсруулагдсан: задрах болонэргэлтэнд. Сүүлчийн тохиолдолд худалдаачин суваг доторх үнийн өөрчлөлтийн динамикийг анхаарч үзэх болно. Утга нь дэмжлэг эсвэл эсэргүүцлийн шугам руу ойртох тусам хөдөлгөөн эсрэг чиглэлд эхлэх магадлал дээр бооцоо тавьдаг. Хэрэв үнэ дээд хил рүү ойртвол та хөрөнгөөс салж болно. Хэрэв энэ нь доод хязгаарт байгаа бол та худалдан авах талаар бодох хэрэгтэй. Захиалга хийх стратеги нь захиалга ашиглах явдал юм. Тэдгээрийг хязгаараас гадуур харьцангуй бага зайд суурилуулсан. Үнэ нь зарим тохиолдолд тэдгээрийг богино хугацаанд зөрчиж байгааг харгалзан үзвэл та үүнийг аюулгүй тоглож, алдагдалыг зогсоох хэрэгтэй. Мэдээжийн хэрэг, сонгосон стратегиас үл хамааран худалдаачин зах зээл дээр үүссэн нөхцөл байдлыг аль болох тайван хүлээн авч, үнэлэх хэрэгтэй.

Дүгнэлт

Тиймээс логистик регрессийн хэрэглээ нь өгөгдсөн параметрийн дагуу санал асуулгад оролцогчдыг хурдан бөгөөд хялбар ангилалд оруулах боломжийг олгоно. Шинжилгээ хийхдээ та ямар ч тодорхой аргыг ашиглаж болно. Ялангуяа олон гишүүнт регресс нь бүх нийтийн шинж чанартай байдаг. Гэсэн хэдий ч шинжээчид дээр дурдсан бүх аргыг хослуулан хэрэглэхийг зөвлөж байна. Энэ нь энэ тохиолдолд загварын чанар мэдэгдэхүйц өндөр байх болно гэсэнтэй холбоотой юм. Энэ нь эргээд түүний хэрэглээний хүрээг тэлэх болно.

Зөвлөмж болгож буй: