Multivarate scaling (MDS) нь өгөгдлийн багц дахь бие даасан тохиолдлуудын ижил төстэй байдлын түвшинг дүрслэн харуулах хэрэгсэл юм. Энэ нь мэдээллийг дүрслэн харуулах, ялангуяа зайны матрицад агуулагдах мэдээллийг харуулахад ашигладаг холбогдох томилох аргуудын багцыг хэлнэ. Энэ нь шугаман бус хэмжээсийн бууралтын нэг хэлбэр юм. MDS алгоритм нь объект бүрийг N хэмжээст орон зайд объект хоорондын зайг аль болох сайн хадгалахаар байрлуулах зорилготой. Дараа нь объект бүрд N хэмжээс бүрт координат оноогдоно.
MDS графикийн хэмжээсийн тоо нь 2-оос хэтэрч болох ба априори заасан. N=2-ыг сонгох нь 2D тархалтын графикийн объектын байршлыг оновчтой болгодог. Та нийтлэл дэх зургуудаас олон хэмжээст масштабын жишээг харж болно. Орос хэл дээрх тэмдэг бүхий жишээнүүд нь ялангуяа тод харагдаж байна.
Эссенс
Олон хэмжээст масштабын арга (MMS,MDS) нь жин гэх мэт мэдэгдэж буй зайны оролтын матриц, алдагдлын функцүүдийн багцыг оновчтой болгох процедурыг нэгтгэсэн сонгодог хэрэгслүүдийн өргөтгөсөн багц юм. Энэ утгаараа алдагдлын ашигтай функцийг стресс гэж нэрлэдэг бөгөөд үүнийг ихэвчлэн стресс ихэсгэх гэж нэрлэдэг процедурын тусламжтайгаар багасгадаг.
Гарын авлага
Олон хэмжээст масштабын хэд хэдэн сонголт байдаг. MDS програмууд нь шийдлийг авахын тулд ачааллыг автоматаар багасгадаг. Метрик бус MDS алгоритмын цөм нь хоёр талт оновчлолын процесс юм. Нэгдүгээрт, хамгийн оновчтой монотон ойрын хувирлыг олох хэрэгтэй. Хоёрдугаарт, тохиргооны цэгүүдийг оновчтой байрлуулах ёстой бөгөөд ингэснээр тэдгээрийн зай нь масштабтай ойрын утгуудтай аль болох ойр байх ёстой.
Өргөтгөл
Зорилтот орон зай нь дурын гөлгөр Евклидийн бус орон зай байдаг статистикийн олон хэмжээст хэмжигдэхүүний өргөтгөл. Ялгаа нь гадаргуу дээрх зай, зорилтот орон зай нь өөр гадаргуу юм. Сэдэвчилсэн програмууд нь нэг гадаргууг нөгөөд хамгийн бага гажилттай хавсралтыг олох боломжийг олгодог.
Алхам
Олон хувьсагчтай масштабыг ашиглан судалгаа хийх хэд хэдэн алхам байдаг:
- Асуудлын томъёолол. Та ямар хувьсагчдыг харьцуулахыг хүсч байна вэ? Та хэдэн хувьсагчийг харьцуулахыг хүсч байна вэ? Судалгааг ямар зорилгоор ашиглах вэ?
- Оролтын өгөгдлийг авч байна. Судалгаанд оролцогчдод хэд хэдэн асуулт асуудаг. Хос бүтээгдэхүүн бүрийн хувьд ижил төстэй байдлыг (ихэвчлэн 7 онооны Likert-ийн масштабаар маш төстэйгээс маш ялгаатай хүртэл) үнэлэхийг хүснэ. Эхний асуулт нь Coca-Cola/Pepsi, жишээлбэл, дараагийнх нь шар айраг, дараагийнх нь Доктор Пеппер гэх мэт байж болно. Асуултуудын тоо нь брэндийн тооноос хамаарна.
Алтернатив аргууд
Өөр хоёр арга бий. Бүтээгдэхүүнийг шинж чанарт нь задалж, семантик дифференциал масштабаар үнэлдэг "Perceptual Data: Derived Approach" хэмээх арга техник байдаг. Өөр нэг арга бол "давуулах өгөгдлийн арга" бөгөөд энэ нь судалгаанд оролцогчдоос ижил төстэй зүйл биш харин давуу байдлын талаар асуудаг.
Энэ нь дараах алхмуудаас бүрдэнэ:
- MDS статистикийн програмыг эхлүүлж байна. Процедурыг гүйцэтгэх програм хангамж нь статистикийн олон багц програм хангамжид байдаг. Метрийн MDS (интервал эсвэл харьцааны түвшний өгөгдөлтэй харьцдаг) ба хэмжүүрийн бус MDS (эргийн өгөгдөлтэй харьцдаг) хоёрын хооронд сонголт ихэвчлэн байдаг.
- Хэмжилтийн тоог тодорхойлох. Судлаач компьютер дээр үүсгэхийг хүсч буй хэмжилтийн тоог тодорхойлох ёстой. Хэмжилт их байх тусам статистик тохирно, гэхдээ үр дүнг тайлбарлахад илүү хэцүү болно.
- Үр дүнг харуулах, хэмжилтийг тодорхойлох - статистикийн программ (эсвэл холбогдох модуль) үр дүнг харуулах болно. Газрын зураг нь бүтээгдэхүүн бүрийг харуулах болно (ихэвчлэн 2D).зай). Бүтээгдэхүүний ойролцоо байдал нь аль аргыг ашигласанаас хамааран ижил төстэй байдал эсвэл давуу талыг илэрхийлдэг. Гэсэн хэдий ч хэмжилтүүд нь системийн үйл ажиллагааны хэмжилттэй хэрхэн нийцэж байгаа нь үргэлж тодорхой байдаггүй. Тохирлын субьектив дүгнэлтийг эндээс гаргаж болно.
- Үр дүнгийн найдвартай, хүчинтэй эсэхийг шалгах - MDS журмаар тооцож болох масштабтай өгөгдлийн хэлбэлзлийн эзлэх хувийг тодорхойлохын тулд R квадратыг тооцоол. Квадрат R 0.6 нь хамгийн бага зөвшөөрөгдөх түвшин гэж тооцогддог. R квадрат нь 0.8 нь хэмжигдэхүүнийг хэмжихэд тохиромжтой, харин 0.9 нь хэмжүүрийн бус масштаблахад сайн гэж тооцогддог.
Төрөл бүрийн тестүүд
Бусад боломжит тестүүд бол Крускал төрлийн стресс тест, өгөгдлийн хуваах тест, өгөгдлийн тогтвортой байдлын тест, найдвартай байдлын дахин тест юм. Туршилтын үр дүнгийн талаар дэлгэрэнгүй бичнэ үү. Зураглалын зэрэгцээ зайны хэмжүүр (жишээ нь: Соренсоны индекс, Жаккардын индекс) болон найдвартай байдлын (жишээ нь, стрессийн утга) хэмжүүрийг зааж өгөх ёстой.
Хэрэв та эхлүүлэх тохиргоог өгсөн эсвэл санамсаргүй сонголт хийсэн бол ихэвчлэн ашигладаг програмаар тодорхойлогддог алгоритмыг (жишээ нь Kruskal, Mather) өгөх нь зүйтэй (заримдаа алгоритмын тайланг орлуулах). хэмжээсийн гүйлтүүд, Монте Карлогийн үр дүн, давталтын тоо, тогтвортой байдлын оноо, тэнхлэг бүрийн пропорциональ хэлбэлзэл (r-квадрат).
Харааны мэдээлэл, өгөгдөлд дүн шинжилгээ хийх аргаолон хэмжээст масштаб
Мэдээллийн дүрслэл нь хүний танин мэдэхүйг сайжруулахын тулд хийсвэр өгөгдлийн интерактив (харааны) дүрслэлийг судлах явдал юм. Хийсвэр өгөгдөлд тоон болон тоон бус өгөгдөл, тухайлбал текст болон газарзүйн мэдээлэл орно. Гэсэн хэдий ч мэдээллийн дүрслэл нь шинжлэх ухааны дүрслэлээс ялгаатай: "орон зайн дүрслэлийг сонгоход энэ нь мэдээллийн (мэдээллийн дүрслэл), орон зайн дүрслэлийг өгөх үед scivis (шинжлэх ухааны дүрслэл) юм."
Мэдээллийн дүрслэх талбар нь хүн-компьютерийн харилцан үйлчлэл, компьютерийн шинжлэх ухааны хэрэглээ, график, визуал дизайн, сэтгэл судлал, бизнесийн аргуудын судалгаанаас үүссэн. Энэ нь шинжлэх ухааны судалгаа, дижитал номын сан, өгөгдөл олборлолт, санхүүгийн өгөгдөл, зах зээлийн судалгаа, үйлдвэрлэлийн хяналт гэх мэт чухал бүрэлдэхүүн хэсэг болгон улам бүр ашиглагдаж байна.
Арга, зарчим
Мэдээллийн дүрслэл нь дүрслэл болон харилцан үйлчлэлийн аргууд нь хүний ойлголтын баялаг давуу талыг ашиглан хэрэглэгчдэд нэгэн зэрэг их хэмжээний мэдээллийг харж, судлах, ойлгох боломжийг олгодог. Мэдээллийн дүрслэл нь хийсвэр мэдээлэл, мэдээллийг ойлгомжтой байдлаар дамжуулах арга барилыг бий болгох зорилготой.
Өгөгдлийн шинжилгээ нь салбарын бүх хэрэглээний судалгаа, асуудлыг шийдвэрлэх салшгүй хэсэг юм. ИхэнхӨгөгдлийн шинжилгээний үндсэн аргууд нь дүрслэл (гистограмм, тархсан график, гадаргуугийн график, модны зураг, параллель координатын график гэх мэт), статистик (таамаглалыг шалгах, регресс, PCA гэх мэт), өгөгдөлд дүн шинжилгээ хийх (тохируулах гэх мэт) юм..d.) болон машин сургалтын аргууд (бүлэглэл, ангилал, шийдвэрийн мод гэх мэт).
Эдгээр аргуудын дотроос мэдээллийн дүрслэл эсвэл визуал өгөгдлийн шинжилгээ нь аналитик ажилтнуудын танин мэдэхүйн ур чадвараас хамгийн их хамааралтай бөгөөд зөвхөн хүний төсөөлөл, бүтээлч чадвараар хязгаарлагдах бүтэцгүй, хэрэгжүүлэх боломжтой ойлголтуудыг нээх боломжийг олгодог. Шинжээч нь өгөгдлийн дүрслэлийг тайлбарлахын тулд нарийн төвөгтэй арга техник сурах шаардлагагүй. Мэдээллийн дүрслэл нь мөн статистик таамаглалыг шалгах зэрэг илүү аналитик эсвэл албан ёсны дүн шинжилгээ хийх боломжтой бөгөөд ихэвчлэн дагалддаг таамаглал үүсгэх схем юм.
Суралцах
Орчин үеийн дүрслэлийг судлах нь компьютер графикаас эхэлсэн бөгөөд анхнаасаа шинжлэх ухааны асуудлуудыг судлахад ашиглагдаж байсан. Гэвч эхний жилүүдэд графикийн хүч чадал хомс байсан нь түүний ашиг тусыг хязгаарлаж байсан. Дүрслэлийг нэн тэргүүнд тавьж эхэлсэн. 1987 онд шинжлэх ухааны тооцоолол дахь компьютерийн график ба дүрслэлд зориулсан тусгай программ хангамжийг гаргаснаар IEEE Компьютерийн Нийгэмлэг болон ACM SIGGRAPH хамтран хэд хэдэн хурал, семинар зохион байгуулсан.
Тэд өгөгдлийн дүрслэл, мэдээллийн дүрслэл, шинжлэх ухааны дүрслэл зэрэг ерөнхий сэдвүүдийг хамарсан.түүнчлэн дууны хэмжээг дүрслэх зэрэг илүү тодорхой хэсгүүд.
Товч мэдээлэл
Ерөнхий олон хэмжээст масштаб (GMDS) нь зорилтот орон зай нь Евклидийн бус байх хэмжигдэхүүнтэй олон хэмжээст масштабын өргөтгөл юм. Ялгаа нь гадаргуу дээрх зай, зорилтот орон зай нь өөр гадаргуу байх үед GMDS нь хамгийн бага гажуудалтайгаар нэг гадаргууг нөгөө гадаргуу руу үүрлэх боломжийг олох боломжийг олгодог.
GMDS бол судалгааны шинэ чиглэл юм. Одоогоор үндсэн хэрэглээ нь хэв гажилттай объект таних (жишээ нь, 3D царайг таних) болон бүтэцтэй зураглал юм.
Олон хэмжээст масштабын зорилго нь олон хэмжээст өгөгдлийг дүрслэх явдал юм. Олон хэмжээст өгөгдөл, өөрөөр хэлбэл 2-3 хэмжигдэхүүнийг илэрхийлэх шаардлагатай өгөгдлийг тайлбарлахад хэцүү байдаг. Хялбарчлах нэг арга бол сонирхсон өгөгдөл нь өндөр хэмжээст орон зайд суурилагдсан шугаман бус олон талт талбарт оршдог гэж үзэх явдал юм. Хэрэв коллектор хангалттай бага хэмжээстэй бол өгөгдлийг бага хэмжээст орон зайд дүрсэлж болно.
Шугаман бус хэмжээсийг багасгах олон аргууд нь шугаман аргуудтай холбоотой байдаг. Шугаман бус аргуудыг ерөнхийд нь хоёр бүлэгт ангилж болно: зураглалыг өгдөг (өндөр хэмжээст орон зайгаас бага хэмжээст шигтгээ хүртэл, эсвэл эсрэгээр), энгийн дүрслэлийг өгдөг. Машин сургалтын хүрээнд зураглалын аргуудыг гэж үзэж болношинж чанарыг задлах урьдчилсан шат бөгөөд дараа нь хэв маягийг таних алгоритмуудыг ашигладаг. Дүрслэл өгдөг нь ихэвчлэн ойрын өгөгдөл дээр суурилдаг, тухайлбал зайны хэмжилтүүд. Олон хэмжээст масштаб нь сэтгэл судлал болон бусад хүмүүнлэгийн шинжлэх ухаанд нэлээд түгээмэл байдаг.
Хэрэв шинж чанаруудын тоо их бол өвөрмөц боломжит мөрүүдийн орон зай мөн экспоненциалаар том байна. Тиймээс хэмжээс нь том байх тусам орон зайг дүрслэх нь илүү хэцүү болно. Энэ нь маш их асуудал үүсгэдэг. Өндөр хэмжээст өгөгдөл дээр ажилладаг алгоритмууд нь цаг хугацааны хувьд маш нарийн төвөгтэй байдаг. Өгөгдлийг цөөн хэмжигдэхүүн болгон багасгах нь ихэвчлэн шинжилгээний алгоритмуудыг илүү үр дүнтэй болгож, машин сургалтын алгоритмуудад илүү үнэн зөв таамаглал гаргахад тусалдаг. Ийм учраас олон хэмжээст өгөгдлийн масштаб маш их алдартай.