Perceptron нь Нэр томъёоны тодорхойлолт, онцлог, хэрэглээ

2025 Зохиолч: Angel Austin | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2025-01-23 12:27:06

Машин сургалтын явцад перцептрон нь хоёртын ангилагчийн хяналттай сургалтын алгоритм юм. Үүнийг ихэвчлэн перцептрон гэж нэрлэдэг. Хоёртын ангилагч нь тоонуудын вектороор дүрслэгдсэн оролт нь тодорхой ангилалд хамаарах эсэхийг шийдэх функц юм. Энэ нь шугаман ангилагчийн төрөл бөгөөд жингийн багцыг онцлог вектортой хослуулсан шугаман таамаглагч функц дээр үндэслэн таамагладаг ангиллын алгоритм юм.

Сүүлийн жилүүдэд гүнзгий суралцах дэвшлийн улмаас хиймэл мэдрэлийн сүлжээнүүд анхаарал татах болсон. Гэхдээ хиймэл мэдрэлийн сүлжээ гэж юу вэ, юунаас бүрддэг вэ?

Перцептронтой танилцаарай

Энэ нийтлэлд бид хиймэл мэдрэлийн сүлжээг ерөнхийд нь авч үзээд, дараа нь нэг нейроныг авч үзээд эцэст нь (энэ бол кодлох хэсэг) хиймэл мэдрэлийн хамгийн энгийн хувилбарыг авч үзэх болно. нейрон, перцептрон ба түүний цэгүүдийг ангилнаонгоц.

Яагаад ямар ч хүнд маш хялбар мөртлөө компьютерт үнэхээр хэцүү даалгавар байдгийг та бодож үзсэн үү? Хиймэл мэдрэлийн сүлжээ (богинохондоо ANN) нь хүний төв мэдрэлийн системээс санаа авсан. Биологийн аналогийн нэгэн адил ANN нь том сүлжээнд нэгтгэгдсэн дохио боловсруулах энгийн элементүүд дээр бүтээгдсэн.

Мэдрэлийн сүлжээг сурах ёстой

Уламжлалт алгоритмуудаас ялгаатай нь мэдрэлийн сүлжээг зориулалтын дагуу ажиллуулахын тулд "програмчлах" эсвэл "тохируулж" болохгүй. Хүний тархи шиг тэд даалгавраа гүйцэтгэж сурах ёстой. Ойролцоогоор гурван сурах стратеги байдаг.

Хэрэв тодорхой үр дүн бүхий туршилтын тохиолдол (хангалттай том) байвал хамгийн хялбар аргыг хэрэглэж болно. Дараа нь сургалт дараах байдлаар явагдана: нэг багц өгөгдлийг боловсруул. Үр дүнг мэдэгдэж буй үр дүнтэй харьцуул. Сүлжээг тохируулаад дахин оролдоно уу. Энэ бол бидний энд ашиглах сургалтын стратеги юм.

Хяналтгүй суралцах

Хэрэв туршилтын өгөгдөл байхгүй, хүссэн үйлдлээсээ зарим зардлын функцийг гаргаж авах боломжтой бол ашигтай. Зардлын функц нь мэдрэлийн сүлжээнд зорилтот цэгээс хэр хол байгааг хэлж өгдөг. Сүлжээ нь бодит өгөгдөлтэй ажиллахдаа өөрийн параметрүүдийг шууд тохируулах боломжтой.

Бататгасан сургалт

"Лууван ба саваа" арга. Мэдрэлийн сүлжээ нь тасралтгүй үйлдэл үүсгэдэг бол үүнийг ашиглаж болно. Цаг хугацаа өнгөрөх тусам сүлжээ нь зөв үйлдлийг илүүд үзэж, буруу зүйлээс зайлсхийхэд суралцдаг.

За, одоо бид бага зэрэг мэдэж байнахиймэл мэдрэлийн сүлжээний мөн чанар, гэхдээ тэдгээр нь яг юунаас бүтсэн бэ? Тагийг нь онгойлгоод дотогшоо харвал юу харагдах вэ?

Нейрон нь мэдрэлийн сүлжээний барилгын материал юм. Аливаа хиймэл мэдрэлийн сүлжээний гол бүрэлдэхүүн хэсэг нь хиймэл нейрон юм. Тэдгээрийг биологийн ижил төстэй хүмүүсийнхээ нэрээр нэрлээд зогсохгүй бидний тархины нейронуудын зан үйлийн дагуу загварчлагдсан байдаг.

Биологи ба технологи

Биологийн нейронд дохио хүлээн авах дендрит, тэдгээрийг боловсруулах эсийн бие, бусад мэдрэлийн эсүүд рүү дохио илгээх аксон байдаг шиг хиймэл нейронд олон оролтын суваг, боловсруулах үе шат, нэг гаралт байдаг. бусад олон хүмүүст салбарлана. хиймэл мэдрэлийн эсүүд.

Бид ганц перцептроноор хэрэгтэй зүйл хийж чадах уу? Ганц перцептрон шийдэж чадах нэг төрлийн асуудал байдаг. Оролтын векторыг цэгийн координат гэж үзье. n элементтэй векторын хувьд энэ цэг нь n хэмжээст орон зайд амьдрах болно. Амьдралыг хялбарчлахын тулд (мөн доорх код) үүнийг 2D гэж үзье. Цаас шиг.

Дараа нь бид энэ хавтгай дээр санамсаргүй хэдэн цэг зурж, цаасан дээр шулуун шугам татах замаар тэдгээрийг хоёр багц болгон хуваана гэж төсөөлөөд үз дээ. Энэ шугам нь цэгүүдийг хоёр багц болгон хуваадаг бөгөөд нэг нь шугамын дээр, нөгөө нь доор байна. Дараа нь хоёр багцыг шугаман салгах боломжтой гэж нэрлэнэ.

Нэг перцептрон хэчнээн энгийн мэт санагдаж байсан ч энэ шугам хаана байгааг мэдэх чадвартай бөгөөд сургалтаа дуусгасны дараа тухайн цэг энэ шугамаас дээш эсвэл доор байгааг тодорхойлж чадна.

Түүхшинэ бүтээл

Энэ аргын алгоритмыг 1957 онд Корнеллийн нисэхийн лабораторид АНУ-ын Тэнгисийн цэргийн судалгааны албанаас санхүүжүүлдэг Фрэнк Розенблатт (ихэвчлэн түүний нэрээр нэрлэдэг) зохион бүтээжээ. Перцептрон нь программ биш, машин байх зорилготой байсан бөгөөд анхны хэрэгжилт нь IBM 704-д зориулсан програм хангамжид байсан ч дараа нь "Mark 1 Perceptron" нэртэйгээр тусгайлан бүтээгдсэн техник хангамжид хэрэгжсэн. Энэ машин нь дүрсийг танихад зориулагдсан: мэдрэлийн эсүүдтэй санамсаргүй холбогдсон 400 фотоэлелээс бүрдсэн массивтай байв. Жинг потенциометрээр кодлосон бөгөөд сургалтын явцад жингийн шинэчлэлтийг цахилгаан мотороор хийсэн.

1958 онд АНУ-ын Тэнгисийн цэргийн хүчний зохион байгуулсан хэвлэлийн бага хурал дээр Розенблатт хиймэл оюун ухааны залуучуудын дунд ширүүн маргаан үүсгэсэн перцептроны талаар мэдэгдэл хийсэн; Розенблаттын мэдэгдлүүд дээр үндэслэн Нью-Йорк Таймс сонинд мэдээлснээр уг мэдрэгч нь "Тэнгисийн цэргийн хүчин алхаж, ярьж, харж, бичиж, өөрийгөө үржүүлж, оршин тогтнох чадвартай байх ёстой гэж найдаж буй үр хөврөлийн электрон компьютер"

Цаашид хөгжүүлэлт

Хэдийгээр перцептрон нь эхэндээ ирээдүйтэй мэт санагдаж байсан ч перцептроныг олон ангиллын хэв маягийг танихад сургаж чаддаггүй нь хурдан нотлогдсон. Энэ нь хоёр ба түүнээс дээш давхарга (мөн гэж нэрлэдэг) бүхий дамжуулагч мэдрэлийн сүлжээ гэдгийг хүлээн зөвшөөрөхөөс өмнө олон жилийн турш перцептрон мэдрэлийн сүлжээний судалгааны салбарт зогсонги байдалд хүргэсэн.олон давхаргат перцептрон) нь нэг давхаргын перцептроноос (мөн нэг давхаргын перцептрон гэж нэрлэдэг) илүү их боловсруулах чадвартай байв. Нэг давхаргат перцептрон нь зөвхөн шугаман салж болох бүтцийг судлах чадвартай. 1969 онд Марвин Мински, Сеймур Паперт нарын алдарт "Perceptrons" ном нь эдгээр ангиллын сүлжээнүүд XOR функцийг сурч чадахгүй байгааг харуулсан. Гэхдээ энэ нь нэг давхаргат перцептронд ашиглагдах шугаман бус ангиллын функцэд хамаарахгүй.

Ийм функцийг ашиглах нь XOR функцийг хэрэгжүүлэх зэрэг перцептроны чадавхийг өргөжүүлдэг. Тэд олон давхаргат перцептрон сүлжээнд ижил төстэй үр дүн гарна гэж таамаглаж байсан гэж ихэнхдээ (буруу) таамагладаг. Гэсэн хэдий ч Мински, Паперт хоёр олон давхаргат перцептронууд XOR функцийг бий болгох чадвартай гэдгийг аль хэдийн мэддэг байсан тул энэ нь тийм биш юм. Гурван жилийн дараа Стивен Гроссберг дифференциал функц, тодосгогчийг сайжруулах функц, XOR функцийг загварчлах чадвартай сүлжээг танилцуулсан цуврал нийтлэлүүдийг нийтлэв.

Бүтээлүүд 1972, 1973 онд хэвлэгдсэн. Гэсэн хэдий ч ихэнхдээ үл тоомсорлодог Мински/Паперт текст нь мэдрэлийн сүлжээний перцептроныг ашиглах сонирхол, судалгааны санхүүжилтийг мэдэгдэхүйц бууруулсан. 1980-аад онд мэдрэлийн сүлжээний судалгаа сэргээгдэх хүртэл дахиад арван жил өнгөрчээ.

Онцлогууд

Перцептрон цөмийн алгоритмыг 1964 онд Yzerman et al. Өмнөх үр дүнгээ сунгаж, L1 шинэ хязгаарыг өгсөн Мори ба Ростамизаде (2013).

Перцептрон бол биологийн нейроны хялбаршуулсан загвар юм. Мэдрэлийн зан үйлийг бүрэн ойлгохын тулд биологийн мэдрэлийн загваруудын нарийн төвөгтэй байдал ихэвчлэн шаардлагатай байдаг ч перцептронтой төстэй шугаман загвар нь бодит нейронуудад ажиглагддаг зарим зан үйлийг өдөөж болохыг судалгаагаар харуулж байна.

Перцептрон нь шугаман ангилагч тул D сургалтын багцыг шугаман байдлаар салгах боломжгүй тохиолдолд бүх оролтын векторуудыг зөв ангилсан төлөвт хэзээ ч орохгүй. хэрэв эерэг жишээг сөрөг жишээнээс гипер хавтгайгаар салгах боломжгүй бол. Энэ тохиолдолд ямар ч "ойролцоогоор" шийдэл нь стандарт сургалтын алгоритмаар алхам алхмаар дамжихгүй, харин суралцах нь бүхэлдээ бүтэлгүйтэх болно. Тиймээс, хэрэв сургалтын багцын шугаман салгах чадвар нь априори мэдэгдэхгүй бол доорх сургалтын сонголтуудын аль нэгийг ашиглах хэрэгтэй.

Халаасны алгоритм

Ратчет халаасны алгоритм нь өнөөг хүртэл олдсон хамгийн сайн шийдлийг "халаасанд" хадгалснаар перцептрон сурах бат бөх байдлын асуудлыг шийддэг. Дараа нь халаасны алгоритм нь эцсийн шийдэл биш халаасанд байгаа шийдлийг буцаана. Үүнийг мөн ялгаж салгах боломжгүй өгөгдлийн багцад ашиглаж болох бөгөөд зорилго нь цөөн тооны буруу ангилал бүхий перцептрон олох явдал юм. Гэсэн хэдий ч эдгээр шийдлүүд стохастик мэт харагддаг тул халаасны алгоритм нь тэдэнд тохирохгүй байна.сургалтын явцад аажим аажмаар явагдах ба тодорхой тооны сургалтын алхмуудаар илрэх баталгаагүй.

Максовер алгоритм

Maxover-ийн алгоритм нь өгөгдлийн багцын шугаман салгах чадварын мэдлэгээс үл хамааран нэгдэх утгаараа "бат бөх" юм. Шугаман хуваах тохиолдолд энэ нь сургалтын асуудлыг шийдэх болно, тэр ч байтугай хамгийн оновчтой тогтвортой байдал (анги хоорондын хамгийн их зөрүү). Салгах боломжгүй өгөгдлийн багцын хувьд цөөн тооны буруу ангилалтай шийдлийг буцаана. Бүх тохиолдолд алгоритм нь сургалтын явцад өмнөх төлөвүүдийг санахгүйгээр, санамсаргүй үсрэлтгүйгээр аажмаар шийдэлд ойртдог. Конвергенц нь хуваалцсан өгөгдлийн багцын глобал оновчтой байдал, салгах боломжгүй өгөгдлийн багцын дотоод оновчтой байдалд оршдог.

Санал өгсөн Perceptron

Voted Perceptron алгоритм нь олон жинтэй перцептрон ашигладаг хувилбар юм. Алгоритм нь жишээг буруу ангилах болгонд шинэ перцептроныг эхлүүлж, жингийн векторыг сүүлчийн хүлээн авагчийн эцсийн жингээр эхлүүлдэг. Перцептрон бүрд нэгийг нь буруу ангилахаас өмнө хэдэн жишээг зөв ангилсантай нь харгалзах өөр жин өгөх ба төгсгөлд гаралт нь бүхэл бүтэн перцептроныг жинлэсэн санал өгөх болно.

Програм

Салгаж болох асуудлын хувьд перцептрон сургалт нь анги хоорондын хамгийн том тусгаарлах заагийг олоход чиглэгдэж болно. Гэж нэрлэдэгТогтвортой байдлын оновчтой перцептроныг Min-Over эсвэл AdaTron алгоритм зэрэг давталтын сургалт, оновчтой болгох схемийг ашиглан тодорхойлж болно. AdaTron нь тохирох квадрат оновчлолын бодлого нь гүдгэр гэдгийг ашигладаг. Тогтвортой байдлын оновчтой перцептрон нь цөмийн трикийн хамт дэмжлэгийн вектор машины үзэл баримтлалын үндэс юм.

Хувилбар

Олон давхарга ашиглахгүйгээр шугаман бус асуудлыг шийдэх өөр нэг арга бол дээд эрэмбийн сүлжээ (сигма-пи блок) ашиглах явдал юм. Энэ төрлийн сүлжээнд оролтын векторын элемент бүрийг үржүүлсэн оролтын хос хосолсон хослол тус бүрээр (хоёр дахь дарааллаар) өргөжүүлдэг. Үүнийг n эрэмбийн сүлжээнд өргөтгөж болно. Perceptron бол маш уян хатан зүйл.

Гэхдээ хамгийн сайн ангилагч нь сургалтын бүх өгөгдлийг үнэн зөв ангилах албагүй гэдгийг санаарай. Үнэн хэрэгтээ, хэрэв өгөгдөл нь ижил хувьсах Гауссын тархалтаас ирдэг гэсэн хязгаарлалттай байсан бол оролтын орон зайд шугаман хуваагдах нь оновчтой бөгөөд шугаман бус шийдлийг хүчингүй болгоно.

Бусад шугаман ангиллын алгоритмуудад Winnow, дэмжлэгийн вектор болон логистик регресс орно. Перцептрон бол бүх нийтийн алгоритмуудын багц юм.

Хяналттай сургалтын үндсэн хамрах хүрээ

Хяналттай сургалт нь оролтыг гаралттай харьцуулах функцийг сурдаг машин сургалтын даалгавар юморолт/гаралтын хосуудын жишээн дээр үндэслэсэн. Тэд жишээнүүдийн багцаас бүрдсэн шошготой сургалтын өгөгдлөөс онцлог шинж чанарыг гаргадаг. Хяналттай сургалтын хувьд жишээ бүр нь оролтын объект (ихэвчлэн вектор) болон хүссэн гаралтын утга (мөн хяналтын дохио гэж нэрлэдэг) зэргээс бүрдсэн хос юм.

Хяналттай сургалтын алгоритм нь сургалтын өгөгдөлд дүн шинжилгээ хийж, шинэ жишээг харуулахад ашиглаж болох тооцоолсон функцийг гаргадаг. Хамгийн оновчтой хувилбар нь алгоритмд үл үзэгдэх тохиолдлуудын ангиллын шошгыг зөв тодорхойлох боломжийг олгоно. Энэ нь сургалтын алгоритмыг "боломжийн" аргаар үл үзэгдэх нөхцөл байдалд сургалтын өгөгдлийг нэгтгэхийг шаарддаг.

Хүн, амьтны сэтгэл судлалын зэрэгцээ даалгаврыг ихэвчлэн концепцын сургалт гэж нэрлэдэг.