multiclass perceptron ทำงานอย่างไร


13

ฉันไม่มีพื้นหลังในวิชาคณิตศาสตร์ แต่ฉันเข้าใจว่า Perceptron ง่าย ๆ ทำงานอย่างไรและฉันคิดว่าฉันเข้าใจแนวคิดของไฮเปอร์เพลน (ฉันจินตนาการว่ามันเป็นเรขาคณิตในระนาบในอวกาศ 3 มิติซึ่งแยกเมฆสองจุดออกเป็นเส้นแยกกัน เมฆสองจุดในพื้นที่ 2 มิติ)

แต่ฉันไม่เข้าใจว่าระนาบหนึ่งเส้นหรือหนึ่งเส้นสามารถแยกเมฆจุดแตกต่างกันสามจุดในพื้นที่ 3 มิติหรือในพื้นที่ 2 มิติตามลำดับ - นี่เป็นไปไม่ได้ทางเรขาคณิตใช่ไหม?

ฉันพยายามเข้าใจส่วนที่เกี่ยวข้องในบทความ Wikipediaแต่ล้มเหลวอย่างน่าสมเพชในประโยค“ ที่นี่อินพุต x และผลลัพธ์ y ถูกดึงออกมาจากชุดที่กำหนดเอง” ใครบางคนสามารถอธิบาย perceptron แบบหลายคลาสให้ฉันและมันเป็นไปตามแนวคิดของไฮเปอร์เพลนหรืออาจชี้ให้ฉันไปที่คำอธิบายที่ไม่เกี่ยวกับคณิตศาสตร์?

คำตอบ:


8

สมมติว่าเรามีข้อมูลที่เป็นพาหะนำเข้าและมี การจำแนกประเภท(x1,y1),,(xk,yk)xiRnyi{red, blue, green}

เรารู้วิธีสร้างลักษณนามสำหรับผลลัพธ์ไบนารีดังนั้นเราจึงทำเช่นนี้สามครั้ง: จัดกลุ่มผลลัพธ์เข้าด้วยกัน ,และ\}{red, blue or green}{blue, red or green}{green, blue or red}

แต่ละรุ่นใช้รูปแบบของฟังก์ชันเรียกมันว่าตามลำดับ นี่จะนำเวกเตอร์อินพุตไปยังระยะทางที่ถูกเซ็นสัญญาจากไฮเปอร์เพลนที่เกี่ยวข้องกับแต่ละรุ่นโดยที่ระยะทางบวกนั้นสอดคล้องกับการทำนายสีน้ำเงินถ้าf:RnRfR,fB,fGfBfRfGfG(x)x

xargmaxc fc(x)fG(x){fG(x),fB(x),fR(x)}x

กลยุทธ์นี้จะเรียกว่า "หนึ่งเทียบกับทุกคน" และคุณสามารถอ่านเกี่ยวกับเรื่องที่นี่


3

ฉันไม่สามารถเข้าใจบทความ Wiki ได้เลย นี่คือทางเลือกอื่นในการอธิบาย

p1p

pi1i=(1,2)pi

mm+1


คุณแน่ใจหรือไม่ว่าผลลัพธ์เป็นความน่าจะเป็นที่แท้จริง อย่างไรก็ตามฉันไม่ทราบว่าการถดถอยโลจิสติกพหุนามทำงานอย่างไรดังนั้นฉันจะต้องพิจารณาเรื่องนี้ แต่ไม่มีวิธี (อัลกอริทึม) ในการอธิบายวิธีสร้าง perceptron ที่มีโหนดเอาต์พุตสองโหนดขึ้นไป? พวกเขาถูกล่ามโซ่กันอย่างใด?
wnstnsmth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.