คำนวณและทำกราฟขอบเขตการตัดสินใจของ LDA


19

ฉันเห็นพล็อต LDA (การวิเคราะห์จำแนกเชิงเส้น) ที่มีขอบเขตการตัดสินใจจากองค์ประกอบของการเรียนรู้ทางสถิติ :ป้อนคำอธิบายรูปภาพที่นี่

ฉันเข้าใจว่ามีการฉายข้อมูลลงในพื้นที่ย่อยที่มีมิติน้อย อย่างไรก็ตามฉันต้องการทราบว่าเราจะได้รับขอบเขตการตัดสินใจในมิติเดิมอย่างไรเพื่อให้ฉันสามารถฉายขอบเขตการตัดสินใจลงในพื้นที่ย่อยที่มีมิติต่ำกว่า (ชอบเส้นสีดำในภาพด้านบน)

มีสูตรที่ฉันสามารถใช้คำนวณขอบเขตการตัดสินใจในมิติเดิม (สูงกว่า) ได้หรือไม่ ถ้าใช่แล้วสูตรนี้ต้องการปัจจัยอะไร?


3
แทนที่จะเป็นขอบเขตการตัดสินใจคุณอาจพบประโยชน์เพิ่มเติมในการพิจารณาความน่าจะเป็นหลังของการเป็นสมาชิกในชั้นเรียน สิ่งนี้สามารถทำได้โดยใช้สมมติฐานน้อยลงโดยใช้การถดถอยโลจิสติกแบบหลายตัวแปร (polyinomial) แต่สามารถทำได้ด้วย LDA (ความน่าจะเป็นหลัง)
Frank Harrell

2
ภายใน LDA ผู้ขอบเขตการจำแนกเป็นการสิ่งที่เป็นที่รู้จักแผนที่ดินแดน ฉันทำงานกับ SPSS และมันจัดวางมันในรูปแบบข้อความ ตามการออกแบบโปรแกรม SPSS หนึ่งขอบเขตจะพบได้ง่ายโดยวิธีการปฏิบัติ:
ttnphns

3
(ต่อ) ทุก ๆ จุดของกริดที่ดีคือ LDA-จำแนกแล้วถ้าจุดนั้นถูกจัดเป็นเพื่อนบ้านของมันจุดนั้นจะไม่แสดง ดังนั้นจึงมีเพียงขอบเขตในฐานะ "แถบแห่งความกำกวม" ในตอนท้าย they (bondaries) are never computed. The plot is drawn by classifying every character cell in it, then blanking out all those surrounded by cells classified into the same categoryอ้างอิง:
ttnphns

คำตอบ:


22

รูปนี้โดยเฉพาะใน Hastie และคณะ ผลิตโดยไม่มีการคำนวณสมการของขอบเขตของชั้นเรียน มีการใช้อัลกอริทึมที่ระบุโดย @ttnphns ในความคิดเห็นให้ดูเชิงอรรถ 2 ในหัวข้อ 4.3 หน้า 110:

สำหรับตัวเลขนี้และตัวเลขที่คล้ายกันจำนวนมากในหนังสือเราคำนวณขอบเขตการตัดสินใจโดยใช้วิธีการกำหนดเส้นขอบอย่างละเอียด เราคำนวณกฎการตัดสินใจบนจุดที่ละเอียดและจากนั้นใช้อัลกอริธึมเส้นขอบเพื่อคำนวณขอบเขต

อย่างไรก็ตามฉันจะอธิบายวิธีการรับสมการของขอบเขตคลาส LDA ต่อไป

ให้เราเริ่มด้วยตัวอย่างง่ายๆ 2 มิติ นี่คือข้อมูลจากที่ชุดไอริส ; ฉันละทิ้งการวัดกลีบดอกและพิจารณาเฉพาะความยาว sepal และ sepal width เท่านั้น สามคลาสมีการทำเครื่องหมายด้วยสีแดงสีเขียวและสีน้ำเงิน:

ชุดข้อมูล Iris

ขอให้เราแสดงว่าระดับหมายถึง (centroids) เป็น\ LDA ถือว่าคลาสทั้งหมดมีความแปรปรวนร่วมแบบเดียวกันภายในชั้นเรียน ได้รับข้อมูลเมทริกซ์ความแปรปรวนร่วมที่ใช้ร่วมกันนี้ถูกประเมิน (ขึ้นอยู่กับขนาด) เป็นซึ่งผลรวมอยู่เหนือจุดข้อมูลทั้งหมดและเซนทรอยด์ของคลาสนั้น ๆ จะถูกลบออกจากแต่ละจุดμ1,μ2,μ3W=i(xiμk)(xiμk)

สำหรับแต่ละชั้นเรียน (เช่นชั้นและ ) จะมีขอบเขตของชั้นเรียนระหว่างกัน เป็นที่ชัดเจนว่าเขตแดนที่มีการผ่านจุดตรงกลางระหว่างสอง centroids ระดับ 2 หนึ่งในผล LDA กลางคือว่าเขตแดนนี้เป็นเส้นตรงตั้งฉากกับ{2}) มีหลายวิธีในการรับผลลัพธ์นี้และแม้ว่ามันจะไม่ได้เป็นส่วนหนึ่งของคำถามก็ตาม12(μ1+μ2)/2W1(μ1μ2)

โปรดทราบว่าสิ่งที่เขียนข้างต้นเป็นแล้วสเปคที่แม่นยำของเขตแดน ถ้าใครอยากมีสมการเส้นตรงในรูปแบบมาตรฐานก็จะสามารถคำนวณค่าสัมประสิทธิ์และและจะได้รับจากสูตรที่ยุ่งเหยิง ฉันแทบจะไม่สามารถจินตนาการถึงสถานการณ์เมื่อสิ่งนี้จะต้องy=ax+bab

ให้เราใช้สูตรนี้กับตัวอย่างของ Iris สำหรับแต่ละชั้นเรียนฉันจะหาจุดกลางและพล็อตบรรทัดตั้งฉากกับ :W1(μiμj)

LDA ของชุดข้อมูล Iris ขอบเขตการตัดสินใจ

สามบรรทัดตัดกันในจุดเดียวตามที่ควรจะเป็น ขอบเขตการตัดสินใจจะได้รับจากรังสีเริ่มต้นจากจุดแยก:

LDA ของชุดข้อมูล Iris ขอบเขตการตัดสินใจขั้นสุดท้าย

โปรดทราบว่าหากจำนวนคลาสเป็นจะมีคลาสคู่และมีจำนวนบรรทัดมากทุกเส้นตัดกันเป็นพันกัน ในการวาดภาพสวย ๆ จาก Hastie และคณะเราจำเป็นต้องเก็บเฉพาะส่วนที่จำเป็นเท่านั้นและเป็นปัญหาอัลกอริทึมแยกต่างหากในตัวมันเอง (ไม่เกี่ยวข้องกับ LDA ในทางใดทางหนึ่งเพราะไม่ต้องการให้ทำ การจำแนกประเภทเพื่อจำแนกจุดใด ๆ ให้ตรวจสอบระยะทาง Mahalanobis กับแต่ละชั้นเรียนและเลือกจุดที่มีระยะทางต่ำสุดหรือใช้อนุกรมหรือ LDA ตามลำดับ)K2K(K1)/2

ในสูตรยังคงเหมือนเดิม : ขอบเขตคือ orthogonal ถึงและผ่าน 2 อย่างไรก็ตามในมิติที่สูงขึ้นนี้ไม่ได้เป็นสายอีกต่อไป แต่ไฮเปอร์เพลของมิติ สำหรับวัตถุประสงค์ในการอธิบายเราสามารถฉายชุดข้อมูลให้กับแกนแบ่งแยกสองอันแรกได้และลดปัญหาให้กับกรณี 2D (ซึ่งฉันเชื่อว่าเป็นสิ่งที่ Hastie et al. ทำเพื่อสร้างรูปนั้น)D>2W1(μ1μ2)(μ1+μ2)/2D1

ภาคผนวก

จะดูได้อย่างไรว่าขอบเขตนั้นเป็นแนวตั้งฉากกับ ? ต่อไปนี้เป็นวิธีที่เป็นไปได้หลายวิธีในการรับผลลัพธ์นี้:W1(μ1μ2)

  1. วิธีแฟนซี:เจือจางตัวชี้วัด Mahalanobis บนเครื่องบิน; ขอบเขตจะต้องเป็นมุมฉากกับในการวัดนี้ QEDW1μ1μ2

  2. มาตรฐานแบบเกาส์: ถ้าทั้งสองเรียนอธิบายโดยการแจกแจงแบบเกาส์จากนั้นก็มีความเป็นไปได้ที่จุด logเป็นคลาสสัดส่วนmu_k) บนขอบเขตความเป็นไปได้ของการเป็นสมาชิกของคลาสและจะเท่ากัน; จดบันทึกลดความซับซ้อนและคุณจะไปที่ , QEDxk(xμk)W1(xμk)12xW1(μ1μ2)=const

  3. วิธีที่ใช้แรงงานมาก แต่ใช้งานง่าย ลองจินตนาการว่าเป็นเมทริกซ์เอกลักษณ์นั่นคือทุกคลาสนั้นเป็นทรงกลม แล้ววิธีการแก้ปัญหาที่เห็นได้ชัด: เขตแดนเป็นเพียงฉากกับ\ ถ้าชั้นเรียนไม่เป็นทรงกลมก็สามารถทำให้ชั้นเรียนนั้นเป็นทรงกลมได้ ถ้า eigen - การสลายตัวของคือแล้วเมทริกซ์จะทำการหลอกลวง (ดูเช่นที่นี่ ) ดังนั้นหลังจากใช้เขตแดนเป็นฉากกับ{2}) หากเรานำขอบเขตนี้มาเปลี่ยนกลับด้วยμ 1 - μ 2 W W = U D US = D - 1 / 2 US S ( μ 1 - μ 2 ) S - 1 SS (Wμ1μ2WW=UDUS=D1/2USS(μ1μ2)S1และถามว่ามันคืออะไรมุมฉากคำตอบ (จากการออกกำลังกาย) คือ: ถึง{2}) เสียบนิพจน์สำหรับเราจะได้ QEDSSS(μ1μ2)S


ฉันยังไม่ได้ศึกษาคำตอบของคุณ ดูเหมือนว่ามีความซับซ้อนและอาจถูกต้อง เป็นเรื่องเกี่ยวกับ "จุดโรยจำแนกและแยกขอบเขตแล้ว" ที่ใช้งานได้จริงและง่ายขึ้นซึ่งฉันได้อธิบายไว้ในความคิดเห็นคืออะไร วิธีการของคุณเปรียบกับผลลัพธ์ของมัน (ซึ่งเห็นได้ชัดว่าถูกต้อง)? คุณคิดอย่างไร?
ttnphns

1
@ttnphns: ส่วนทางเทคนิคเดียวของคำตอบของฉัน (รายการหมายเลขที่มี 3 รายการ) คือการแสดงหลักฐานบางอย่างและสามารถข้ามได้อย่างปลอดภัย ส่วนที่เหลือฉันเชื่อว่าไม่ซับซ้อนเป็นพิเศษ! บางทีฉันควรย้ายส่วน "พิเศษ" นั้นลงไปเป็นภาคผนวกหรือไม่? เกี่ยวกับความคิดเห็นของคุณ: ฉันคิดว่านี่เป็นวิธีที่ถูกต้องและฉันชอบ ASCII ที่มีลักษณะเป็น SPSS "แผนที่อาณาเขต" บางทีคุณสามารถย้ายความคิดเห็นของคุณไปเป็นคำตอบแยกต่างหาก (และให้ภาพที่เป็นตัวอย่างของแผนที่ SPSS ที่นั่น) ฉันคิดว่ามันจะมีประโยชน์สำหรับการอ้างอิงในอนาคต ผลลัพธ์ที่ได้ควรมีความเท่าเทียมกัน
อะมีบาพูดว่า Reinstate Monica

@ttnphns: ปรากฎว่า Hastie และคณะ ใช้วิธีที่คุณอธิบายในที่นี้เพื่อพล็อตตัวเลขรวมถึงสิ่งที่ทำซ้ำใน OP ฉันพบเชิงอรรถที่บอกอย่างชัดเจนว่า (และอัปเดตคำตอบของฉันโดยอ้างอิงจากจุดเริ่มต้น)
อะมีบากล่าวว่า Reinstate Monica

Waouh! คำตอบที่ดี (3 ปีต่อมา!) ฉันขอถามว่าคุณจะวาดส่วนในปัญหาเฉพาะนี้ได้อย่างไร
Xavier Bourret Sicotte
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.