ฉันกำลังศึกษาวิเคราะห์พินิจพิเคราะห์ แต่ฉันมีช่วงเวลาที่ยากลำบากในการปรับคำอธิบายที่แตกต่างกันหลายอย่าง ฉันเชื่อว่าฉันต้องพลาดบางสิ่งบางอย่างเพราะฉันไม่เคยพบกับความแตกต่างในระดับนี้ (ดู) มาก่อน ดังที่กล่าวไปแล้วจำนวนคำถามเกี่ยวกับการวิเคราะห์การเลือกปฏิบัติบนเว็บไซต์นี้ดูเหมือนจะเป็นเครื่องยืนยันถึงความซับซ้อน
LDA และ QDA สำหรับหลายคลาส
หนังสือข้อความหลักของฉันคือ Johnson & Wichern ประยุกต์การวิเคราะห์เชิงสถิติหลายตัวแปร (AMSA) และบันทึกของครูตามสิ่งนี้ ฉันจะเพิกเฉยต่อการตั้งค่าทั้งสองกลุ่มเพราะฉันเชื่อว่าสูตรง่าย ๆ ของการตั้งค่านี้ทำให้เกิดความสับสนอย่างน้อย แหล่งอ้างอิง LDA และ QDA นี้ถูกกำหนดให้เป็นส่วนขยายแบบ Parametric (สมมติว่ามีภาวะปกติหลายตัวแปร) ของกฎการจำแนกประเภทตามค่าใช้จ่ายที่คาดหวังของการจำแนกประเภท (ECM) ECM จะรวมกับค่าใช้จ่ายที่คาดหวังตามเงื่อนไขสำหรับการจำแนกการสังเกตการณ์ x ใหม่ให้กับกลุ่มใด ๆ (รวมค่าการแบ่งประเภทและความน่าจะเป็นก่อนหน้านี้) และเราเลือกภูมิภาคการจำแนกที่ลดสิ่งนี้ลง ที่ไหน
สมมุติว่ากฎการจำแนกประเภทนี้เทียบเท่ากับ "กฎข้อที่เพิ่มความน่าจะเป็นหลัง" (sic AMSA) ซึ่งฉันสามารถสันนิษฐานได้ว่าเป็นแนวทางของ Bayes ที่ฉันเคยเห็น ถูกต้องหรือไม่ และ ECM เป็นวิธีที่เก่ากว่าเพราะฉันไม่เคยเห็นมันเกิดขึ้นที่อื่นเลย
สำหรับประชากรปกติกฎนี้ลดความซับซ้อนของคะแนนการจำแนกแบบสองชั้น:(p_i)
นี้ดูเหมือนว่าเทียบเท่ากับองค์ประกอบของการเรียนรู้ทางสถิติ (ESL) สูตร 4.12 ในหน้า 110 ถึงแม้ว่าพวกเขาอธิบายว่ามันเป็นจำแนกกำลังสองฟังก์ชั่นมากกว่าคะแนน ยิ่งไปกว่านั้นพวกเขามาถึงที่นี่ผ่านอัตราส่วนล็อกของความหนาแน่นหลายตัวแปร (4.9) นี่เป็นอีกชื่อสำหรับแนวทางของ Bayes หรือไม่?
เมื่อเราถือว่าความแปรปรวนร่วมเท่ากันสูตรจะลดความซับซ้อนของคะแนนการจำแนกเชิงเส้นให้มากยิ่งขึ้น
สูตรนี้ไม่แตกต่างจากการสอนภาษาอังกฤษ (4.10) ที่ระยะแรกจะถูกกลับรายการ:\ รุ่น ESL ยังเป็นหนึ่งที่ระบุไว้ในการเรียนรู้ทางสถิติในการวิจัย ยิ่งไปกว่านั้นใน SAS output ที่แสดงใน AMSA ฟังก์ชั่นการแบ่งแยกเชิงเส้นถูกอธิบายไว้ประกอบด้วยค่าคงที่และสัมประสิทธิ์ เวกเตอร์ดูเหมือนจะสอดคล้องกับเวอร์ชั่น ESL
อะไรคือสาเหตุของความคลาดเคลื่อนนี้?
การเลือกปฏิบัติและวิธีการของฟิชเชอร์
หมายเหตุ: หากคำถามนี้มีขนาดใหญ่เกินไปฉันจะลบหัวข้อนี้และเปิดคำถามใหม่ แต่จะสร้างในส่วนก่อนหน้า ขอโทษสำหรับกำแพงของข้อความโดยไม่คำนึงถึงฉันพยายามทำให้ดีที่สุดเพื่อจัดวางโครงสร้าง แต่ฉันแน่ใจว่าความสับสนของฉันเกี่ยวกับวิธีนี้ได้นำไปสู่การกระโดดของตรรกะที่ค่อนข้างแปลก
หนังสือ AMSA ยังอธิบายถึงวิธีการของชาวประมงเช่นกันสำหรับหลาย ๆ กลุ่ม อย่างไรก็ตาม ttnphns ได้ชี้ให้เห็นหลาย ครั้งว่า FDA เป็นเพียง LDA กับสองกลุ่ม องค์การอาหารและยาหลายชั้นนี้คืออะไร? บางทีองค์การอาหารและยาอาจมีความหมายหลายอย่าง?
AMSA อธิบายการแบ่งแยกของฟิชเชอร์ในฐานะ eigenvectors ของซึ่งเพิ่มอัตราส่วน{a}}} การรวมกันเชิงเส้นเป็นตัวอย่างจำแนก (ซึ่งมี ) สำหรับการจำแนกประเภทเราเลือกกลุ่ม k ที่มีค่าน้อยที่สุดสำหรับโดยที่ r คือจำนวนของ discriminants ที่เราต้องการใช้ ถ้าเราใช้ discriminants ทั้งหมดกฎนี้จะเทียบเท่ากับฟังก์ชัน discriminant เชิงเส้น
คำอธิบายมากมายเกี่ยวกับ LDA ดูเหมือนจะอธิบายวิธีการที่เรียกว่า FDA ในหนังสือ AMSA คือเริ่มจากด้านนี้ระหว่าง / ภายในแง่มุมที่เปลี่ยนแปลงได้ องค์การอาหารและยาหมายถึงอะไรถ้าไม่ใช่การสลายตัวของเมทริกซ์ BW?
นี่เป็นครั้งแรกที่หนังสือเรียนกล่าวถึงการลดขนาดของการวิเคราะห์จำแนกในขณะที่คำตอบหลาย คำในเว็บไซต์นี้เน้นถึงลักษณะสองขั้นตอนของเทคนิคนี้ แต่นี่ไม่ชัดเจนในการตั้งค่าสองกลุ่มเพราะมีเพียง 1 จำแนก ด้วยสูตรข้างต้นสำหรับ LDA แบบหลายคลาสและ QDA มันยังไม่ปรากฏชัดเจนสำหรับฉันเมื่อมีการเลือกปฏิบัติปรากฏขึ้น
ความคิดเห็นนี้ทำให้ฉันสับสนโดยเฉพาะอย่างยิ่งการสังเกตว่าการจำแนกประเภท Bayes สามารถทำได้กับตัวแปรดั้งเดิม แต่ถ้า FDA และ LDA มีความเท่าเทียมกันทางคณิตศาสตร์ตามที่ระบุไว้ในหนังสือและที่นี่การลดมิติข้อมูลไม่ควรอยู่ในฟังก์ชันหรือไม่ ฉันเชื่อว่านี่คือสิ่งที่ลิงก์สุดท้ายระบุไว้ แต่ฉันไม่แน่ใจทั้งหมด
บันทึกหลักสูตรของครูของฉันอธิบายต่อไปว่าองค์การอาหารและยาเป็นรูปแบบหนึ่งของการวิเคราะห์ความสัมพันธ์แบบบัญญัติ ฉันเพิ่งพบแหล่งข้อมูลอีก 1 แหล่งที่พูดถึงแง่มุมนี้ แต่ดูเหมือนว่ามันจะเชื่อมโยงอย่างใกล้ชิดกับแนวทางฟิชเชอร์ของการย่อยสลายระหว่างและภายในความแปรปรวนอีกครั้ง SAS นำเสนอผลลัพธ์ในขั้นตอน LDA / QDA (DISCRIM) ที่เห็นได้ชัดว่าเกี่ยวข้องกับวิธีการของฟิชเชอร์ ( https://stats.stackexchange.com/a/105116/62518 ) อย่างไรก็ตามตัวเลือก FDA 'SAS (CANDISC) ดำเนินการเกี่ยวกับความสัมพันธ์แบบบัญญัติโดยไม่แสดงค่าสัมประสิทธิ์การจัดหมวดหมู่ของฟิชเชอร์ มันแสดงค่าสัมประสิทธิ์แบบบัญญัติซึ่งฉันเชื่อว่าเทียบเท่ากับ eigenvectors W-1B ของ R ที่ได้จาก lda (MASS) (https://support.sas.com/documentation/cdl/th/statug/63033/HTML/default/viewer.htm#statug_candisc_sect019.htm ) ค่าสัมประสิทธิ์การจำแนกประเภทนั้นหาได้จากฟังก์ชันการจำแนกที่ฉันอธิบายไว้ในส่วน LDA และ QDA ของฉัน (เนื่องจากมี 1 ฟังก์ชันต่อประชากรและเราเลือกค่าที่ใหญ่ที่สุด)
ฉันขอขอบคุณสำหรับการชี้แจงหรือการอ้างอิงถึงแหล่งที่สามารถช่วยฉันดูป่าผ่านต้นไม้ สาเหตุหลักของความสับสนของฉันน่าจะเป็นที่ตำราวิธีการโทรที่แตกต่างกันโดยใช้ชื่อที่แตกต่างกันหรือนำเสนอรูปแบบที่แตกต่างกันเล็กน้อยของคณิตศาสตร์โดยไม่ยอมรับความเป็นไปได้อื่น ๆ แม้ว่าฉันคิดว่ามันไม่น่าแปลกใจเมื่อพิจารณาอายุของหนังสือ AMSA .
Extract the discriminants -> classify by them all (using Bayes approach, as usual)
เมื่อโดยปกติแล้วค่าเริ่มต้นจะรวมอยู่ในเมทริกซ์ความแปรปรวนร่วมคลาสของ discriminants
W^-1B
แล้วทำ "เบย์" มันเทียบเท่า แต่มีความยืดหยุ่นน้อยกว่า (คุณไม่สามารถเลือก discriminants เพียงไม่กี่ตัวเท่านั้นคุณไม่สามารถใช้แยกจากกันภายในเมทริกซ์ความแปรปรวนร่วมที่จัดประเภท ฯลฯ )
If we use all the discriminants this rule would be equivalent to the linear discriminant function
กำกวม "Discriminant" และ "discriminant function" เป็นคำพ้องความหมาย คุณอาจใช้ discriminants ทั้งหมดหรือเพียงไม่กี่คนที่แข็งแกร่งที่สุด / สำคัญของพวกเขา ฉันไม่ได้หันไปหาหนังสือ AMSA แต่ฉันสงสัยว่า FDA = LDA สำหรับผู้แต่ง จริงๆแล้วฉันคิดว่า "ฟิชเชอร์ LDA" จะเป็นคำที่เกินความจำเป็น