ปรับเทียบลักษณนามเพิ่มหลายคลาส


19

ฉันได้อ่านอเล็กซาน Niculescu-Mizil และรวย Caruana กระดาษ " ได้รับการสอบเทียบความน่าจะเป็นจากการส่งเสริม " และการอภิปรายในนี้ด้าย อย่างไรก็ตามฉันยังคงมีปัญหาในการทำความเข้าใจและใช้งานโลจิสติกส์หรือการปรับขนาดของแพลตต์เพื่อปรับเทียบผลลัพธ์ของตัวแยกประเภทการเพิ่มคลาสหลายระดับของฉัน

ฉันค่อนข้างคุ้นเคยกับโมเดลเชิงเส้นทั่วไปและฉันคิดว่าฉันเข้าใจว่าวิธีการสอบเทียบของโลจิสติกและแพลตทำงานอย่างไรในกรณีไบนารี แต่ฉันไม่แน่ใจว่าฉันรู้วิธีขยายวิธีที่อธิบายไว้ในกระดาษไปยังกรณีหลายระดับ

ตัวจําแนกฉันใช้ผลลัพธ์ต่อไปนี้:

  • = จำนวนคะแนนโหวตที่ลักษณนามใช้สำหรับคลาส jสำหรับตัวอย่าง iที่ถูกจัดประเภทผมJJผม
  • Yผม = คลาสโดยประมาณ

ณ จุดนี้ฉันมีคำถามต่อไปนี้:

คำถามที่ 1:ฉันจำเป็นต้องใช้ logom หลายค่าเพื่อประมาณความน่าจะเป็นหรือไม่? หรือฉันยังสามารถทำได้ด้วยการถดถอยโลจิสติก (เช่นใน 1-vs-all )?

Q2:ฉันจะกำหนดตัวแปรเป้าหมายระดับกลางได้อย่างไร (เช่นในการปรับขนาดของแพลต) สำหรับกรณีที่มีหลายระดับ

คำถามที่3:ฉันเข้าใจว่าอาจเป็นเรื่องที่ถามบ่อย แต่ทุกคนจะยินดีที่จะร่างรหัสหลอกสำหรับปัญหานี้หรือไม่? (ในระดับปฏิบัติมากขึ้นฉันสนใจในโซลูชันใน Matlab)


1
คำถามที่ดี ฉันสงสัยเช่นกันเกี่ยวกับวิธีการสร้างการสอบเทียบแม้ว่าคุณจะใช้ 1 กับรูปแบบที่เหลือ หากคุณสร้างแบบจำลอง k โดยใช้ 1 กับส่วนที่เหลือ (และมีคลาส k) คุณต้องทำมาตรฐาน / ให้เป็นมาตรฐานอย่างใดเพื่อให้รวมเป็น 1 (เช่นหารความน่าจะเป็นที่สอบเทียบแต่ละครั้งด้วยผลรวมของ k ทั้งหมด)?
B_Miner

คำตอบ:


9

นี่เป็นหัวข้อที่ฉันสนใจจริง ๆ เช่นกันดังนั้นฉันจึงทำการวิจัยเล็กน้อย ต่อไปนี้เป็นบทความสองบทความโดยผู้เขียนที่มักระบุว่าเป็นข้อมูลอ้างอิงในเรื่องเหล่านี้

  1. การแปลงคะแนนตัวจําแนกเป็นการประมาณการความน่าจะเป็นแบบหลายคลาสที่ถูกต้อง
  2. การลดมัลติคลาสไปเป็นไบนารีโดยเชื่อมต่อการประมาณความน่าจะเป็น

ส่วนสำคัญของเทคนิคที่สนับสนุนที่นี่คือการลดปัญหามัลติคลาสเป็นไบนารีหนึ่ง (เช่นหนึ่งเทียบกับส่วนที่เหลือ AKA หนึ่งเทียบกับทั้งหมด) ใช้เทคนิคเช่น Platt (ควรใช้ชุดทดสอบ) เพื่อปรับคะแนน / ความน่าจะเป็นไบนารี่และ จากนั้นจึงรวมเทคนิคเหล่านี้เข้าด้วยกันโดยใช้เทคนิคตามที่กล่าวไว้ในเอกสาร ในลิงค์แรกพบผลลัพธ์ที่ดีที่สุดโดยเพียงแค่ปรับความน่าจะเป็นแบบไบนารีให้เป็นปกติเพื่อรวมเป็น 1

ฉันชอบที่จะได้ยินคำแนะนำอื่น ๆ และหาก tecnhiqes ใด ๆ เหล่านี้มีส่วนร่วมในอาร์


ลิงก์ที่กล่าวถึงในคำตอบนั้นล้าสมัยแล้ว ลิงค์ล่าสุดคือ: citeseerx.ist.psu.edu/viewdoc/… citeseerx.ist.psu.edu/viewdoc/ ......
จันทรา

อ้างอิงจากที่นี่stats.stackexchange.com/questions/362460/…
TMrtSmith

สะท้อนคำตอบนี้ สิ่งนี้ทำให้ฉันงงบ้าง แต่กระดาษของ Zadrozny และ Elkan นั้นมีประโยชน์
songololo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.