ฝึกพื้นฐานการสุ่มมาร์คอฟสำหรับการจำแนกพิกเซลในรูปภาพ


16

ฉันพยายามเรียนรู้วิธีใช้ Markov Random Fields เพื่อแบ่งส่วนพื้นที่ในรูปภาพ ฉันไม่เข้าใจพารามิเตอร์บางอย่างใน MRF หรือเหตุใดการเพิ่มความคาดหวังสูงสุดที่ฉันดำเนินการจึงล้มเหลวในการรวมเข้ากับโซลูชันในบางครั้ง

เริ่มต้นจากทฤษฎีบทของเบย์ฉันมีp(x|y)=p(y|x)p(x)/p(y)โดยที่yคือค่าระดับสีเทาของพิกเซลและxเป็นป้ายกำกับคลาส ฉันเลือกที่จะใช้การแจกแจงแบบเกาส์สำหรับp(y|x)ในขณะที่p(x)เป็นแบบจำลองโดยใช้ MRF

ฉันใช้ฟังก์ชันที่เป็นไปได้สำหรับ MRF ที่มีทั้งศักยภาพ clique pairwise และค่าที่เป็นไปได้สำหรับเลเบลคลาสของพิกเซลที่ถูกจัดประเภท ค่าพิกเซลที่อาจเกิดขึ้นเพียงครั้งเดียวเป็นบางส่วนคงที่αที่ขึ้นอยู่บนฉลากระดับxxฟังก์ชันที่มีโอกาสเป็นคู่ได้รับการประเมินสำหรับเพื่อนบ้านที่เชื่อมต่อกัน 4 รายการและส่งกลับค่าบวกβหากเพื่อนบ้านมีป้ายกำกับคลาสเดียวกันกับพิกเซลนี้และβหากป้ายกำกับแตกต่างกัน

ที่จุดในการขยายความคาดหวังสูงสุดที่ฉันต้องค้นหาค่าของα(x)และβที่เพิ่มค่าที่คาดหวังของความเป็นไปได้สูงสุดที่บันทึกไว้ฉันใช้วิธีการหาค่าเหมาะที่สุดเชิงตัวเลข พบว่าค่าของβจะกลายเป็นลบจะเพิ่มขึ้นอย่างมากและการวนซ้ำหรือสองครั้งหลังจากนั้นภาพทั้งหมดจะถูกกำหนดให้กับหนึ่งป้ายเท่านั้นเท่านั้น (พื้นหลัง: การกำหนดป้ายชื่อชั้นเรียนโดยใช้พารามิเตอร์ MRF นั้นใช้ ICM) หากฉันลบอัลฟ่านั่นคือการใช้ศักยภาพของกลุ่มคู่เท่านั้นแล้วการเพิ่มความคาดหวังจะทำได้ดีα

โปรดอธิบายจุดประสงค์ของอัลฟ่าสำหรับแต่ละชั้นเรียนคืออะไร? ฉันคิดว่าพวกเขาจะเกี่ยวข้องกับจำนวนของคลาสนั้นที่ปรากฏในรูปภาพ แต่ไม่ปรากฏ เมื่อฉันได้ MRF ทำงานด้วยศักยภาพแบบคู่เท่านั้นฉันเปรียบเทียบมันกับแบบจำลองส่วนผสมแบบเกาส์ตรงไปข้างหน้าและพบว่าพวกมันให้ผลลัพธ์ที่เหมือนกันเกือบทั้งหมด ฉันคาดหวังว่าศักยภาพในการจับคู่จะทำให้ชั้นเรียนราบรื่นขึ้นเล็กน้อย แต่นั่นไม่ได้เกิดขึ้น กรุณาแนะนำที่ฉันผิด


แค่อยากรู้ว่าทำไมคุณถึงเลือกรูปแบบกราฟที่ไม่ได้บอกทาง

ในแอปพลิเคชันของฉันค่าระดับสีเทาของจำนวนพิกเซลและพิกเซลใกล้เคียงมีแนวโน้มที่จะมีเลเบลระดับเดียวกัน แต่ไม่มีเหตุผลใดที่จะใช้เบต้าที่แตกต่างกันสำหรับแต่ละกลุ่ม ฉันหวังว่าฉันเข้าใจคำถามของคุณอย่างถูกต้อง
chippies

1
อัลฟาคงที่ดูเหมือนจะให้บริการเพื่อวัตถุประสงค์ในการจำลองการกระจายก่อนหน้านี้บนฉลาก ตามที่คุณควรอัลฟ่าที่ถูกต้องน่าจะใส่ป้ายกำกับเหล่านั้นที่พบบ่อยในชุดฝึกซ้อม หากแบบจำลองของคุณใช้งานได้ดีหากไม่มีพวกเขาทำไมคุณไม่ลองดรอปแบบนั้นกับแบบจำลอง? คำอธิบายของคุณไม่เพียงพอที่จะตอบว่าทำไมอัลฟาจะเติบโตและทำให้เสียทุกอย่าง แต่คุณอาจต้องทำให้เป็นปกติ พยายามที่จะเพิ่มเกาส์ก่อนที่อัลฟาในรูปแบบเช่นเพิ่มเพื่อเข้าสู่ระบบหลังนี้อาจจะป้องกันไม่ให้ overfitting λα2
Roman Shapovalov

คำถามของคุณยังไม่ชัดเจน: 1) ความน่าจะเป็นของคุณ p (y | x) สลายตัวไปตามพิกเซลหรือเปล่า 2) อะไรคือวัตถุประสงค์ที่แน่นอนที่คุณเพิ่มประสิทธิภาพใน EM (คุณพูดถึงความเป็นไปได้ในการบันทึก แต่คุณใช้ MRF สำหรับการสร้างแบบจำลองก่อนหน้า)? 3) คุณกำหนดศักยภาพในโดเมนลอการิทึมหรือไม่ การเพิ่มเบต้าหมายถึงการเพิ่ม P (x) หรือพลังงานซึ่งคือ -log P (x) หรือพลังงานเชิงลบหรือไม่ 4) คุณจัดการเพื่อลดวัตถุประสงค์ EM โดยการตั้งค่าอัลฟ่าเสื่อมโทรมเช่นนั้นหรือการเพิ่มประสิทธิภาพล้มเหลวหรือไม่?
Roman Shapovalov

สิ่งที่เกี่ยวกับการเผยแพร่ความเชื่อเป็นวงแหวน?
wolfsatthedoor

คำตอบ:


1

การวินิจฉัยโรค

ดูเหมือนว่าปัญหาการเริ่มต้น

โมเดล MRF ที่คุณกำลังใช้นั้นไม่มีรูปแบบนูนและดังนั้นจึงมีหลายท้องถิ่นขนาดเล็ก เท่าที่ฉันรู้เทคนิคการเพิ่มประสิทธิภาพที่มีอยู่ทั้งหมดนั้นมีความอ่อนไหวต่อการเริ่มต้นซึ่งหมายความว่าคุณภาพของการแก้ปัญหาขั้นสุดท้ายนั้นได้รับผลกระทบอย่างมากจากการที่คุณเริ่มขั้นตอนการปรับให้เหมาะสม

โซลูชั่นที่แนะนำ

ฉันขอแนะนำให้ลองกลยุทธ์ที่แตกต่างเพื่อเริ่มต้นโมเดล ตัวอย่างเช่นกลยุทธ์หนึ่งที่อยู่ในใจของฉันคือต่อไปนี้:

  1. ฝึกโมเดลสำหรับก่อนและละเว้นเทอมก่อนสำหรับตอนนี้ นั่นคือการแก้ไขP ( x )จะเป็นเหมือนกันตัวอย่างเช่นโดยการตั้งค่าα = β = 0และทำให้พวกเขาได้รับการแก้ไข หากคุณต้องการเป็นนักเล่นคุณสามารถกำหนดp ( x )ให้เป็นการกระจายแบบหลายจุดซึ่งแสดงถึงความถี่สัมพัทธ์ของฉลากในชุดฝึกอบรม คุณสามารถทำได้โดยการตั้งค่าαอย่างเหมาะสมp(y|x) p(x)α=β=0 p(x)α

  2. ทำน้ำแข็งให้ละลายเงื่อนไข unary และ pairwise ในโมเดล MRF ที่ให้เพิ่มประสิทธิภาพของคุณเปลี่ยนค่าของและβαβ

การเริ่มต้นที่แนะนำคือไม่ได้เป็นวิธีที่ดีที่สุดในการเริ่มต้นการเพิ่มประสิทธิภาพของคุณ แต่เป็นเพียงตัวเลือกเดียวที่เป็นไปได้

สุดท้ายตามที่Roman Shapovalovแนะนำคุณสามารถพิจารณาปรับพารามิเตอร์ก่อนหน้านี้ ตัวอย่างเช่นโดยการวางแบบเกาส์ก่อนที่พวกเขา: ที่λ อัลฟ่าและλ บีตามี Hyper-พารามิเตอร์ที่สามารถตีความเป็นความแปรปรวนของไพรเออร์เสียนλα||α||2+λβ||β||2λαλβ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.