ฉันใช้ Bayes เพื่อแก้ปัญหาการจัดกลุ่ม หลังจากทำการคำนวณบางอย่างฉันก็จำเป็นต้องได้รับอัตราส่วนของความน่าจะเป็นสองอย่าง:
เพื่อให้สามารถที่จะได้รับ ) ความน่าจะเป็นเหล่านี้ได้มาจากการรวมกันของ KD หลายตัวแปร 2D สองแบบตามที่อธิบายไว้ในคำตอบนี้ :
โดยที่และคือ KDEs และการรวมเข้าด้วยกันนั้นทำสำหรับทุกจุดใต้ thresholdsและs_b) ทั้งสอง KDEs ใช้เคอร์เนล Gaussian ภาพตัวแทนของ KDE คล้ายกับคนที่ฉันกำลังทำงานกับสามารถมองเห็นได้ที่นี่: การบูรณาการประมาณค่าความหนาแน่นของเคอร์เนลในแบบ 2D
ฉันคำนวณ KDE ด้วยการใช้python
ฟังก์ชั่นstats.gaussian_kdeดังนั้นฉันจึงถือว่ารูปแบบทั่วไปดังต่อไปนี้:
n
ความยาวของอาร์เรย์ของคะแนนของฉันอยู่ที่ไหนและh
ใช้แบนด์วิดท์เป็นเท่าไหร่
อินทิกรัลด้านบนคำนวณโดยใช้กระบวนการมอนติคาร์โลซึ่งมีราคาค่อนข้างสูง ฉันได้อ่านที่ไหนสักแห่ง (ลืมที่ไหนขอโทษ) ว่าในกรณีเช่นนี้มันเป็นไปได้ที่จะแทนที่อัตราส่วนของความน่าจะเป็นด้วยอัตราส่วนของ PDF (KDE) ที่ประเมินที่จุดเริ่มต้นเพื่อให้ได้ผลลัพธ์ที่ถูกต้องเท่าเทียมกัน ฉันสนใจสิ่งนี้เพราะการคำนวณอัตราส่วนของ KDE นั้นเป็นคำสั่งที่มีขนาดเร็วกว่าการคำนวณอัตราส่วนของอินทิกรัลกับ MC
ดังนั้นคำถามจะลดลงตามความถูกต้องของนิพจน์นี้:
ภายใต้สถานการณ์ใดฉันสามารถพูดได้ว่าความสัมพันธ์นี้เป็นจริงหรือไม่
[แก้ไขข้อผิดพลาด (แก้ไข)
เพิ่ม :
นี่คือคำถามเดียวกันโดยทั่วไป แต่ทำในรูปแบบทางคณิตศาสตร์มากขึ้น
P(X)
ซึ่งเป็นสิ่งที่ฉันพยายามหลีกเลี่ยงการคำนวณ คุณช่วยขยายความเกี่ยวข้องของพารามิเตอร์นั้นหน่อยได้ไหม?