ฉันคิดว่าคุณสามารถประเมินและได้ถึงค่าคงที่ normalizing แสดงว่าและg_ufgf(x)=fu(x)/cfg(x)=gu(x)/cg
ตัวประมาณที่สอดคล้องกันที่อาจใช้คือ
โดยที่
เป็นความสำคัญการสุ่มตัวอย่างประมาณการสำหรับอัตราส่วนc_fที่นี่คุณใช้และเป็นความหนาแน่นของอุปกรณ์สำหรับและตามลำดับและเพื่อกำหนดเป้าหมายอัตราส่วนการบันทึกของความหนาแน่นผิดปกติ
DKLˆ(f||g)=[n−1∑jfu(xj)/πf(xj)]−11N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]−log(r^)
r^=1/n1/n∑jfu(xj)/πf(xj)∑jgu(yj)/πg(yj).(1)
cf/cgπfπgfuguπr
ดังนั้นขอให้ ,และ\ เศษของ (1) ลู่ไปc_fตัวหารลู่ไปc_gอัตราส่วนสอดคล้องกับทฤษฎีบทการทำแผนที่อย่างต่อเนื่อง บันทึกของอัตราส่วนสอดคล้องกันโดยการทำแผนที่ต่อเนื่องอีกครั้ง{xi}∼πf{yi}∼πg{zi}∼πrcfcg
เกี่ยวกับส่วนอื่น ๆ ของตัวประมาณ
ตามกฎหมายจำนวนมาก
1N∑iN[log(fu(zi)gu(zi))fu(zi)πr(zi)]→ascfE[log(fu(zi)gu(zi))]
แรงจูงใจของฉันคือ:
DKL(f||g)=∫∞−∞f(x)log(f(x)g(x))dx=∫∞−∞f(x){log[fu(x)gu(x)]+log[cgcf]}dx=Ef[logfu(x)gu(x)]+log[cgcf]=c−1fEπr[logfu(x)gu(x)fu(x)πr(x)]+log[cgcf].
ดังนั้นฉันจะแบ่งมันออกเป็นชิ้นง่ายต่อการเข้าใจ
สำหรับแนวคิดเพิ่มเติมเกี่ยวกับวิธีจำลองอัตราส่วนความน่าจะเป็นฉันพบกระดาษที่มีจำนวนน้อย:
https://projecteuclid.org/download/pdf_1/euclid.aos/1031594732