บันทึก (p (x, y)) ทำข้อมูลร่วมกันให้เป็นจุดปกติได้อย่างไร


9

ฉันกำลังพยายามที่จะเข้าใจรูปแบบของข้อมูลร่วมกันแบบจุดตามปกติ

npmi=pmi(x,y)log(p(x,y))

เหตุใดความน่าจะเป็นร่วมของบันทึกจึงทำให้ข้อมูลร่วมกันที่เป็นจุดเป็นปกติอยู่ระหว่าง [-1, 1]?

ข้อมูลร่วมกันที่ชาญฉลาดคือ:

pmi=log(p(x,y)p(x)p(y))

p (x, y) ถูกล้อมรอบด้วย [0, 1] ดังนั้นล็อก (p (x, y)) ถูกล้อมรอบด้วย (, 0] ดูเหมือนว่าบันทึก (p (x, y)) ควรเปลี่ยนแปลงสมดุลใน ตัวเศษ แต่ฉันไม่เข้าใจอย่างชัดเจนว่ามันทำให้ฉันนึกถึงเอนโทรปีh=log(p(x))แต่อีกครั้งฉันไม่เข้าใจความสัมพันธ์ที่แน่นอน


สำหรับผู้เริ่มต้นข้อมูลร่วมจุดใช้ลอการิทึม (ฉันไม่แน่ใจว่าพิมพ์ผิดหรือคุณกำลังใช้ปริมาณอื่น )
Piotr Migdal

คำตอบ:


12

จากรายการ Wikipedia บนข้อมูลร่วมกันแบบจุด :

ข้อมูลร่วมกันในแนวตั้งจุดสามารถทำให้เป็นมาตรฐานระหว่าง [-1, + 1] ส่งผลให้ -1 (ในขีด จำกัด ) สำหรับไม่เคยเกิดขึ้นพร้อมกัน, 0 เพื่อความเป็นอิสระและ +1 สำหรับการเกิดร่วมที่สมบูรณ์

ทำไมมันเกิดขึ้น ความหมายของข้อมูลร่วมกันแบบจุดคือ

pmilog[p(x,y)p(x)p(y)]=logp(x,y)logp(x)logp(y),

ในขณะที่ข้อมูลมาตรฐานร่วมกันคือ:

npmipmilogp(x,y)=log[p(x)p(y)]logp(x,y)1.

เมื่อมี:

  • ไม่มีเหตุการณ์ร่วมดังนั้นnmpiคือ -1,logp(x,y)
  • เกิดขึ้นแบบสุ่ม, , ดังนั้นnmpiคือ 0,logp(x,y)=log[p(x)p(y)]
  • เสร็จสมบูรณ์ร่วมเกิดดังนั้น nmpiคือ 1logp(x,y)=logp(x)=logp(y)

มันจะเป็นคำตอบที่สมบูรณ์มากขึ้นเพื่อแสดงให้เห็นว่าทำไม npmi อยู่ในช่วง[-1,1]ดูหลักฐานของฉันในคำตอบอื่น ๆ [1,1]
Hans

1

ในขณะที่คำตอบ Piotr Migdal เป็นข้อมูลในการให้ตัวอย่างที่ประสบความสำเร็จใน nmpi สามค่ามากก็ไม่ได้พิสูจน์ว่ามันอยู่ในช่วง[-1,1]นี่คือความไม่เท่าเทียมกันและที่มาของมัน เป็นสำหรับการใด ๆ เหตุการณ์ การหารทั้งสองข้างด้วยค่าที่ไม่เป็นลบเรามี [1,1]

logp(x,y)logp(x,y))logp(x)logp(y)=logp(x,y)p(x)p(y)=:pmi(x;y)=logp(y|x)+logp(y|x)logp(x,y)logp(x,y)
logp(A)0Ah(x,y):=logp(x,y)
1nmpi(x;y):=mpi(x;y)h(x,y)1.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.