ข้อมูลรวมเป็นความน่าจะเป็น


11

ข้อมูลร่วมกันของเอนโทรปีสามารถร่วมกันได้:

0I(X,Y)H(X,Y)1

หมายถึง: "ความน่าจะเป็นในการถ่ายทอดข้อมูลจาก X ถึง Y"?

ฉันขอโทษที่ไร้เดียงสามาก แต่ฉันไม่เคยศึกษาทฤษฎีข้อมูลและฉันพยายามเข้าใจแนวคิดบางอย่างของเรื่องนั้น


1
ยินดีต้อนรับสู่ CV, luca maggi! เป็นคำถามแรกที่น่ารัก!
Alexis

คำตอบ:


8

การวัดที่คุณอธิบายนั้นเรียกว่าอัตราส่วนคุณภาพสารสนเทศ [IQR] (Wijaya, Sarno และ Zulaika, 2017) IQR คือข้อมูลร่วมกัน หารด้วย "ความไม่แน่นอนทั้งหมด" (เอนโทรปีร่วม) (แหล่งที่มาของภาพ: Wijaya, Sarno และ Zulaika, 2017)ผม(X,Y)H(X,Y)

ป้อนคำอธิบายรูปภาพที่นี่

ตามที่อธิบายโดย Wijaya, Sarno และ Zulaika (2017),

ช่วงของ IQR เป็น[0,1]มูลค่าสูงสุด (IQR = 1) สามารถเข้าถึงได้หาก DWT สามารถสร้างสัญญาณใหม่ได้อย่างสมบูรณ์แบบโดยไม่สูญเสียข้อมูล มิฉะนั้นค่าต่ำสุด (IQR = 0) หมายความว่า MWT เข้ากันไม่ได้กับสัญญาณดั้งเดิม กล่าวอีกนัยหนึ่งสัญญาณที่สร้างขึ้นใหม่ด้วย MWT เฉพาะไม่สามารถเก็บข้อมูลที่จำเป็นและแตกต่างอย่างสิ้นเชิงกับลักษณะสัญญาณดั้งเดิม[0,1]

คุณสามารถตีความว่ามันเป็นความน่าจะเป็นสัญญาณว่าจะได้รับการสร้างขึ้นใหม่ได้อย่างสมบูรณ์แบบโดยไม่สูญเสียข้อมูล ขอให้สังเกตว่าการตีความดังกล่าวใกล้เคียงกับการตีความความน่าจะเป็นของอัตนัยนิยมแล้วเป็นการตีความแบบดั้งเดิมและบ่อยครั้ง

มันเป็นความน่าจะเป็นสำหรับเหตุการณ์ไบนารี (การสร้างข้อมูลใหม่เทียบกับไม่) โดยที่ IQR = 1 หมายความว่าเราเชื่อว่าข้อมูลที่สร้างขึ้นใหม่จะเชื่อถือได้และ IQR = 0 หมายถึงสิ่งที่ตรงกันข้าม มันแบ่งปันคุณสมบัติทั้งหมดสำหรับความน่าจะเป็นของเหตุการณ์ไบนารี ยิ่งไปกว่านั้นเอนโทรปียังมีคุณสมบัติอื่น ๆ อีกมากมายที่มีความน่าจะเป็น (เช่นคำนิยามของเอนโทรปีแบบมีเงื่อนไขความเป็นอิสระและอื่น ๆ ) ดังนั้นดูเหมือนความน่าจะเป็นและการหลอกลวงเหมือนกัน


Wijaya, DR, Sarno, R. , & Zulaika, E. (2017) อัตราส่วนคุณภาพสารสนเทศเป็นตัวชี้วัดที่แปลกใหม่สำหรับการเลือกเวฟเล็ต เคมีและระบบห้องปฏิบัติการอัจฉริยะ, 160, 59-71


1
วิธีการคือฟังก์ชั่น IQR กำหนดไว้สำหรับโอห์มในการสั่งซื้อเพื่อตรวจสอบกับการกำหนดคุณสมบัติของการวัดความน่าจะเป็น? คุณแนะนำฉัน( X , Y )และH ( X , Y )กับX : = X I ( A ) ,AΩI(X,Y)H(X,Y)ที่ฉันเป็นลักษณะการทำงาน? X'=Xผม(A),Y'=Yผม(A)ผม
ฮันส์

คำถามของฉันถูกนำไปเป็นส่วนหนึ่งของคำตอบของคุณไม่ใช่คำถามแบบสแตนด์อะโลน คุณกำลังแนะนำให้ฉันเปิดคำถามใหม่และเชื่อมโยงและตรงไปยังคำตอบของคุณ?
ฮันส์

@ ฮันสิ่งที่ฉันพูดคือมาตรการนี้เหมาะกับคำจำกัดความแก้ไขให้ฉันถ้าฉันผิด สัจพจน์ 1 และ 2 ชัดเจน สำหรับสัจพจน์ 3 คือการทับซ้อน, H ( X , Y )คือพื้นที่ทั้งหมดดังนั้นเศษส่วนสามารถมองเห็นได้ง่ายว่าเป็นความน่าจะเป็น ผม(X,Y)H(X,Y)
ทิม

1
ความน่าจะเป็นที่กำหนดไว้ในพื้นที่ตัวอย่างและเขตซิกมัน ) ฉันสับสนว่าค่าความน่าจะเป็นนี้วัด IQR อย่างไร มีพื้นที่ตัวอย่างและฟิลด์ซิกมาสำหรับการวัดความน่าจะเป็นที่กำหนดไว้สำหรับตัวแปรสุ่มXและYแล้ว พื้นที่ตัวอย่างและเขตข้อมูลของการวัดความน่าจะเป็นใหม่นั้นเหมือนกับการวัดความน่าจะเป็นแบบเก่าที่เชื่อมโยงกับXและYหรือไม่ ถ้าไม่พวกเขาจะกำหนดอย่างไร หรือคุณกำลังบอกว่าสิ่งเหล่านี้ไม่จำเป็นต้องมีการกำหนด? แล้วคุณจะตรวจสอบกับสัจพจน์ได้อย่างไร (Ω,F)XYXY
Hans

@Hans ฉันระบุว่ามันชัดเจนว่านี้สอดคล้องกับสัจพจน์ แต่มันยากที่จะพูดว่าน่าจะเป็นของสิ่งที่จะเป็น การตีความที่ฉันแนะนำอาจเป็นการสร้างสัญญาณใหม่ นี่ไม่ใช่การแจกแจงความน่าจะเป็นของ X หรือ Y ฉันเดาว่าคุณสามารถตีความและทำความเข้าใจได้ลึกซึ้งยิ่งขึ้น คำถามคือถ้าสิ่งนี้สามารถตีความได้ว่าเป็นความน่าจะเป็นและคำตอบคือใช่อย่างเป็นทางการ
ทิม

2

นี่คือนิยามของพื้นที่ความน่าจะเป็น ให้เราใช้สัญลักษณ์ที่นั่น IQR เป็นฟังก์ชั่นของ tuple (Ω,F,P,X,Y) (สามองค์ประกอบแรกในรูปแบบของพื้นที่ความน่าจะเป็นที่ตัวแปรสุ่มสองตัวกำหนดไว้) การวัดความน่าจะเป็นต้องเป็นฟังก์ชั่นชุดที่ตอบสนองทุกเงื่อนไขของคำจำกัดความที่ระบุไว้ในคำตอบของทิม หนึ่งจะต้องระบุΘ=(Ω,F,P,X,Y)เป็นส่วนบางส่วนของชุดΩ~ Ω ยิ่งกว่านั้นชุดของΘต้องสร้างเขตข้อมูลย่อยของΩ~และIQR(Ω,F,P,X,Y)นั้น( Ω , F , P , X , Y )ต้องตอบสนองคุณสมบัติทั้งสามที่ระบุไว้ในคำจำกัดความของความน่าจะเป็นที่ระบุไว้ในคำตอบของ Tim จนกว่าจะมีใครสร้างวัตถุเช่นนี้มันผิดที่จะบอกว่า IQR เป็นการวัดความน่าจะเป็น ฉันคนหนึ่งไม่เห็นประโยชน์ของการวัดความน่าจะเป็นที่ซับซ้อน (ไม่ใช่ฟังก์ชัน IQR แต่เป็นการวัดความน่าจะเป็น) IQR ในบทความที่อ้างถึงในคำตอบของทิมไม่ได้ถูกเรียกหรือใช้เป็นความน่าจะเป็น แต่เป็นตัวชี้วัด (ตัวแรกคือตัวหลังตัวหนึ่ง แต่ตัวหลังนั้นไม่ใช่แบบตัวแรก)

ในทางกลับกันมีการก่อสร้างเล็กน้อยที่อนุญาตให้หมายเลขใด ๆใน[0,1]เป็นความน่าจะเป็น โดยเฉพาะในกรณีของเราพิจารณาใดก็ตามΘΘเลือกชุดที่สององค์ประกอบเป็นพื้นที่ตัวอย่างΩ~={a,}ให้สนามเป็นF~=2Ω~และกำหนดตัวชี้วัดความน่าจะเป็นP~(a)=IQR(Θ) ) เรามีคลาสของความน่าจะเป็นที่ว่างซึ่งจัดทำดัชนีโดยΘΘ


(xผม,Yผม)

Θ:=(Ω,F,P,X,Y)

ถ้าคุณใช้โครงข่ายประสาทที่ซับซ้อนด้วยฟังก์ชั่นการเปิดใช้งาน sigmoid ในตอนท้ายคุณสามารถพิสูจน์ได้ว่าผลลัพธ์เป็นความน่าจะเป็นในแง่ของเมตริก - ทฤษฎี .. ทว่าเรามักเลือกตีความว่าเป็นความน่าจะเป็น
ทิม

[0,1]AP(A)=μ((A))μR

ขออภัยฉันไม่เคยพบการสนทนาแบบนี้ & ทฤษฎีการวัดที่น่าสนใจดังนั้นฉันจะถอนตัวจากการอภิปรายเพิ่มเติม ฉันยังไม่เห็นประเด็นของคุณที่นี่โดยเฉพาะอย่างยิ่งเนื่องจากย่อหน้าสุดท้ายของคุณดูเหมือนจะพูดตรงกับสิ่งที่ฉันพูดจากขอทาน
ทิม
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.