ความหมายของเครื่องหมายความน่าจะเป็น


27

ความแตกต่างในความหมายระหว่างสัญกรณ์และซึ่งใช้กันทั่วไปในหนังสือและเอกสารจำนวนมากคืออะไร?P ( z | d , w )P(z;d,w)P(z|d,w)


13
f (x; θ) เป็นเช่นเดียวกับ f (x | simply) เพียงแค่หมายความว่า fixed เป็นพารามิเตอร์คงที่และฟังก์ชั่น f เป็นฟังก์ชันของ x f (x, Θ), OTOH เป็นองค์ประกอบของตระกูล (ชุด) ของฟังก์ชันที่องค์ประกอบถูกจัดทำดัชนีโดยΘ ความแตกต่างที่ลึกซึ้งบางทีอาจเป็นเรื่องสำคัญ เมื่อถึงเวลาที่ต้องประมาณค่าพารามิเตอร์ที่ไม่รู้จักθบนพื้นฐานของข้อมูลที่รู้จัก x ในเวลานั้นθเปลี่ยนแปลงและ x ได้รับการแก้ไขส่งผลให้ "ฟังก์ชันความน่าจะเป็น" การใช้ "|" พบได้ทั่วไปในหมู่นักสถิติ ";" ในหมู่นักคณิตศาสตร์
jbowman

ใช่ jbowman ถูกต้อง บางครั้งเราเรียกว่าความหนาแน่นของ X ที่ให้มาΘ
Michael R. Chernick

@ jbowman ทำไมไม่โพสต์ว่าเป็นคำตอบ? คำถามเดียวของฉันคือ - ทำไมพวกเขาจะใช้ทั้งสอง แต่ฉันคิดว่ามันมีบางสิ่งที่เกี่ยวข้องกับบริบท ("|" ใช้กับ "P" และ ";" กับ " ") f
Abe

ความคิดที่ดี Abe; นั่นอาจจะเป็น เป็นเรื่องทั่วไปมากกว่าฉันคิดว่า f
jbowman

คำตอบ:


12

ฉันเชื่อว่าต้นกำเนิดของสิ่งนี้คือกระบวนทัศน์ความน่าจะเป็น (แม้ว่าฉันยังไม่ได้ตรวจสอบความถูกต้องทางประวัติศาสตร์ที่แท้จริงของด้านล่างมันเป็นวิธีที่สมเหตุสมผลในการทำความเข้าใจว่าฉันมาเป็นอย่างไร)

สมมติว่าในการตั้งค่าการถดถอยคุณจะมีการแจกแจง: p (Y | x, เบต้า) ซึ่งหมายความว่า: การกระจายของ Y ถ้าคุณรู้ (มีเงื่อนไข) ค่า x และเบต้า

หากคุณต้องการประเมิน betas คุณต้องการเพิ่มโอกาส: L (เบต้า; y, x) = p (Y | x, เบต้า) เป็นหลักตอนนี้คุณกำลังมองหานิพจน์ p (Y | x, beta) เป็น ฟังก์ชั่นของเบต้า แต่นอกเหนือจากนั้นไม่มีความแตกต่าง (สำหรับนิพจน์ที่ถูกต้องทางคณิตศาสตร์ที่คุณสามารถหามาได้อย่างถูกต้องนี่เป็นสิ่งจำเป็น - แม้ว่าในทางปฏิบัติแล้วไม่มีใครรบกวนจิตใจ)

จากนั้นในการตั้งค่าแบบเบย์ความแตกต่างระหว่างพารามิเตอร์และตัวแปรอื่น ๆ จะจางหายไปในไม่ช้าดังนั้นจึงเริ่มมีการใช้เครื่องหมายทั้งสองแบบผสม

ดังนั้นในสาระสำคัญ: ไม่มีความแตกต่างที่เกิดขึ้นจริง: พวกเขาทั้งสองบ่งบอกถึงการแจกแจงแบบมีเงื่อนไขของสิ่งทางด้านซ้ายและเงื่อนไขทางด้านขวา


23

คือความหนาแน่นของตัวแปรสุ่ม Xที่จุด xกับ θเป็นพารามิเตอร์ของการกระจาย f ( x , θ )คือความหนาแน่นรอยต่อของ Xและ Θณ จุด ( x , θ )และมีเหตุผลเพียงถ้า Θเป็นตัวแปรสุ่ม f ( x | θ )คือการแจกแจงแบบมีเงื่อนไขของ X ที่ให้ Θและอีกครั้งเหมาะสมถ้าf(x;θ)Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘเป็นตัวแปรสุ่ม สิ่งนี้จะชัดเจนมากขึ้นเมื่อคุณอ่านเพิ่มเติมและดูการวิเคราะห์แบบเบย์Θ


Uhhhh ... คือการแจกแจงแบบมีเงื่อนไขของx ที่ให้θสมเหตุสมผลอย่างสมบูรณ์แม้ว่าθจะไม่ใช่ตัวแปรสุ่ม มันเป็นสัญกรณ์มาตรฐานที่ค่อนข้างมากในสถิติแบบดั้งเดิมโดยที่θไม่ใช่ตัวแปรสุ่ม f(x|θ)xθθθ
jbowman

Uhhhh .... ถ้าคุณตีความนั่นหมายความว่า P [Θ = θ] = 1 (ซ้ายΘคือตัวแปรสุ่มขวาθเป็นค่าคงที่) จากนั้นฉันก็เห็นด้วย ไม่เช่นนั้นฉันจะไม่ทำ ... แล้ว P [Θ = θ] จะหมายถึงอะไรในตัวหารของคำจำกัดความของการแจกแจงแบบมีเงื่อนไข?
PeterR

หาร? ฉันสามารถเขียนโดยที่fคือการแจกแจงแบบปกติโดยไม่มีการอ้างอิงถึงกฎของเบย์ μและσได้รับการแก้ไข คนอื่นทำเกินไปเช่นll.mit.edu/mission/communications/ist/publications/... xf(x|μ,σ)fμσ
jbowman

jbowman ดังนั้นคำจำกัดความของ f (x | μ, σ) ของคุณคือความหนาแน่นแบบมีเงื่อนไขคืออะไรเมื่อμและσเป็นจำนวนคงที่
PeterR

1
คำว่า "เงื่อนไข" ซึ่งเกี่ยวข้องกับสัญกรณ์ f (X | Y) ถูกกำหนดให้เป็น "เงื่อนไขตามเหตุการณ์สุ่มบางอย่างที่เกิดขึ้น" หากคุณใช้มันเพื่อหมายถึงอย่างอื่นเช่นเพียงแค่ "ได้รับ" เช่นเดียวกับใน "f (x) ที่ได้รับ (ค่าเฉพาะของ) μและσ" นั่นก็คือสัญกรณ์ f (x; μ, σ) สำหรับ. เนื่องจาก OP ได้ถามเกี่ยวกับสัญกรณ์หมายถึงเราควรแม่นยำเกี่ยวกับสัญกรณ์ในคำตอบ
PeterR

18

f(x;θ)เป็นเช่นเดียวกับf(x|θ)เพียงหมายความว่าθเป็นพารามิเตอร์ที่คงที่และฟังก์ชั่นfเป็นหน้าที่ของxxf(x,Θ) , OTOH เป็นองค์ประกอบของครอบครัว (หรือชุด) ฟังก์ชั่นที่องค์ประกอบที่มีการจัดทำดัชนีโดยΘΘความแตกต่างที่ลึกซึ้งบางทีอาจเป็นเรื่องสำคัญ เมื่อมันถึงเวลาที่จะประเมินพารามิเตอร์ที่ไม่รู้จักθบนพื้นฐานของข้อมูลที่รู้จักกันx ; ในเวลานั้นθแตกต่างกันและxได้รับการแก้ไขส่งผลให้ "ฟังก์ชั่นโอกาส" การใช้เป็นเรื่องธรรมดามากขึ้นในหมู่นักสถิติในขณะที่;ในหมู่นักคณิตศาสตร์


1
วิธีการคือพูดวาจา? คุณพูดว่า "f of x ให้θ" หรือไม่? f(x;θ)
stackoverflowuser2010

@ stackoverflowuser2010 - ใช่แน่นอน
jbowman

2
ฉันพบในวิดีโอ Coursera บางเรื่องที่ศาสตราจารย์แอนดรูว์อึ้งทำการพูดอัฒภาคด้วยวาจาว่า "กำหนดค่าโดย" ดู: class.coursera.org/ml-005/lecture/34 ดังนั้นตัวอย่างจะถูกพูดเป็น "f of x แปรสภาพโดย theta"
stackoverflowuser2010

5
การพูดว่า "ได้รับ" หรือ "เงื่อนไข" นั้นแตกต่างกันมาก (โดยทั่วไป) จาก "พารามิเตอร์" ฉันเกลียดถ้ามีคนเห็นสิ่งนี้และคิดว่าทั้งสองนั้นเทียบเท่ากัน การพูดว่า "แปรสภาพ" จะเหมาะสมก็ต่อเมื่อปริมาณที่กำหนดไว้นั้นเป็นพารามิเตอร์ที่ทำดัชนี pdf ของตัวแปรในเทอมแรก สำหรับตัวแปรสองตัว (เช่น f (x; y)) การใช้คำนั้นจะผิด
ATJ

2
@ MikeWilliamson - แน่นอนเลือกสัญกรณ์ที่คุณรู้ว่าทุกอย่างหมายถึงอะไรและติดอยู่กับมัน! ด้วยวิธีนี้เมื่อคุณกลับไปที่สิ่งที่คุณทำไปก่อนหน้านี้เช่นเดียวกับประสบการณ์ของฉันในช่วง 4 ชั่วโมงก่อนหน้านี้คุณไม่จำเป็นต้องรู้ว่าคุณหมายถึงอะไรเมื่อใช้ "|" ฉันเห็นด้วยมันเป็นเรื่องที่น่ารำคาญ แต่หลังจากนั้นไม่นานคุณก็สังเกตเห็นการใช้สัญกรณ์ครั้งแรกและจดจำมันสำหรับกระดาษ / หนังสือที่เหลือ ความแตกต่างไม่ใช่สิ่งที่สำคัญ
jbowman

9

แม้ว่ามันจะไม่ได้เป็นอย่างนี้เสมอไปวันนี้มักใช้เมื่อd , wไม่ใช่ตัวแปรสุ่ม P ( Z | d , W )บ่งชี้ว่าเครื่องกับค่าของd , W การปรับเงื่อนไขเป็นการดำเนินการกับตัวแปรสุ่มและเป็นเช่นนั้นโดยใช้สัญกรณ์นี้เมื่อd , wไม่ใช่ตัวแปรสุ่มที่ทำให้เกิดความสับสนP(z;d,w)d,wP(z|d,w)d,wd,w

เป็นจุด @ Nick Sabbe ออกเป็นสัญกรณ์ที่พบบ่อยสำหรับการกระจายการสุ่มตัวอย่างของข้อมูลที่สังเกตY ผู้ใช้บางคนจะใช้สัญกรณ์นี้ แต่ยืนยันว่าΘไม่ใช่ตัวแปรสุ่มซึ่งเป็นการละเมิด IMO แต่พวกเขาไม่มีการผูกขาดที่นั่น ฉันเคยเห็น Bayesians ทำเช่นนั้นด้วยการตรึงไฮเปอร์พารามิเตอร์ไว้ที่ท้ายเงื่อนไขp(y|X,Θ)yΘ


2
X
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.