วิธีการกำหนดโอกาสอย่างจริงจัง?


30

โอกาสที่สามารถกำหนดได้หลายวิธีตัวอย่างเช่น:

  • ฟังก์ชั่นจากซึ่งแผนที่เพื่อเช่น{R}LΘ×X(θ,x)L(θx)L:Θ×XR

  • ฟังก์ชั่นแบบสุ่มL(X)

  • เราอาจพิจารณาได้ว่าความน่าจะเป็นเป็นเพียงโอกาส "สังเกต"L(xobs)

  • ในทางปฏิบัติความน่าจะเป็นที่นำข้อมูลไปสู่ขึ้นอยู่กับค่าคงที่แบบ multiplicative เท่านั้นดังนั้นเราจึงสามารถพิจารณาความเป็นไปได้ว่าเป็นคลาสเทียบเท่าของฟังก์ชันแทนที่จะเป็นฟังก์ชันθ

อีกคำถามที่เกิดขึ้นเมื่อพิจารณาการเปลี่ยนแปลงของ parametrization: ถ้าเป็น parameterization ใหม่ที่เรามักจะแสดงโดยโอกาสในและนี่ไม่ใช่การประเมินฟังก์ชั่นก่อนหน้าที่แต่ในพี} นี่คือเครื่องหมายที่ไม่เหมาะสม แต่มีประโยชน์ซึ่งอาจทำให้เกิดความยุ่งยากสำหรับผู้เริ่มต้นหากไม่ได้เน้นϕ=θ2L(ϕx)ϕL(x)θ2ϕ

คำจำกัดความที่คุณชื่นชอบอย่างเข้มงวดของความน่าจะเป็นคืออะไร?

นอกจากนี้คุณจะเรียกอย่างไร ฉันมักจะพูดว่า "ความน่าจะเป็นในเมื่อสังเกต "L(θx)θx

แก้ไข: ในมุมมองของความคิดเห็นด้านล่างฉันรู้ว่าฉันควรจะมีบริบท ฉันพิจารณาแบบจำลองทางสถิติที่กำหนดโดยตระกูลพารามิเตอร์ของความหนาแน่นที่เกี่ยวกับการวัดที่มีอิทธิพลเหนือแต่ละอันที่มีกำหนดไว้ในพื้นที่สังเกตX} ดังนั้นเราจึงกำหนดและคำถามคือ "คืออะไร?" (คำถามไม่ได้เกี่ยวกับความหมายทั่วไปของความน่าจะเป็น)( | θ ) X L ( θ | x ) = F ( x | θ ) L{f(θ),θΘ}f(θ)XL(θx)=f(xθ)L


2
(1) เนื่องจากสำหรับทั้งหมดฉันเชื่อว่าแม้ค่าคงที่ในจะถูกกำหนด (2) หากคุณคิดว่าพารามิเตอร์เช่นและเป็นเพียงการประสานงานเพื่อการกระจายการเปลี่ยนแปลงแล้วการเปลี่ยนแปลงของการแปรสภาพพารามิเตอร์ไม่มีความหมายทางคณิตศาสตร์ที่แท้จริง มันเป็นเพียงการเปลี่ยนคำอธิบาย (3) เจ้าของภาษาพูดภาษาอังกฤษโดยธรรมชาติจะพูดว่า "โอกาสของ " มากกว่า "เปิด" (4) ข้อ "เมื่อเป็นที่สังเกต" มีความยากลำบากปรัชญาเพราะส่วนใหญ่จะไม่ถูกตั้งข้อสังเกต ทำไมไม่เพียงแค่พูดว่า "โอกาสที่จะได้รับθ L ไวθ θ xL(θ|x)dx=1θLϕθ θxθ xxθx "?
whuber

1
@whuber: สำหรับ (1) ฉันไม่คิดว่าค่าคงที่จะถูกกำหนดไว้อย่างดี ดูหนังสือของ ET Jaynes ที่เขาเขียนว่า: "ความน่าจะเป็นไม่ใช่ความน่าจะเป็นเพราะการทำให้เป็นมาตรฐานนั้นเป็นกฎเกณฑ์"
Neil G

3
ดูเหมือนว่าคุณจะสับสนสองชนิดของการฟื้นฟูนีล: เจย์นส์หมายถึงการฟื้นฟูโดยบูรณาการมากกว่าไม่xxθx
whuber

1
@ โฮเบอร์: ฉันไม่คิดว่าปัจจัยการปรับจะสำคัญสำหรับ Cramer-Rao ที่ถูกผูกไว้เนื่องจากการเปลี่ยนเพิ่มจำนวนคงที่ให้กับบันทึกความน่าจะเป็นซึ่งจะหายไปเมื่อนำอนุพันธ์บางส่วนมาใช้ k
Neil G

1
ฉันเห็นด้วยกับ Neil ฉันไม่เห็นแอปพลิเคชันใดที่ค่าคงที่มีบทบาท
Stéphane Laurent

คำตอบ:


13

รายการที่สามของคุณคือสิ่งที่ฉันได้เห็นบ่อยที่สุดที่ใช้เป็นคำจำกัดความที่เข้มงวด

คนอื่นก็น่าสนใจเช่นกัน (+1) โดยเฉพาะอย่างยิ่งสิ่งแรกที่น่าสนใจด้วยความยากลำบากที่ขนาดตัวอย่างที่ยังไม่ได้กำหนด (ยัง) มันยากที่จะกำหนดชุด "จาก"

สำหรับฉันแล้วสัญชาตญาณพื้นฐานของความน่าจะเป็นคือมันเป็นฟังก์ชั่นของโมเดล + พารามิเตอร์ไม่ใช่ฟังก์ชั่นของตัวแปรสุ่ม (เช่นเป็นจุดสำคัญสำหรับวัตถุประสงค์ในการสอน) ดังนั้นฉันจะยึดตามคำจำกัดความที่สาม

แหล่งที่มาของความไม่เหมาะสมของสัญกรณ์คือชุด "จาก" โอกาสที่จะเกิดขึ้นโดยปริยายซึ่งมักจะไม่ใช่กรณีสำหรับฟังก์ชั่นที่กำหนดไว้อย่างดี ที่นี่วิธีการที่เข้มงวดที่สุดคือการตระหนักว่าหลังจากการเปลี่ยนแปลงความน่าจะเป็นที่เกี่ยวข้องกับรูปแบบอื่น มันเทียบเท่ากับรุ่นแรก แต่ยังคงเป็นรุ่นอื่น ดังนั้นสัญลักษณ์ความน่าจะเป็นที่ควรแสดงรูปแบบที่อ้างถึง (ตามตัวห้อยหรืออื่น ๆ ) ฉันไม่เคยทำแน่นอน แต่สำหรับการสอนฉันอาจ

ในที่สุดเพื่อให้สอดคล้องกับคำตอบก่อนหน้าของฉันฉันพูดว่า "ความน่าจะเป็นของ " ในสูตรสุดท้ายของคุณθ


ขอบคุณ และคุณมีคำแนะนำอย่างไรเกี่ยวกับความเสมอภาคจนถึงค่าคูณแบบคูณ?
Stéphane Laurent

ส่วนตัวผมชอบเรียกมันเมื่อจำเป็นมากกว่ารหัสยากในคำจำกัดความ และคิดว่าสำหรับการเลือกแบบจำลอง / การเปรียบเทียบความเท่าเทียมแบบ 'up-to-a-multiplicative-constant' นี้ไม่ได้มีไว้
gui11aume

ตกลง. คุณอาจจินตนาการได้ว่าคุณได้พูดคุยเกี่ยวกับความน่าจะเป็นและสำหรับการสังเกตสองครั้ง ในกรณีเช่นนี้คุณจะพูดว่า "ความน่าจะเป็นของเมื่อสังเกตเห็น" หรือ "ความน่าจะเป็นของสำหรับการสังเกต " หรืออย่างอื่นหรือไม่? L ( θ x 2 ) θ x 1 θ x 1L(θx1)L(θx2)θx1θx1
Stéphane Laurent

1
หากคุณอีกครั้ง parametrize รูปแบบของคุณกับคุณจริงคำนวณความน่าจะเป็นองค์ประกอบของฟังก์ชั่นที่ 2 ในกรณีนี้ไปจากถึงดังนั้นชุดคำจำกัดความ (กล่าวถึงเป็น "จาก" ชุด) ของความน่าจะไม่เหมือนเดิมอีกต่อไป คุณสามารถเรียกใช้ฟังก์ชันแรกและที่สองเนื่องจากฟังก์ชั่นเหล่านี้ไม่ใช่ฟังก์ชันเดียวกัน L ( . | x ) g ( . ) g ( y ) = y 2 g R R + L 1 ( . | ) L 2 ( . | )ϕ=θ2L(.|x)g(.)g(y)=y2gRR+L1(.|)L2(.|)
gui11aume

1
คำจำกัดความที่สามเป็นอย่างไรอย่างเข้มงวด? และปัญหาของขนาดตัวอย่างที่ไม่ได้ถูกกำหนดไว้คืออะไร? เนื่องจากเราบอกว่าซึ่งโดยธรรมชาติแล้วการมีพีชคณิตซิกม่าที่สอดคล้องกันสำหรับพื้นที่ตัวอย่างทำไมเราจึงไม่มีคำจำกัดความคู่ขนานสำหรับความเป็นไปได้? Ω nP(x1,x2,,xnθ)Ωn
Neil G

8

ฉันคิดว่าฉันจะเรียกมันว่าสิ่งที่แตกต่าง ความน่าจะเป็นความหนาแน่นของความน่าจะเป็นสำหรับ x สังเกตให้ค่าของพารามิเตอร์แสดงเป็นฟังก์ชั่นของสำหรับกำหนดxฉันไม่แชร์มุมมองเกี่ยวกับค่าคงที่สัดส่วน ผมคิดว่ามีเพียงมาลงเล่นเพราะการเพิ่มฟังก์ชั่นต่อเนื่องใด ๆ ของความน่าจะช่วยให้การแก้ปัญหาเหมือนกันสำหรับθดังนั้นคุณสามารถเพิ่มสำหรับหรือฟังก์ชัน monotonic อื่น ๆ เช่นซึ่งเป็นเรื่องปกติθθxθcL(θx)c>0log(L(θx))


4
ไม่เพียง แต่การขยายให้ใหญ่สุด: ความเป็นสัดส่วนที่มากขึ้นยังมาพร้อมกับแนวคิดอัตราส่วนความน่าจะเป็นและในสูตร Bayes สำหรับสถิติ Bayesian
Stéphane Laurent

ฉันคิดว่าบางคนอาจลงคะแนนคำตอบของฉัน แต่ฉันคิดว่ามันค่อนข้างสมเหตุสมผลที่จะกำหนดความน่าจะเป็นแบบนี้ว่าเป็นความน่าจะเป็นที่แน่นอนโดยไม่เรียกสิ่งที่น่าจะเป็นไปได้ @ StéphaneLaurentถึงความคิดเห็นของคุณเกี่ยวกับ Priors หากฟังก์ชั่นสามารถบูรณาการมันสามารถทำให้เป็นมาตรฐานความหนาแน่น หลังเป็นสัดส่วนกับโอกาสที่ครั้งก่อน เนื่องจากหลังต้องถูกทำให้เป็นมาตรฐานโดยการหารด้วยอินทิกรัลเราก็อาจระบุก่อนการกระจาย มันเป็นเพียงในแง่ที่ว่าสิ่งนี้ได้ถูกนำไปใช้กับนักบวชที่ไม่เหมาะสม
Michael R. Chernick

1
ฉันไม่แน่ใจว่าทำไมคนจะdownvoteคำตอบนี้ ดูเหมือนว่าคุณกำลังพยายามตอบคำถามที่สองและคำถามของ OP มากกว่าคำถามแรก บางทีนั่นอาจไม่ชัดเจนสำหรับผู้อ่านคนอื่น ๆ ไชโย :)
พระคาร์ดินัล

@Michael ฉันไม่เห็นด้วยที่จะต้องลงคะแนนคำตอบนี้ด้วย เกี่ยวกับนักบวชที่ไม่ใช่คนใหม่ (นี่คือการสนทนาอื่นและ) ฉันตั้งใจจะเปิดการอภิปรายใหม่เกี่ยวกับเรื่องนี้ ฉันจะไม่ทำเร็ว ๆ นี้เพราะฉันไม่ได้ใช้ภาษาอังกฤษง่ายและนี่เป็นเรื่องยากสำหรับฉันที่จะเขียน "ปรัชญา" มากกว่าคณิตศาสตร์
Stéphane Laurent

1
@Stephane: หากคุณต้องการโปรดพิจารณาการโพสต์คำถามอื่นของคุณโดยตรงในภาษาฝรั่งเศส เรามีเจ้าของภาษาชาวฝรั่งเศสหลายคนในเว็บไซต์นี้ที่น่าจะช่วยแปลข้อความใด ๆ ที่คุณไม่แน่ใจ ซึ่งรวมถึงผู้ดำเนินรายการและเป็นบรรณาธิการของวารสารสถิติภาษาอังกฤษที่เป็นที่นิยมอันดับต้น ๆ ฉันหวังว่าจะได้คำถาม
พระคาร์ดินัล

6

นี่คือความพยายามในการกำหนดทางคณิตศาสตร์ที่เข้มงวด:

ปล่อยเป็นเวกเตอร์สุ่มที่ยอมรับความหนาแน่นด้วยความเคารพต่อการวัดบนสำหรับ ,เป็นครอบครัวที่มีความหนาแน่นในด้วยความเคารพ\จากนั้นสำหรับเราจะกำหนดฟังก์ชันความน่าจะเป็นให้เป็น ; เพื่อความชัดเจนสำหรับแต่ละเรามีR ใคร ๆ ก็คิดว่าเป็นศักยภาพที่เฉพาะเจาะจงX:ΩRnf(x|θ0)νRnθΘ{f(x|θ):θΘ}RnνxRnL(θ|x)f(x|θ)xLx:ΘRxxobsและเป็นมูลค่า "จริง" ของ\θ0θ

ข้อสังเกตสองประการเกี่ยวกับคำนิยามนี้:

  1. ความหมายก็เพียงพอที่แข็งแกร่งที่จะไม่ต่อเนื่องจับอย่างต่อเนื่องและทุกประเภทอื่น ๆ ของครอบครัวของการกระจายสำหรับXX
  2. เรากำลังกำหนดโอกาสที่ระดับความหนาแน่นของฟังก์ชั่นแทนที่จะเป็นที่ระดับความน่าจะเป็น / การแจกแจงความน่าจะเป็น เหตุผลของเรื่องนี้ก็คือความหนาแน่นไม่ซ้ำกันและปรากฎว่านี่ไม่ใช่สถานการณ์ที่เราสามารถส่งผ่านความหนาแน่นของความหนาแน่นเท่ากันและยังปลอดภัย: ตัวเลือกความหนาแน่นที่แตกต่างกันนำไปสู่ความหนาแน่นของ MLE ที่แตกต่างกัน อย่างไรก็ตามในกรณีส่วนใหญ่มีทางเลือกตามธรรมชาติของครอบครัวของความหนาแน่นที่เป็นที่ต้องการในทางทฤษฎี
  3. ฉันชอบคำจำกัดความนี้เพราะมันรวมเอาตัวแปรสุ่มที่เราทำงานด้วยลงไปและด้วยการออกแบบเนื่องจากเราต้องกำหนดการกระจายพวกเขาเรายังได้สร้างอย่างจริงจังในแนวคิดของค่า "จริง แต่ไม่ทราบ" ของที่นี่ แสดง\สำหรับฉันในฐานะนักเรียนความท้าทายของการเข้มงวดเกี่ยวกับความน่าจะเป็นคือวิธีการกระทบยอดแนวคิดโลกแห่งความจริงของ "จริง"และ "สังเกต"กับคณิตศาสตร์เสมอ สิ่งนี้มักจะไม่ได้รับความช่วยเหลือจากผู้สอนที่อ้างว่าแนวคิดเหล่านี้ไม่เป็นทางการ แต่จากนั้นจึงหันมาใช้อย่างเป็นทางการเมื่อพิสูจน์สิ่งต่าง ๆ ! ดังนั้นเราจัดการกับพวกเขาอย่างเป็นทางการในคำจำกัดความนี้θθ0θxobs
  4. แก้ไข:แน่นอนเรามีอิสระที่จะพิจารณาองค์ประกอบสุ่มตามปกติ ,และและภายใต้คำจำกัดความนี้โดยไม่มีปัญหาจริงกับความเข้มงวดในฐานะ ตราบใดที่คุณระมัดระวัง (หรือแม้ว่าคุณจะไม่ได้หากระดับความรุนแรงนั้นไม่สำคัญสำหรับคุณ)L(θ|X)S(θ|X)I(θ|X)

4
@ ซีอาน Letจะเหมือนกันในtheta) พิจารณาสองหนาแน่นเมื่อเทียบกับtheta] ทั้งและเป็นความหนาแน่นที่ถูกต้องสำหรับแต่ภายใต้ MLE มีอยู่และเท่ากับขณะที่ต่ำกว่าขณะที่เรามีดังนั้น ถ้าคุณตั้งค่าคุณจะมีโอกาสเป็นและที่จริงแล้ว MLE นั้นไม่มีอยู่จริงเพราะX1,...,Xn(0,θ)f1(x)=θ1I[0<x<θ]f2(x)=θ1I[0xθ]f1f2U(0,θ)f2maxXif1jf1(xj|maxxi)=0θ^=maxXi0supθjf1(x|θ)ไม่ได้บรรลุสำหรับการใด ๆ\θ
ผู้ชาย

1
@guy: ขอบคุณฉันไม่รู้เกี่ยวกับตัวอย่างเคาน์เตอร์ที่น่าสนใจนี้
ซีอาน

1
@guy คุณพูดว่าไม่ได้รับการตอบสนองใด ๆอย่างไรก็ตาม supremum นี้บรรลุบางจุดตามที่ฉันแสดงด้านล่าง: ที่\} ฉันกำลังสมมติว่าสำหรับทุก n มันง่ายที่จะเห็นว่า 1ถ้า ; 2.ถ้า<\ ต่อเนื่อง ...supθjf1(xj|θ)θ
L1(θ;x)=j=1nf1(xj|θ)=θnj=1nI(0<xj<θ)=θnI(0<M<θ),
M=max{x1,,xn}xj>0j=1,,nL1(θ;x)=00<θML1(θ;x)=θnM<θ<
Alexandre Patriota

1
@guy: อย่างต่อเนื่อง ... นั่นคือสำหรับทุกinfty) เราไม่มีค่าสูงสุด แต่มี supremum อยู่และให้โดยและอาร์กิวเมนต์คือ บางทีอาจไม่ได้ใช้ asymptotics ปกติที่นี่และควรมีการจ้างโทลเวย์อื่น ๆ แต่จำนวนสูงสุดของมีอยู่หรือฉันพลาดแนวคิดพื้นฐานบางอย่าง
L1(θ;x)[0,Mn),
θ(0,)
supθ(0,)L1(θ,x)=Mn
M=argsupθ(0,)L1(θ;x).
L1(θ;x)
Alexandre Patriota

1
@AlexandrePatriota supremum มีอยู่อย่างชัดเจน แต่ไม่สามารถบรรลุได้โดยฟังก์ชั่น ผมไม่แน่ใจว่าสิ่งที่สัญกรณ์ควรจะหมายถึง - มีข้อโต้แย้งของไม่มีซึ่งผลตอบแทนถัวเฉลี่ยเพราะ0 MLE ถูกกำหนดให้เป็นซึ่งได้รับ (โดยทั่วไป) และไม่มีบรรลุถึงที่นี่ เห็นได้ชัดว่ามีวิธีรอบมัน - asymptotics ที่เราอุทธรณ์ไปยังต้องการให้มีอยู่โอกาสที่มีคุณสมบัติดังกล่าวและและมีไม่ มันเป็นเพียงมากกว่าL_1argsupL1(θ;x)supL1(θ;M)=0θ^supθ^supL2L1
ผู้ชาย
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.