เหตุใดผู้คนจึงใช้ค่า p แทนการคำนวณความน่าจะเป็นของแบบจำลองที่ให้ข้อมูล


43

การพูดค่า p-value โดยประมาณให้ความน่าจะเป็นของผลลัพธ์ที่สังเกตได้ของการทดลองที่กำหนดสมมติฐาน (model) การมีความน่าจะเป็นนี้ (p-value) เราต้องการตัดสินสมมติฐานของเรา แต่มันจะไม่เป็นธรรมชาติหรือที่จะคำนวณความน่าจะเป็นของสมมติฐานที่ได้จากผลลัพธ์ที่สังเกตได้หรือไม่

ในรายละเอียดเพิ่มเติม เรามีเหรียญ เราพลิกมัน 20 ครั้งและเราได้ 14 หัว (14 จาก 20 คือสิ่งที่ฉันเรียกว่า "ผลลัพธ์ของการทดสอบ") ทีนี้สมมุติฐานของเราคือว่าเหรียญมีความยุติธรรม (ความน่าจะเป็นของหัวและหางมีค่าเท่ากัน) ตอนนี้เราคำนวณค่า p ซึ่งเท่ากับความน่าจะเป็นที่จะได้ 14 หรือมากกว่าใน 20 เหรียญ ตกลงตอนนี้เรามีความน่าจะเป็นนี้ (0.058) และเราต้องการใช้ความน่าจะเป็นนี้ในการตัดสินแบบจำลองของเรา (เป็นไปได้อย่างไรที่เรามีเหรียญที่ยุติธรรม)

แต่ถ้าเราต้องการประเมินความน่าจะเป็นของโมเดลทำไมเราไม่คำนวณความน่าจะเป็นของโมเดลที่ได้รับจากการทดสอบ ทำไมเราจึงคำนวณความน่าจะเป็นของการทดสอบที่ได้รับจากแบบจำลอง (p-value)


คุณยังคงต้องสร้างแบบจำลองการทดสอบของคุณเพื่อให้สามารถคำนวณความน่าจะเป็นของฟังก์ชันได้
Raskolnikov

11
Pete Dixon เขียนบทความย้อนกลับไปในปี 1998 เรียกว่า "ทำไมนักวิทยาศาสตร์ให้ความสำคัญกับ p-values" ( psychonomic.org/backissues/1631/R382.pdf ) ที่อาจเป็นการอ่านที่ให้ข้อมูล การติดตามผลที่ดีจะเป็นรายงานประจำปี 2547 ของ Glover & Dixon ในอัตราส่วนความน่าจะเป็นในการวัดผลทดแทน ( pbr.psychonomic-journals.org/content/11/5/791.full.pdf )
Mike Lawrence

2
ไมค์มันดูน่าสงสัยเหมือนเป็นคำตอบที่ดีสำหรับฉัน มันทำอะไรในความคิดเห็น?
Matt Parker

John D Cook โพสต์คำตอบที่ยอดเยี่ยมสำหรับคำถามของฉันซึ่งฉันคิดว่าคุณน่าสนใจ: stats.stackexchange.com/questions/1164/…
doug

ผู้คนไม่ใช้ค่า p, นักสถิติทำ (ไม่สามารถต้านทาน pithy ที่บอกว่าเป็นจริงได้เช่นกันแน่นอนเมื่อคุณเริ่มมีคุณสมบัติที่เหมาะสมในนามแต่ละคำมันจะสูญเสียความแหลมคมของมันไป)
Wayne

คำตอบ:


31

การคำนวณความน่าจะเป็นที่สมมติฐานถูกต้องนั้นไม่เหมาะสมในคำจำกัดความของความน่าจะเป็นแบบบ่อย (ความถี่ในระยะยาว) ซึ่งถูกนำมาใช้เพื่อหลีกเลี่ยงความเป็นส่วนตัวของนิยามความน่าจะเป็นแบบเบส์ ความจริงของสมมติฐานเฉพาะไม่ใช่ตัวแปรสุ่มมันเป็นจริงหรือไม่และไม่มีความถี่ในการทำงานนาน มันเป็นธรรมชาติมากกว่าที่จะให้ความสนใจในความน่าจะเป็นของความจริงของสมมติฐานซึ่งเป็น IMHO ว่าทำไมค่า p จึงถูกตีความผิดเนื่องจากความน่าจะเป็นที่สมมติฐานสมมุติฐานเป็นจริง ส่วนหนึ่งของความยากลำบากคือจากกฎเบย์เรารู้ว่าการคำนวณความน่าจะเป็นด้านหลังที่สมมติฐานเป็นจริงคุณต้องเริ่มต้นด้วยความน่าจะเป็นก่อนหน้านี้ที่สมมติฐานนั้นเป็นจริง

ชาวเบย์จะคำนวณความน่าจะเป็นที่สมมติฐานนั้นเป็นจริงให้ข้อมูล (และความเชื่อเดิมของเขา / เธอ)

โดยพื้นฐานแล้วในการตัดสินใจระหว่างวิธีการแบบประจำและแบบเบย์คือทางเลือกว่าแนวคิดแบบเบส์แบบใดที่น่ารังเกียจมากกว่าความจริงที่ว่าวิธีการแบบเป็นประจำโดยทั่วไปไม่ได้ให้คำตอบโดยตรงกับคำถามที่คุณต้องการถาม - แต่มีห้องสำหรับ ทั้งสอง

ในกรณีที่ถามว่าเหรียญมีความยุติธรรมหรือไม่เช่นความน่าจะเป็นของหัวเท่ากับความน่าจะเป็นของหางเรายังมีตัวอย่างของสมมติฐานที่เรารู้ว่าในโลกแห่งความเป็นจริงนั้นเกือบจะเป็นเท็จตั้งแต่เริ่มแรก ทั้งสองด้านของเหรียญไม่มีความสมมาตรดังนั้นเราควรคาดหวังความไม่สมดุลเล็กน้อยในความน่าจะเป็นของหัวและก้อยดังนั้นถ้าเหรียญ "ผ่าน" การทดสอบก็หมายความว่าเราไม่มีข้อสังเกตเพียงพอที่จะสามารถ สรุปสิ่งที่เรารู้แล้วว่าเป็นจริง - เหรียญนั้นมีอคติน้อยมาก!


4
ที่จริงแล้วเหรียญส่วนใหญ่อยู่ใกล้กับงานจริงมากและมันก็ยากที่จะหาวิธีที่เป็นไปได้ทางร่างกายที่จะทำให้พวกเขามีอคติได้มาก - ดูตัวอย่างเช่นstat.columbia.edu/~gelman/research/published/diceRev2.pdf
Ben Bolker

8
การเข้าใกล้ความยุติธรรมไม่ได้เป็นสิ่งเดียวกับความยุติธรรมซึ่งเป็นสมมติฐานว่าง ฉันกำลังชี้ให้เห็นหนึ่งในนิสัยของการทดสอบสมมติฐานนั่นคือเรามักจะรู้ว่าสมมติฐานว่างเป็นเท็จ แต่ใช้มันต่อไป การทดสอบภาคปฏิบัติเพิ่มเติมจะมุ่งมั่นที่จะตรวจสอบว่ามีหลักฐานว่าเหรียญมีอคติอย่างมีนัยสำคัญมากกว่าหลักฐานที่สำคัญว่าเหรียญจะลำเอียง
Dikran Marsupial

1
สวัสดีบางทีฉันเข้าใจผิด แต่ฉันคิดในด้านวิทยาศาสตร์คุณไม่สามารถพูดได้ว่าสมมติฐานทางเลือกเป็นจริงคุณสามารถพูดได้ว่าสมมติฐานว่างถูกปฏิเสธและคุณยอมรับสมมติฐานทางเลือก สำหรับฉันค่า p สะท้อนถึงโอกาสที่คุณจะทำผิดพลาดประเภท 1 นั่นคือคุณจะปฏิเสธสมมติฐานทางเลือกและยอมรับสมมติฐานว่าง (พูด p = .05 หรือ 5% ของเวลาเป็นสิ่งสำคัญที่จะต้องแยกแยะระหว่างประเภท 1 ข้อผิดพลาดและข้อผิดพลาดประเภท 2 และบทบาทที่มีบทบาทในการสร้างแบบจำลองของเหตุการณ์
user2238

3
สำหรับการทดสอบบ่อยครั้งฉันจะใช้คำสั่งที่อ่อนกว่าซึ่งก็คือคุณ "ปฏิเสธสมมติฐานว่าง" หรือคุณ "ล้มเหลวในการปฏิเสธสมมติฐานว่าง" และไม่ยอมรับอะไรเลย ประเด็นสำคัญคือ (ในกรณีของเหรียญที่มีอคติ) บางครั้งคุณรู้ว่าข้อสันนิษฐานว่าสมมติฐานว่างเปล่านั้นไม่เป็นความจริงคุณแค่มีข้อมูลไม่เพียงพอที่จะแสดงให้เห็นว่ามันไม่เป็นความจริง ในกรณีนี้มันจะแปลกที่จะ "ยอมรับ" มัน การทดสอบบ่อยครั้งมีอัตราความผิดพลาดแบบ Type-I และ Type-II แต่นั่นไม่ได้หมายความว่าพวกเขาสามารถพูดถึงความน่าจะเป็นของสมมติฐานเฉพาะที่เป็นจริงเช่นเดียวกับใน OP
Dikran Marsupial

2
@ user2238 p-value เป็นโอกาสของข้อผิดพลาดประเภทที่ 1 เฉพาะเมื่อสมมติฐานว่างเป็น "ง่าย" (ไม่ประกอบ) และมันจะเป็นจริง ตัวอย่างเช่นในการทดสอบด้านเดียวว่าเหรียญจะเอนเอียงไปทางก้อยหรือไม่ ( ) การใช้เหรียญสองหัวรับประกันว่าโอกาสของข้อผิดพลาดประเภทที่ 1 จะเป็นศูนย์แม้ว่าค่า p จาก ตัวอย่าง จำกัด ใด ๆ จะไม่ใช่ศูนย์ H0:p<0.5
whuber

18

ไม่มีอะไรที่เหมือนกับการตอบคำถามที่เก่ามาก แต่นี่จะไป ....

p-values ​​เกือบทดสอบสมมติฐานที่ถูกต้อง นี่เป็นตัวอย่างที่ดัดแปลงมาเล็กน้อยจากหนังสือทฤษฎีความน่าจะเป็นของเจย์นส์ปี 2003 (การทดลองซ้ำ: ความน่าจะเป็นและความถี่) สมมติว่าเรามีสมมติฐานว่างเปล่าที่เราต้องการทดสอบ เรามีข้อมูลที่ดีและข้อมูลก่อนที่ฉัน สมมติว่ามีบางสมมติฐานที่ไม่ระบุHว่าเราจะทดสอบH 0กับ อัตราส่วนอัตราต่อรองหลังสำหรับH AเทียบกับH 0จะถูกกำหนดโดย:H0DIHAH0HAH0

P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)

ตอนนี้คำแรกบนด้านขวามือเป็นอิสระจากข้อมูลดังนั้นข้อมูลสามารถมีอิทธิพลต่อผลลัพธ์ผ่านเทอมที่สองเท่านั้น ทีนี้เราสามารถประดิษฐ์สมมติฐานทางเลือกขึ้นมาได้เสมอว่าP ( D | H A I ) = 1 - สมมติฐาน "สมบูรณ์แบบ" ดังนั้นเราสามารถใช้1HAP(D|HAI)=1เป็นการวัดว่าข้อมูลสามารถรองรับสมมติฐานทางเลือกใด ๆ เหนือโมฆะได้ดีเพียงใด ไม่มีสมมติฐานทางเลือกว่าข้อมูลสามารถรองรับH0 ได้มากกว่า11P(D|H0I)H0 ) นอกจากนี้เรายังสามารถ จำกัด คลาสของทางเลือกและการเปลี่ยนแปลงก็คือ1จะถูกแทนที่ด้วยโอกาสสูงสุด (รวมถึงค่าคงที่ปกติ) ภายในชั้นเรียนนั้น ถ้าP(D|H0I)เริ่มมีขนาดเล็กเกินไปเราจะเริ่มสงสัยว่าโมฆะเพราะจำนวนทางเลือกระหว่างH0และHAเพิ่มขึ้น (รวมถึงบางอย่างที่มีความน่าจะเป็นก่อนหน้านี้เล็กน้อย) แต่นี่เกือบจะเป็นสิ่งที่ทำกับค่า p แต่มีข้อยกเว้นหนึ่งข้อ: เราไม่คำนวณความน่าจะเป็นสำหรับt(1P(D|H0I)1P(D|H0I)H0HAสำหรับบางสถิติ t ( D )และบางพื้นที่ "ไม่ดี" ของสถิติ เราคำนวณความน่าจะเป็น D - ข้อมูลที่เราจริงมีมากกว่าส่วนย่อยบางส่วนของมัน,เสื้อ( D )t(D)>t0t(D)Dt(D)

D{x1,,xN}xiNormal(μ,σ2)IH0:μ=μ0. จากนั้นเรามีหลังจากการคำนวณเล็กน้อย:

P(D|H0I)=(2πσ2)N2exp(N[s2+(x¯μ0)2]2σ2)

x¯=1Ni=1Nxis2=1Ni=1N(xix¯)2P(D|H0I)μ0=x¯

P(D|HAI)=(2πσ2)N2exp(Ns22σ2)

เราจึงหาอัตราส่วนของสองตัวนี้แล้วเราจะได้:

P(D|HAI)P(D|H0I)=(2πσ2)N2exp(Ns22σ2)(2πσ2)N2exp(Ns2+N(x¯μ0)22σ2)=exp(z22)

z=Nx¯μ0σ|z|x¯

x¯X¯Normal(μ,σ2N)X¯x¯|X¯μ0||X¯μ0||x¯μ0|

p-value=P(|X¯μ0||x¯μ0||H0)
=1P[N|x¯μ0|σNX¯μ0σN|x¯μ0|σ|H0]
=1P(|z|Z|z||H0)=2[1Φ(|z|)]

|z|

แม้ว่าพวกเขาจะเป็นทั้งสองสิ่งง่าย ๆ ที่จะทำในตัวอย่างนี้พวกเขาไม่ได้ง่ายเสมอไปในกรณีที่ซับซ้อนมากขึ้น ในบางกรณีอาจเป็นการง่ายกว่าในการเลือกสถิติที่เหมาะสมในการใช้และคำนวณการกระจายตัวตัวอย่าง ในคนอื่น ๆ อาจเป็นการง่ายกว่าที่จะกำหนดคลาสของทางเลือกและขยายให้กว้างกว่าคลาสนั้น

ตัวอย่างง่ายๆนี้อธิบายถึงการทดสอบตามค่า p จำนวนมากเนื่องจากการทดสอบสมมติฐานจำนวนมากมีความหลากหลาย "ประมาณปกติ" มันให้คำตอบโดยประมาณสำหรับปัญหาเหรียญของคุณด้วย (โดยใช้การประมาณแบบปกติกับทวินาม) นอกจากนี้ยังแสดงให้เห็นว่าค่า p ในกรณีนี้จะไม่ทำให้คุณหลงทางอย่างน้อยก็ในแง่ของการทดสอบสมมติฐานเดียว ในกรณีนี้เราสามารถพูดได้ว่าค่า p เป็นตัวชี้วัดของหลักฐานเทียบกับสมมติฐานว่าง

0.193.870.05196.830.12.330.052.78


4
+1 "... การเลือกสถิติเทียบเท่ากับการกำหนดสมมติฐานทางเลือกที่คุณกำลังพิจารณา" ทำให้ฉันเข้าใจอย่างลึกซึ้ง
whuber

kk

1
@ faheemmitha- คุณพูดถูกเกี่ยวกับ combinatorical explosion แต่สิ่งนี้ไม่ได้เกิดขึ้นสำหรับวิธีที่ฉันอธิบาย (อันที่จริงคุณสามารถแสดงให้เห็นได้ว่าแนวทาง Bayes นั้นกำหนดส่วนที่เหลือได้อย่างมีประสิทธิภาพ) นี่เป็นเพราะเราเพียงแค่ต้องกำหนดระดับแล้วเพิ่ม เราไม่จำเป็นต้องประเมินแต่ละทางเลือกเพียงแค่หาสิ่งที่ดีที่สุด
ความน่าจะเป็นเชิง

เหตุใดคำตอบนี้จึงเป็น Wiki ชุมชน
อะมีบาพูดว่า Reinstate Monica

10

ในฐานะอดีตนักวิชาการที่ย้ายเข้ามาฝึกฉันจะถ่ายภาพ ผู้คนใช้ค่า p เนื่องจากมีประโยชน์ คุณไม่สามารถดูได้ในตัวอย่างแบบเรียนของการพลิกเหรียญ แน่นอนว่ามันไม่ได้มีรากฐานที่มั่นคงจริง ๆ แต่อาจจะไม่จำเป็นเท่าที่เราต้องการจะคิดเมื่อเรากำลังคิดเชิงวิชาการ ในโลกของข้อมูลเราถูกล้อมรอบด้วยสิ่งต่าง ๆ ที่เป็นไปไม่ได้ที่จะสำรวจต่อไป ด้วยการคำนวณค่า p สิ่งที่คุณต้องการในฐานะที่เป็นแนวคิดของสิ่งที่ไม่น่าสนใจและฮิวริสติกแบบตัวเลขสำหรับข้อมูลประเภทใดที่น่าสนใจ จากนั้นเป็นรายบุคคลหรือเป็นกลุ่มเราสามารถสแกนสิ่งต่าง ๆ ได้ง่าย ๆ โดยปฏิเสธกลุ่มที่ไม่น่าสนใจ ค่า p ช่วยให้เราพูดว่า "ถ้าฉันไม่ได้ให้ความสำคัญกับการคิดเรื่องนี้เป็นอย่างมาก


10

คำถามของคุณเป็นตัวอย่างที่ดีของการใช้เหตุผลอย่างสม่ำเสมอและเป็นจริงโดยธรรมชาติ ฉันใช้ตัวอย่างนี้ในชั้นเรียนของฉันเพื่อสาธิตลักษณะของการทดสอบสมมติฐาน ฉันขออาสาสมัครทำนายผลการพลิกเหรียญ ไม่ว่าผลลัพธ์จะเป็นอะไรฉันบันทึกการทายคำว่า "ถูกต้อง" เราทำสิ่งนี้ซ้ำ ๆ จนกระทั่งชั้นเรียนเริ่มเป็นที่น่าสงสัย

ตอนนี้พวกเขามีนางแบบหัวอยู่ในหัว พวกเขาคิดว่าเหรียญมีความยุติธรรม เมื่อการสันนิษฐานนั้นถูกต้อง 50% เมื่อทุกอย่างยุติธรรมการคาดเดาที่ถูกต้องทุกครั้งจะทำให้เกิดความสงสัยว่าแบบจำลองเหรียญยุติธรรมนั้นไม่ถูกต้อง การเดาที่ถูกต้องสองสามข้อและพวกเขายอมรับบทบาทของโอกาส หลังจากเดาถูกต้อง 5 หรือ 10 ครั้งผู้เรียนจะเริ่มสงสัยว่าโอกาสของเหรียญยุติธรรมนั้นต่ำ ดังนั้นจึงเป็นไปตามธรรมชาติของการทดสอบสมมติฐานภายใต้โมเดลบ่อยๆ

มันเป็นตัวแทนที่ชัดเจนและใช้งานง่ายของผู้ใช้บ่อยในการทดสอบสมมติฐาน มันเป็นความน่าจะเป็นของข้อมูลที่สังเกตได้ว่าเป็นจริง จริงๆแล้วมันค่อนข้างเป็นธรรมชาติที่แสดงให้เห็นโดยการทดลองง่าย ๆ นี้ เราคิดว่าแบบจำลองนั้นมีขนาด 50-50 แต่จากหลักฐานที่ติดตั้งฉันปฏิเสธแบบจำลองนั้นและสงสัยว่าจะมีอะไรอีกที่เล่น

ดังนั้นถ้าความน่าจะเป็นของสิ่งที่ฉันสังเกตนั้นต่ำเนื่องจากแบบจำลองที่ฉันสมมติ (ค่า p) ดังนั้นฉันจึงมีความมั่นใจในการปฏิเสธแบบจำลองที่สมมติขึ้นของฉัน ดังนั้น p-value เป็นตัวชี้วัดที่มีประโยชน์ในการเปรียบเทียบกับตัวแบบที่สันนิษฐานของฉันโดยคำนึงถึงบทบาทของโอกาส

ข้อความปฏิเสธความรับผิดชอบ: ฉันนำแบบฝึกหัดนี้จากบทความที่ถูกลืมมานานซึ่งฉันจำได้ว่าเป็นวารสาร ASA ฉบับหนึ่ง


เบรตต์มันน่าสนใจและเป็นตัวอย่างที่ดี แบบจำลองสำหรับฉันที่นี่ดูเหมือนจะเป็นที่คนคาดหวังว่าคำสั่งของหัวและก้อยจะเกิดขึ้นในแบบสุ่ม ตัวอย่างเช่นถ้าฉันเห็น 5 หัวในแถวฉันอนุมานได้ว่านี่เป็นตัวอย่างของกระบวนการที่ไม่สุ่ม ในความเป็นจริงและฉันอาจผิดที่นี่ความน่าจะเป็นของ toin coss (สมมติว่ามีการสุ่ม) คือ 50% หัวและ 50% tails และนี่เป็นอิสระอย่างสมบูรณ์จากผลลัพธ์ก่อนหน้า ประเด็นก็คือว่าถ้าเราโยนเหรียญ 50,000 ครั้งและครั้งแรกที่ 25,000 เป็นหัวหน้าถ้าส่วนที่เหลือ 25,000 เป็นหางนี่ก็ยังคงสะท้อนถึงการขาดอคติ
2238

@ user2238: คำสั่งสุดท้ายของคุณเป็นจริง แต่มันจะหายากมาก ในความเป็นจริงการเห็นการวิ่ง 5 หัวในการโยน 5 ครั้งจะเกิดขึ้นเพียง 3% ของเวลาหากเหรียญมีความยุติธรรม เป็นไปได้เสมอว่าค่าว่างนั้นเป็นจริงและเราได้เห็นเหตุการณ์ที่หายาก
Brett

6

"การพูด p-value โดยประมาณให้ความน่าจะเป็นของผลลัพธ์ที่สังเกตได้ของการทดลองตามสมมติฐาน (model)"

แต่มันก็ไม่ได้ ไม่แม้แต่คร่าวๆ - สิ่งนี้ทำให้เกิดความแตกต่างที่สำคัญ

ไม่ได้ระบุแบบจำลองดังที่ Raskolnikov ชี้ให้เห็น แต่สมมติว่าคุณหมายถึงรูปแบบทวินาม (การโยนเหรียญอิสระการแก้ไขอคติเหรียญที่ไม่รู้จัก) สมมติฐานคือการอ้างว่าพารามิเตอร์ที่เกี่ยวข้องในโมเดลนี้ความเอนเอียงหรือความน่าจะเป็นของหัวคือ 0.5

"การมีความน่าจะเป็นนี้ (ค่า p) เราต้องการตัดสินสมมติฐานของเรา (มีโอกาสมากน้อยเพียงใด)"

เราอาจต้องการตัดสินใจนี้ แต่ p-value จะไม่ (และไม่ได้ถูกออกแบบมาเพื่อ) ช่วยเราทำเช่นนั้น

"แต่มันจะไม่เป็นธรรมชาติหรือที่จะคำนวณความน่าจะเป็นของสมมติฐานที่ได้จากผลลัพธ์ที่สังเกตได้"

บางทีมันอาจจะ ดูการสนทนาทั้งหมดของ Bayes ด้านบน

"[... ] ตอนนี้เราคำนวณ p-value นั่นเท่ากับความน่าจะเป็นที่จะได้ 14 หรือมากกว่าใน 20 flips ของเหรียญตกลงตอนนี้เรามีความน่าจะเป็นนี้ (0.058) และเราต้องการใช้ความน่าจะเป็นนี้ ตัดสินโมเดลของเรา (เป็นไปได้อย่างไรที่เรามีเหรียญที่ยุติธรรม) "

'จากสมมติฐานของเราโดยสมมติว่าแบบจำลองของเราเป็นจริง' แต่โดยพื้นฐานแล้ว: ใช่ ค่า p ใหญ่บ่งบอกว่าพฤติกรรมของเหรียญสอดคล้องกับสมมติฐานที่ว่ามันยุติธรรม (โดยทั่วไปแล้วพวกเขายังสอดคล้องกับสมมติฐานที่เป็นเท็จ แต่ใกล้เคียงกับความจริงเราไม่มีข้อมูลเพียงพอที่จะบอกได้; ดู 'กำลังทางสถิติ')

"แต่ถ้าเราต้องการประเมินความน่าจะเป็นของโมเดลทำไมเราไม่คำนวณความน่าจะเป็นของโมเดลที่ให้การทดสอบทำไมเราถึงคำนวณความน่าจะเป็นของโมเดลที่ได้รับจากการทดลอง (p-value)"

เราไม่ได้คำนวณความน่าจะเป็นของผลการทดลองที่ให้สมมติฐานในการตั้งค่านี้ ท้ายที่สุดแล้วความน่าจะเป็นนั้นอยู่ที่ประมาณ 0.176 จากการเห็นเพียง 10 หัวเท่านั้นเมื่อสมมติฐานเป็นจริงและนั่นเป็นค่าที่น่าจะเป็นมากที่สุด นี่ไม่ใช่ปริมาณที่น่าสนใจเลย

นอกจากนี้ยังเกี่ยวข้องกับที่เรามักจะไม่ประเมินความน่าจะเป็นของโมเดลเช่นกัน ทั้งคำตอบที่ใช้บ่อยและแบบเบย์โดยทั่วไปถือว่าตัวแบบเป็นจริงและทำการอ้างถึงพารามิเตอร์ ที่จริงแล้วไม่ใช่ว่าชาวเบย์ทุกคนจะสนใจในความน่าจะเป็นของแบบจำลองกล่าวคือความน่าจะเป็นที่สถานการณ์ทั้งหมดเป็นแบบอย่างที่ดีจากการแจกแจงทวินาม พวกเขาอาจทำการตรวจสอบแบบจำลองจำนวนมาก แต่ไม่เคยถามจริงว่ามีแนวโน้มว่าทวินามอยู่ในพื้นที่ของโมเดลที่เป็นไปได้อื่น ๆ อย่างไร Bayesians ที่สนใจเกี่ยวกับปัจจัย Bayes สนใจคนอื่นไม่มาก


2
อืมสองลงคะแนน ถ้าคำตอบนั้นแย่มากมันน่าจะมีความเห็นบ้าง
ผัน

ฉันชอบคำตอบนี้ บางครั้งผู้คนลงคะแนนให้คำตอบเพราะมันไม่คล้ายกับตำราเรียนและพยายามกำจัดทุกเว็บไซต์ของการอภิปรายที่มีเรื่องธรรมดาสามัญสำนึกหรือฆราวาสเช่นคำอธิบาย
Vass

ฉันไม่ได้ลงคะแนน แต่ฉันคิดว่าปัญหาคือประเด็นของคุณยังไม่ชัดเจน
Elvis

6

หมายเหตุด้านคำตอบที่ยอดเยี่ยมอื่น ๆ : บางครั้งมีบางครั้งที่เราทำไม่ได้ ตัวอย่างเช่นจนกระทั่งเมื่อเร็ว ๆ นี้พวกเขาถูกห้ามทันทีในวารสารระบาดวิทยา - ตอนนี้พวกเขาเป็นเพียง "ท้อแท้อย่างยิ่ง" และคณะบรรณาธิการได้ทุ่มเทพื้นที่จำนวนมหาศาลเพื่อการอภิปรายของพวกเขาที่นี่: http: //journals.lww co.th / epidem / หน้า / collectiondetails.aspx? TopicalCollectionId = 4



2

กำหนดความน่าจะเป็น ฉันหมายถึงมัน ก่อนที่เราจะคืบหน้าต่อไปเราจำเป็นต้องชำระตามข้อกำหนด

DM

P(M|D)P(M,D)

106/28109

ในปัญหาที่เกิดขึ้นจริงในโลกด้วยเงื่อนไขทางการแพทย์และวิธีการทำงานคุณอาจไม่สามารถหาส่วนประกอบเหล่านี้ของการกระจายข้อต่อได้และไม่สามารถแก้ไขได้

P(M,D)p=0.5P(p=0.5)=0B(0.5,0.5)B(1000,1000)0.528109/(28109+106)

นอกจากความยากลำบากในการพูดคุยเกี่ยวกับแบบจำลองที่ถูกต้องแล้ววิธีการแบบเบย์ก็มีวิธี จำกัด ในการจัดการกับการสะกดผิดแบบจำลอง หากคุณไม่ชอบข้อผิดพลาดแบบเกาส์หรือคุณไม่เชื่อในความเป็นอิสระของการโยนเหรียญ (มือของคุณเหนื่อยหลังจากโยน 10,000 ครั้งแรกดังนั้นคุณจะไม่โยนมันให้สูงถึง 1,000 ครั้งแรก ซึ่งอาจส่งผลกระทบต่อความน่าจะเป็น) สิ่งที่คุณสามารถทำได้ในโลกของ Bayesian คือการสร้างแบบจำลองที่ซับซ้อนมากขึ้น - การทำลายไพรเมอร์สำหรับการผสมแบบปกติ แต่ไม่มีข้อผิดพลาดมาตรฐานโดยตรงกับ Huber Sandwich ที่ยอมรับอย่างชัดเจนว่าแบบจำลองนั้นอาจมีการผิดพลาดและถูกเตรียมไว้สำหรับเรื่องนั้น

<Ω,F,P>ΩFσPAΩAFXt,t[0,1]{Xt>0,t[0,0.5]}{Xt>0,t{t1,t2,,tk}}kσ


1

แต่ถ้าเราต้องการประเมินความน่าจะเป็นของโมเดลทำไมเราไม่คำนวณความน่าจะเป็นของโมเดลที่ได้รับจากการทดสอบ

เพราะเราไม่รู้ มีจำนวนโมเดลที่เป็นไปได้ไม่ จำกัด และไม่ได้กำหนดพื้นที่ความน่าจะเป็น

นี่คือตัวอย่างที่ใช้งานได้จริง สมมติว่าฉันต้องการคาดการณ์จีดีพีของสหรัฐฯ ฉันได้รับอนุกรมเวลาและพอดีกับโมเดล ความน่าจะเป็นที่โมเดลนี้เป็นจริงคืออะไร

Δlnyt=μ+et
μet

ป้อนคำอธิบายรูปภาพที่นี่

lnyt=ct+et
c

μ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.