หากหลักการความน่าจะเป็นขัดแย้งกับความน่าจะเป็นที่เกิดขึ้นบ่อยครั้งเราจะยกเลิกหนึ่งในนั้นหรือไม่?


19

ในความคิดเห็นเพิ่งโพสต์ที่นี่ผู้วิจารณ์คนหนึ่งชี้ไปที่บล็อกของLarry Wassermanผู้ชี้ให้เห็น (โดยไม่มีแหล่งที่มา) ที่การอนุมานบ่อย ๆ ปะทะกับหลักการความน่าจะเป็น

หลักการความน่าจะเป็นเพียงกล่าวว่าการทดลองที่ให้ฟังก์ชันความน่าจะเป็นที่คล้ายกันควรให้ข้อสรุปที่คล้ายคลึงกัน

คำถามสองส่วนนี้:

  1. ส่วนใดกลิ่นรสหรือโรงเรียนที่มีการอนุมานเป็นประจำละเมิดหลักการความน่าจะเป็นโดยเฉพาะ?

  2. หากมีการปะทะกันเราต้องยกเลิกอย่างใดอย่างหนึ่งหรือไม่? ถ้าใช่แล้วอันไหนล่ะ? ฉันจะขอแนะนำว่าถ้าเราต้องทิ้งอะไรเราควรทิ้งส่วนของการอนุมานที่พบบ่อยซึ่งการปะทะกันเนื่องจากการแฮ็กและRoyallทำให้ฉันเชื่อว่าหลักการความน่าจะเป็นจริงเป็นจริง


2
ฉันไม่เคยเข้าใจเลยว่าทำไมหลักการโอกาสน่าจะเป็นสัจพจน์
Stéphane Laurent

6
สวัสดีStéphane ปัญหาคือ Birnbaum พิสูจน์แล้วว่าความน่าจะเป็นนั้นเทียบเท่ากับอีกสองหลักการซึ่งเป็นเรื่องธรรมดาที่พวกเขาควรจะต้องมี เราเขียนรีวิวสั้น ๆ เกี่ยวกับผลลัพธ์นี้ ที่นี่: ime.usp.br/~pmarques/papers/redux.pdf
Zen

@ เซนขอบคุณ เมื่อเห็นแวบแรกจุดที่ฉันไม่เห็นด้วยคือประโยคนี้เขียนไว้ใต้หลักการเงื่อนไข: "สิ่งที่สำคัญคือสิ่งที่เกิดขึ้นจริง" ฉันควรพูดแทน "สิ่งที่สำคัญคือสิ่งที่เกิดขึ้นจริงในบรรดาปัญหาที่อาจเกิดขึ้น" (ขออภัยถ้าภาษาอังกฤษของฉันไม่ถูกต้อง) นั่นคือสิ่งที่ฉันอ้างในการสนทนากับ gui11aume: ในแง่หนึ่งหลักการความน่าจะเป็นอ้างว่าการออกแบบการทดสอบไม่สำคัญและฉันไม่สามารถเห็นด้วยกับประเด็นนี้
Stéphane Laurent

1
@ เซนตอนนี้ฉันได้อ่านเอกสารของคุณอย่างระมัดระวังมากขึ้น มันเป็นความจริงที่มันยากที่จะไม่เห็นด้วยกับหลักการเงื่อนไขและหลักการแปรปรวน
Stéphane Laurent

1
LP ไม่ได้รับความนิยมในทุกวันนี้ด้วยเหตุผลเชิงปฏิบัติ คุณจะหลีกเลี่ยงการใช้นักบวชที่ขึ้นกับนางแบบเช่นเจฟฟรีย์ก่อนหน้านี้นักบวชสังยุคและการทดสอบสมมติฐานซึ่งมีประโยชน์ในหลายบริบท ฉันเชื่อว่าสถิติเช่นเดียวกับฟิสิกส์ไม่สามารถแบ่งเป็น axiomatised อย่างมีความหมายได้ (แม้ว่าการสนทนานี้อาจฟังดูเหมือนแบบนี้ ) แต่สิ่งสำคัญคือการระบุข้อดีและข้อเสียของกระบวนทัศน์ที่แตกต่างกัน

คำตอบ:


12

ส่วนหนึ่งของวิธีการใช้บ่อยซึ่งขัดแย้งกับหลักการความน่าจะเป็นคือทฤษฎีของการทดสอบทางสถิติ (และการคำนวณค่า p) มันมักจะเน้นด้วยตัวอย่างต่อไปนี้

สมมติว่าสอง frequentist ต้องการที่จะศึกษาเหรียญลำเอียงซึ่งผลัดกัน 'หัว' กับ propability ไม่รู้จักหน้าพวกเขาสงสัยว่ามันจะลำเอียงไปทาง 'หาง' เพื่อให้พวกเขาอ้างโมฆะสมมติฐานเดียวกันP = 1 / 2และเดียวกันทางเลือกสมมติฐานP < 1 / 2pp=1/2p<1/2

นักสถิติคนแรกพลิกเหรียญจนกว่า 'หัว' จะปรากฎขึ้นซึ่งเกิดขึ้นเป็น 6 ครั้ง ที่สองตัดสินใจที่จะพลิกเหรียญ 6 ครั้งและได้รับ 'หัว' เพียงครั้งเดียวในการโยนครั้งสุดท้าย

ตามโมเดลของนักสถิติคนแรก p-value ถูกคำนวณดังนี้:

p(1p)5+p(1p)6+...=p(1p)511p=p(1p)4.

ตามโมเดลของสถิติที่สอง p-value จะถูกคำนวณดังนี้:

(61)p(1p)5+(60)(1p)6=(5p+1)(1p)5.

การเปลี่ยนโดย1 / 2ที่พบครั้งแรก p-value เท่ากับ1 / 2 5 = 0.03125ที่พบสอง p-value เท่ากับ7 / 2 × 1 / 2 5 = 0.109375p1/21/25=0.031257/2×1/25=0.109375

ดังนั้นพวกเขาจึงได้ผลลัพธ์ที่แตกต่างกันเพราะพวกเขาทำสิ่งต่าง ๆ ใช่ไหม แต่ตามหลักการความน่าจะเป็นพวกเขาควรได้ข้อสรุปเดียวกัน หลักการความน่าจะเป็นสั้น ๆ กล่าวว่าโอกาสที่จะเกิดขึ้นก็คือสิ่งที่สำคัญสำหรับการอนุมาน ดังนั้นการปะทะกันที่นี่มาจากข้อเท็จจริงที่ว่าการสังเกตทั้งสองมีความเป็นไปได้เหมือนกันสัดส่วนกับ (ความน่าจะเป็นถูกกำหนดเป็นค่าคงที่สัดส่วน)p(1p)5

เท่าที่ฉันรู้คำตอบสำหรับคำถามที่สองของคุณเป็นความคิดเห็นที่ถกเถียงกันมากขึ้น ฉันพยายามหลีกเลี่ยงการทดสอบและการคำนวณค่า p ด้วยเหตุผลส่วนตัวข้างต้นและสำหรับคนอื่น ๆ ที่อธิบายไว้ในโพสต์บล็อกนี้

แก้ไข:ตอนนี้ฉันคิดเกี่ยวกับมันการประมาณค่าตามช่วงความเชื่อมั่นจะแตกต่างกัน จริง ๆ แล้วถ้าโมเดลนั้นแตกต่างกัน CI จะแตกต่างกันไปตามโครงสร้างp


1
ฉันอยู่ภายใต้ความประทับใจว่าหลักการความน่าจะเป็นถูกละเมิดอย่างเห็นได้ชัดในสถิติบ่อยครั้ง (การทดสอบสมมติฐานช่วงเวลาความเชื่อมั่น) เพราะเราคำนึงถึงความน่าจะเป็นของผลลัพธ์ที่เป็นไปได้แต่ละอย่างไม่เพียง แต่ความน่าจะเป็น ใช่มั้ย
Stéphane Laurent

@ Stéphane Laurent ใช่นั่นเป็นวิธีที่ฉันเข้าใจ James Berger มีการอ้างอิงที่ดีในทฤษฎีการตัดสินใจทางสถิติและการวิเคราะห์แบบเบส์ซึ่งบอกว่าบางครั้งผู้ปฏิเสธบ่อย ๆ ได้ตั้งสมมติฐานเพราะข้อมูลที่ไม่เคยสังเกต (มันฟังดูดีขึ้น แต่ฉันจำไม่ได้)
gui11aume

ขอบคุณ gui11aume ฉันมีสิทธิ์ที่จะตีความว่าเป็นตัวอย่างที่ 'ความหมาย' ของค่า P แตกต่างกันไปตามเจตนาของผู้ทดลองหรือไม่ ฉันคิดว่าเป็นกรณีที่ค่า P ถูกตีความว่าเป็นอัตราการผิดพลาดที่เป็นบวกของเกณฑ์ที่เป็นเท็จเพราะพวกเขาจะต้องมีการกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่าง? นั่นเป็นสิ่งที่จำเป็นสำหรับวิธีการของฟิชเชอร์ที่นำเสนอค่า P เป็นดัชนีของความแข็งแกร่งของหลักฐานหรือไม่?
Michael Lew

4
(+1) ความแตกต่างประเภทนี้มักจะปรากฏขึ้นเมื่อกฎการหยุดเกี่ยวข้องกับรุ่นใดรุ่นหนึ่ง

1
@Scortchi ที่จริงฉันถูกเข้าใจผิดคิดว่าหนึ่งในค่า P- ชี้ไปที่ฟังก์ชั่นโอกาสที่ถูกต้องและอื่น ๆ ไม่: พวกเขาทั้งสองชี้ไปที่ฟังก์ชั่นโอกาสเดียวกันซึ่งไม่แสดงหลักฐานที่เกี่ยวข้องกับความน่าจะเป็นของหัว คุณควรละเว้นสองประโยคสุดท้ายของความคิดเห็นก่อนหน้าของฉัน (ฉันแก้ไขไม่ได้ใช่ไหม?)
Michael Lew

4

ฉันชอบตัวอย่างโดย @ gui11aume (+1) แต่สามารถสร้างความประทับใจได้ว่าความแตกต่างในค่าสองค่าเกิดขึ้นเนื่องจากกฎการหยุดที่แตกต่างกันซึ่งใช้โดยผู้ทดสอบสองคนp

ในความเป็นจริงฉันเชื่อว่ามันเป็นปรากฏการณ์ทั่วไปมากขึ้น ลองพิจารณาผู้ทดสอบคนที่สองในคำตอบของ @ gui11aume: ผู้ที่โยนเหรียญหกครั้งและสังเกตผู้เข้าร่วมเฉพาะในการโยนครั้งสุดท้าย ผลลัพธ์จะเป็นดังนี้: สิ่งที่เป็นพี -value? วิธีการตามปกติคือการคำนวณความน่าจะเป็นที่เหรียญยุติธรรมจะส่งผลให้หนึ่งหรือน้อยกว่าหัว มี 7ความเป็นไปได้จากทั้งหมด 64กับหนึ่งหรือน้อยกว่าหัวจึง P = 7 / 64 0.109

TTTTTH,
p764p=7/640.109

แต่ทำไมไม่ใช้เวลาอีกสถิติทดสอบ ? ตัวอย่างเช่นในการทดลองนี้เราสังเกตห้าหางในแถว ลองหาความยาวของลำดับหางที่ยาวที่สุดเป็นสถิติทดสอบ มีความเป็นไปได้ที่มีห้าหรือหกก้อยติดต่อกันดังนั้นp = 3 /3 0.047p=3/640.047

ดังนั้นหากในกรณีนี้อัตราความผิดพลาดคงที่ที่แล้วทางเลือกของการทดสอบทางสถิติสามารถทำให้ผลอย่างใดอย่างหนึ่งอย่างมีนัยสำคัญหรือไม่และนี้มีอะไรจะทำอย่างไรกับกฎหยุดต่อ seα=0.05


ส่วนเก็งกำไร

ตอนนี้ในเชิงปรัชญาแล้วฉันจะบอกว่าการเลือกสถิติทดสอบบ่อยๆนั้นมีความคลุมเครือคล้ายกับตัวเลือกเบย์ก่อนหน้านี้ เราเลือกหนึ่งหรืออีกสถิติการทดสอบเพราะเราเชื่อว่าเหรียญที่ไม่เป็นธรรมจะทำในลักษณะนี้หรือวิธีการเฉพาะ (และเราต้องการที่จะมีอำนาจในการตรวจสอบพฤติกรรมนี้) การใส่ก่อนหน้านี้เป็นประเภทเหรียญหรือไม่

ppp

ฉันสนใจที่จะรับฟังความคิดเห็นบางส่วนเกี่ยวกับส่วนการเก็งกำไรนี้ที่นี่หรือในการแชท


อัปเดตการสนทนาต่อไปนี้ด้วย @MichaelLew

ppp

ฉันยังคงต้องคิดว่านี่หมายถึงอะไรสำหรับส่วน "การเก็งกำไร" ของฉันข้างต้น


ความคิดที่น่าสนใจ ใช่ฉันยอมรับว่าไม่จำเป็นต้องมีความขัดแย้งระหว่าง LP และค่า P ตราบใดที่ค่า P ไม่ได้ถูกตีความเป็นหลักฐานในลักษณะเดียวกับฟังก์ชันความน่าจะเป็น ฟังก์ชั่นน่าจะมีหลักฐานที่เกี่ยวข้องกับพารามิเตอร์ของดอกเบี้ยที่กำหนดแบบจำลองทางสถิติ เมื่อคุณเปลี่ยนสถิติการทดสอบคุณเปลี่ยนโมเดลดังนั้นฟังก์ชันความน่าจะเป็นสำหรับโมเดลทางเลือกของคุณจะแตกต่างจากฟังก์ชันโอกาสในการทดสอบสำหรับต้นฉบับ
Michael Lew

ไมเคิลฉันไม่แน่ใจว่า "แบบจำลองเชิงสถิติ" หมายถึงอะไร แต่ไม่ใช่เหรียญที่มีความน่าจะเป็นหัว พีเป็นโมเดลอยู่แล้ว? สถิติการทดสอบเปลี่ยนโมเดลได้อย่างไร
อะมีบาพูดว่า Reinstate Monica

นอกเหนือจากนั้นฉันพบคำถามนี้เพราะฉันกำลังอ่านบทความ "To P หรือไม่ P" ของคุณอีกครั้ง (และ "หลักการความน่าจะเป็น") ที่ googled โดยทั่วไปฉันชอบกระดาษ แต่ฉันสับสนโดยสมบูรณ์ในหัวข้อ 4.4 คุณเขียนว่าค่า p ไม่ควร "ปรับ" โดยการหยุดกฎเข้าบัญชี แต่ฉันไม่เห็นการปรับเปลี่ยนใด ๆ ในสูตร 5-6 ค่า p ที่ไม่ได้ปรับคืออะไร คุณหมายถึงว่าหนึ่งในนั้นถูกปรับและอีกอันไม่ ถ้าเป็นเช่นนั้นอันไหนและทำไมไม่ตรงกันข้าม
อะมีบาพูดว่า Reinstate Monica

แบบจำลองทางสถิติมักถูกละเว้นหรือสันนิษฐานว่าเป็นค่าคงที่โดยปริยาย อย่างไรก็ตามสำหรับเหรียญมันรวมถึงความน่าจะเป็นที่ไม่ทราบแน่ชัดของหัวการสุ่มเลือกของการสังเกตและสำหรับหัวออกจากสถิติทดสอบการทดลองการกระจายแบบทวินามของผลลัพธ์ที่เป็นไปได้ ฉันไม่รู้ว่าการกระจายตัวของผลลัพธ์สำหรับหางในสถิติการทดสอบแถว แต่ฉันสงสัยว่ามันแตกต่างกัน แม้ว่ามันจะเหมือนกันโมเดลที่มีสถิติการทดสอบของคุณจะไม่เหมือนกับโมเดลดั้งเดิมดังนั้นฟังก์ชันความน่าจะเป็นอาจแตกต่างกันแม้ว่ามันจะมีหลักฐานทั้งหมดอยู่ก็ตาม
Michael Lew

ฉันเกือบจะเสร็จสิ้นการ reworking ที่สมบูรณ์ของกระดาษที่ มันเกี่ยวข้องกับการสนทนานี้ แต่ยังไม่พร้อมสำหรับการส่ง (นี่คือการแชทหรือไม่)
Michael Lew
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.