การใช้ค่า p เพื่อคำนวณความน่าจะเป็นของสมมติฐานที่เป็นจริง ต้องการอะไรอีก


9

คำถาม:

ความเข้าใจผิดอย่างหนึ่งที่พบบ่อยของค่า p คือพวกมันเป็นตัวแทนของความน่าจะเป็นของสมมติฐานว่างเปล่าที่เป็นจริง ฉันรู้ว่าไม่ถูกต้องและฉันรู้ว่าค่า p แสดงถึงความน่าจะเป็นในการหาตัวอย่างมากเช่นนี้เนื่องจากสมมติฐานว่างเป็นจริง อย่างไรก็ตามอย่างสังหรณ์ใจคนหนึ่งควรจะได้รับมาจากคนหลัง ต้องมีเหตุผลว่าทำไมไม่มีใครทำเช่นนี้ ข้อมูลใดที่เราขาดหายไปซึ่ง จำกัด เราจากการได้รับความน่าจะเป็นของสมมติฐานที่เป็นจริงจากค่า p และข้อมูลที่เกี่ยวข้อง?


ตัวอย่าง:

สมมติฐานของเราคือ "วิตามินดีส่งผลต่ออารมณ์" (สมมติฐานว่างเปล่าว่าเป็น "ไม่มีผล") สมมติว่าเราทำการศึกษาทางสถิติที่เหมาะสมกับ 1,000 คนและค้นหาความสัมพันธ์ระหว่างอารมณ์และระดับวิตามิน สิ่งอื่น ๆ ที่เท่าเทียมกันค่า p-0.01 บ่งชี้ความเป็นไปได้ของสมมติฐานที่แท้จริงสูงกว่าค่า p-0.05 สมมุติว่าเราได้ค่า p เป็น 0.05 ทำไมเราไม่สามารถคำนวณความน่าจะเป็นจริงที่สมมติฐานของเราเป็นจริงได้ ข้อมูลอะไรที่เราขาดหายไป?


คำศัพท์สำรองสำหรับนักสถิติประจำ:

หากคุณยอมรับหลักฐานของคำถามของฉันคุณสามารถหยุดอ่านได้ที่นี่ ต่อไปนี้สำหรับผู้ที่ปฏิเสธที่จะยอมรับว่าสมมติฐานสามารถมีการตีความความน่าจะเป็น เรามาลืมคำศัพท์กันสักครู่ แทน...

สมมติว่าคุณกำลังเดิมพันกับเพื่อนของคุณ เพื่อนของคุณแสดงการศึกษาทางสถิตินับพันเกี่ยวกับวิชาที่ไม่เกี่ยวข้อง สำหรับการศึกษาแต่ละครั้งคุณจะได้รับอนุญาตให้ดูที่ p-value ขนาดตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่าง สำหรับการศึกษาแต่ละครั้งเพื่อนของคุณเสนอโอกาสที่จะเดิมพันว่าสมมติฐานที่นำเสนอในการศึกษาเป็นจริง คุณสามารถเลือกที่จะเดิมพันหรือไม่ก็ได้ หลังจากที่คุณทำการเดิมพันสำหรับการศึกษาทั้งหมด 1,000 ครั้งแล้วออราเคิลก็ขึ้นไปหาคุณและบอกคุณว่าสมมติฐานใดถูกต้อง ข้อมูลนี้ช่วยให้คุณสามารถตัดสินการเดิมพัน การอ้างสิทธิ์ของฉันคือมีกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมนี้. ในโลกทัศน์ของฉันนั้นเทียบเท่ากับการรู้ความน่าจะเป็นสำหรับสมมติฐานที่เป็นจริง แต่ถ้าเราไม่เห็นด้วยมันก็ดี ในกรณีนี้เราสามารถพูดคุยเกี่ยวกับวิธีการใช้ค่า p เพื่อเพิ่มความคาดหวังสูงสุดสำหรับการเดิมพัน


ดูตัวอย่าง: math.tut.fi/~piche/bayes/notes06.pdf
klumbard

13
"เราขาดข้อมูลอะไรบ้าง" - ความน่าจะเป็นก่อนหน้าของ H0 นั้นเป็นจริง มันเป็นเพียงทฤษฎีบทของเบย์ เพื่อที่จะคำนวณหลังคุณจะต้องมีก่อน
อะมีบา

1
@ Adamo ฉันไม่เห็นว่าสิ่งที่ตามมาจากกฎของ Cromwell ซึ่งเกี่ยวกับก่อนไม่ใช่คนหลัง ฉันคิดว่าคุณอาจสับสน "ความจริง" กับ "ความรู้บางอย่าง" หากเราสนใจความรู้บางอย่างเราจะใช้ตรรกะแทนที่จะใช้เหตุผลที่น่าจะเป็น
Dikran Marsupial

1
@AdamO ฉันไม่ได้ติดตาม OP ถามว่า "ข้อมูลอะไรที่เราขาดหายไปซึ่ง จำกัด เราจากการได้รับความน่าจะเป็นของสมมติฐานที่เป็นจริงจากค่า p และข้อมูลที่เกี่ยวข้อง" ความน่าจะเป็น 1 และการรู้อะไรบางอย่างที่เป็นความจริงเกี่ยวข้องกับสิ่งนั้นอย่างไร
อะมีบา

1
ในการตอบสนองต่อความคิดเห็นก่อนหน้าของคุณ @Atte: ถ้าใครอยากคิดก่อนหน้านี้ 0.5 ก็ดี แต่ฉันไม่เห็นว่าทำไมสิ่งนี้ควรเป็นสมมติฐานที่มีความหมายเสมอ ไม่ว่าในกรณีใดมันเป็นข้อสันนิษฐาน
อะมีบา

คำตอบ:


5

คำตอบอื่น ๆ ได้รับปรัชญาทั้งหมด แต่ฉันไม่เห็นว่าทำไมมันจำเป็นที่นี่ ลองพิจารณาตัวอย่างของคุณ:

สมมติฐานของเราคือ "วิตามินดีส่งผลต่ออารมณ์" (สมมติฐานว่างเปล่าว่าเป็น "ไม่มีผล") สมมติว่าเราทำการศึกษาทางสถิติที่เหมาะสมกับ 1,000 คนและค้นหาความสัมพันธ์ระหว่างอารมณ์และระดับวิตามิน สิ่งอื่น ๆ ที่เท่าเทียมกันค่า p-0.01 บ่งชี้ความเป็นไปได้ของสมมติฐานที่แท้จริงสูงกว่าค่า p-0.05 สมมุติว่าเราได้ค่า p เป็น 0.05 ทำไมเราไม่สามารถคำนวณความน่าจะเป็นจริงที่สมมติฐานของเราเป็นจริงได้ ข้อมูลอะไรที่เราขาดหายไป?

สำหรับได้รับสอดคล้องกับค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่าง\ สมมติฐานคือ 0 สมมติฐานทางเลือกคือ0n=1000p=0.05ρ^=0.062H0:ρ=0H1:ρ0

p-value คือและเราสามารถคำนวณได้ตามการสุ่มตัวอย่าง การกระจายของภายใต้ null; ไม่จำเป็นต้องมีอะไรอีก

p-value=P(|ρ^|0.062|ρ=0),
ρ^

คุณต้องการคำนวณ

P(H0|data)=P(ρ=0|ρ^=0.062),

และสำหรับสิ่งนี้คุณต้องการส่วนผสมทั้งหมดเพิ่มเติม อันที่จริงโดยการใช้ทฤษฎีบทของเบย์เราสามารถเขียนได้ดังนี้:

P(ρ^=0.062|ρ=0)P(ρ=0)P(ρ^=0.062|ρ=0)P(ρ=0)+P(ρ^=0.062|ρ0)(1P(ρ=0)).

ดังนั้นในการคำนวณความน่าจะเป็นหลังของโมฆะคุณต้องมีสองสิ่งเพิ่มเติม:

  1. ก่อนที่สมมติฐานนี้เป็นจริง:0)P(ρ=0)
  2. ข้อสันนิษฐานเกี่ยวกับวิธีการกระจายหากสมมติฐานทางเลือกเป็นจริง นี่เป็นสิ่งจำเป็นในการคำนวณคำศัพท์ρP(ρ^=0.062|ρ0)

หากคุณยินดีที่จะสมมติว่า --- แม้ว่าฉันเองก็ไม่แน่ใจว่าทำไมสิ่งนี้จึงเป็นสมมติฐานที่มีความหมาย --- คุณจะยังคงต้องสมมติการกระจายของภายใต้ ทางเลือก ในกรณีนี้คุณจะสามารถคำนวณสิ่งที่เรียกว่าBayes factor :P(ρ=0)=0.5ρ

B=P(ρ^=0.062|ρ=0)P(ρ^=0.062|ρ0).

ที่คุณเห็นปัจจัย Bayes ไม่ได้ขึ้นอยู่กับความน่าจะเป็นก่อน null แต่มันไม่ได้ขึ้นอยู่กับความน่าจะเป็นก่อน (ภายใต้ทางเลือก)ρ

[โปรดทราบว่าผู้เสนอชื่อในปัจจัย Bayes ไม่ใช่ค่า p เนื่องจากความเสมอภาคแทนที่จะเป็นเครื่องหมายความไม่เท่าเทียมกัน ดังนั้นเมื่อคำนวณ Bayes factor หรือเราไม่ได้ใช้ p-value ของตัวเองเลย แต่แน่นอนว่าเราใช้การกระจายตัวตัวอย่าง ]P(H0)P(ρ^|ρ=0)


คำถามคือเกี่ยวกับ "ความน่าจะเป็นที่เป็นจริง '' คุณคิดว่าพวกเบคำนวณสิ่งนี้หรือไม่หรือพวกเขาคำนวณ '' ความน่าเชื่อถือ '' ของว่าเป็นจริงหรือไม่เช่นพวกเขาคำนวณระดับความเชื่อที่เป็นจริง (ให้ข้อมูลที่พวกเขาสังเกต) หรือพวกเขาคำนวณความน่าจะเป็นที่เป็นจริงหรือไม่H0H0H0H0

2
ฉันไม่เข้าใจความแตกต่างที่คุณกำลังทำ @fcop ในมุมมองโลกของเบย์ความน่าจะเป็นคือระดับของความเชื่อ ( เช่นดูที่นี่ )
อะมีบา

แล้วทำไมพวกเขาถึงเรียกมันว่า 'ความน่าเชื่อถือ' '

1
ขออภัย @fcop ฉันไม่ต้องการมีการอภิปรายเชิงปรัชญาหรือความหมายที่นี่ OP กำลังถามสิ่งที่จำเป็นในการคำนวณและฉันตอบคำถามเฉพาะจากมุมมองทางคณิตศาสตร์ P(H0)
อะมีบา

@fcop ดูเพิ่มเติมstats.stackexchange.com/questions/173056/…
ทิม

7

ค่อนข้าง veritas?

ฉันยอมรับคำตอบของ @ amoeba ได้อย่างง่ายดายเหมือนโปสเตอร์ต้นฉบับ อย่างไรก็ตามข้อควรระวังในการทำงานทั้งหมดของฉันฉันไม่พบการวิเคราะห์แบบเบย์ซึ่งคำนวณ "ความน่าจะเป็นที่สมมติฐานว่างเป็นจริง" และข้อสรุปดังกล่าวจะดึงดูดข้อโต้แย้งทั้งหมดจากการตรวจสอบงานของคุณ! ในทางปรัชญามันทำนำเรากลับไปที่คำถาม: "ความจริงคืออะไร" บางที "ความจริง" อาจปฏิเสธไม่ได้แม้จะเป็นหลักฐาน สถิติเป็นเครื่องมือของวิทยาศาสตร์ในการหาปริมาณความไม่แน่นอน ฉันยังคงยืนยันว่าในขณะที่หลักฐานสามารถชี้ให้เห็นถึงความจริงได้อย่างมาก แต่ก็มีความเสี่ยงในการค้นพบในเชิงบวกที่ผิดพลาดและนักสถิติที่ดีควรรายงานความเสี่ยงนี้ แม้ในการทดสอบทฤษฎีการตัดสินใจแบบเบย์กฎการตัดสินใจจะได้รับเพื่อให้เราสามารถยอมรับหรือปฏิเสธสมมติฐานตามปัจจัย Bayes ซึ่งเป็นสัดส่วนคร่าวๆกับแต่ความเชื่อของเราไม่เคยเป็นหรือแม้ว่าการตัดสินใจของเราจะเป็นอย่างไร ทฤษฎีการตัดสินใจทำให้เรา "ก้าวไปข้างหน้า" ด้วยความรู้บางส่วนและยอมรับความเสี่ยงเหล่านี้Pr(H0|X)10

ส่วนหนึ่งของเหตุผลสำหรับการทดสอบสมมติฐานทางสถิติ (NHST) และ -value คือคาร์ลตกใจของปรัชญาของการทำผิด ในเรื่องนี้: ข้อสันนิษฐานที่สำคัญก็คือว่า "ความจริง" ไม่เคยรู้มาก่อนเราสามารถลดสมมติฐานอื่นลงได้ ที่น่าสนใจและวิจารณ์ที่ถูกต้องของ NHST คือคุณจะบังคับเพื่อให้สมมติฐานไร้สาระเช่นการสูบบุหรี่ที่จะไม่ก่อให้เกิดโรคมะเร็งเมื่อคุณกำลังสนใจจริงๆในพรรณนา (ไม่อนุมาน) การศึกษา: และคุณเป็นเพียงการอธิบายถึงวิธีการมากมะเร็งสาเหตุการสูบบุหรี่ .p

การวิจารณ์การสนทนาได้ถูกนำไปใช้กับการศึกษาแบบเบย์ซึ่งคุณสามารถใช้นักบวชได้อย่างอิสระ: เดนนิสลินด์ลีย์กล่าวว่า "ด้วยความเป็นไปได้ก่อนหน้า 0 ว่าดวงจันทร์ทำจากชีสมนุษย์อวกาศกลับมาด้วยแขนเต็มไปด้วยชีส

ข้อมูลที่ขาดหายไปเพื่อตรวจสอบว่าสมมติฐานว่างเป็นจริงหรือไม่เป็นเรื่องเล็กน้อยความรู้เกี่ยวกับว่าสมมติฐานว่างเป็นจริงหรือไม่ เมื่อเรามุ่งเน้นไปที่สถิติเชิงพรรณนาเราสามารถยอมรับช่วงที่ยอมรับได้ของผลกระทบที่เป็นไปได้และสรุปได้อย่างชัดเจนว่าแนวโน้มน่าจะเป็นจริง: แต่การทดสอบทางสถิติไม่ได้นำเราไปสู่การค้นพบดังกล่าว แม้ในการอนุมานแบบเบย์ไม่มีข้อมูลใด ๆ ที่จะนำไปสู่การหลังเอกพจน์โดยไม่ต้องมีปัญหาวิธีการบางอย่างดังนั้นการรวมกันของก่อนไม่ได้แก้ปัญหานี้


1
"" ด้วยความน่าจะเป็นก่อนหน้านี้ 0 ที่ดวงจันทร์ทำจากชีส "แต่ได้รับ" cogito ergo sum "(และอาจไม่ได้เป็นอย่างนั้น) คือสิ่งที่เรารู้แน่นอนว่าเราควรให้ความน่าจะเป็นก่อนหน้านี้ที่ 0 ว่าดวงจันทร์ทำจากชีส ? 0 และ 1 ควรสงวนไว้สำหรับเหตุผลที่เป็นไปไม่ได้และแน่นอนและ eps และ 1-eps สำหรับข้อความเกี่ยวกับโลกแห่งความเป็นจริงกรอบ Bayesian นั้นดีถ้านักบวชของคุณเป็นตัวแทนของความรู้ก่อนหน้าของปัญหาอย่างแม่นยำ ปัญหา).
Dikran Marsupial

1
@DikranMarsupial การโต้แย้งของคุณต่อการใช้ 0/1 นั้นเป็นสิ่งที่คำพูดแนะนำ มัน ridicules สถานการณ์ที่จะอธิบายถึงความจำเป็นของสิ่งที่ลินด์เรียกกฎรอมเวลล์
nwn

1
@watarok ขอบคุณสำหรับลิงค์ / คำชี้แจงดูเหมือนว่าการกล่าวถึงในคำตอบนั้นเป็นความเข้าใจผิดเล็กน้อยเนื่องจาก Lindley ไม่ได้วิจารณ์การศึกษาแบบเบย์จริง ๆ นักบวชที่มีความมั่นใจมากเกินไป
Dikran Marsupial

@DikranMarsupial ฉันคิดว่าปัญหาของนักบวชที่มีความมั่นใจมากเกินไปนั้นเป็นสิ่งที่สามารถนำไปใช้กับสถิติ Bayesian ทั้งหมดได้ การไม่ให้ข้อมูลก่อนมักจะนำไปสู่การอนุมานและการวิเคราะห์ที่พบบ่อย ความแตกต่างคือในการตีความ: ผลลัพธ์แบบเบย์ต้องสอดคล้องกับแนวคิดของ "ความจริง" หรือ "พารามิเตอร์ที่แท้จริง" นั่นเป็นเรื่องที่ดีตราบใดที่เราอธิบายสมมติฐานอย่างรอบคอบและวิธีแก้ไขอัตรากำลังและข้อผิดพลาด
AdamO

@watarok อาจารย์สถิติสก็อตเบย์ของฉันใช้คำพูดนั้นเป็นประจำ แต่ไม่เคยอธิบายความเกี่ยวข้อง ตอนนี้ฉันรู้สึกซาบซึ้งที่ได้รู้
AdamO

6

มีความพยายามสองครั้งที่จะทำสิ่งที่คุณพูดในประวัติศาสตร์สถิติ Bayesian และ Fiducial RA Fisher ก่อตั้งโรงเรียนการคิดเชิงสถิติสองแห่งคือโรงเรียน Likelihoodist ที่สร้างขึ้นโดยมีความเป็นไปได้สูงสุดและ Fiducial ซึ่งจบลงด้วยความล้มเหลว แต่พยายามทำสิ่งที่คุณต้องการ

คำตอบสั้น ๆ ว่าทำไมมันล้มเหลวก็คือการแจกแจงความน่าจะเป็นไม่ได้รวมกับเอกภาพ ในที่สุดบทเรียนก็คือความน่าจะเป็นก่อนหน้าเป็นสิ่งจำเป็นที่จะต้องสร้างสิ่งที่คุณกำลังพยายามสร้าง แน่นอนว่าคุณกำลังก้าวไปตามเส้นทางของนักสถิติที่ยิ่งใหญ่ที่สุดคนหนึ่งในประวัติศาสตร์และนักบวชอีกสองสามคนเสียชีวิตโดยหวังว่าจะได้รับการแก้ไขปัญหานี้ หากพบว่ามันจะวางวิธีการสมมุติฐานว่างกับวิธีเบย์ในแง่ของประเภทของปัญหาที่พวกเขาสามารถแก้ไขได้ อันที่จริงมันจะผลักดัน Bayes ที่ผ่านมายกเว้นในกรณีที่ข้อมูลก่อนจริงมีอยู่

นอกจากนี้คุณยังต้องระวังด้วยคำสั่งของคุณว่า p-value ระบุโอกาสที่สูงกว่าสำหรับทางเลือก นั่นเป็นความจริงในโรงเรียนชาวประมงที่เป็นชาวลิเบีย มันไม่เป็นความจริงเลยในโรงเรียนบ่อย ๆ ของ Pearson-Neyman การเดิมพันของคุณที่ด้านล่างดูเหมือนจะเป็นการเดิมพันแบบ Pearson-Neyman ในขณะที่ค่า p ของคุณไม่เข้ากันเนื่องจากมาจากโรงเรียนชาวประมง

เพื่อการกุศลฉันจะสันนิษฐานว่าสำหรับตัวอย่างของคุณว่าไม่มีอคติการตีพิมพ์และดังนั้นผลลัพธ์ที่สำคัญเท่านั้นที่ปรากฏในวารสารที่สร้างอัตราการค้นพบที่ผิดพลาดสูง ฉันถือว่านี่เป็นตัวอย่างแบบสุ่มของการศึกษาทั้งหมดที่ดำเนินการโดยไม่คำนึงถึงผลลัพธ์ ฉันจะยืนยันว่าอัตราเดิมพันของคุณจะไม่สอดคล้องกันในความรู้สึกคลาสสิกเดอ Finetti ของคำว่า

ในโลกของเดอฟิเนตตีการเดิมพันจะสอดคล้องกันหากผู้เล่นเจ้ามือรับแทงม้าไม่สามารถวางเดิมพันได้ ในการก่อสร้างที่ง่ายที่สุดมันก็เหมือนวิธีแก้ปัญหาของการตัดเค้ก คนหนึ่งตัดชิ้นครึ่ง แต่อีกคนเลือกชิ้นที่ต้องการ ในการก่อสร้างนี้คนคนหนึ่งจะระบุราคาสำหรับการเดิมพันในแต่ละสมมติฐาน แต่คนอื่นจะเลือกที่จะซื้อหรือขายเดิมพัน ในสาระสำคัญคุณสามารถขายเป็นโมฆะ เพื่อความเหมาะสมอัตราต่อรองจะต้องยุติธรรมอย่างเคร่งครัด ค่า P จะไม่นำไปสู่อัตราต่อรองที่ยุติธรรม

หากต้องการแสดงตัวอย่างนี้ให้พิจารณาการศึกษาของ Wetzels และคณะที่http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf

หนังเรื่องนี้คือ Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson และ Eric-Jan Wagenmakers หลักฐานทางสถิติในจิตวิทยาการทดลอง: การเปรียบเทียบเชิงประจักษ์โดยใช้การทดสอบ 855 ครั้ง มุมมองทางวิทยาศาสตร์จิตวิทยา. 6 (3) 291-298 2011

นี่คือการเปรียบเทียบโดยตรงของการทดสอบ t-855 ที่เผยแพร่โดยใช้ปัจจัยของเบย์เพื่อหลีกเลี่ยงปัญหาของการแจกแจงก่อนหน้า ใน 70% ของค่า p ระหว่าง. 05 และ. 01 ปัจจัย Bayes อยู่ในระดับที่ดีที่สุด นี่เป็นเพราะรูปแบบทางคณิตศาสตร์ที่ใช้โดย Frequentists ในการแก้ปัญหา

วิธีการตั้งสมมติฐานว่าเป็นโมฆะสันนิษฐานว่าแบบจำลองเป็นจริงและการก่อสร้างของพวกเขาใช้การกระจายทางสถิติน้อยที่สุดมากกว่าการกระจายความน่าจะเป็น ปัจจัยทั้งสองนี้มีผลกระทบต่อความแตกต่างระหว่างโซลูชันแบบเบย์และไม่ใช่แบบเบย์ พิจารณาการศึกษาที่วิธีการแบบเบย์ประเมินความน่าจะเป็นด้านหลังของสมมติฐานเป็นร้อยละสาม ลองจินตนาการว่าค่า p มีค่าน้อยกว่าร้อยละห้า ทั้งสองเป็นจริงเนื่องจากสามเปอร์เซ็นต์น้อยกว่าห้าเปอร์เซ็นต์ อย่างไรก็ตามค่า p ไม่ใช่ความน่าจะเป็น เพียงระบุค่าสูงสุดที่น่าจะเป็นในการดูข้อมูลไม่ใช่ความน่าจะเป็นจริงที่สมมติฐานจะเป็นจริงหรือเท็จ อันที่จริงภายใต้โครงสร้าง p-value คุณไม่สามารถแยกแยะความแตกต่างระหว่างเอฟเฟกต์เนื่องจากโอกาสที่มีค่าว่างจริงและค่าลบเท็จที่มีข้อมูลดี

หากคุณดูจากการศึกษาของ Wetzel คุณจะสังเกตได้ว่าอัตราเดิมพันที่บอกเป็นนัยโดย p-values ​​นั้นไม่ตรงกับราคาที่วัดโดย Bayesian เนื่องจากการวัดแบบเบย์มีทั้งที่ยอมรับและเชื่อมโยงกันและผู้ที่ไม่ได้อยู่ในเบย์ไม่สอดคล้องกันจึงไม่ปลอดภัยที่จะสมมติแผนที่ p-values ​​กับความน่าจะเป็นที่แท้จริง ข้อสันนิษฐานที่บังคับว่าโมฆะนั้นถูกต้องนั้นให้ความน่าจะเป็นที่ครอบคลุมที่ดี แต่มันไม่ได้สร้างความน่าจะเป็นที่จะเสี่ยงต่อการพนัน

เพื่อให้ได้ความรู้สึกที่ดีขึ้นว่าทำไมให้พิจารณาสัจพจน์แรกของ Cox ที่ความเป็นไปได้ของสมมติฐานสามารถอธิบายได้ด้วยจำนวนจริง สิ่งนี้หมายความว่าสมมติฐานทั้งหมดมีจำนวนจริงที่เชื่อมโยงกับความเป็นไปได้ ในวิธีการตั้งสมมติฐานว่างเป็นโมฆะมีเพียงจำนวนจริงที่เชื่อมโยงกับความเป็นไปได้ สมมติฐานทางเลือกไม่มีการวัดและแน่นอนว่าไม่ใช่ความสมบูรณ์ของความน่าจะเป็นในการสังเกตข้อมูลที่ระบุว่าค่า Null นั้นเป็นจริง แน่นอนถ้าว่างเป็นจริงแล้วส่วนประกอบนั้นเป็นเท็จโดยการสันนิษฐานโดยไม่คำนึงถึงข้อมูล

หากคุณสร้างความน่าจะเป็นโดยใช้ค่า p เป็นพื้นฐานของการวัดของคุณการวัดแบบเบส์โดยใช้การวัดแบบเบย์จะสามารถได้รับประโยชน์จากคุณเสมอ หาก Bayesian กำหนดอัตราต่อรองแล้วทฤษฎีการตัดสินใจของ Pearson และ Neyman จะจัดทำรายการเดิมพันหรือไม่เดิมพัน แต่พวกเขาจะไม่สามารถกำหนดจำนวนเงินที่จะเดิมพันได้ เนื่องจากอัตราเดิมพันแบบเบย์มีความยุติธรรมกำไรที่คาดหวังจากการใช้วิธีของ Pearson และ Neyman จะเป็นศูนย์

อันที่จริงการศึกษาของ Wetzel นั้นเป็นสิ่งที่คุณกำลังพูดถึง แต่มีการเดิมพันน้อยลง 145 รายการ หากคุณดูที่ตารางที่สามคุณจะเห็นการศึกษาบางอย่างที่ผู้ถกเถียงประจำปฏิเสธว่าเป็นโมฆะ แต่ Bayesian พบว่าความน่าจะเป็นนั้นเป็นโมฆะ


5

การวิเคราะห์เป็นประจำไม่สามารถให้ความน่าจะเป็นที่สมมติฐานหนึ่งนั้นเป็นจริง (หรือเท็จ) เพราะไม่มีความถี่ในการทำงานนาน (เป็นจริงหรือไม่จริง) ดังนั้นเราจึงไม่สามารถกำหนดความน่าจะเป็นได้ (ยกเว้น 0 หรือ 1 ) หากคุณต้องการทราบความน่าจะเป็นที่สมมติฐานหนึ่งเป็นจริงเราจำเป็นต้องปรับใช้กรอบการทำงานแบบเบย์ (ซึ่งตรงไปตรงมาเราเพียงแค่ต้องพิจารณาความน่าจะเป็นก่อนหน้านี้ ฯลฯ )

ผู้ใช้บ่อยสามารถหากลยุทธ์ที่ดีที่สุดสำหรับการทดสอบสมมติฐานว่าง ( กรอบNeyman-Pearson ) แต่พวกเขาไม่สามารถแปลความเป็นไปได้ที่สมมติฐานนั้นเป็นจริง แต่เพียงเพราะความหมายของความน่าจะเป็น


คุณช่วยให้แม่นยำมากขึ้นใน '' ไม่สามารถแปลความน่าจะเป็นที่สมมติฐานนั้นเป็นจริงได้ แต่เพราะนิยามความน่าจะเป็น '' เพราะฉันไม่เข้าใจว่าทำไมถึงเป็นเช่นนั้น?

บ่อยครั้งที่กำหนดความน่าจะเป็นในแง่ของความถี่ในระยะยาวและความจริงของสมมติฐานที่เฉพาะเจาะจงไม่มีความถี่ระยะยาว (ไม่ใช่เรื่องไม่สำคัญ) ดังนั้นนักความถี่จึงไม่สามารถติดความน่าจะเป็นได้ en.wikipedia.org/wiki/Frequentist_probability นี่คือเหตุผลที่เราพูดสิ่งที่คลุมเครือเล็กน้อยเช่น "เราสามารถปฏิเสธสมมติฐานว่างที่ระดับ X สำคัญ" มากกว่า "ความน่าจะเป็นของ H0 ที่เป็นเท็จคือ p" (ซึ่งก็คือ รูปแบบของคำตอบที่เรามักจะต้องการ)
Dikran Marsupial

1
@fcop การแสดงออกเช่น ,หรือไม่ใช่นิพจน์ที่ถูกต้องในทฤษฎีความน่าจะเป็นประจำ เนื่องจากหรือสมมติฐานใด ๆ ไม่ใช่ตัวแปรสุ่ม ดูโพสต์นี้โดย Larry Wasserman สำหรับรายละเอียดเพิ่มเติม p(H0=true)p(H0=true|D)p(D|H0=true)H0
matus

ดูคำตอบของฉันในหัวข้อนี้เช่นกันสำหรับ @matus

@DikranMarsupial จะไม่เชื่อแบบ Bayesian เพียงแค่ยอมรับบางสิ่งบางอย่างในฐานะ "ความจริง" ถ้าความน่าจะเป็นสำหรับผลลัพธ์เฉพาะคือ 1 และสำหรับความเป็นไปได้อื่น ๆ ทั้งหมดคือ 0? คุณเคยได้รับสิ่งนี้ในการวิเคราะห์แบบเบย์หรือไม่? คุณจะต้องมีความเป็นไปได้ซึ่งครอบงำก่อนหน้านี้ แต่จากนั้นผู้เข้าร่วมประชุมและ Bayesians ก็ต้องยอมรับ: ข้อมูลได้บอกเราทุกอย่าง
AdamO

1

หลังจากที่คุณทำการเดิมพันสำหรับการศึกษาทั้งหมด 1,000 ครั้งแล้วออราเคิลก็ขึ้นไปหาคุณและบอกคุณว่าสมมติฐานใดถูกต้อง ข้อมูลนี้ช่วยให้คุณสามารถตัดสินการเดิมพัน การอ้างสิทธิ์ของฉันคือมีกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมนี้

ปัญหาในการตั้งค่าของคุณคือ Oracle มักจะไม่ได้มาเพื่อตัดสินเดิมพัน สมมติว่าคุณกำลังเดิมพันว่าความน่าจะเป็นที่การสูบบุหรี่ทำให้เกิดมะเร็งนั้นเป็น 97% ออราเคิลนี้จะมาเพื่อยุติการเดิมพันเมื่อไหร่? ไม่เคย แล้วคุณจะพิสูจน์ได้อย่างไรว่ากลยุทธ์ที่ดีที่สุดของคุณเหมาะสมที่สุด

อย่างไรก็ตามหากคุณลบ Oracle และแนะนำตัวแทนอื่น ๆ เช่นคู่แข่งและลูกค้าจะมีกลยุทธ์ที่ดีที่สุด ฉันกลัวว่ามันจะไม่ขึ้นอยู่กับค่า p แต่ มันจะคล้ายกับแนวทางของ Gosset มากขึ้นด้วยฟังก์ชั่นการสูญเสีย ตัวอย่างเช่นคุณและคู่แข่งของคุณในภาคเกษตรกรรมกำลังเดิมพันด้วยการพยากรณ์อากาศว่าเป็นจริง ใครก็ตามที่เลือกกลยุทธ์ที่ดีกว่าจะทำเงินได้มากกว่า ไม่จำเป็นต้องมีใน Oracle และการเดิมพันจะตัดสินในตลาด คุณไม่สามารถวางกลยุทธ์ตามค่า p ที่นี่ได้คุณจะต้องคำนึงถึงความสูญเสียและผลกำไรเป็นดอลลาร์


ทำไมเราไม่คิดว่า Oracle จะมาตัดสินเดิมพันทันที?
Atte Juvonen

ทำไมเราไม่สามารถสันนิษฐานได้ว่าเมื่อเราประมาณค่าเฉลี่ยตัวอย่าง Oracle มาแล้วบอกเราว่าประชากรหมายถึงอะไร มันเป็นสิ่งเดียวกันถ้าคุณคิดเกี่ยวกับมัน มันไม่สมจริงเลย
Aksakal

0

ในสมมติฐานที่คุณต้องการทดสอบบางคำสั่งเกี่ยวกับโลกแห่งความเป็นจริงเช่นความยาวเฉลี่ยของผู้ชายทุกคนคือ 1.75m จากนั้นเราจะทำการทดสอบสมมติฐานเช่นH0:μL=1.75 กับ H1:μL1.75.

นี่คือคำแถลงของเราและเราต้องการทดสอบว่าในโลกแห่งความจริงนี่เป็นข้อเท็จจริงหรือไม่ แต่บ่อยครั้งกล่าวว่าในโลกแห่งความจริงนี้เป็นจริงหรือเท็จ เช่นเดียวกับในโลกแห่งความจริงH0 เป็นจริงหรือเท็จซึ่งหมายความว่าในโลกแห่งความจริง P(H0=TRUE) เป็น 0 หรือ 1

ดังนั้นในทางทฤษฎีผลลัพธ์ของการทดสอบสมมติฐานของเราควรเป็น H0เป็นจริงหรือเท็จ แต่เมื่อเราทำงานกับตัวอย่างเราไม่สามารถหาข้อสรุปที่ยากได้ดังนั้นเราจึงพยายามใช้ตัวแปรทางสถิติของเทคนิคทางคณิตศาสตร์ที่เรียกว่า 'พิสูจน์ด้วยความขัดแย้ง' สำหรับรายละเอียดโปรดดูสิ่งต่อไปนี้หากเราไม่สามารถปฏิเสธสมมติฐานว่างได้ .

สำหรับเธรดบนค่า p ให้ดูที่การเข้าใจผิดเกี่ยวกับค่าP

Baysians ทำสิ่งที่แตกต่าง พวกเขาแสดงความเชื่อหรือความน่าเชื่อถือที่พวกเขามีในบทสรุปของการทดสอบดังนั้นจึงไม่ใช่ความน่าจะเป็นที่แท้จริงH0 เป็นจริง แต่ระดับของความเชื่อที่พวกเขามีในบทสรุปของพวกเขาพวกเขาทำหลังจากการทดสอบเกี่ยวกับ H0. นี่คือเหตุผลที่เรียกว่า '' ความน่าเชื่อถือ ''

ยกตัวอย่างคุณทดสอบ "H0: วิตามินดีมีผลต่ออารมณ์ "กับ"H1: วิตามินดีไม่ส่งผลต่ออารมณ์ "

จากตัวอย่างคุณคำนวณสถิติการทดสอบและความน่าจะเป็นที่จะเกินเมื่อเป็นจริง หากค่าของสถิติการทดสอบนี้ต่ำมาก (ต่ำกว่าระดับนัยสำคัญที่เราเลือก) ดังนั้นสมมติว่านั้นเป็นจริงนำไปสู่บางสิ่งที่ไม่น่าจะเป็นไปได้มากหรือนำไปสู่การพูดว่าH0H0

ผู้ใช้บ่อยจะสรุปได้ว่าในกรณีดังกล่าวนำไปสู่การไม่รู้สึกทางสถิติ อย่างไรก็ตามใน '' โลกแห่งความจริง '' มีเพียงความจริงเดียวเท่านั้นหรือ !H0H0H1

Bayesians คำนวณความน่าจะเป็นที่เป็นจริงเมื่อได้รับข้อมูล ดังนั้นในโลกเป็นจริงเป็นจริงหรือเป็นจริง แต่การใช้ข้อมูลพวกเขาสามารถแสดงระดับความเชื่อของพวกเขา (ที่ได้จากข้อมูล) ที่เป็นจริง H0H0H1H0

พวกเขาเรียกสิ่งนี้ว่า '' ความน่าเชื่อถือของสมมติฐาน '' แต่มันไม่ได้พูดอะไรเกี่ยวกับความน่าจะเป็นที่เป็นจริง (หรือไม่เกี่ยวกับความน่าจะเป็นที่เป็นจริง)H0H1

พวกเขาเพียงแสดงความเชื่อมั่นใน '' บทสรุปของการทดสอบ '' ซึ่งได้มาจาก '' ข้อมูลที่มีอยู่ ''

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.