ตัวอย่างที่หลักการความน่าจะเป็น * สำคัญจริงๆหรือ?


20

มีตัวอย่างที่การทดสอบที่ป้องกันได้สองแบบที่แตกต่างกันซึ่งมีความน่าจะเป็นสัดส่วนจะนำไปสู่การอนุมานที่แตกต่างกันอย่างชัดเจน (และการป้องกันที่เท่ากัน) อย่างเช่นที่ p-values ​​เป็นลำดับของขนาดไกลออกไป

ตัวอย่างทั้งหมดที่ฉันเห็นนั้นโง่มากการเปรียบเทียบทวินามกับลบทวินามโดยที่ p-value ของอันแรกคือ 7% และ 3% ที่สองซึ่งเป็น "แตกต่าง" เพียงอย่างเดียวที่จะทำการตัดสินใจไบนารีบนธรณีประตูตามอำเภอใจ อย่างมีนัยสำคัญเช่น 5% (ซึ่งโดยวิธีการเป็นมาตรฐานที่ค่อนข้างต่ำสำหรับการอนุมาน) และไม่ต้องกังวลกับการดูที่อำนาจ ถ้าฉันเปลี่ยนเกณฑ์เป็น 1% ทั้งคู่นำไปสู่ข้อสรุปเดียวกัน

ฉันไม่เคยเห็นตัวอย่างที่จะนำไปสู่ข้อสรุปที่แตกต่างและชัดเจนซึ่งสามารถป้องกันได้ มีตัวอย่างเช่นนี้หรือไม่?

ฉันถามเพราะฉันเห็นหมึกจำนวนมากที่ใช้ในหัวข้อนี้ราวกับว่าหลักการความน่าจะเป็นเป็นพื้นฐานในการอนุมานเชิงสถิติ แต่ถ้าตัวอย่างที่ดีที่สุดมีตัวอย่างที่ไร้สาระเหมือนตัวอย่างข้างต้นหลักการนั้นดูเหมือนจะไม่สมบูรณ์

ดังนั้นฉันกำลังมองหาตัวอย่างที่น่าสนใจมากซึ่งหากไม่มีใครทำตาม LP น้ำหนักของหลักฐานจะชี้ไปในทิศทางเดียวอย่างท่วมท้นเมื่อได้รับการทดสอบเพียงครั้งเดียว แต่ในการทดสอบอื่นที่มีความเป็นไปได้สัดส่วนน้ำหนักของหลักฐานจะ จะชี้ไปในทิศทางตรงกันข้ามอย่างท่วมท้นและข้อสรุปทั้งสองดูสมเหตุสมผล

ตามหลักการแล้วเราสามารถแสดงให้เห็นว่าเรามีคำตอบที่ห่างไกล แต่มีเหตุผลเช่นการทดสอบด้วยพี=0.1เทียบกับพี=10-10ด้วยความน่าจะเป็นสัดส่วนและพลังงานที่เทียบเท่าในการตรวจหาทางเลือกเดียวกัน

PS:คำตอบของบรูซไม่ได้ตอบคำถามเลย


5
เมื่อทำการทดสอบอย่างมีนัยสำคัญเราสามารถเปลี่ยนการตัดสินใจได้โดยเปลี่ยนขีด จำกัด ดังนั้นคุณสามารถอธิบายสิ่งที่คุณหมายถึงโดย "อย่างชัดเจน" "โง่" หรือ "น่าสนใจ"? BTW คุณดูเหมือนจะอ่านบทความวิกิพีเดีย
whuber

2
ยินดีต้อนรับสู่ CV, @statslearner คุณสามารถให้ตัวอย่างของหนึ่งหรือมากขึ้นโดยเฉพาะวิธีการอนุมานที่ไม่ได้ใช้หลักการความน่าจะเป็นที่ที่คุณต้องการจะดูแตกต่าง?
อเล็กซิส

1
@whuber นึกคิดฉันอยากจะเห็นว่าคุณสามารถสร้างคำตอบที่แตกต่างกันโดยพลการเช่นถ้าคุณต้องการใช้ค่าบางอย่างเช่น p = 0.5ต่อp = 10 - 5และการคำนวณทั้งคู่ก็ดูเหมือนว่าจะป้องกันได้ p=0.5p=105
statslearner2

3
ฉันไม่สามารถติดตามความคิดเห็นนั้นได้เนื่องจากไม่สมเหตุสมผล คุณคำนึงถึงเพียงแค่เปลี่ยนตัวเลขที่ให้ไว้ในตัวอย่างของ Wikipedia หรือไม่? พี=105
whuber

6
ความแตกต่างที่สำคัญกับนัยที่เป็นจริงคือการประมวลผลกฎการหยุด: ภายใต้ LP ที่พวกเขาไม่สำคัญนอก LP ที่พวกเขาทำ ตรวจสอบรายละเอียดของ Berger & Wolpert (1987)
ซีอาน

คำตอบ:


7

คิดเกี่ยวกับสถานการณ์สมมุติเมื่อสมมติฐานจุด null เป็นความจริง แต่อย่างหนึ่งที่ช่วยให้การสุ่มตัวอย่างจนกว่าพี<0.05 (ซึ่งจะมักจะเกิดขึ้นเร็วหรือช้าคือมันจะเกิดขึ้นกับความน่าจะเป็น 1) และจากนั้นตัดสินใจที่จะหยุดการพิจารณาคดีและปฏิเสธโมฆะ นี่เป็นกฎการหยุดที่รุนแรงเป็นที่ยอมรับ แต่พิจารณาเพื่อประโยชน์ในการโต้แย้ง

ขั้นตอนทางปัญญาอ่อนนี้จะมีอัตราความผิดพลาด 100% ประเภทที่ 1 แต่ไม่มีอะไรผิดปกติตามหลักการความน่าจะเป็น

ฉันจะบอกว่าสิ่งนี้ถือว่าเป็นเรื่อง "จริง ๆ " แน่นอนคุณสามารถเลือกαใด ๆในการโต้แย้งนี้ Bayesians สามารถใช้การตัดค่าคงที่กับปัจจัย Bayes ได้หากต้องการ ใช้ตรรกะเดียวกัน บทเรียนหลักที่นี่คือคุณไม่สามารถปฏิบัติตาม LP และมีการรับประกันอัตราข้อผิดพลาด ไม่มีอาหารกลางวันฟรี


4
ฉันคิดถึงตัวอย่างนี้เช่นกัน แต่ฉันไม่ได้พูดถึงมันเพราะมันเป็นปัญญาอ่อนแน่นอน แต่จริงๆแล้วมันเป็นสิ่งที่เกิดขึ้นในทางปฏิบัติทางอ้อมและไม่เป็นทางการ
Sextus Empiricus

1
สถิติ 2 รายการและโอกาสในการเป็นตัวอย่างของคุณคืออะไร ในแง่ลบ กรณีทวินามกับทวินามเรามี: 1) สถิติ 1, จำนวนการทดลองจนถึง 3 หัว, ความน่าจะเป็นที่เป็นลบ 2) สถิติ 2 จำนวนหัวในการทดลอง n ครั้ง binomail ที่เป็นความชอบ ในตัวอย่างของคุณฉันไม่เห็นว่าทั้งสองสถิติคืออะไรและถ้าพวกเขามีความเป็นไปได้ตามสัดส่วน
statslearner2

1
ในตัวอย่างของคุณอาจเป็น "จำนวนการทดลองจนถึง p <0.05" ซึ่งฉันแทบจะสงสัยว่ามันเป็นสัดส่วนกับทวินามดังนั้นฉันไม่แน่ใจว่าตัวอย่างของคุณถูกต้องอะมีบา
statslearner2

1
ฉันไม่คิดว่าหลักการความน่าจะเป็นกล่าวว่า "ไม่มีอะไรผิดปกติกับมัน" หลักการความน่าจะเป็นเป็นการกรองขั้นตอนที่ไม่ดีออกไป ความจริงที่ว่ากระบวนการไม่เชื่อฟังหลักการความน่าจะเป็นไม่เหมือนกับที่มันได้รับการรับรองโดยหลักการความน่าจะเป็น การวิเคราะห์แบบเบย์ของปัญหาการทดสอบตามลำดับนี้ซึ่งแน่นอนว่าทำตามหลักการความน่าจะเป็นมีคุณสมบัติที่ดีอย่างสมบูรณ์เพราะจะไม่ใช้ขั้นตอน "moronic" ที่คุณอธิบาย
ผู้ชาย

3
@amoeba พิจารณาภายใต้ทางเลือกหรือθ = 0ภายใต้โมฆะด้วยY ฉัน ~ N ( θ , 1 ) มันง่ายที่จะแสดงให้เห็นว่าบันทึกของปัจจัย Bayes อยู่ที่ประมาณ1θN(0,τ1)θ=0YiN(θ,1)โดยที่Znเป็นสถิติทดสอบZปกติ การปฏิเสธเมื่อปัจจัย Bayes มากกว่า1เท่ากับการปฏิเสธเมื่อ| Zn| >O(12[log(τ/n)+Zn2]ZnZ1 ) ภายใต้ null สิ่งนี้ไม่รับประกันว่าจะเกิดขึ้นในการตั้งค่าการทดสอบตามลำดับ (cf กฎหมายของลอการิทึมที่ทำซ้ำ); ดังนั้นขั้นตอนแบบเบย์จะไม่ตกเป็นเหยื่อของปัญหาที่คุณอธิบาย |Zn|>O(เข้าสู่ระบบn)
คนที่แต่งตัวประหลาด

4

ข้อจำกัดความรับผิดชอบ: ฉันเชื่อว่าคำตอบนี้เป็นหัวใจหลักของการโต้แย้งทั้งหมดดังนั้นจึงควรค่าแก่การอภิปราย แต่ฉันยังไม่ได้สำรวจปัญหาอย่างเต็มที่ ฉันยินดีรับการแก้ไขการปรับแต่งและความคิดเห็น

สิ่งสำคัญที่สุดคือการพิจารณาข้อมูลที่รวบรวมตามลำดับ ตัวอย่างเช่นสมมติว่าคุณสังเกตผลลัพธ์ไบนารีและคุณเห็นความสำเร็จ 10 ข้อและความล้มเหลว 5 ข้อ หลักการความเป็นไปได้บอกว่าคุณควรจะมาถึงข้อสรุปที่เหมือนกันเกี่ยวกับความน่าจะเป็นของความสำเร็จไม่ว่าคุณจะเก็บรวบรวมข้อมูลได้จนกว่าคุณจะมีความสำเร็จ 10 (ทวินามลบ) หรือวิ่ง 15 การทดลองที่ 10 ก็ประสบความสำเร็จ (ทวินาม)

เหตุใดจึงมีความสำคัญใด ๆ

เนื่องจากตามหลักการความน่าจะเป็น (หรืออย่างน้อยก็เป็นการตีความที่แน่นอน) จึงเป็นเรื่องดีที่จะปล่อยให้ข้อมูลมีอิทธิพลต่อเมื่อคุณจะหยุดรวบรวมข้อมูลโดยไม่ต้องเปลี่ยนเครื่องมืออนุมานของคุณ

ขัดแย้งกับวิธีการตามลำดับ

ความคิดที่ว่าการใช้ข้อมูลของคุณเพื่อตัดสินใจว่าเมื่อใดที่จะหยุดการรวบรวมข้อมูลโดยไม่ต้องเปลี่ยนเครื่องมืออนุมานของคุณจะทำการบินอย่างสมบูรณ์เมื่อเผชิญกับวิธีการวิเคราะห์ตามลำดับแบบดั้งเดิม ตัวอย่างคลาสสิกของเรื่องนี้คือด้วยวิธีการที่ใช้ในการทดลองทางคลินิก เพื่อลดความเสี่ยงที่อาจเกิดขึ้นกับการรักษาที่เป็นอันตรายข้อมูลมักถูกวิเคราะห์ในระดับกลางก่อนที่จะทำการวิเคราะห์ หากการทดลองยังไม่เสร็จ แต่นักวิจัยมีข้อมูลเพียงพอที่จะสรุปได้ว่าการรักษานั้นได้ผลหรือเป็นอันตรายจริยธรรมการแพทย์บอกเราว่าเราควรหยุดการทดลอง หากการรักษานั้นเป็นไปอย่างมีจริยธรรมจะต้องหยุดการทดลองและเริ่มให้การรักษาแก่ผู้ป่วยที่ไม่ได้ทดลอง ถ้ามันเป็นอันตรายมันมีจริยธรรมมากกว่าที่จะหยุดเพื่อให้เราหยุดการเปิดเผยผู้ป่วยทดลองเพื่อการรักษาที่เป็นอันตราย

ปัญหาคือตอนนี้เราได้เริ่มทำการเปรียบเทียบหลายครั้งดังนั้นเราจึงเพิ่มอัตราความผิดพลาด Type I ของเราถ้าเราไม่ปรับวิธีการของเราในการเปรียบเทียบหลายรายการ สิ่งนี้ไม่เหมือนกับปัญหาการเปรียบเทียบหลายแบบแบบดั้งเดิมเนื่องจากเป็นการเปรียบเทียบบางส่วนที่แท้จริงหลายประการ (เช่นถ้าเราวิเคราะห์ข้อมูลหนึ่งครั้งด้วย 50% ของข้อมูลที่รวบรวมและอีกครั้งที่มี 100% ตัวอย่างสองตัวอย่างนี้ไม่ชัดเจน!) แต่โดยทั่วไปยิ่งเราทำการเปรียบเทียบมากเท่าไหร่เรายิ่งจำเป็นต้องเปลี่ยนเกณฑ์การปฏิเสธสมมติฐานว่างเพื่อรักษาอัตราความผิดพลาดประเภทที่ 1 โดยมีการเปรียบเทียบที่วางแผนไว้มากขึ้นซึ่งต้องการหลักฐานเพิ่มเติมที่จะปฏิเสธโมฆะ

สิ่งนี้ทำให้นักวิจัยทางคลินิกกระอักกระอ่วน; คุณต้องการตรวจสอบข้อมูลของคุณบ่อยครั้งหรือไม่จากนั้นเพิ่มหลักฐานที่จำเป็นในการปฏิเสธโมฆะหรือคุณต้องการตรวจสอบข้อมูลของคุณไม่บ่อยครั้งเพิ่มพลังของคุณ แต่อาจไม่ทำในลักษณะที่เหมาะสมที่สุดในเรื่องจริยธรรมทางการแพทย์ (เช่นอาจ ชะลอผลิตภัณฑ์ออกสู่ตลาดหรือเปิดเผยผู้ป่วยนานเกินความจำเป็นในการรักษาที่เป็นอันตราย)

มันเป็นความเข้าใจของฉัน (อาจเข้าใจผิด)ว่าหลักการความน่าจะเป็นปรากฏขึ้นเพื่อบอกเราว่าไม่สำคัญว่าเราจะตรวจสอบข้อมูลกี่ครั้งเราควรทำการอนุมานแบบเดียวกัน โดยพื้นฐานแล้วบอกว่าวิธีการทั้งหมดในการออกแบบการทดลองตามลำดับนั้นไม่จำเป็นอย่างสมบูรณ์ เพียงใช้หลักการความน่าจะเป็นและหยุดเมื่อคุณรวบรวมข้อมูลเพียงพอที่จะสรุป เนื่องจากคุณไม่จำเป็นต้องเปลี่ยนวิธีการอนุมานเพื่อปรับเปลี่ยนตามจำนวนการวิเคราะห์ที่คุณเตรียมไว้จึงไม่มีปัญหาใด ๆ ระหว่างจำนวนครั้งที่ตรวจสอบและกำลังงาน แบมฟิลด์ทั้งหมดของการวิเคราะห์ตามลำดับได้รับการแก้ไข (ตามการตีความนี้)

โดยส่วนตัวแล้วสิ่งที่ทำให้ฉันสับสนเกี่ยวกับเรื่องนี้คือความจริงที่ว่ามีความรู้ในด้านการออกแบบตามลำดับ แต่ค่อนข้างบอบบางคือความน่าจะเป็นของสถิติการทดสอบขั้นสุดท้ายถูกเปลี่ยนแปลงโดยกฎการหยุด กฎการหยุดเพิ่มความน่าจะเป็นในลักษณะที่ไม่ต่อเนื่องที่จุดหยุด นี่คือโครงเรื่องของการบิดเบือน เส้นประคือ PDF ของสถิติการทดสอบขั้นสุดท้ายภายใต้ค่า Null หากข้อมูลถูกวิเคราะห์หลังจากรวบรวมข้อมูลทั้งหมดแล้วในขณะที่เส้นทึบให้การแจกแจงภายใต้ค่า Null ของสถิติการทดสอบถ้าคุณตรวจสอบข้อมูล 4 ครั้งด้วยค่าที่กำหนด กฎ.

จากที่กล่าวมามันเป็นความเข้าใจของฉันว่าหลักการความเป็นไปได้ดูเหมือนจะบอกเป็นนัยว่าเราสามารถทิ้งทุกสิ่งที่เรารู้เกี่ยวกับการออกแบบตามลำดับบ่อยและลืมเกี่ยวกับจำนวนครั้งที่เราวิเคราะห์ข้อมูลของเรา เห็นได้ชัดว่าความหมายของสิ่งนี้โดยเฉพาะอย่างยิ่งสำหรับสาขาการออกแบบทางคลินิกนั้นมีขนาดใหญ่มาก อย่างไรก็ตามฉันไม่ได้คำนึงถึงวิธีการที่พวกเขาให้เหตุผลว่าการหยุดกฎเปลี่ยนแปลงความน่าจะเป็นของสถิติขั้นสุดท้ายอย่างไร

สามารถพบการอภิปรายเล็กน้อยที่นี่ส่วนใหญ่เป็นสไลด์สุดท้าย


2
+1 ฉันคิดว่ามันแนวคิดง่ายที่จะคิดเกี่ยวกับสถานการณ์สมมุติเมื่อสมมติฐานที่เป็นความจริง แต่อย่างหนึ่งที่ช่วยให้การสุ่มตัวอย่างจนกว่า (กำแพงนี้มักจะเกิดขึ้นเร็วหรือช้าคือมันจะเกิดขึ้นกับความน่าจะเป็น 1) และจากนั้นตัดสินใจที่จะหยุดการพิจารณาคดี โพรซีเดอร์นี้จะมีอัตราความผิดพลาด 100% ถึงแม้ว่ามันจะเป็นไปตาม LP พี<0.05
อะมีบาพูดว่า Reinstate Monica

@ amoeba: ฉันยอมรับว่าตัวอย่างของคุณตรงไปตรงมา (+1) เป้าหมายของคำตอบของฉันคือการเน้นว่าทำไมถึงมีการอภิปราย ฉันคิดว่าคำตอบคือถ้าหากความหมายและการตีความของ LP นั้นถูกต้องก็หมายความว่าการทดลองทางคลินิกจะไม่ต้องเลือกระหว่างอำนาจสูงสุดและการสัมผัสที่ไม่จำเป็นซึ่งจะเป็นประโยชน์อย่างมาก โดยทั่วไปแล้วนักวิจัยจะไม่ต้องคาดเดาขนาดตัวอย่างที่เหมาะสมล่วงหน้าซึ่งจะช่วยปรับปรุงการทดสอบทางสถิติได้อย่างมาก
หน้าผา AB

ฉันคิดว่ากรอบทั้งหมดของการทดสอบเป็นประจำนั้นไม่สอดคล้องกับ LP และนั่นเป็นวิธีที่มันเป็น หนึ่งใช้การทดสอบบ่อยครั้งหากต้องการรับประกันในอัตราข้อผิดพลาด ปรากฎว่าสิ่งนี้ไม่สอดคล้องกับ LP ดูความขัดแย้งของ Lindley และทุกสิ่ง ดีแกร่ง ฉันเคยตื่นเต้นกับเรื่องเหล่านี้ แต่ตอนนี้ฉันไม่ได้อีกแล้ว ไม่มีอาหารกลางวันฟรี มีให้เลือกบางอย่าง หมายเหตุว่าจำนวนมากของขั้นตอนการคชกรรมละเมิด LP เช่นกัน
อะมีบากล่าวว่า Reinstate Monica

"ความน่าจะเป็นของสถิติการทดสอบขั้นสุดท้ายนั้นส่วนใหญ่ถูกเปลี่ยนแปลงโดยกฎการหยุด"ไฟล์ PDF นั้นมีการเปลี่ยนแปลงและความเป็นไปได้ (แต่โดยค่าคงที่เท่านั้น) แต่คุณยังอาจจบลงด้วยฟังก์ชั่นโอกาสที่เหมือนกัน สัดส่วนคงที่ เช่นการแจกแจงทวินามและการแจกแจงทวินามเชิงลบสำหรับความสำเร็จและการทดลองnมีทั้งโอกาสL ( p | n , k )ที่เป็นสัดส่วนกับp k p n - kknL(พี|n,k)αพีkพีn-k
Sextus Empiricus

3

โครงร่างของการทดสอบ LR สำหรับข้อมูลชี้แจง

Let X1,X2,...,Xnจะเป็นตัวอย่างที่สุ่มจาก Exพี(อัตรา=λ),เพื่อให้E(Xผม)=μ=1/λ. สำหรับx>0,ฟังก์ชั่นความหนาแน่น(x)=λอี-λxและ CDF คือF(x)=1-อี-λx.

1. สถิติทดสอบคือตัวอย่างขั้นต่ำ

ให้V=X(1)=นาทีn(Xผม).แล้ว V~Exพี(nλ).เป็นโครงร่างของการพิสูจน์

P(V>โวลต์)=P(X1>โวลต์,...,Xn>โวลต์)=[อี-λโวลต์]n=อี-nλโวลต์,
เพื่อให้P(Vโวลต์)=1-อี-nλโวลต์,สำหรับโวลต์>0

ในการทดสอบH9:μμ0กับHa:μ>μ0,ที่ระดับα=5%,เราพิจารณาVเป็นสังเกตเดียวจากการกระจายการชี้แจงของตน เราพบว่าอัตราส่วนความน่าจะเป็นของบันทึกแสดงถึงการปฏิเสธเมื่อV>,ที่ P(V>|μ=μ0)=0.05

สำหรับกรณีที่เฉพาะเจาะจงในการที่n=100และμ0=10,λ0=0.1, เรามีอัตราที่ชี้แจง10=n/μ0=100/10=10,เพื่อให้=0.2295 จาก R ที่กระจายชี้แจงจะแปรโดยอัตรา

 qexp(.95, 10)
 [1] 0.2995732
 1 - pexp(0.2996, 10)
 [1] 0.04998662

ดังนั้นพลังงานกับทางเลือกμa=100 (อัตราn/μa=1)อยู่ที่ประมาณ 74%

1 - pexp(0.2996, 1)
[1] 0.7411146

2. สถิติทดสอบคือค่าเฉลี่ยตัวอย่าง

บันทึกชั้นฟอร์ดยู (หน้าสอง) แสดงให้เห็นว่าการทดสอบอัตราส่วนความน่าจะเป็นของH0:μμ0กับ H0:μ>μ0 ที่ระดับ 5% ของเสียอย่างมีนัยสำคัญสำหรับX¯>,ที่P(X¯>|μ=μ0)=0.5 นอกจากนี้สามารถแสดงให้เห็นการใช้ฟังก์ชั่นการสร้างช่วงเวลาที่ X¯~Gaม.ม.a(n,nλ).

สำหรับกรณีที่เฉพาะเจาะจงในการที่n=100และμ0=10,λ0=0.1,เรามีX¯~Gaม.ม.a(100,10),เพื่อให้=11.7

qgamma(.95, 100, 10)
[1] 11.69971
1 - pgamma(11.7, 100, 10)
[1] 0.04997338

ดังนั้นพลังงานต่อμa=14ทางเลือกที่ 14 =ประมาณ 95.6%

1 - pgamma(11.7, 100, 100/14)
[1] 0.9562513

เห็นได้ชัดว่าเพื่อวัตถุประสงค์ในการทดสอบสมมติฐานเกี่ยวกับค่าเฉลี่ยชี้แจงμ,ข้อมูลสถิติที่เพียงพอX¯ มากขึ้นกว่าข้อมูลในขั้นต่ำตัวอย่าง


ฉันไม่คิดว่าที่อยู่คำถามนี้เลยทั้งสองเป็นไปได้สัดส่วน? ก่อนอื่นคุณต้องแสดงความเป็นไปได้ของการทดลองทั้งสองนั้นให้ได้สัดส่วนไม่เช่นนั้นจะไม่ใช้หลักการความน่าจะเป็น ประการที่สองในตัวอย่างนี้การทดสอบสองรายการนำไปสู่ข้อสรุปเดียวกันดังนั้นจึงเป็นเรื่องที่ยากกว่าตัวอย่างของทวินามและทวินามลบ
statslearner2

ฉันเพิ่งตรวจสอบเอกสารความน่าจะเป็นไม่ได้สัดส่วนเนื่องจากโอกาสแรกมีในเลขชี้กำลังและอีกอันมีx iดังนั้นหลักการความน่าจะเป็นไม่ควรนำไปใช้ที่นี่มันดีสำหรับการทดสอบสองครั้งเพื่อนำไปสู่ข้อสรุปที่แตกต่างกัน กับหลักการความน่าจะเป็น โวลต์Σxผม
statslearner2

2
บรูซเพียงเพื่ออธิบายให้ชัดเจนว่าหลักการความน่าจะเป็นคืออะไร: มันบอกว่าถ้าคุณมีการทดลองสองครั้งที่ความน่าจะเป็นแตกต่างกันโดยค่าคงที่เท่านั้นคุณควรได้ข้อสรุปเดียวกันจากพวกเขา สิ่งนี้เกิดขึ้นในกรณีทวินามกับกรณีทวินามเชิงลบที่พวกมันต่างกันเฉพาะในส่วนของสัมประสิทธิ์ทวินาม (คงที่) ตัวอย่างของคุณแสดงการทดสอบสองแบบโดยที่ความน่าจะเป็นไม่ได้แตกต่างกันเพียงค่าคงที่ดังนั้น LP จึงไม่สามารถใช้งานได้
statslearner2

@ statslearner2 ฟังก์ชั่นความน่าจะเป็นสำหรับการสังเกตตัวอย่างx1,...,xnคือ นี้เป็นเหมือนกันไม่ว่าคุณเลือกขั้นต่ำหรือค่าเฉลี่ยเป็นเกณฑ์ที่จะดำเนินการทดสอบ การละเมิดที่เกิดขึ้นที่นี่สามารถเห็นได้ว่าเป็นประเภทที่คำจำกัดความของ 'กรณีที่รุนแรง' นั้นแตกต่างกันและการรวมเพื่อคำนวณค่า p จะทำแตกต่างกัน
(x1,...,xn)=Πผม=1nλอี-λxผม
Sextus Empiricus

3

การละเมิดโดยฟังก์ชั่น pdf ต่างๆ(x,θ)และก.(x,θ)

กรณีนี้จะเป็นตัวอย่างของ 'การละเมิด' เนื่องจากฟังก์ชันการแจกแจงความน่าจะเป็น(x,θ) ก.(x,θ)นั้นแตกต่างกันอย่างแท้จริง แม้ว่าและก.ต่างกันพวกมันอาจเกี่ยวข้องกับหลักการความน่าจะเป็นเพราะในการวัดค่าคงที่xพวกมันให้ฟังก์ชันเดียวกันของθ up เพื่อขยาย ความแตกต่างเปิดโอกาสให้กับ "การละเมิด"


เหรียญพลิกโดยมีหรือไม่มีกฎการหยุดที่ไม่จำเป็น

เหรียญพลิกมีหรือไม่มีกฎหยุดตัวเลือกเป็นตัวอย่างทั่วไป, PDF เป็นทวินามหรือเชิงลบทวินามที่มีฟังก์ชั่นที่แตกต่างกันในรูปแบบ PDF และนำไปสู่การคำนวณที่แตกต่างกันของ P-ค่านิยมและความเชื่อมั่น แต่พวกเขานำไปสู่ฟังก์ชั่นความน่าจะเป็นเหมือนกันสำหรับการแก้ไข ตัวอย่าง / การวัด (สูงสุดถึงการปรับขนาด)

ทวินามลบ(n|k,พี)=(n-1k-1)พีk(1-พี)n-kมีสองจำนวน(k|n,พี)=(nk)พีk(1-พี)n-k


อีกตัวอย่างสุดขั้ว

พิจารณาการวัดค่าXซึ่งกระจายออกไป

L(θ|x)=(x|θ)={0 ถ้า x<0a ถ้า 0x<1(1-a)θประสบการณ์(-θ(x-1)) ถ้า x1

ที่บางพารามิเตอร์ที่รู้จักกันว่าขึ้นอยู่กับชนิดของการทดลองและθคือพารามิเตอร์บางอย่างที่อาจจะไม่รู้จักและอาจจะอนุมานจากการวัดxaθx

สำหรับการใดก็ตามxและฟังก์ชั่นความน่าจะเป็นสัดส่วนกับฟังก์ชั่นเดียวกันกับที่มีความเป็นอิสระจาก:aa

  • ถ้าx<1ดังนั้นL(θ|x)α1
  • ถ้าx1แล้วL(θ|x)αθประสบการณ์(-θ(x-1))

แต่ถึงแม้ว่าฟังก์ชั่นความน่าจะเป็นแบบเดียวกันนั้น p-value อาจแตกต่างกันอย่างมากขึ้นอยู่กับการทดสอบ (เช่นค่าของa ) เช่นเมื่อคุณวัดx=2และทดสอบH0:θ=1เทียบกับH0:θ<1ดังนั้นค่า p คือ

P(X>2|θ=1)=(1-a)ประสบการณ์(1)


ปรีชา:เหตุผลสำหรับการละเมิดในกรณีเหล่านี้ก็คือว่า P-ค่าและการทดสอบสมมติฐานจะไม่ได้อิงกับฟังก์ชั่นความน่าจะเป็นสำหรับโดยเฉพาะอย่างยิ่งค่าสังเกตxx

ค่า p ไม่ได้ถูกคำนวณจากความน่าจะเป็น(θ|x)ด้วยxคงที่ แต่มีรูปแบบไฟล์ PDF (x|θ)กับθคงที่ซึ่งเป็นชิ้นที่แตกต่างกัน ช่วงความเชื่อมั่นค่า p-value และการทดสอบสมมติฐานนั้นต่างจากข้อมูลจากอัตราส่วนความน่าจะเป็น

p-values ​​ไม่ใช่หลักฐานจริง ๆ : p-value เกี่ยวข้องกับข้อผิดพลาดประเภทที่ 1 ซึ่งเป็นหน่วยวัดที่เกี่ยวข้องกับกลุ่มของการวัดมากกว่าการวัดเดี่ยว ข้อผิดพลาดประเภท I นี้หรือค่า p ไม่เหมือนกับ 'ความหมายที่เป็นหลักฐาน' จากฐานรากของหลักฐานทางสถิติ 'Birnbaums' สิ่งนี้เกี่ยวข้องกับปัญหามากมายเกี่ยวกับค่า pและนักวิทยาศาสตร์ค้นหาผลลัพธ์เพียงอย่างเดียวที่มีนัยสำคัญทางสถิติมากกว่าผลกระทบที่สำคัญ

เราต้องการตัวอย่างที่การอนุมานแตกต่างกันอย่างชัดเจนหรือไม่? กรณีที่รุนแรงเป็นตัวอย่างที่วางแผนไว้ กรณีดังกล่าวหรืออะไรก็ตามที่มีความแตกต่างกันอย่างมากคล้ายกันนั้นแน่นอนว่าไม่เกิดขึ้นได้ง่ายในทางปฏิบัติ มันมักจะเป็นกรณีที่ความแตกต่างจะมีขนาดเล็กเช่นในกรณีที่คุณอ้างถึงว่าโง่

เพื่อขอตัวอย่างที่หลักการความน่าจะเป็น 'เรื่องจริง' หรือที่สองการหาข้อสรุปที่แตกต่างกันนำไปสู่ผลลัพธ์ที่แตกต่างกันมากเป็นบิตของคำถามโหลด อย่างน้อยเมื่อเจตนาสำหรับคำถามนี้เกี่ยวข้องกับการโต้แย้งทางปรัชญาบางอย่าง มันเป็นคำถามที่โหลดเพราะมันอนุมานว่าหลักการที่เรื่องควรนำไปสู่ผลลัพธ์ที่แตกต่างกันมาก ในกรณีที่ใช้งานได้จริงหลาย ๆ ผลลัพธ์จะมีขนาดเล็ก (ในแง่ของค่า p ที่แตกต่างกันน้อยกว่าคำสั่งซื้อ) ฉันเชื่อว่านี่ไม่ใช่เรื่องแปลกสำหรับสองวิธีที่แตกต่างกัน แต่เป็นไปได้ทั้งวิธีที่ทำให้เกิดผลลัพธ์ที่คล้ายกันมากขึ้นหรือน้อยลง ฉันจะพิจารณาหลักการความน่าจะเป็นที่จะไม่ 'ละเมิดน้อย' เมื่อความแตกต่างมีเพียงเล็กน้อย


เกี่ยวกับกรณีที่ 1: ฉันคิดว่าการเลือกสถิติการทดสอบที่แตกต่างกันสามารถ (ควร?) ถูกมองว่าเป็นการเปลี่ยนฟังก์ชันความน่าจะเป็น
อะมีบาพูดว่า Reinstate Monica

2
@Martijn เรากำลังเลือกใช่สถิติทดสอบที่แตกต่างกันสิ่งที่สำคัญคือความน่าจะเป็นของสถิติไม่ใช่ข้อมูล มิฉะนั้นฉันสามารถใช้ลำดับการพลิก 100 ครั้งและคำนวณสถิติหลายอย่าง: จำนวนการวิ่งของหัว, จำนวนการสลับของหัวและก้อย สิ่งนี้ไม่เป็นการละเมิด LP
statslearner2

คุณต้องเลือกสองสถิติที่จะมีความเป็นไปได้ตามสัดส่วนเช่นจำนวนการทดลองจนถึง 3 ความสำเร็จหรือจำนวนความสำเร็จในการทดลอง n และอื่น ๆ
statslearner2

1

นี่คือตัวอย่างที่ดัดแปลงมาจากทฤษฎีการตัดสินใจเชิงสถิติและการวิเคราะห์แบบเบย์โดย James O. Berger (ฉบับที่สองหน้า 29)

xYH0H1

ตารางดัดแปลงมาจากทฤษฎีการตัดสินใจทางสถิติและการวิเคราะห์แบบเบย์โดย James O. Berger

H1H0

H0H0H0


หมายเหตุ : แน่นอนหนึ่งสามารถตั้งค่าการทดสอบกับกฎ“ ยอมรับH0


x=1Y=1H0Yα

ถึงกระนั้นฉันก็ยอมรับว่าตัวอย่างนี้ค่อนข้างจะถูกวางแผนและไม่ซื่อสัตย์อย่างสมบูรณ์เพราะมันเล่นกับความยากลำบากในการจัดเรียงการทดสอบด้วยข้อมูลที่ไม่ต่อเนื่อง เราสามารถหาตัวอย่างที่เทียบเท่ากับข้อมูลต่อเนื่อง แต่พวกเขาจะได้รับการวางแผนมากขึ้น ฉันเห็นด้วยกับ OP ว่าหลักการความน่าจะเป็นนั้นแทบจะไม่มีคุณค่าในทางปฏิบัติ ฉันตีความว่ามันเป็นหลักการเพื่อรับประกันความมั่นคงภายในทฤษฎี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.