เนย์แมน - เพียร์สันบทแทรก


21

ฉันได้อ่านบทสรุปของเนย์แมน - เพียร์สัน จากหนังสือ บทนำสู่ทฤษฎีสถิติโดย Mood, Graybill และ Boes แต่ฉันไม่เข้าใจบทแทรก

ใครช่วยอธิบายบทแทรกให้ฉันด้วยคำพูดธรรมดา ๆ ได้ไหม? มันระบุว่าอะไร?

Neyman-Pearson Lemma:ให้เป็นตัวอย่างแบบสุ่มจากโดยที่เป็นหนึ่งในสองค่าที่รู้จักและและให้ได้รับการแก้ไข .X1,,Xnf(x;θ)θθ0θ10<α<1

ให้ เป็นค่าคงที่เป็นบวกและเป็นเซตย่อยของซึ่งตอบสนอง: \ text {และ} \ quad \ lambda \ ge \ quad k ^ * \ ข้อความ {ถ้า} (x_1, \ ldots, x_n) \ in \ bar C ^ * จากนั้นทดสอบ\ gamma ^ * ที่สอดคล้องกับพื้นที่วิกฤติC ^ *เป็นการทดสอบที่มีประสิทธิภาพมากที่สุดในขนาด\ alphaของ\ mathscr H_0: \ theta = \ theta_0เมื่อเทียบกับ\ mathscr H_1: \ theta = \ theta_1kCX

(1)Pθ0[(X1,,Xn)C]=α
(2)λ=L(θ0;x1,,xn)L(θ1;x1,,xn)=L0L1kif (x1,,xn)C
andλk if (x1,,xn)C¯
γCαH0:θ=θ0H1:θ=θ1

แสดงเป็นคำฉันเข้าใจว่าเกณฑ์ทั้งสองระบุ

(1) P [ปฏิเสธสมมติฐานว่างเปล่า | สมมติฐานว่างเป็นจริง] = ระดับนัยสำคัญ

(2) ปฏิเสธสมมติฐานเมื่ออัตราส่วน ,คงบวกถ้าตกอยู่ในภูมิภาคที่สำคัญλk(x1,,xn)

จากนั้นทดสอบคือการทดสอบที่มีประสิทธิภาพมากที่สุดของสมมติฐานที่เรียบง่าย

  • ทำไมมันเป็นเพียงสมมติฐานง่าย ๆ ? มันไม่สามารถใช้เป็นสมมติฐานเชิงประกอบได้ใช่หรือไม่ คำอธิบายของฉันเป็นคำที่ถูกต้องหรือไม่?

คำตอบ:


7

ฉันคิดว่าคุณเข้าใจบทแทรกได้ดี

ทำไมมันไม่ทำงานสำหรับทางเลือกคอมโพสิต? ดังที่คุณเห็นในอัตราส่วนความน่าจะเป็นเราต้องเสียบพารามิเตอร์สำหรับสมมติฐานทางเลือก หากทางเลือกคือคอมโพสิตคุณจะเสียบพารามิเตอร์ใด


1
คุณสามารถนำไปใช้กับทางเลือกอื่นได้หากอัตราส่วนความน่าจะเป็นเป็นเสียงเดียว
Michael R. Chernick

11

ฉันเพิ่งเขียนรายการในบล็อก linkedin ที่ระบุ Neyman Pearson บทแทรกในคำธรรมดาและให้ตัวอย่าง ฉันพบตัวอย่างการเปิดตาในแง่ของการให้สัญชาตญาณที่ชัดเจนเกี่ยวกับบทแทรก บ่อยครั้งที่มีความน่าจะเป็นมันขึ้นอยู่กับฟังก์ชันความน่าจะเป็นแบบมวลโดยสิ้นเชิงดังนั้นจึงง่ายต่อการทำงานมากกว่าเมื่อทำงานกับ pdf นอกจากนี้ให้คำนึงถึงฉันกำหนดอัตราส่วนความน่าจะเป็นความเป็นไปได้ของสมมติฐานทางเลือกเทียบกับสมมติฐานว่างซึ่งตรงกันข้ามกับคำสั่งบทแทรกของคุณ คำอธิบายเหมือนกัน แต่น้อยกว่าตอนนี้มากกว่า ฉันหวังว่ามันจะช่วย ...

ผู้ที่ทำงานในการวิเคราะห์ข้อมูลและผ่านหลักสูตรสถิติบางอย่างอาจรู้จัก Neyman-Pearson lemma (NP-lemma) ข้อความนั้นเรียบง่ายการสาธิตไม่มาก แต่สิ่งที่ฉันมักจะพบเจอได้ยากคือการได้รับความรู้สึกร่วมของสิ่งที่มันเป็น การอ่านหนังสือชื่อ "ข้อผิดพลาดทั่วไปในสถิติ" โดย PIGood และ JWHardin ฉันได้รับคำอธิบายและตัวอย่างที่ช่วยให้ฉันได้รับความรู้สึกเกี่ยวกับ NP-lemma ที่ฉันคิดถึงมาตลอด

ในภาษาที่ไม่สมบูรณ์แบบทางคณิตศาสตร์ 100% สิ่งที่ Neyman-Pearson บอกกับเราคือการทดสอบที่ทรงพลังที่สุดสามารถตรวจสอบสมมติฐานที่กำหนดภายในระดับความสำคัญที่กำหนดโดยเขตการปฏิเสธที่ทำโดยการสังเกตที่เป็นไปได้ทั้งหมดจาก อัตราส่วนความน่าจะเป็นสูงกว่าเกณฑ์ที่กำหนด ... woahhh! ใครบอกว่ามันง่าย!

รักษาความสงบและแยกแยะรูปแทรก:

  1. สมมติฐาน ในสถิติเรามักทำงานกับสมมติฐานสองข้อที่การทดสอบทางสถิติควรปฏิเสธหรือไม่ปฏิเสธ มีสมมติฐานว่างที่จะไม่ถูกปฏิเสธจนกว่าจะมีหลักฐานตัวอย่างที่ชัดเจนเพียงพอ นอกจากนี้ยังมีสมมติฐานทางเลือกหนึ่งที่เราจะใช้ถ้าค่าว่างดูเหมือนว่าเป็นเท็จ
  2. พลังของการทดสอบ (หรือที่เรียกว่าความไว) บอกเราว่าสัดส่วนของเวลาที่เราจะปฏิเสธสมมติฐานว่างเมื่อมันผิด เราต้องการการทดสอบที่ทรงพลังดังนั้นเวลาส่วนใหญ่ที่เราปฏิเสธสมมติฐานว่างที่เราพูดถูก!
  3. ระดับความสำคัญของการทดสอบ (หรือที่เรียกว่าอัตราการบวกที่ผิดพลาด) จะบอกเราว่าสัดส่วนครั้งใดที่เราจะปฏิเสธสมมติฐานที่ผิดพลาดเมื่อมันเป็นจริง เราต้องการระดับความสำคัญเล็กน้อยดังนั้นส่วนใหญ่ที่เราปฏิเสธสมมติฐานว่างเราไม่ผิด!
  4. เขตการปฏิเสธเนื่องจากผลการทดสอบที่เป็นไปได้ทั้งหมดภูมิภาคการปฏิเสธจะรวมผลลัพธ์ที่จะทำให้เราปฏิเสธสมมติฐานว่างเปล่าเพื่อผลประโยชน์ของทางเลือก
  5. ความน่าจะเป็นคือความน่าจะเป็นที่ได้เห็นผลลัพธ์ที่สังเกตได้จากการทดสอบที่ระบุว่าสมมติฐานว่าง (ความน่าจะเป็นของสมมติฐานว่าง) หรือทางเลือกหนึ่ง (โอกาสของสมมติฐานทางเลือก) เป็นจริง
  6. อัตราส่วนความน่าจะเป็นคืออัตราส่วนของความน่าจะเป็นสมมุติฐานทางเลือกหารด้วยความน่าจะเป็นสมมุติฐานว่าง หากผลการทดสอบคาดหวังมากหากสมมติฐานว่างเป็นจริงกับทางเลือกอื่นอัตราส่วนความน่าจะเป็นควรน้อย

คำจำกัดความเพียงพอ! (แม้ว่าคุณจะดูพวกเขาอย่างระมัดระวังคุณจะรู้ว่าพวกเขาฉลาดมาก!) ไปที่สิ่งที่เนย์แมนและเพียร์สันบอกกับเราว่า: หากคุณต้องการมีการทดสอบทางสถิติที่ดีที่สุดจากมุมมองของพลังงานเพียงแค่กำหนดขอบเขตการปฏิเสธโดยรวมถึงผลการทดสอบที่มีอัตราส่วนความน่าจะเป็นสูงสุด ผลลัพธ์จนกว่าคุณจะถึงค่าที่แน่นอนสำหรับจำนวนครั้งที่การทดสอบของคุณจะปฏิเสธสมมติฐานว่างเมื่อเป็นจริง (ระดับนัยสำคัญ)

ลองดูตัวอย่างที่หวังว่าทุกอย่างจะมารวมกัน ตัวอย่างขึ้นอยู่กับหนังสือที่กล่าวถึงข้างต้น มันถูกสร้างขึ้นอย่างสมบูรณ์ด้วยตัวเองดังนั้นจึงไม่ควรมองว่าเป็นการสะท้อนความเป็นจริงหรือความคิดเห็นส่วนตัว

ลองนึกภาพว่าเราต้องการที่จะตัดสินว่าใครบางคนกำลังสนับสนุนโควต้าการเข้าเมือง (สมมติฐานว่าง) หรือไม่ (สมมุติฐานทางเลือก) โดยถามความรู้สึกของเขา / เธอกับสหภาพยุโรป

ลองนึกภาพเรารู้ว่าการกระจายความน่าจะเป็นที่แท้จริงสำหรับคนทั้งสองประเภทเกี่ยวกับคำตอบสำหรับคำถามของเรา:

ป้อนคำอธิบายรูปภาพที่นี่

ลองจินตนาการว่าเรายินดีที่จะยอมรับข้อผิดพลาดในเชิงบวกที่ผิดพลาด 30% นั่นคือ 30% ของเวลาที่เราจะปฏิเสธสมมติฐานว่างและสันนิษฐานว่าผู้สัมภาษณ์นั้นไม่เห็นด้วยกับโควต้าเมื่อเขา / เธอเป็นจริงสำหรับพวกเขา เราจะสร้างแบบทดสอบอย่างไร

จากข้อมูลของเนย์แมนและเพียร์สันเราจะได้ผลลัพธ์ที่มีอัตราส่วนความน่าจะเป็นสูงสุด นี่คือคำตอบของ "ชอบ EU จริง ๆ " ด้วยอัตราส่วน 3 ด้วยผลลัพธ์นี้ถ้าเราคิดว่าใครบางคนขัดกับโควต้าเมื่อเขา / เธอบอกว่าเขา "ชอบ EU จริง ๆ " 10% ของเวลาที่เราจะมอบหมาย สำหรับคนโควต้าต่อต้าน (นัยสำคัญ) อย่างไรก็ตามเราจะจำแนกคนโควต้าได้อย่างถูกต้อง 30% ของเวลา (พลังงาน) เนื่องจากไม่ใช่ทุกคนในกลุ่มนี้ที่มีความคิดเห็นแบบเดียวกันเกี่ยวกับสหภาพยุโรป

สิ่งนี้ดูเหมือนว่าจะเป็นผลลัพธ์ที่แย่เท่าที่มีอำนาจเกี่ยวข้อง อย่างไรก็ตามการทดสอบไม่ได้ทำผิดพลาดมากมายในการจัดประเภทสำหรับคนโควต้า (สำคัญ) เนื่องจากเรามีความยืดหยุ่นมากขึ้นเกี่ยวกับความสำคัญลองมองหาผลการทดสอบถัดไปว่าเราควรเพิ่มคำตอบที่ปฏิเสธสมมติฐานว่าง (เขตการปฏิเสธ)

คำตอบถัดไปที่มีอัตราส่วนความน่าจะเป็นสูงที่สุดคือ "like EU" หากเราใช้คำตอบ "ชอบ" และ "ชอบ" สหภาพยุโรปเป็นผลการทดสอบที่อนุญาตให้เราปฏิเสธสมมติฐานว่างเปล่าของคนที่เป็นโควต้าเราจะทำผิดพลาดสำหรับคนโควต้าไม่ใช่ 30% ของเวลา (10% จาก "ชอบ" จริง ๆ และ 20% จาก "ชอบ") และเราจะจัดประเภทอย่างถูกต้องกับคนโควต้า 65% ของเวลา (30% จาก "ชอบ" และ 35% จาก "ชอบ") ในศัพท์แสงทางสถิติ: ความสำคัญของเราเพิ่มขึ้นจาก 10% เป็น 30% (ไม่ดี!) ในขณะที่พลังการทดสอบของเราเพิ่มขึ้นจาก 30% เป็น 65% (ดี!)

นี่คือสถานการณ์ที่การทดสอบทางสถิติทั้งหมดมี ไม่มีบางอย่างเช่นอาหารกลางวันฟรีแม้ในสถิติ! หากคุณต้องการเพิ่มพลังในการทดสอบของคุณคุณต้องเพิ่มค่าใช้จ่ายในการเพิ่มระดับความสำคัญ หรือในแง่ที่ง่ายกว่า: คุณต้องการจัดประเภทคนดี ๆ ให้ดีกว่าคุณจะต้องเสียค่าใช้จ่ายในการมีคนร้ายที่ดูดีกว่า!

โดยพื้นฐานแล้วเราเสร็จแล้ว! เราสร้างการทดสอบที่ทรงพลังที่สุดที่เราสามารถทำได้ด้วยข้อมูลที่กำหนดและระดับความสำคัญ 30% โดยใช้ป้ายกำกับ "ชอบ" และ "ชอบ" เพื่อดูว่ามีใครต่อโควต้า ... เราแน่ใจหรือไม่

จะเกิดอะไรขึ้นถ้าเราได้รวมไว้ในขั้นตอนที่สองหลังจากเลือกคำตอบ "ชอบ" จริง ๆ แล้วคำตอบ "ไม่แยแส" แทนที่จะเป็น "ชอบ"? ความสำคัญของการทดสอบจะเป็นแบบเดียวกันกับก่อนหน้านี้ที่ 30%: 10% สำหรับคนโควต้าจะตอบว่า "ชอบ" และ 20% สำหรับคนที่โควต้าจะตอบว่า "ไม่ชอบ" การทดสอบทั้งสองจะไม่ดีเท่าการแบ่งประเภทสำหรับบุคคลโควต้า อย่างไรก็ตามพลังจะแย่ลง! ด้วยการทดสอบใหม่เราจะมีพลัง 50% แทนที่จะเป็น 65% ที่เราเคยมีมาก่อน: 30% จาก "ชอบจริงๆ" และ 20% จาก "ไม่สนใจ" ด้วยการทดสอบใหม่เราจะแม่นยำน้อยลงในการระบุกับคนโควต้า!

ใครช่วยออกที่นี่ อัตราส่วนความน่าจะเป็นของเนย์แมน - บุคคลความคิดที่น่าทึ่ง! การตอบแต่ละครั้งด้วยอัตราส่วนความน่าจะเป็นที่สูงที่สุดทำให้เรามั่นใจว่าเราได้รวมการทดสอบใหม่ให้ได้มากที่สุดเท่าที่จะเป็นไปได้


ว้าวเพิ่งเห็นทุกอย่างในตารางนั้นช่วยได้หนึ่งตันและการอ้างถึงบางส่วนของมันช่วยตัน ขอขอบคุณ!
Yatharth Agarwal

5

บริบท

(ในส่วนนี้ฉันจะอธิบายการทดสอบสมมติฐานพิมพ์ข้อผิดพลาดหนึ่งและสอง ฯลฯ ในสไตล์ของฉันเองถ้าคุณพอใจกับเนื้อหานี้ให้ข้ามไปยังหัวข้อถัดไป)

Neyman เพียร์สันแทรกขึ้นมาในปัญหาของการทดสอบสมมติฐานที่เรียบง่าย เรามีการแจกแจงความน่าจะเป็นสองแบบบนพื้นที่ทั่วไปΩ : P0และP1เรียกว่า null และสมมุติฐานทางเลือก อยู่บนพื้นฐานของการสังเกตเดียวωΩเราจะต้องมากับการคาดเดาที่ของทั้งสองแจกแจงความน่าจะอยู่ในผลกระทบ การทดสอบจึงเป็นฟังก์ชั่นที่แต่ละคนωกำหนดให้เดาว่า "สมมติฐานว่างเปล่า" หรือ "สมมติฐานทางเลือก" การทดสอบสามารถระบุได้อย่างชัดเจนกับภูมิภาคที่ส่งคืน "ทางเลือก" ดังนั้นเราจึงแค่มองหาชุดย่อย (เหตุการณ์) ของพื้นที่ความน่าจะเป็น

โดยทั่วไปแล้วในแอปพลิเคชันสมมติฐานว่างจะสอดคล้องกับสถานะบางประการในขณะที่สมมติฐานทางเลือกคือปรากฏการณ์ใหม่ที่คุณกำลังพยายามพิสูจน์หรือพิสูจน์ว่าไม่จริง ตัวอย่างเช่นคุณอาจทดสอบคนเพื่อพลังจิต คุณรันการทดสอบมาตรฐานกับการ์ดที่มีเส้นหยัก ๆ หรืออะไรที่ไม่ได้และให้พวกเขาเดาจำนวนครั้ง สมมติฐานว่างคือพวกเขาจะได้รับไม่เกินหนึ่งในห้าถูกต้อง (เนื่องจากมีไพ่ห้าใบ), สมมติฐานทางเลือกคือว่าพวกเขามีพลังจิตและอาจได้รับสิทธิมากกว่า

สิ่งที่เราต้องการทำคือลดโอกาสในการทำผิดพลาดให้น้อยที่สุด น่าเสียดายที่นั่นเป็นความคิดที่ไร้ความหมาย มีสองวิธีที่คุณสามารถทำผิดได้ ทั้งสมมติฐานที่เป็นความจริงและคุณลิ้มลองωในการทดสอบของคุณ "ทางเลือก" ภูมิภาคหรือสมมติฐานทางเลือกที่เป็นความจริงและคุณลิ้มลอง "null" ภูมิภาค ทีนี้ถ้าคุณแก้ไขพื้นที่Aของพื้นที่ความน่าจะเป็น (การทดสอบ) ดังนั้นตัวเลขP0(A)และP1(Ac)ความน่าจะเป็นที่ทำให้ข้อผิดพลาดทั้งสองนั้นมีความสมบูรณ์ชัดเจน แต่เนื่องจากคุณไม่มีความคิดก่อนหน้าของ "ความน่าจะเป็นที่สมมติฐานว่างเปล่า / ทางเลือกเป็นจริง" คุณไม่สามารถได้รับความหมายที่น่าจะเป็น ความผิดพลาด" นี่เป็นสถานการณ์ที่ค่อนข้างธรรมดาในวิชาคณิตศาสตร์ที่เราต้องการ "ดีที่สุด" ของวัตถุบางคลาส แต่เมื่อคุณดูอย่างใกล้ชิดจะไม่มี "ดีที่สุด" อันที่จริงสิ่งที่เรากำลังพยายามทำคือลดขนาดP0(A)ในขณะที่เพิ่มP1(A)ให้มากที่สุดซึ่งเป็นเป้าหมายที่ชัดเจน

โปรดจำไว้ว่าตัวอย่างของการทดสอบความสามารถทางจิตนั้นฉันหมายถึงประเภทของข้อผิดพลาดที่เป็นโมฆะจริง แต่คุณสรุปทางเลือกว่า " ผิด " จริง (คุณเชื่อว่ากายสิทธิ์ของผู้ชาย แต่เขาไม่ได้) และ ความผิดพลาดประเภทอื่นในฐานะ "การหลงลืม "

บทแทรก

วิธีการของ Neyman-Pearson lemma มีดังต่อไปนี้: เราแค่เลือกความน่าจะเป็นสูงสุดของความเข้าใจผิดαที่เรายินดีที่จะทนและจากนั้นหาการทดสอบที่มีความน่าจะเป็นน้อยที่สุดของการหลงลืม ผลที่ได้คือการทดสอบดังกล่าวมักจะมีรูปแบบของการทดสอบความน่าจะเป็น - อัตราส่วน:

ข้อเสนอ (Neyman-Pearson บทแทรก)

ถ้าL0,L1มีฟังก์ชั่นความน่าจะเป็น (ไฟล์ PDF) ของโมฆะและสมมติฐานทางเลือกและα>0แล้วภูมิภาคโอห์มซึ่งจะเพิ่มP 1 ( )ในขณะที่รักษาP 0 ( ) αเป็นของ ฟอร์มAΩP1(A)P0(A)α

A={ωΩL1(ω)L0(ω)K}

สำหรับบางคนคงK>0 0 ตรงกันข้ามสำหรับใด ๆ K , การทดสอบดังกล่าวข้างต้นมีP1(A)P1(B)สำหรับการใด ๆBดังกล่าวว่าP0(B)P0(A) )

ดังนั้นทั้งหมดที่เราต้องทำคือการหาค่าคงKเช่นที่P0(A)=α α

การพิสูจน์วิกิพีเดียในเวลาเขียนเป็นข้อพิสูจน์ทางคณิตศาสตร์ที่น่าสนใจซึ่งประกอบด้วยการคาดเดารูปแบบนั้นและยืนยันว่ามันเหมาะสมที่สุด แน่นอนความลึกลับที่แท้จริงคือการที่ไม่ความคิดของการอัตราส่วนของโอกาสเกิดได้แม้มาจากและคำตอบคือ: อัตราส่วนเป็นเพียงความหนาแน่นของP1ส่วนที่เกี่ยวกับP0 0

หากคุณได้เรียนรู้ถึงความน่าจะเป็นผ่านวิธีการที่ทันสมัยกับอินทิกรัลของ Lebesgue และไม่เป็นเช่นนั้นคุณจะรู้ว่าภายใต้เงื่อนไขที่ไม่ จำกัด อย่างเป็นธรรมคุณสามารถแสดงความน่าจะเป็นหนึ่งในการวัดความน่าจะเป็นหนึ่ง ในเงื่อนไขของ Neyman เพียร์สันแทรกเรามีสองน่าจะเป็นมาตรการP0 , P1ซึ่งทั้งสองมีความหนาแน่นที่เกี่ยวกับมาตรการพื้นฐานบางอย่างมักจะเป็นตัวชี้วัดการนับในพื้นที่ต่อเนื่องหรือเกอวัดในRn n ปรากฎว่าเนื่องจากปริมาณที่เราสนใจในการควบคุมคือP0(A)เราควรรับP0เป็นตัวชี้วัดพื้นฐานของเราและดูP1ในแง่ของวิธีการที่เกี่ยวข้องกับP0ดังนั้นเราจะพิจารณาP1ที่จะได้รับโดยฟังก์ชั่นความหนาแน่นที่เกี่ยวกับP0 0

ซื้อที่ดิน

หัวใจของบทแทรกจึงเป็นดังต่อไปนี้:

μΩfΩα>0Aμ(A)αAfdμ

{ωΩf(ω)K}
K>0fB

αffαμP0fP1P0L1/L0

ABBABBABBxAf(y)>f(x)yAxyAf1([K,+))K

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.