บทความเกี่ยวกับการใช้สถิติใน NYTimes


20

ฉันหมายถึงบทความนี้: http://www.nytimes.com/2011/01/11/science/11esp.html

พิจารณาการทดลองต่อไปนี้ สมมติว่ามีเหตุผลที่เชื่อได้ว่าเหรียญถูกถ่วงน้ำหนักไว้ที่หัวเล็กน้อย ในการทดสอบเหรียญขึ้นมา 527 ครั้งจาก 1,000 ครั้ง

นี่เป็นหลักฐานสำคัญที่บ่งบอกว่าเหรียญมีน้ำหนัก

การวิเคราะห์แบบดั้งเดิมบอกว่าใช่ ด้วยเหรียญที่ยุติธรรมโอกาสที่จะได้รับ 527 หรือมากกว่าในการโยน 1,000 ครั้งนั้นน้อยกว่า 1 ใน 20 หรือ 5 เปอร์เซ็นต์ซึ่งเป็นการตัดแบบธรรมดา เพื่อนำไปใช้อีกทางหนึ่ง: การทดลองค้นหาหลักฐานของเหรียญถ่วงน้ำหนัก“ ที่มีความมั่นใจ 95 เปอร์เซ็นต์”

แต่นักสถิติหลายคนไม่ซื้อ หนึ่งใน 20 คือความน่าจะเป็นที่จะได้รับจำนวนหัวมากกว่า 526 ต่อ 1,000 ในการโยน นั่นคือมันคือผลรวมของความน่าจะเป็นในการพลิก 527, ความน่าจะเป็นของการพลิก 528, 529 และอื่น ๆ

แต่การทดสอบไม่พบตัวเลขทั้งหมดในช่วงนั้น พบว่ามีเพียงหนึ่ง - 527 มันจึงแม่นยำยิ่งขึ้นผู้เชี่ยวชาญเหล่านี้พูดว่าเพื่อคำนวณความน่าจะเป็นที่จะได้เลขหนึ่งนั่นคือ 527 - ถ้าเหรียญนั้นมีน้ำหนักและเปรียบเทียบกับความน่าจะเป็นที่จะได้หมายเลขเดียวกันถ้าเหรียญนั้น ธรรม

นักสถิติสามารถแสดงให้เห็นว่าอัตราส่วนนี้จะต้องไม่สูงกว่าประมาณ 4 ต่อ 1 ตามข้อมูลของ Paul Speckman นักสถิติที่มี Jeff Rouder นักจิตวิทยาให้ตัวอย่าง

คำถามแรก:นี่เป็นเรื่องใหม่สำหรับฉัน มีใครอ้างอิงที่ฉันสามารถหาการคำนวณที่แน่นอนและ / หรือคุณสามารถช่วยฉันได้โดยให้การคำนวณที่แน่นอนด้วยตัวคุณเองและ / หรือคุณสามารถชี้ให้ฉันไปยังเนื้อหาที่ฉันสามารถหาตัวอย่างที่คล้ายกันได้บ้าง

Bayes คิดค้นวิธีในการอัพเดทความน่าจะเป็นของสมมติฐานเมื่อมีหลักฐานใหม่เข้ามา

ดังนั้นในการประเมินความแข็งแรงของการค้นพบที่ให้มาการวิเคราะห์แบบเบย์ (เด่นชัด BAYZ-ee-un) รวมความน่าจะเป็นที่รู้จักถ้ามีจากนอกการศึกษา

มันอาจเรียกว่าเอฟเฟกต์ "ใช่ถูกต้อง" หากการศึกษาพบว่า Kumquats ลดความเสี่ยงของโรคหัวใจโดย 90 เปอร์เซ็นต์ว่าการรักษารักษาติดยาเสพติดแอลกอฮอล์ในสัปดาห์ที่ผู้ปกครองที่มีความสำคัญเป็นสองเท่าน่าจะให้กำเนิดเด็กผู้หญิงคนหนึ่งกับการตอบสนอง Bayesian ที่ คนขี้ระแวงพื้นเมือง: ใช่แล้ว ผลการศึกษาพบว่ามีน้ำหนักเทียบกับสิ่งที่สังเกตได้ในโลก

ในพื้นที่ของยาอย่างน้อยหนึ่งแห่ง - การทดสอบการตรวจคัดกรองวินิจฉัย - นักวิจัยใช้ความน่าจะเป็นที่รู้จักแล้วเพื่อประเมินผลการค้นพบใหม่ ตัวอย่างเช่นการทดสอบการตรวจจับการโกหกใหม่อาจมีความแม่นยำ 90 เปอร์เซ็นต์ตั้งค่าสถานะ 9 จาก 10 โกหกอย่างถูกต้อง แต่ถ้ามอบให้กับประชากร 100 คนที่รู้จักกันแล้วว่ารวม 10 โกหกการทดสอบนั้นน่าประทับใจน้อยกว่ามาก

มันถูกต้องระบุ 9 จาก 10 โกหกและพลาดอย่างใดอย่างหนึ่ง; แต่มันไม่ถูกต้องระบุว่า 9 จาก 90 อื่น ๆ เป็นเท็จ การหารผลบวกจริงที่เรียกว่า (9) ด้วยจำนวนคนทั้งหมดที่การทดสอบถูกตั้งค่าสถานะ (18) ให้อัตราความแม่นยำ 50 เปอร์เซ็นต์ "ผลบวกปลอม" และ "ผลลบปลอม" ขึ้นอยู่กับอัตราที่ทราบในประชากร

คำถามที่สอง:คุณจะตัดสินได้อย่างไรว่าการค้นพบใหม่เป็น "ของจริง" หรือไม่ด้วยวิธีนี้ และ: นี่ไม่ใช่กฎเกณฑ์ที่เป็นอุปสรรค 5% เนื่องจากการใช้ความน่าจะเป็นที่ตั้งค่าไว้ล่วงหน้าบางส่วนใช่หรือไม่


3
สำหรับเหรียญที่ยุติธรรมและไม่ยุติธรรมการอ่านนี้เป็นประโยชน์: stat.columbia.edu/~gelman/research/published/diceRev2.pdf
mpiktas

คำตอบ:


31

ฉันจะตอบคำถามแรกโดยละเอียด

ด้วยเหรียญที่ยุติธรรมโอกาสที่จะได้รับ 527 หรือมากกว่าในการโยน 1,000 ครั้งนั้นน้อยกว่า 1 ใน 20 หรือ 5 เปอร์เซ็นต์ซึ่งเป็นการตัดแบบธรรมดา

n=1000พี=1/2

P(B(1000,1/2)> =527)

สามารถคำนวณได้ด้วยชุดซอฟต์แวร์สถิติใด ๆ R ให้เรา

> pbinom(526,1000,1/2,lower.tail=FALSE)
   0.04684365

ดังนั้นความน่าจะเป็นที่มีเหรียญยุติธรรมเราจะได้รับมากกว่า 526 หัวคือประมาณ 0.047 ซึ่งใกล้เคียงกับ 5% cuttoff ที่กล่าวถึงในบทความ

คำสั่งดังต่อไปนี้

เพื่อนำไปใช้อีกทางหนึ่ง: การทดลองค้นหาหลักฐานของเหรียญถ่วงน้ำหนัก“ ที่มีความมั่นใจ 95 เปอร์เซ็นต์”

เป็นที่ถกเถียงกัน ฉันลังเลที่จะพูดเพราะความมั่นใจ 95% สามารถตีความได้หลายวิธี

ต่อไปเราหันไป

แต่การทดสอบไม่พบตัวเลขทั้งหมดในช่วงนั้น พบว่ามีเพียงหนึ่ง - 527 มันจึงแม่นยำยิ่งขึ้นผู้เชี่ยวชาญเหล่านี้พูดว่าเพื่อคำนวณความน่าจะเป็นที่จะได้เลขหนึ่งนั่นคือ 527 - ถ้าเหรียญนั้นมีน้ำหนักและเปรียบเทียบกับความน่าจะเป็นที่จะได้หมายเลขเดียวกันถ้าเหรียญนั้น ธรรม

B(1000,1/2)=527B(1000,พี)=527

P(B(1000,พี)=527)P(B(1000,1/2)=527)=พี527(1-พี)473(1/2)1000.

พี

นักสถิติสามารถแสดงให้เห็นว่าอัตราส่วนนี้จะต้องไม่สูงกว่าประมาณ 4 ต่อ 1 ตามข้อมูลของ Paul Speckman นักสถิติที่มี Jeff Rouder นักจิตวิทยาให้ตัวอย่าง

พี

พี=5271000.

เราสามารถตรวจสอบว่ามันเป็นจริงสูงสุดโดยใช้การทดสอบอนุพันธ์ที่สองเช่น แทนที่มันเป็นสูตรที่เราได้รับ

(527/1000)527(473/1000)473(1/2)10004.3

ดังนั้นอัตราส่วนคือ 4.3 ต่อ 1 ซึ่งสอดคล้องกับบทความ


"ตอนนี้เพิ่มปริมาณนี้ด้วยความเคารพต่อ p": ฉันคิดว่าคุณหมายถึงย่อให้เล็กสุด
Simon Byrne

@mpiktas (+1) คำตอบที่ดี (อัปเดต)
chl

1212พี(12±ε)ε

@Simon ทำไมการแก้ไขเพื่อลดคืออะไร? ไม่พบค่า P ที่เพิ่มอัตราส่วนสูงสุดหรือไม่

@statnovice: คำตอบเวอร์ชันเดิมเปลี่ยนเป็นตัวเศษและส่วน
Simon Byrne
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.