ฉันหมายถึงบทความนี้: http://www.nytimes.com/2011/01/11/science/11esp.html
พิจารณาการทดลองต่อไปนี้ สมมติว่ามีเหตุผลที่เชื่อได้ว่าเหรียญถูกถ่วงน้ำหนักไว้ที่หัวเล็กน้อย ในการทดสอบเหรียญขึ้นมา 527 ครั้งจาก 1,000 ครั้ง
นี่เป็นหลักฐานสำคัญที่บ่งบอกว่าเหรียญมีน้ำหนัก
การวิเคราะห์แบบดั้งเดิมบอกว่าใช่ ด้วยเหรียญที่ยุติธรรมโอกาสที่จะได้รับ 527 หรือมากกว่าในการโยน 1,000 ครั้งนั้นน้อยกว่า 1 ใน 20 หรือ 5 เปอร์เซ็นต์ซึ่งเป็นการตัดแบบธรรมดา เพื่อนำไปใช้อีกทางหนึ่ง: การทดลองค้นหาหลักฐานของเหรียญถ่วงน้ำหนัก“ ที่มีความมั่นใจ 95 เปอร์เซ็นต์”
แต่นักสถิติหลายคนไม่ซื้อ หนึ่งใน 20 คือความน่าจะเป็นที่จะได้รับจำนวนหัวมากกว่า 526 ต่อ 1,000 ในการโยน นั่นคือมันคือผลรวมของความน่าจะเป็นในการพลิก 527, ความน่าจะเป็นของการพลิก 528, 529 และอื่น ๆ
แต่การทดสอบไม่พบตัวเลขทั้งหมดในช่วงนั้น พบว่ามีเพียงหนึ่ง - 527 มันจึงแม่นยำยิ่งขึ้นผู้เชี่ยวชาญเหล่านี้พูดว่าเพื่อคำนวณความน่าจะเป็นที่จะได้เลขหนึ่งนั่นคือ 527 - ถ้าเหรียญนั้นมีน้ำหนักและเปรียบเทียบกับความน่าจะเป็นที่จะได้หมายเลขเดียวกันถ้าเหรียญนั้น ธรรม
นักสถิติสามารถแสดงให้เห็นว่าอัตราส่วนนี้จะต้องไม่สูงกว่าประมาณ 4 ต่อ 1 ตามข้อมูลของ Paul Speckman นักสถิติที่มี Jeff Rouder นักจิตวิทยาให้ตัวอย่าง
คำถามแรก:นี่เป็นเรื่องใหม่สำหรับฉัน มีใครอ้างอิงที่ฉันสามารถหาการคำนวณที่แน่นอนและ / หรือคุณสามารถช่วยฉันได้โดยให้การคำนวณที่แน่นอนด้วยตัวคุณเองและ / หรือคุณสามารถชี้ให้ฉันไปยังเนื้อหาที่ฉันสามารถหาตัวอย่างที่คล้ายกันได้บ้าง
Bayes คิดค้นวิธีในการอัพเดทความน่าจะเป็นของสมมติฐานเมื่อมีหลักฐานใหม่เข้ามา
ดังนั้นในการประเมินความแข็งแรงของการค้นพบที่ให้มาการวิเคราะห์แบบเบย์ (เด่นชัด BAYZ-ee-un) รวมความน่าจะเป็นที่รู้จักถ้ามีจากนอกการศึกษา
มันอาจเรียกว่าเอฟเฟกต์ "ใช่ถูกต้อง" หากการศึกษาพบว่า Kumquats ลดความเสี่ยงของโรคหัวใจโดย 90 เปอร์เซ็นต์ว่าการรักษารักษาติดยาเสพติดแอลกอฮอล์ในสัปดาห์ที่ผู้ปกครองที่มีความสำคัญเป็นสองเท่าน่าจะให้กำเนิดเด็กผู้หญิงคนหนึ่งกับการตอบสนอง Bayesian ที่ คนขี้ระแวงพื้นเมือง: ใช่แล้ว ผลการศึกษาพบว่ามีน้ำหนักเทียบกับสิ่งที่สังเกตได้ในโลก
ในพื้นที่ของยาอย่างน้อยหนึ่งแห่ง - การทดสอบการตรวจคัดกรองวินิจฉัย - นักวิจัยใช้ความน่าจะเป็นที่รู้จักแล้วเพื่อประเมินผลการค้นพบใหม่ ตัวอย่างเช่นการทดสอบการตรวจจับการโกหกใหม่อาจมีความแม่นยำ 90 เปอร์เซ็นต์ตั้งค่าสถานะ 9 จาก 10 โกหกอย่างถูกต้อง แต่ถ้ามอบให้กับประชากร 100 คนที่รู้จักกันแล้วว่ารวม 10 โกหกการทดสอบนั้นน่าประทับใจน้อยกว่ามาก
มันถูกต้องระบุ 9 จาก 10 โกหกและพลาดอย่างใดอย่างหนึ่ง; แต่มันไม่ถูกต้องระบุว่า 9 จาก 90 อื่น ๆ เป็นเท็จ การหารผลบวกจริงที่เรียกว่า (9) ด้วยจำนวนคนทั้งหมดที่การทดสอบถูกตั้งค่าสถานะ (18) ให้อัตราความแม่นยำ 50 เปอร์เซ็นต์ "ผลบวกปลอม" และ "ผลลบปลอม" ขึ้นอยู่กับอัตราที่ทราบในประชากร
คำถามที่สอง:คุณจะตัดสินได้อย่างไรว่าการค้นพบใหม่เป็น "ของจริง" หรือไม่ด้วยวิธีนี้ และ: นี่ไม่ใช่กฎเกณฑ์ที่เป็นอุปสรรค 5% เนื่องจากการใช้ความน่าจะเป็นที่ตั้งค่าไว้ล่วงหน้าบางส่วนใช่หรือไม่