การออกแบบการทดสอบสำหรับจิตใจที่บอกว่าเขาสามารถมีอิทธิพลต่อลูกเต๋า


11

สมมติว่าฉันมีเพื่อน (เรียกเขาว่า "จอร์จ") ที่บอกว่าเขาสามารถควบคุมการหมุนของลูกเต๋าโดยใช้ความคิดของเขา (เช่นทำให้ลูกเต๋ามีแนวโน้มที่จะลดลงตามจำนวนที่เขากำลังคิด)

ฉันจะออกแบบการทดสอบอย่างเข้มงวดทางวิทยาศาสตร์เพื่อตัดสินว่าเขาสามารถทำสิ่งนี้ได้จริงหรือไม่? (ฉันไม่คิดว่าจริง ๆ แล้วเขาสามารถทำได้ แต่ฉันต้องการให้เขาเห็นด้วยกับรายละเอียดของการทดสอบ Amazing Randi-style ก่อนการทดสอบจะเริ่มต้น) ฉันต้องการลดข้อแก้ตัวหลังการทดสอบ (น่าจะเป็นมาก) ว่าเขาจะมาด้วย

นี่คือสิ่งที่ฉันมี:

  1. กำหนดเทคนิคการทอยลูกเต๋า (ซึ่งลูกเต๋าถ้วยเชคเกอร์พื้นผิวจอด ฯลฯ )

  2. กำหนด "เซสชั่นการทดสอบ" ประกอบด้วยXม้วนลูกเต๋า สิ่งนี้จะต้องมีขนาดเล็กพอที่จะทำในการนั่ง แต่มีขนาดใหญ่พอที่จะตรวจสอบ (หลังจากการวิเคราะห์) ภายใน 95% -99% ความมั่นใจไม่ว่าลูกเต๋าตกลงยุติธรรมหรือได้รับการสนับสนุนด้านใดด้านหนึ่ง

  3. รันเซสชันYบนลูกเต๋าที่เลือก (โดยไม่มีอิทธิพลจากจอร์จ) ในฐานะ "การควบคุม" เพื่อให้แน่ใจว่าลูกเต๋าแสดงผลลัพธ์ "ยุติธรรม" ด้วยตนเอง

  4. รันเซสชันZกับ George ก่อนที่แต่ละตัวให้หมุนตายแยกต่างหากเพื่อกำหนดว่า George จะ "จดจ่อกับ" หมายเลขใดในระหว่างเซสชันทั้งหมด

  5. รวบรวมและวิเคราะห์ผลลัพธ์

  6. จอร์จทำข้อแก้ตัวบางอย่างสำหรับการทำงานที่น่าหดหู่ของเขา

ดังนั้นคำถามของฉันสำหรับคุณ:

  • ข้อบกพร่องหรือปัญหาเกี่ยวกับวิธีการโดยรวมของฉันได้อย่างไร สิ่งที่จอร์จมีแนวโน้มที่จะคัดค้าน?

  • ฉันควรใช้ D6 หรือไม่ หรือ D20 มันสำคัญไหม การตายที่มีใบหน้ามากขึ้นจะต้องใช้ม้วนกระดาษมากขึ้นเพื่อสร้างผลลัพธ์ที่มีความมั่นใจในทำนองเดียวกัน หรือตรงกันข้าม ฉันต้องการม้วนน้อยกว่ามากขึ้นเนื่องจากการพิจารณาในทางปฏิบัติ :)

  • ค่าที่เหมาะสมสำหรับX , YและZคืออะไร พวกเขาไม่เกี่ยวข้องทั้งหมด; ถ้าค่าX ที่เลือกไว้ของฉันอนุญาตให้มีความมั่นใจ 95% สำหรับหนึ่งเซสชันดังนั้น 1 ในทุก ๆ 20 เซสชันอาจ "ล้มเหลว" แม้ไม่มีอิทธิพลของจอร์จ

  • ฉันจะกำหนด "สำเร็จ" หรือ "ล้มเหลว" สำหรับแต่ละเซสชันได้อย่างไร (ฉันได้พบคำถามนี้ซึ่งผ่านรายละเอียดของการทดสอบแบบไคสแควร์ดังนั้นฉันคิดว่านั่นเป็นวิธีการประเมินผลของฉัน แต่เกณฑ์ความเชื่อมั่นที่สมเหตุสมผลคืออะไร)

  • ฉันจะกำหนด "ความสำเร็จ" หรือ "ความล้มเหลว" สำหรับการทดสอบโดยรวมได้อย่างไร จอร์จอาจ "ชนะ" เซสชั่นเดียวโดยมีโอกาสเต็มที่ แต่เขาจะต้องผ่านเซสชั่นZกี่ครั้งเพื่อผ่านการทดสอบทั้งหมด?

ฉันอาจจะวิเคราะห์ผลลัพธ์เหล่านี้ในสเปรดชีต MS Excel ถ้านั่นสร้างความแตกต่าง


หากเขาจัดการกับลูกเต๋าด้วยความคิดของเขาแล้วใครบางคนควรจะโยนพวกเขา ฉันคิดว่าสิ่งต่าง ๆ เช่น D6 หรือ D20 ควรจะถูกทิ้งไว้กับจอร์จ จอร์จบอกว่าเขาสามารถทำอะไรได้บ้าง เขาบอกว่าเขาสามารถสร้างหมายเลขเฉพาะที่เขาต้องการได้หรือไม่? ถ้าเป็นเช่นนั้นความสำเร็จจะเป็นตัวเลขของตัวเลขนั้นในขณะที่ความล้มเหลวจะเป็นอย่างอื่น
จอห์น

@ John - เขาอ้าง แต่เพียงว่าเขาสามารถทำให้ตัวเลขที่เกิดขึ้นบ่อยขึ้นกว่าที่มันจะเป็นอย่างอื่นไม่ว่าจะเสมอมาว่าจำนวน
BradC

(แต่เดิมถามคำถามรุ่นนี้ที่math.stackexchange.com/q/57624/14626 )
BradC

คำตอบของคุณเกี่ยวกับคณิตศาสตร์โดย Michael Hardy และ TonyK นั้นค่อนข้างดี
จอห์น

4
ฉันจะไม่พอใจกับระดับความเชื่อมั่นต่ำถึง 95% หรือ 99% การเรียกร้องพิเศษมักจะต้องการหลักฐานพิเศษ หรือเพื่อให้อยู่ในบริบทของเบย์มากขึ้นความเชื่อก่อนหน้าของฉันที่มีความสามารถดังกล่าวต่ำมากจนฉันต้องการหลักฐานที่ไร้สาระจำนวนมากเพื่อเปลี่ยนความเชื่อด้านหลังของฉัน
Michael McGowan

คำตอบ:


2

ฉันขอแนะนำให้วิเคราะห์สิ่งนี้ด้วยวิธีต่อไปนี้:

นับแต่ละบทบาทที่จอร์จทำนายผลไว้เป็นผลสำเร็จและอีกบทบาทหนึ่งเป็นความล้มเหลว จากนั้นคุณสามารถคำนวณความน่าจะเป็นของความสำเร็จของจอร์จได้อย่างง่ายดายและช่วงความมั่นใจ 95% หรือ 99% เขาอ้างว่าเขาสามารถทำนายผลลัพธ์ได้ "สองครั้งด้วย" เช่นเดียวกับการทอยลูกเต๋าแบบสุ่มหรือไม่? แล้ว:

H0: p> = 1/3

H1: p <1/3

(สมมติว่าเป็นตาย 6 ด้าน)

จากตรงนั้นมันค่อนข้างตรงไปตรงมาที่จะทำการทดสอบสมมติฐาน นอกจากนี้คุณสามารถคำนวณกำลังไฟฟ้าได้อย่างง่ายดาย (แม้ในบางอย่างเช่น Excel) เลือกจำนวนม้วน (เช่น 10) จากนั้นสร้างตารางที่มีความสำเร็จที่เป็นไปได้เช่นแถว (0-10) จากนั้นสำหรับแต่ละความสำเร็จให้คำนวณความน่าจะเป็นที่เขาจะประสบความสำเร็จมากมาย (ถ้าเขาจะต้องเดาซึ่งเป็นสิ่งที่เราสมมติว่าเขากำลังทำอยู่) นอกจากนี้สำหรับแต่ละค่าให้พิจารณาว่าจะนำไปสู่การปฏิเสธหรือการยอมรับค่าว่างหรือไม่ จากนั้นในการค้นหาพลังคุณสามารถรวมความน่าจะเป็นทั้งหมดที่ค่า null จะถูกปฏิเสธ


1

D20 จะต้องใช้ม้วนมากขึ้นสำหรับระดับความสำคัญเดียวกันสำหรับจอร์จที่ประสบความสำเร็จอย่างแน่นอนถ้าคุณต้องการใช้การทดสอบไคสแควร์ ฉันไม่คิดว่าคุณจะต้องทำการทดสอบ chis-square เต็มรูปแบบ คุณเพียงแค่ต้องตรวจสอบว่าลูกเต๋าหมุนหมายเลข "ที่เลือก" บ่อยกว่าโอกาส ฉันจะใช้cdf ของทวินามเพื่อคำนวณ p-value ของการหมุนหมายเลขที่เลือกบ่อยกว่าโอกาสด้วยเป็นพารามิเตอร์ทวินามสำหรับ D6 ฉันคิดว่ามันง่ายที่จะกำหนดหมายเลขตามค่า p ที่คุณต้องการสำหรับจอร์จที่ประสบความสำเร็จ ฉันไม่แน่ใจด้วยซ้ำว่าคุณต้องการเซสชัน Z ทำไมไม่เพียงแค่เรียกใช้หนึ่งเซสชันสำหรับแต่ละด้านของการตาย การสุ่มด้านที่เลือกนั้นสำคัญสำหรับสมมติฐานที่คุณสนใจหรือไม่?θ=16X


การสุ่มเลือกด้านอาจไม่สำคัญฉันแค่กังวลเกี่ยวกับA)การบัญชีสำหรับอคติที่เป็นไปได้ใด ๆ ในลูกเต๋าและB)ตรวจสอบให้แน่ใจว่าเซสชันผิดปกติใด ๆ ครั้งเดียว (1 ใน 20 เนื่องจากการสุ่มที่ฉันพูดถึง) ไม่ ไม่ได้รับการยืนยันความสามารถทางจิตของเขา อาจจะมี 6 เซสชันหนึ่งหมายเลขสำหรับแต่ละหมายเลขจะเพียงพอตราบใดที่X (และระดับความมั่นใจ) ของฉันสูงพอ
BradC
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.