คุณสามารถพูดได้ว่าสถิติและความน่าจะเป็นเป็นเหมือนการชักนำและการหักเงิน?


17

ฉันได้อ่านหัวข้อนี้และดูเหมือนว่าฉันสามารถกล่าวได้ว่า:

  • สถิติ = การเหนี่ยวนำ?
  • ความน่าจะเป็น = การหักเงิน?

แต่ฉันสงสัยว่าอาจมีรายละเอียดเพิ่มเติมเกี่ยวกับการเปรียบเทียบที่ขาดหายไปหรือไม่ ตัวอย่างเช่นสถิติเท่ากับการเหนี่ยวนำหรือเป็นกรณีเฉพาะของมันหรือไม่ ดูเหมือนว่าความน่าจะเป็นกรณีย่อยของการหัก (เนื่องจากเป็นกรณีย่อยของการคิดทางคณิตศาสตร์)

ฉันรู้ว่านี่เป็นคำถามที่จู้จี้จุกจิก แต่ในแง่นี้เป็นเหตุผลที่ฉันถามมัน - เพราะฉันต้องการให้แน่ใจว่าเปรียบเทียบข้อตกลงเหล่านี้ได้อย่างแม่นยำ


ไม่ใช่เพราะมันตอบคำถามของคุณ แต่เป็นเพราะพวกเขาเชื่อมต่อกัน: stats.stackexchange.com/questions/665/ … (ฉันชอบคำตอบของ Mark / Peter) และstats.stackexchange.com/questions/2641/…
robin girard

คำตอบ:


15

ฉันคิดว่าเป็นการดีที่สุดที่จะสรุปความหมายของการให้เหตุผลเชิงอุปนัยและนิรนัยอย่างรวดเร็วก่อนที่จะตอบคำถามของคุณ

  • เหตุผลที่ต้องหักห้ามใจ: "ข้อโต้แย้งที่หักห้ามใจคือความพยายามที่จะแสดงให้เห็นว่าข้อสรุปจำเป็นต้องมาจากชุดของสถานที่การโต้แย้งแบบนิรนัยเป็นสิ่งที่ถูกต้องหากข้อสรุปไม่เป็นไปตามที่จำเป็นจากสถานที่เช่นถ้าข้อสรุปต้องเป็นจริงการโต้แย้งแบบนิรนัยคือเสียงถ้ามันถูกต้องและสถานที่นั้นเป็นจริงการโต้แย้งแบบหักล้างนั้นถูกต้องหรือไม่ถูกต้องเสียงหรือไม่ถูกผูกมัด แต่จะไม่ผิดหรือเป็นความจริง " ( ยกมาจากวิกิพีเดียเน้นเพิ่ม)

  • "เหตุผลอุปนัยยังเป็นที่รู้จักเหนี่ยวนำหรือตรรกะอุปนัยหรือคาดเดาการศึกษาในภาษาอังกฤษเป็นชนิดของเหตุผลที่ช่วยให้การเป็นไปได้ว่าข้อสรุปคือแม้เท็จที่ทุกสถานที่เป็นจริงได้. สถานที่ของการโต้แย้งตรรกะอุปนัย บ่งบอกถึงระดับของการสนับสนุน (ความน่าจะเป็นแบบอุปนัย) สำหรับข้อสรุป แต่ไม่ได้นำมาใช้นั่นคือพวกเขาไม่รับประกันความจริง "( จากวิกิพีเดียเน้นเพิ่ม)

เพื่อเน้นความแตกต่างที่สำคัญ: ในขณะที่การใช้เหตุผลแบบนิรนัยถ่ายโอนความจริงจากสถานที่ไปยังข้อสรุปการให้เหตุผลเชิงอุปนัยไม่ได้ นั่นคือในขณะที่การอนุมานเหตุผลคุณไม่เคยขยายความรู้ของคุณ (เช่นทุกอย่างอยู่ในสถานที่ แต่บางครั้งซ่อนอยู่และจำเป็นต้องแสดงผ่านการพิสูจน์) การให้เหตุผลเชิงอุปนัยช่วยให้คุณขยายความรู้ของคุณ (เช่นคุณอาจได้รับข้อมูลเชิงลึกใหม่ ๆ ยังไม่ได้มีอยู่ในสถานที่ แต่สำหรับค่าใช้จ่ายที่ไม่ทราบความจริงของพวกเขา)

สิ่งนี้เกี่ยวข้องกับความน่าจะเป็นและสถิติอย่างไร

ในสายตาของฉันความน่าจะเป็นคือการลดทอน มันเป็นสาขาของคณิตศาสตร์ ดังนั้นตามความจริงหรือความคิด (อันที่จริงน่าจะ) มันอนุมานทฤษฎี

อย่างไรก็ตามสถิติไม่จำเป็นต้องมีการเหนี่ยวนำ เฉพาะในกรณีที่คุณพยายามใช้เพื่อสร้างความรู้เกี่ยวกับเอนทิตีที่ไม่ได้รับการตรวจสอบ (เช่นการหาสถิติเชิงอนุมานให้ดูคำตอบของ onestop ด้วย) อย่างไรก็ตามถ้าคุณใช้สถิติเพื่ออธิบายตัวอย่าง (เช่นสถิติ decriptive) หรือถ้าคุณสุ่มตัวอย่างประชากรทั้งหมดมันจะยังคงเป็นการลดทอนเนื่องจากคุณไม่ได้รับความรู้หรือข้อมูลเพิ่มเติมตามที่มีอยู่แล้วในตัวอย่าง

ดังนั้นหากคุณคิดเกี่ยวกับสถิติว่าเป็นความพยายามอย่างกล้าหาญของนักวิทยาศาสตร์ที่พยายามใช้วิธีการทางคณิตศาสตร์เพื่อค้นหากฎเกณฑ์ที่ควบคุมการมีอิทธิพลซึ่งกันและกันของหน่วยงานเชิงประจักษ์ในโลกซึ่งในความเป็นจริงไม่เคยประสบความสำเร็จเลย จากทฤษฎีของเราเป็นจริง) จากนั้นใช่นี่คือการชักนำ นอกจากนี้ยังเป็นวิธีการทางวิทยาศาสตร์ตามที่ฟรานซิสเบคอนเปล่งออกมาซึ่งวิทยาศาสตร์เชิงประจักษ์ที่ทันสมัยได้ถูกก่อตั้งขึ้น วิธีการดังกล่าวนำไปสู่ข้อสรุปแบบอุปนัยซึ่งมีความเป็นไปได้สูงอย่างมากแม้ว่าจะไม่แน่นอน สิ่งนี้นำไปสู่การเข้าใจผิดในหมู่นักวิทยาศาสตร์ที่ไม่ใช่เกี่ยวกับความหมายของทฤษฎีทางวิทยาศาสตร์และหลักฐานทางวิทยาศาสตร์


Update:หลังจากอ่านคำตอบของ Conjugate Prior (และหลังจากที่คิดในชั่วข้ามคืน) ฉันต้องการเพิ่มบางอย่าง ฉันคิดว่าคำถามเกี่ยวกับการให้เหตุผลเชิงสถิติ (อนุมาน) ว่าเป็นนิรนัยหรืออุปนัยขึ้นอยู่กับว่าคุณสนใจหรือไม่นั่นคือข้อสรุปที่คุณกำลังพยายาม

หากคุณสนใจในข้อสรุปความน่าจะเป็นแล้วการใช้เหตุผลเชิงสถิตินั้นเป็นนิรนัย ซึ่งหมายความว่าหากคุณต้องการทราบว่าเช่นใน 95 จาก 100 กรณีค่าประชากรอยู่ในช่วงเวลาใดช่วงหนึ่ง (เช่นช่วงความมั่นใจ) คุณจะได้รับค่าความจริง (จริงหรือไม่จริง) สำหรับคำสั่งนี้ คุณสามารถพูดได้ (ถ้าสมมติฐานเป็นจริง) ว่าเป็นกรณีที่ 95 จาก 100 กรณีค่าประชากรอยู่ภายในช่วงเวลา อย่างไรก็ตามในกรณีเชิงประจักษ์คุณจะทราบได้ว่ามูลค่าประชากรอยู่ใน CI ที่คุณได้รับ ไม่ว่าจะเป็นหรือไม่ แต่ก็ไม่มีทางที่จะแน่ใจได้ การใช้เหตุผลเดียวกันนี้สำหรับความน่าจะเป็นใน p-value แบบดั้งเดิมและสถิติแบบเบย์ คุณสามารถมั่นใจได้เกี่ยวกับความน่าจะเป็น

อย่างไรก็ตามหากคุณสนใจข้อสรุปเกี่ยวกับหน่วยงานเชิงประจักษ์ (เช่นค่าของประชากรอยู่ที่ไหน) คุณสามารถโต้เถียงอุปนัยได้เท่านั้น คุณสามารถใช้วิธีการทางสถิติที่มีอยู่ทั้งหมดเพื่อรวบรวมหลักฐานที่สนับสนุนข้อเสนอบางอย่างเกี่ยวกับหน่วยงานเชิงประจักษ์หรือกลไกเชิงสาเหตุที่พวกเขาโต้ตอบกัน แต่คุณจะไม่มั่นใจในข้อเสนอเหล่านี้

เพื่อสรุป: จุดที่ฉันต้องการทำให้มันเป็นสิ่งสำคัญในสิ่งที่คุณกำลังมองหา ความน่าจะเป็นคุณสามารถอนุมานได้ แต่สำหรับข้อเสนอที่ชัดเจนทุกข้อเกี่ยวกับสิ่งที่คุณสามารถหาหลักฐานได้เท่านั้น ไม่. ดูการเชื่อมโยง onestop ของกับปัญหาการเหนี่ยวนำ


ขอบคุณเฮนริกความแตกต่างระหว่างคำจำกัดความ (และความคิดของคุณที่มีต่อพวกเขา) ก็มีประโยชน์
Tal Galili

การอัปเดตของคุณชัดเจนและตรงประเด็น ถ้าฉันจะให้คุณอีก (+1) ฉันจะ
Tal Galili

7

สถิติเป็นวิธีการอนุมานเพื่อการเหนี่ยวนำ พิจารณาวิธีการหลักสองวิธีในการอนุมานทางสถิติ: นักถี่และชาวเบย์

สมมติว่าคุณเป็นผู้ใช้บ่อย (ในรูปแบบของชาวประมงมากกว่า Neyman เพื่อความสะดวก) คุณสงสัยว่าพารามิเตอร์ที่น่าสนใจสำคัญใช้ค่าเฉพาะหรือไม่ดังนั้นคุณสร้างแบบจำลองเลือกสถิติที่เกี่ยวข้องกับพารามิเตอร์และทำการทดสอบ ค่า p ที่สร้างโดยการทดสอบของคุณบ่งชี้ถึงความน่าจะเป็นที่จะเห็นสถิติเป็นอย่างมากหรือสูงกว่าสถิติที่คำนวณจากตัวอย่างที่คุณมีโดยสมมติว่าแบบจำลองของคุณถูกต้อง คุณได้รับ p-value เพียงพอดังนั้นคุณจึงปฏิเสธสมมติฐานที่ว่าพารามิเตอร์ใช้ค่านั้น การให้เหตุผลของคุณหักทอน: สมมติว่าแบบจำลองนั้นถูกต้องทั้งพารามิเตอร์ใช้มูลค่าของดอกเบี้ยที่แท้จริง แต่คุณเป็นตัวอย่างที่ไม่น่าจะเห็นหรือไม่ใช้ค่าจริง

เปลี่ยนจากการทดสอบสมมติฐานเป็นช่วงความมั่นใจ: คุณมีช่วงความมั่นใจ 95% สำหรับพารามิเตอร์ของคุณซึ่งไม่มีค่าความสนใจที่สำคัญ การให้เหตุผลของคุณหักทอนอีกครั้ง: สมมติว่าแบบจำลองนั้นถูกต้องอาจเป็นหนึ่งในช่วงเวลาที่หายากเหล่านั้นซึ่งจะปรากฏ 1 ใน 20 ครั้งเมื่อพารามิเตอร์มีค่าดอกเบี้ยที่น่าสนใจจริง ๆ (เนื่องจากตัวอย่างของคุณไม่น่าจะเป็น) พารามิเตอร์ไม่ได้มีค่านั้น

ทีนี้สมมติว่าคุณเป็น Bayesian (ในสไตล์ของ Laplace แทนที่จะเป็น Gelman) สมมติฐานโมเดลและการคำนวณของคุณให้การแจกแจงความน่าจะเป็น (ด้านหลัง) มากกว่าค่าพารามิเตอร์ มวลส่วนใหญ่ของการแจกแจงนี้อยู่ไกลจากค่าดอกเบี้ยที่น่าสนใจดังนั้นคุณสรุปได้ว่าพารามิเตอร์อาจไม่มีค่านี้ เหตุผลของคุณหักทอนอีกครั้ง: สมมติว่าแบบจำลองของคุณถูกต้องและหากการกระจายก่อนหน้านี้แสดงถึงความเชื่อของคุณเกี่ยวกับพารามิเตอร์ความเชื่อของคุณเกี่ยวกับมันในแง่ของข้อมูลนั้นถูกอธิบายโดยการแจกแจงหลังซึ่งทำให้มีความเป็นไปได้น้อยมาก เนื่องจากการกระจายนี้ให้การสนับสนุนเพียงเล็กน้อยสำหรับมูลค่าของผลประโยชน์ที่สำคัญคุณอาจสรุปได้ว่าพารามิเตอร์ไม่ได้มีค่าจริง (หรือคุณอาจเป็นเนื้อหาที่ระบุความน่าจะเป็น)

ในทั้งสามกรณีคุณจะได้รับการแบ่งแยกเชิงตรรกะเพื่อยึดการกระทำของคุณซึ่งได้มาจากการอนุมาน / ทางคณิตศาสตร์จากสมมติฐาน สมมติฐานเหล่านี้มักจะเกี่ยวกับรูปแบบของวิธีการสร้างข้อมูล แต่อาจเป็นความเชื่อก่อนหน้าเกี่ยวกับปริมาณอื่น ๆ


1
ขอบคุณ Cp คุณทำให้เป็นจุดที่น่าสนใจ แม้ว่าจากมุมมองของคำตอบของเฮนริกข้างต้นคุณยังอยู่ในขอบเขตของอุปนัยเนื่องจากเหตุผลเชิงสถิติที่คุณอธิบายเป็นสิ่งที่เกี่ยวข้องกับความไม่แน่นอน
Tal Galili

โปรดดูการอัปเดตคำตอบของฉัน (หวังว่าจะเข้าใจได้) โดยที่ฉันพยายามแก้ไขปัญหาที่เกิดขึ้นที่นี่
Henrik

@Henrik นั่นชัดเจน (สำหรับฉันอย่างน้อย) เป็นเพียงความงี่เง่าเล็กน้อย: ไม่ใช่กรณีที่ "การใช้เหตุผลเดียวกันนี้สำหรับความน่าจะเป็นใน p-value แบบดั้งเดิมและสถิติแบบเบย์" สิ่งหลังจะให้ความน่าจะเป็นเหตุการณ์เดี่ยวเช่นความน่าจะเป็นที่ค่าเฉลี่ยที่แท้จริงอยู่ระหว่างค่าบางค่ากับค่าอื่น ๆ (แม้ว่าค่า caveats อื่น ๆ ของคุณจะนำไปใช้ทั้งหมด) ในขณะที่วิธีการแบบดั้งเดิม รักและแพร่หลายหวังว่าพวกเขาทำ การตีความของพวกเขาเป็นจริงตามที่คุณอธิบาย
กัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.