การอนุมานสำหรับตัวอ่านที่สงสัย (แต่ไม่ใช่เชิงคณิตศาสตร์)


14

ฉันเพิ่งดูการบรรยายเรื่องการอนุมานเชิงสถิติ ("การเปรียบเทียบสัดส่วนและความหมาย") ซึ่งเป็นส่วนหนึ่งของคำแนะนำเกี่ยวกับสถิติหลักสูตรออนไลน์ วัสดุที่ทำให้ฉันรู้สึกเหมือนมันเป็นเรื่องเล็กน้อยเสมอ (โดยตอนนี้ฉันต้องเห็นสิ่งนี้หลายสิบครั้งกระจายออกไปในช่วงสามทศวรรษที่ผ่านมา)

ฉันกำลังมองหาหนังสือเกี่ยวกับ "basic Stats-101" (การประมาณจุด, การประเมินแบบประเมิน, การอนุมานเชิงสถิติ, การทดสอบสมมติฐาน, การออกแบบการศึกษา) ที่จริงจังกับปัญหาในการโน้มน้าวผู้อ่านที่สงสัย ...

ด้านล่างฉันให้ตัวอย่างของ ประเภทของคำถามที่ผู้เขียนที่ฉันค้นหาจะใช้เวลาอย่างจริงจังและรู้วิธีการพูดอย่างมั่นใจ

แต่ก่อนอื่นให้ฉันใช้เวลาสักครู่เพื่อเน้นว่าในโพสต์นี้ฉันไม่ได้ถามคำถามเหล่านี้ ได้โปรดอย่าตอบพวกเขา! ฉันให้พวกเขาเป็นเพียงตัวอย่างและผ่าน "การทดสอบสารสีน้ำเงิน" (สำหรับประเภทของผู้แต่งที่กำลังค้นหา)

  1. หาก "สัดส่วน" เป็นเพียงค่าเฉลี่ยของตัวแปรบูลีน (เช่นหนึ่งที่รับเฉพาะค่า 0 และ 1) ทำไมโพรซีเดอร์ที่แตกต่างกันจึงสอนให้ทำการอนุมานเชิงสถิติด้วย "สัดส่วน" และกับ "หมายถึง"?

  2. หากการแจกแจงแบบปกตินั้นแข็งแกร่งมากซึ่งสมมติว่า normality ให้ผลลัพธ์ที่ดีแม้ในกรณีที่ข้อมูลนั้นไม่ได้ถูกกระจายตามปกติและหากการแจกแจงแบบปกตินั้นดูธรรมดามากทำไมเอะอะทั้งหมดเกี่ยวกับการใช้การแจกแจงแบบ t แทน ปกติ?

  3. สิ่งที่ว่าคือ "องศาความเป็นอิสระ" และทำไมเราต้องกังวลเกี่ยวกับพวกเขา?

  4. การพูดถึงค่า "จริง" ของพารามิเตอร์หมายความว่าอย่างไรเมื่อเราเพิ่งใช้การแจกแจงที่เกิดขึ้นเพื่อให้ดูเหมือนกับข้อมูล

  5. "การวิเคราะห์ข้อมูลเชิงสำรวจ" ทำไมเป็นสิ่งที่ดีในขณะที่ "การสอดแนมข้อมูล" เป็นสิ่งที่ชั่วร้าย?

ดังที่ฉันได้กล่าวไปแล้วฉันถูกเลื่อนออกไปจากทัศนคติที่บอกเป็นนัยจากการละเลยคำถามดังกล่าว มันไม่ใช่ "ท่าทางญาณวิทยา" ที่ฉันต้องการเห็นในคนที่สอนฉันบางอย่าง ฉันกำลังมองหาผู้แต่งที่เคารพความสงสัยและความเป็นเหตุเป็นผลของผู้อ่านและผู้รู้วิธีที่จะจัดการกับพวกเขา (โดยไม่จำเป็นต้องเข้าไปในหน้าและหน้าของพิธีการและเทคนิค)

ฉันรู้ว่านี่เป็นคำสั่งซื้อที่สูงและอาจเป็นไปได้โดยเฉพาะอย่างยิ่งเมื่อมันมาถึงสถิติ ดังนั้นฉันไม่คาดหวังว่าผู้แต่งหลายคนจะประสบความสำเร็จ แต่ในขณะที่ฉันจะเป็นเนื้อหาที่มีการค้นหาเพียงหนึ่ง

ขอผมเพิ่มอีกหน่อยว่าผมไม่ชอบคณิตศาสตร์ ในทางตรงกันข้ามฉันรักคณิตศาสตร์ (ฉันพอใจกับการวิเคราะห์ [aka "แคลคูลัสขั้นสูง"], พีชคณิตเชิงเส้น, ทฤษฎีความน่าจะเป็น, แม้แต่ทฤษฎีการวัดขั้นพื้นฐาน)

ที่กล่าวว่าความสนใจของฉันในขณะนี้อยู่ใน "ใช้", "ปฏิบัติ", "ทุกวัน", "โลกแห่งความจริง" สถิติ (ตรงข้ามกับ niceties ทฤษฎี) (แต่ฉันไม่ต้องการตำราอาหารด้วย!)

FWIW ฉันได้อ่านบทแรก ๆ ของการวิเคราะห์ข้อมูลโดยใช้การถดถอยและโมเดลหลายระดับ / ลำดับชั้นโดย Gelman และ Hill และฉันชอบน้ำเสียงของผู้เขียน พวกเขามุ่งเน้นการปฏิบัติ แต่เข้าสู่ทฤษฎีเมื่อจำเป็น พวกเขามักจะถอยกลับและประเมินการปฏิบัติตามมาตรฐานอย่างยิ่งและเสนอความคิดเห็นอย่างตรงไปตรงมาซึ่งดึงดูดความสนใจของผู้อ่านที่สงสัย น่าเสียดายที่ผู้เขียนเหล่านี้ยังไม่ได้เขียนหนังสือเกี่ยวกับเรื่องที่ฉันถามในโพสต์นี้ (เรื่อง "สถิติ 101" ตามที่อธิบายไว้ข้างต้น) ฉันยังทราบด้วยว่าหนึ่งในผู้แต่งเหล่านี้ (เจลแมน) เป็นผู้ร่วมเขียนการวิเคราะห์ข้อมูลแบบเบย์ที่ได้รับการยอมรับอย่างสูงแต่อีกครั้งนี่ไม่ใช่สิ่งที่ฉันกำลังมองหาในขณะนี้

แก้ไข:

Dikran Marsupial ยกการคัดค้านดังต่อไปนี้:

ฉันไม่คิดว่าจะมีอะไรผิดปกติกับคำถามที่ถูกทอดทิ้งมีจุดที่ตอบคำถามทุกข้อที่เบี่ยงเบนความสนใจจากการแสดงแนวคิดพื้นฐานซึ่งมักจะสำคัญกว่า (โดยเฉพาะในหนังสือ 101 เล่ม!)

ฉันเห็นด้วยกับที่ มันจะแม่นยำมากขึ้นสำหรับฉันที่จะบอกว่าฉันกำลังมองหา "การดูสถิติพื้นฐานครั้งที่สอง" ในความเป็นจริงกับเรื่องนี้เป็นแรงจูงใจของฉันฉันมองไปที่หนังสือเรียนที่ใช้ในหลักสูตรระดับบัณฑิตศึกษาในการอนุมาน (พูด) และพบว่าพวกเขามากเกินไปคำถามเช่นคนที่ได้จดทะเบียนถูกทอดทิ้ง หากมีสิ่งใดพวกเขาดูเหมือนมีแนวโน้มที่จะเจาะลึกลงไปในคำถามดังกล่าว (เพื่อให้พวกเขาสามารถมุ่งเน้นไปที่เรื่องต่าง ๆ เช่นเงื่อนไขสำหรับการบรรจบกันหรืออื่น ๆ ของสิ่งนี้หรือว่า ...

ปัญหาคือว่าหนังสือขั้นสูงมากขึ้นจะถูกส่งไปยังประชากรที่แตกต่างกันอย่างรุนแรงของผู้อ่านที่หนึ่งซึ่ง "สงสัยของคนนอก" ได้รับการลดลงอย่างมาก IOW ผู้ที่รับสถิติระดับบัณฑิตศึกษาจะผ่านจุดที่ถูกรบกวนด้วยคำถามที่รบกวนฉัน. พวกเขาไม่สงสัยเกี่ยวกับสิ่งนี้อีกต่อไป (พวกเขาเอาชนะความสงสัยได้อย่างไรบางคนอาจไม่เคยรู้สึกแย่ในตอนแรกโดยเฉพาะอย่างยิ่งถ้าพวกเขาเรียนรู้สถิติของพวกเขาตั้งแต่เช้าตรู่ - ฉันรู้ว่าฉันไม่ได้เป็นนักศึกษาใหม่ที่มีความสำคัญอย่างยิ่งเช่นกันแม้ว่าฉันจะไม่ รับสถิติแล้วคนอื่น ๆ อาจมีครูที่กรอกตำราเรียนของพวกเขาสั้นลงบางคนอาจฉลาดพอที่จะหาคำตอบสำหรับคำถามเหล่านี้ด้วยตนเองใครจะรู้)


2
คำถามเหล่านั้นส่วนใหญ่ - คำถามที่เราไม่ต้องตอบ - มีคำตอบที่ดีใน CV คำถามบางข้อนั้นมีคำตอบที่ไม่สำคัญพอสมควร แต่มีคำถามกว่าพันข้อที่ผู้คนพบเจอในหัวข้อใด ๆ - คุณจะไม่พบคำอธิบายที่ครอบคลุมคำถามที่เป็นไปได้ทั้งหมดและคุณจะไม่พบคำตอบที่คาดหวังเพียงคำถามเฉพาะที่คุณมีในขณะที่ดูหรือ การอ่าน คุณอาจโดนหนึ่งหรือสองคนโดยบังเอิญ แต่โดยรวมแล้วมันเป็นมาตรฐานที่เป็นไปไม่ได้ ทำไมไม่เพียงถามคำถามเมื่อเกิดขึ้น? บนไซต์ที่ตอบคำถาม
Glen_b -Reinstate Monica

2
ฉันจะบอกว่าคำถามที่คล้ายกันเกิดขึ้นเมื่อผู้คนทำสถิติ (และหนังสือบางเล่มตอบคำถามบางข้อ) แต่ส่วนใหญ่ไม่ใช่คำถามจริงที่เกี่ยวข้องกับความสงสัย - ส่วนใหญ่เป็นคำถามที่เข้าใจง่าย เช่น "อะไรคือองศาอิสระและทำไมเราถึงสนใจ" ไม่สงสัยเลยมันขอคำอธิบายและแรงจูงใจที่ชัดเจน สาเหตุที่ผู้ใช้สถิติขั้นสูงไม่ต้องกังวลเพราะเป็นเพราะพวกเขาเข้าใจแล้วว่าทำไมพวกเขาถึงมีค่ามาก
Glen_b -Reinstate Monica

คำตอบ:


6

คุณได้รับคำแนะนำที่ดีอยู่แล้ว นี่คือบางส่วนเพิ่มเติม ก่อนอื่นบล็อกสองรายการที่ฉันอ่านเป็นระยะและบางครั้งมีการพูดถึงคำถามเช่นคุณถามตัวเอง เนื่องจากเป็นบล็อกคุณสามารถถามคำถามและรับคำตอบที่ดีมาก! พวกเขามาที่นี่:

http://andrewgelman.com/ (Andrew Gelman)

http://errorstatistics.com/ (Deborah Mayo)

และฉันคิดว่าหนังสือสองสามเล่มจะช่วยคุณ: Box, Hunter & Hunter: สถิติสำหรับนักทดลอง

ตามที่ชื่อบอกว่าเป็นหลักสูตร ("แรก" แต่จริงๆ ๆ แล้ว ... ที่สอง) สำหรับผู้ที่ต้องการออกแบบการทดลองของตนเองและวิเคราะห์พวกเขา สูงมากในส่วน "ทำไม"

จากนั้น: DR Cox: หลักการอนุมานทางสถิติหนังสืออีกเล่มที่ดีมากเกี่ยวกับ "ทำไม" ไม่ใช่ "อย่างไร"

และเนื่องจากคุณถามว่าทำไมค่าเฉลี่ยและสัดส่วนจึงแตกต่างกันนี่คือหนังสือที่ไม่ทำเช่นนั้น: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1s = หนังสือและเช่น = UTF8 & qid = 1373395118 & sr = 1-1 และคำหลัก = อิสระ + สถิติ

ต่ำในวิชาคณิตศาสตร์สูงในหลักการ


8

ฉันค่อนข้างสงสัยว่าจะมีหนังสือเล่มเดียวที่เหมาะกับคุณเนื่องจากคนแต่ละคนมักจะสงสัยเกี่ยวกับสิ่งต่าง ๆ และหนังสือถูกเขียนขึ้นสำหรับกลุ่มเป้าหมายมากกว่าเป็นรายบุคคล นี่คือหนึ่งในสิ่งที่ดีเกี่ยวกับการสอนโดยบุคคลมากกว่าแค่หนังสือซึ่งคุณสามารถถามคำถามได้ นี่เป็นเรื่องยากที่จะทำในข้อความเชิงเส้น

ฉันไม่คิดว่าจะมีอะไรผิดปกติกับคำถามที่ถูกทอดทิ้งมีจุดที่ตอบคำถามทุกข้อที่เบี่ยงเบนความสนใจจากการแสดงแนวคิดพื้นฐานซึ่งมักจะสำคัญกว่า (โดยเฉพาะในหนังสือ 101 เล่ม!)

ฉันสงสัยว่าวิธีที่ดีที่สุดคือการได้รับหนังสือที่ดีและค้นหาคำตอบสำหรับคำถามที่ยังไม่ได้ตอบที่อื่น ฉันมีชั้นวางหนังสือที่เต็มไปด้วยข้อความสถิติต่อหน้าฉันเพียงเพราะไม่มีพวกเขาคนเดียวที่ฉันต้องการ (ไม่ใช่แม้แต่หนังสือของเจย์เนส; o)

สำหรับผู้เริ่มต้นฉันคิดว่าหนังสือ"การทำความเข้าใจสถิติ"ของ Grant Foster เป็นจุดเริ่มต้นที่ดี แต่ฉันคิดว่ามันค่อนข้างธรรมดาเกินไปในกรณีนี้


1
"ฉันไม่คิดว่าจะมีอะไรผิดปกติกับคำถามที่ถูกทอดทิ้ง ... " ฉันคิดว่านี่เป็นข้อคัดค้านที่ยุติธรรม ฉันได้เพิ่มการแก้ไขในโพสต์ของฉันเพื่อแก้ไข
kjo

7

ลองเส้นทางที่แตกต่างไปจากเดิมอย่างสิ้นเชิง: รับ "ประวัติความเป็นมาของคณิตศาสตร์ (จาก 1750 ถึง 1930)" โดย Anders Hald และเรียนรู้เกี่ยวกับประวัติของหัวข้อของเรา เมื่อคุณเข้าใจการเกิดขึ้นช้าของแนวคิดของตัวแบบสถิติคำถามของคุณจะดูเล็กน้อย แบบจำลองทางสถิติทั้งสองชิ้นจะต้องมีความเข้าใจอย่างชัดเจนนั่นคือข้อมูลที่สังเกตได้XΘXΘΘXเสื้อXΘ


5
+1 ส่วนใหญ่ของสาเหตุที่กระบวนการทางสถิติปรากฏว่าน่าสงสัยเพราะมันค่อนข้างตอบโต้ได้ง่ายและการรู้คุณค่าที่ผ่านมาของสถิติในแบบที่เป็นอยู่น่าจะเป็นวิธีที่ดีสำหรับผู้สงสัย
Dikran Marsupial

2
@DikranMarsupial: อันที่จริงฉันได้อ่าน "ประวัติศาสตร์ของสถิติ" ของ Stigler อย่างแม่นยำเพื่อให้ได้สถิติที่ต่ำที่สุด และมันก็ช่วยบ้าง โชคไม่ดีที่มันตกยุคของฟิชเชอร์ vs เนย์แมนเกือบทั้งหมดเมื่อ (ฉันสงสัย) ว่ามีสิ่งแปลกประหลาดเกิดขึ้นมากมาย ฉันพยายามประมาณ 50 หน้าของหนังสือของ Hald แต่พบว่าผลงานของเขาเป็นไปไม่ได้ที่จะตามมา: พวกเขาถูกส่งไปยังผู้อ่านที่มีความเชี่ยวชาญด้านสถิติอย่างชัดเจน ... มาลองคิดดูฉันคิดว่าหนังสือเล่มหนึ่งส่งถึงคนธรรมดา สถิติแปลกเหรอ? " จะขายดี ... :)
kjo

4
IMHO การต่อต้านการหยั่งรู้ของสถิติก่อนวันที่ฟิชเชอร์ vs เนย์แมน (แม้ว่าการหยั่งรู้ไม่ได้บ่งบอกถึงประโยชน์หรือในทางกลับกัน) หนังสือของ Ian Hacking อาจจะคุ้มค่าที่จะลองดูฉันชอบ "The Emergence of Probability" ฉันพบว่าสถิติแบบเบย์นั้นง่ายกว่าที่จะเข้าใจแนวคิดมากกว่าสถิติบ่อยครั้ง แต่ก็ยากที่จะปฏิบัติในทางปฏิบัติ การเข้าใจความแตกต่างระหว่างวิธีแบบเบย์และวิธีการที่ใช้เป็นประจำช่วยให้ฉันเข้าใจวิธีการแบบใช้บ่อยได้อย่างมาก
Dikran Marsupial

1
ขอบคุณฉันจะตรวจสอบการแฮ็ก หนังสือของเขาอยู่ในสายตาของฉันเป็นเวลานานถึงแม้ว่าฉันจะเลิกอ่านเขาคิดว่าเขาเป็นศูนย์กลางของปรัชญาทฤษฎีความน่าจะเป็นมากขึ้น (เรื่องที่ฉันพบว่าน่าหลงใหลในสิทธิของตนเอง) ที่กล่าวว่าฉันรู้ว่าอย่างน้อยปัญหาของฉันบางอย่างเกี่ยวกับสถิติกระทบการตีความความน่าจะเป็นดังนั้นการอ่านแฮ็คจะดูแลอย่างน้อยการคัดค้านของฉัน
kjo

2
@ kjo ฉันอ่านลอจิกการอนุมานทางสถิติของการแฮ็กและพบว่ามันเป็น 'ปรัชญา' มาก - เขาคิดว่าความน่าจะเป็นที่ 'สนับสนุน' และลงบน Neyman-Pearson แต่เก็บไว้กับตัวอย่างง่ายๆ - ไม่พูดถึงพารามิเตอร์ที่น่ารำคาญ - การอนุมานพารามิเตอร์หรือสิ่งที่ยุ่งยาก (เว้นแต่ฉันจะลืม) อ่านแล้วคุ้มค่าแน่นอน แต่ฉันไม่แนะนำให้เริ่มด้วย
Scortchi - Reinstate Monica

6

Abelson (1995), สถิติในฐานะที่เป็นข้อโต้แย้งเบื้องต้นเป็นสิ่งเบื้องต้นและมีคำถามที่น่าสนใจที่มักทำให้ผู้เรียนสับสน

แต่บางทีคุณเพียงแค่ต้องอ่านหนังสือบางเล่มเกี่ยวกับสถิติเชิงทฤษฎี (การข้ามทุกสิ่งเกี่ยวกับการลู่เข้า, การเว้นวรรค, & c.) และแม้ว่าพวกเขาจะไม่ตอบคำถามแบบเฉพาะคุณก็จะสามารถตอบคำถามส่วนใหญ่ได้ พวกเขาด้วยตัวคุณเองและค้นหาที่เหลือตามที่ @Dikran แนะนำ

ฉันแนะนำในหัวข้ออื่นที่อ่าน Cox & Hinkley, Theoretical Statisticsหรือ Cox, หลักการอนุมานเชิงสถิติร่วมกับ Casella & Berger, อนุมานทางสถิติเพื่อทำความเข้าใจกับมุมมองที่แตกต่างกัน


1
ฉันพบว่ามันน่าสนใจ แต่ฉันไม่คิดว่ามันจะอยู่ในระดับที่คาดหวังจาก OP เลย
Gala

@Gael คุณอาจพูดถูกโดยเฉพาะอย่างยิ่งในมุมมองของการแก้ไข
Scortchi - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.