กลยุทธ์สำหรับการแนะนำสถิติขั้นสูงให้กับผู้ชมที่หลากหลาย


26

ฉันทำงานเป็นหลักกับนักสถิติที่ไม่ใช่ในสาขาต่าง ๆ เช่นยาสังคมศาสตร์และการศึกษา

ไม่ว่าฉันจะให้คำปรึกษากับนักศึกษาระดับบัณฑิตศึกษาการช่วยเหลือนักวิจัยกับบทความหรือการตรวจสอบบทความสำหรับวารสารฉันมักจะมีปัญหาที่ใครบางคน (ลูกค้าผู้เขียนคณะกรรมการวิทยานิพนธ์บรรณาธิการวารสาร) ต้องการใช้เทคนิคที่เป็นที่รู้จักกันดี ไม่เหมาะสมหรือเมื่อมีวิธีการที่ดีขึ้น แต่ไม่ค่อยมีคนรู้จัก บ่อยครั้งที่ฉันจะอธิบายเทคนิคทางเลือก แต่จะบอกว่า "ทุกคนทำอย่างอื่น"

ฉันสนใจที่คนอื่นจะจัดการกับปัญหาเช่นนี้

ADDITIONS

@MichaelChernick แนะนำว่าฉันสามารถแบ่งปันเรื่องราวบางอย่างได้ดังนั้นฉันจะ

ขณะนี้ฉันกำลังทำงานกับคนคนหนึ่งที่ทำซ้ำกระดาษก่อนหน้านี้และเพิ่มตัวแปรอิสระหนึ่งตัวเพื่อดูว่ามันช่วย กระดาษก่อนหน้าคือตรงไปตรงมาน่ากลัว มันปฏิบัติต่อข้อมูลขึ้นอยู่กับว่าพวกเขาเป็นอิสระ; มันมากเกินไปและมีปัญหาอื่น ๆ เช่นกัน กระนั้นเขา (ลูกค้าของฉัน) ได้ส่งวิทยานิพนธ์ฉบับก่อนหน้านี้และไม่เพียง แต่ได้รับปริญญาของเขาเท่านั้น แต่ยังได้รับการยกย่องอย่างกว้างขวางสำหรับการวิจัย

หลายครั้งที่ฉันพยายามโน้มน้าวให้ผู้คนไม่แบ่งขั้วตัวแปร เรื่องนี้เกิดขึ้นบ่อยมากในทางการแพทย์ ฉันอดทนชี้ให้เห็นว่าน้ำหนักแรกเกิด dicohotomizing (พูด) เป็นปกติและต่ำ (ปกติที่ 2,500 กรัม) หมายถึงการรักษาทารก 2,499 กรัมเช่นเดียวกับ 1,400 กรัมหนึ่ง; แต่การดูแลลูกน้อย 2,501 กรัมแตกต่างกันมาก แพทย์เห็นด้วยกับฉันว่ามันโง่ จากนั้นบอกว่าจะทำอย่างนั้น

ฉันมีลูกค้านักศึกษาระดับบัณฑิตศึกษามานานซึ่งคณะกรรมการยืนยันในการวิเคราะห์กลุ่ม นักเรียนไม่เข้าใจวิธีการวิธีนี้ไม่ได้ตอบคำถามที่มีประโยชน์ แต่นั่นคือสิ่งที่คณะกรรมการต้องการดังนั้นนั่นคือสิ่งที่พวกเขาได้รับ

กราฟฟิคสถิติทั้งหมดเป็นที่ที่หลาย ๆ คน "นี่คือวิธีที่คุณปู่ทำ" เพียงพอแล้ว

จากนั้นก็มีคนที่ดูเหมือนจะเพิ่งกดปุ่ม ฉันจำได้หนึ่งงานนำเสนอ (ไม่ใช่โดยคนที่ฉันช่วย!) ที่ทำแบบสอบถามทั้งหมดและวิเคราะห์ปัจจัย หนึ่งในตัวแปรที่เธอรวมคือหมายเลขประจำตัวประชาชน!

เอ๋ย


6
Peter, Meta สำหรับคำถามเกี่ยวกับเว็บไซต์นี้ ฉันสงสัยว่าคุณอาจกำลังคิดเกี่ยวกับสถานะ "ชุมชน Wiki" ซึ่งเป็นคำถามที่มีประโยชน์และน่าสนใจซึ่งไม่น่าจะมีคำตอบที่ดีที่สุดอย่างเป็นกลาง (หรือน่าจะต้องการความร่วมมือในการตอบคำถาม) ดังนั้นฉันได้ตีความข้อเสนอแนะของคุณเป็นคำขอ CW และดำเนินการนั้น
whuber

1
บันทึกย่อเกี่ยวกับการแบ่งแยกขั้ว: จริง ๆ แล้วฉันคิดว่านี่เป็นสัญชาตญาณผิดจากคนที่รู้ว่า "นิด ๆ หน่อย ๆ " ของสถิติ ในสาขาที่คุณพูดถึงฉันจะจินตนาการว่าการวิเคราะห์จำนวนมากจะเหมาะกับการตัดสินใจ (เช่นฉันควรเริ่มรักษาโรค X หรือ Y หรือไม่) นี่คือ dichotomus - และมักจะเป็นขั้วคู่ที่มีประโยชน์ หากคุณมีตัวแปรจำนวนน้อยเท่านั้นการวิเคราะห์การตัดสินใจหรือการทดสอบสมมติฐานที่เหมาะสมอาจเลียนแบบสิ่งนี้ - เราอาจมี "ถ้า x> 10 ใช้ตัวเลือก 1 หรือเลือกใช้ตัวเลือก 2"
ความน่าจะเป็นเชิง

1
นอกจากนี้การวิเคราะห์ตามตัวแปรแบบแบ่งส่วนก็ง่ายต่อการจดจำหากคุณไม่สามารถเข้าถึงคอมพิวเตอร์ได้
ความน่าจะเป็นทางการ

2
ในจิตวิทยาคนมักจะแบ่งขั้วหรือปริมาณเพราะใช้ ANOVA ไม่ใช่การถดถอย มันทำให้ฉันเป็นบ้า ที่ไหนสักแห่งในสถิติ Vanderbilt wiki biostat.mc.vanderbilt.edu/wiki/Mainมีการสาธิตที่ยอดเยี่ยมของความเสียหายที่น่ากลัวที่เกิดจากการแบ่งขั้ว แต่ฉันไม่สามารถหามันพบโชคไม่ดี ฉันคิดว่ามันมีอยู่แล้ว น่าจะมี Evernoted เมื่อฉันมีโอกาส
Chris Beeley

2
จากประสบการณ์ที่ จำกัด ของฉันในอุตสาหกรรมประกันภัยฉันพบว่าเมื่อแบบจำลองการทำนายได้ถูกพัฒนาขึ้นมันจะมีชีวิตเป็นของตัวเองและจะยังคงมีการทำซ้ำ (อาจมีค่าสัมประสิทธิ์ที่ได้รับการปรับปรุง) เป็นเวลาหลายปี เชย ตัวอย่างเช่นการปรับรูปแบบเก่าที่กำหนดอัตรานโยบายการประกันสุขภาพเป็นเรื่องใหญ่เนื่องจากอัตราของคนบางคนก็อาจกระโดดขึ้นรูปแบบใหม่จะต้องเป็นธรรมกับหน่วยงานกำกับดูแลและอื่น ๆ
RobertF

คำตอบ:


16

นี่เป็นคำถามที่ยุ่งยาก!

ก่อนอื่นให้คิดบางอย่างว่าทำไมสิ่งนี้ถึงเกิดขึ้น ฉันทำงานในพื้นที่ที่ (หรืออย่างน้อยควร ) ใช้ประโยชน์จากสถิติอย่างกว้างขวาง แต่ในกรณีที่ผู้ปฏิบัติงานส่วนใหญ่ไม่ใช่ผู้เชี่ยวชาญด้านสถิติ ดังนั้นฉันจึงเห็นว่า "ฉันใส่เวกเตอร์ไว้ในฟังก์ชั่นการทดสอบ t ของ excel และตัวเลขนี้ก็หลุดออกดังนั้นสถิติของฉันจึงได้รับการสนับสนุน"

เหตุผลหลักที่ฉันเห็นในเหตุการณ์นี้คือการขาดความรู้ทางสถิติเริ่มต้นที่ด้านบน หากผู้ตรวจสอบและคณะกรรมการวิทยานิพนธ์ของคุณไม่ได้รับการปรับปรุงเกี่ยวกับเทคนิคทางสถิติคุณจำเป็นต้องแสดงให้เห็นถึงการใช้สิ่งที่ "ผิดปกติ" ตัวอย่างเช่นในวิทยานิพนธ์ฉันเลือกใช้แผนการไวโอลินแทนแผนการแปลงเพื่อแสดงรูปร่างของการแจกแจง การใช้เทคนิคนี้จำเป็นต้องใช้เอกสารมากมายในวิทยานิพนธ์เช่นเดียวกับการอภิปรายเป็นเวลานานในการป้องกันของฉันที่ทั้งหมดของสมาชิกในคณะกรรมการอยากจะรู้ว่าสิ่งพล็อตแปลกนี่หมายความว่าแม้จะมีทั้งคำอธิบายในข้อความและอ้างอิงถึงแหล่งข้อมูล . ถ้าฉันเพิ่งใช้พล็อตกล่อง (ซึ่งแสดงให้เห็นน้อยกว่าอย่างเคร่งครัด ข้อมูลในกรณีนี้และสามารถหลอกลวงผู้ดูเกี่ยวกับรูปร่างของการแจกจ่ายได้อย่างง่ายดายหากมีหลายแบบ) ไม่มีใครพูดอะไรได้เลยและการป้องกันของฉันจะง่ายขึ้น

ประเด็นก็คือผู้ปฏิบัติงานในสาขาที่ไม่ใช่สาขาวิชาต้องเผชิญกับทางเลือกที่ยากลำบาก: เราสามารถอ่านและใช้วิธีการที่ถูกต้องซึ่งก่อให้เกิดงานจำนวนมาก หรือเราก็สามารถไปกับกระแสที่ได้รับตรายางในเอกสารและวิทยานิพนธ์ของเราและให้ใช้ไม่ถูกต้อง แต่เดิมวิธีการ

ตอนนี้เพื่อตอบคำถามของคุณ:

ฉันคิดว่าวิธีการที่ดีคือการเน้นถึงผลที่ตามมาของความล้มเหลวในการใช้เทคนิคที่ถูกต้อง สิ่งนี้อาจนำมาซึ่ง:

  • การยกตัวอย่างโลกแห่งความจริงว่าผู้คนในสาขาของตนประสบกับผลของการอนุมานที่ไม่ดี วิธีนี้ง่ายกว่าในบางสาขา ตัวอย่างที่อาชีพที่ได้รับความเสียหายนั้นดีเป็นพิเศษ

  • การอธิบายว่าการวิเคราะห์ที่ไม่ถูกต้องสามารถทำให้คุณตกอยู่ในสถานการณ์ที่ผลลัพธ์ของคุณไม่น่าจะโอนไปสู่โลกแห่งความเป็นจริงซึ่งอาจทำให้เกิดอันตราย (เช่นในสาขาของฉันถ้าต้นแบบระบบ AI ของคุณปรากฏดีกว่าการแข่งขันทางสถิติ เช่นเดียวกันจากนั้นใช้เวลา 6 เดือนในการสร้างการใช้งานอย่างเต็มรูปแบบเป็นความคิดที่ไม่ดีจริงๆ

  • เลือกเทคนิคที่จะช่วยให้ผู้ใช้ประหยัดเวลาได้มาก มีเวลาเพียงพอเพื่อให้พวกเขาสามารถใช้สิ่งที่พวกเขาบันทึกไว้อธิบายเทคนิคต่าง ๆ เพื่ออัพที่สูงขึ้น


1
การอภิปรายที่ดีและคำตอบที่ดี +1
Michael R. Chernick

Good points @John
Peter Flom - Reinstate Monica

1
+1 สำหรับการชี้ให้เห็นผลที่ตามมา มันสามารถทำสิ่งมหัศจรรย์ที่ทำให้คนเปลี่ยนไปใช้วิธีที่ดีกว่า
Leo

9

การพูดจากมุมมองของนักจิตวิทยาที่มีความซับซ้อนทางสถิติเพียงเล็กน้อย: เมื่อคุณแนะนำวิธีการนี้ให้แนะนำเครื่องมือด้วย ถ้าคุณบอกนักวิจัยส่วนใหญ่ในสาขาของฉันเรื่องยาวเกี่ยวกับวิธีการใหม่ที่ยอดเยี่ยมพวกเขาจะใช้เวลาตลอดทั้งกังวลว่า punchline คือ "และสิ่งที่คุณต้องทำคือแปรงขึ้นบนแคลคูลัสเชิงอนุพันธ์แล้วใช้เวลาสอง หลักสูตรฝึกอบรมสัปดาห์! " (หรือ "และซื้อแพ็คเกจสถิติ $ 2,000!" หรือ "และปรับใช้ Python และ R code 5000 บรรทัด!") ในขณะที่หากมีการใช้งานวิธีการที่มีอยู่ในแพคเกจสถิติที่พวกเขาใช้อยู่แล้วหรือในซอฟต์แวร์ฟรีที่มี GUI ที่เข้าใจได้และพวกเขาสามารถเพิ่มความเร็วได้ในหนึ่งหรือสองวันพวกเขาอาจยินดีมอบ มันลอง

ฉันรู้ว่าวิธีการนี้ดูเหมือนจะไม่ดีและไม่เป็นวิทยาศาสตร์ แต่เป็นเรื่องง่ายสำหรับผู้ที่ต้องกังวลเมื่อพวกเขากังวลเกี่ยวกับเงินช่วยเหลือและสิ่งตีพิมพ์และไม่เห็นการเรียนรู้คณิตศาสตร์จำนวนมากเท่าที่จะช่วยให้พวกเขาทำงานได้


2
@octem ผู้ตรวจสอบไม่สามารถเชื่อใจนักสถิติเพื่อทำส่วนหนึ่งของการทำงานร่วมกัน สาเหตุที่ผู้ตรวจสอบต้องการเครื่องมือ ฉันเปรียบสิ่งนี้กับแพทย์เพื่อย้อนกลับตาราง เขาจะรู้สึกอย่างไรถ้าฉันบอกว่าให้ฉันสอนอย่างรวดเร็วเกี่ยวกับวิธีการทำศัลยกรรมนี้และฉันจะไปข้างหน้าและทำเพื่อคุณ ฉันคิดว่าน่าตกใจและ dsimay และมันผิดกฎหมายสำหรับฉันที่จะฝึก mewdicine โดยไม่มีใบอนุญาต นั่นอาจเป็นสิ่งที่ดี แต่นักสถิติไม่สมควรได้รับความเคารพเท่าเทียมกัน เหตุใดจึงคาดหวังว่าฉันจะให้เครื่องมือแก่เขาและปล่อยให้เขาแฮ็คเมื่อขาดการฝึกฝน
Michael R. Chernick

2
ในจิตวิทยาสังคมมันไม่ปกติที่จะมีนักสถิติ (เพราะมันไม่ใช่เรื่องปกติที่จะมีเงินทุนเพียงพอที่จะจ่ายให้นักสถิติ) ตอนนี้ฉันอยู่ในจิตวิทยาสาธารณสุข / สุขภาพ โดยทั่วไปแล้วเงินช่วยเหลือส่วนใหญ่จะรวมถึงเงินเดือนสำหรับนักสถิติ แต่งานของเราจำนวนมากได้ดำเนินการในโครงการนำร่องเล็ก ๆ ที่เราไม่สามารถจ่ายเงินเดือนให้กับ PI ได้ นั่นคือมุมมองที่ฉันมาจาก ... หากคุณอยู่ในสาขาที่โครงการส่วนใหญ่มีนักสถิติที่ผ่านการฝึกอบรมฉันเห็นด้วยว่าการต่อต้านแบบนี้จะไม่สมเหตุสมผล
octern

1
@octem ขอบคุณสำหรับการตอบสนอง เพียงแค่ติดตามด้วยการเปรียบเทียบ มีเวลาที่การทำแท้งเป็นสิ่งผิดกฎหมายในสหรัฐอเมริกาและผู้หญิงบางคนไปประเทศอื่นหรือทำในห้องด้านหลังอย่างผิดกฎหมายโดยไม่มีเงื่อนไขปลอดเชื้อและมีความเสี่ยงต่อสุขภาพ มันอาจดูไม่เหมือนการเปรียบเทียบที่ยอดเยี่ยม แต่ไม่สามารถที่จะจ่ายค่าสถิติให้กับผู้ที่มีฐานะต่ำต้อยได้? ฉันรู้ว่ายาเป็นสิ่งมีชีวิตหรือความตายมากกว่า แต่วิทยาศาสตร์ที่ไม่ดีก็มีผลกระทบที่เลวร้ายเช่นกัน? การใช้ข้อมูลในทางที่ผิดอาจนำไปสู่การฝึกยาที่ไม่ดีเพราะยาที่ไม่ปลอดภัยจะถูกใช้เมื่อไม่ควรใช้
Michael R. Chernick

@MichaelChernick ดูฉันไม่มีความสุขกับสถานะของการวิเคราะห์ทางสถิติในสังคมศาสตร์เช่นกัน แต่คำถามก็คือจะให้นักวิจัยใช้วิธีการทางสถิติแบบใหม่ได้อย่างไรและฉันจะให้คำตอบที่เหมาะสมกับกลุ่มนักวิจัยจำนวนมากไม่ว่าเราจะชอบหรือไม่ก็ตาม
octern

1
@octem ยุติธรรมเพียงพอและฉันคิดว่าฉันเข้าใจ ฉันให้ upvote ก่อนที่ฉันจะถามคำถาม ทัศนคติของผู้สืบสวนที่จะคิดว่าวิธีที่ถูกคือวิธีที่จะไปคือสิ่งที่ฉันกำลังตั้งคำถามและไม่ใช่ความจริงที่ว่าคุณรับรู้ปัญหาที่มีอยู่ มันทำและฉันเห็นด้วยกับคุณที่นั่น แต่อย่างใดในระยะยาวฉันคิดว่าเราแค่ต้องได้รับความเคารพและการยอมรับมากขึ้นว่างานของเรานั้นไม่สำคัญ
Michael R. Chernick

6

ขอบคุณสำหรับคำถามที่ดีนี้ปีเตอร์ ฉันทำงานที่สถาบันการวิจัยทางการแพทย์และจัดการกับแพทย์ที่ทำวิจัยและตีพิมพ์ในวารสารทางการแพทย์ บ่อยครั้งที่พวกเขาสนใจที่จะตีพิมพ์บทความมากกว่า "การทำสถิติให้ถูกต้อง" ดังนั้นเมื่อฉันเสนอเทคนิคที่แปลกประหลาดพวกเขาจะชี้ไปที่เอกสารที่คล้ายกันและพูดว่า "ดูว่าพวกเขาทำแบบนี้และได้รับผลการตีพิมพ์"

มีปัญหาฉันคิดว่าเมื่อบทความที่ตีพิมพ์ไม่ดีจริง ๆ และมีข้อผิดพลาด เป็นเรื่องยากที่จะโต้แย้งแม้ว่าฉันจะมีชื่อเสียงที่ดี เอกสารบางอย่างมีอัตตาขนาดใหญ่และคิดว่าพวกเขาสามารถเรียนรู้ได้เกือบทุกอย่าง ดังนั้นพวกเขาจึงคิดว่าพวกเขาเข้าใจสถิติเมื่อพวกเขาไม่ทำและสามารถยืนหยัดได้ มันน่าหงุดหงิด เมื่ออยู่ในการทดสอบและ Wilcoxon เหมาะสมกว่าฉันจะให้พวกเขาทำการทดสอบ Wilk Shapiro และหากการปฏิเสธความเป็นปกติเรารวมทั้งวิธีการและอธิบายว่าทำไม Wilcoxon ถึงดีกว่า บางครั้งฉันสามารถโน้มน้าวใจพวกเขาและบ่อยครั้งที่พวกเขาพึ่งพาฉันสำหรับสถิติดังนั้นฉันจึงมีอิทธิพลมากกว่านี้เล็กน้อยจากนั้นอาจมีที่ปรึกษาทั่วไป

ฉันวิ่งเข้าไปในสถานการณ์ที่ฉันทำเส้นโค้ง Kaplan-Meier สำหรับพวกเขาและเราใช้การทดสอบยศล็อก แต่ Wilcoxon ให้ผลที่แตกต่าง มันยากสำหรับฉันที่จะตัดสินใจและในสถานการณ์เช่นนี้ฉันคิดว่ามันเป็นการดีที่สุดที่จะนำเสนอทั้งสองวิธีและอธิบายว่าทำไมพวกเขาถึงแตกต่างกัน เช่นเดียวกันกับการใช้ Peto vs Greenwood ช่วงความเชื่อมั่นสำหรับเส้นโค้งการอยู่รอด การอธิบายสมมติฐานความเป็นอันตรายของสัดส่วนคอคส์นั้นทำได้ยากและพวกเขามักจะตีความอัตราต่อรองที่ผิดพลาดและความเสี่ยงสัมพัทธ์

ไม่มีคำตอบง่ายๆ ฉันมีเจ้านายที่นี่ซึ่งเป็นนักวิจัยด้านการแพทย์ชั้นนำด้านโรคหัวใจและบางครั้งเขาก็เป็นผู้ตัดสินวารสาร เขากำลังดูกระดาษที่เกี่ยวข้องกับการวินิจฉัยและใช้ AUC เป็นตัวชี้วัด เขาไม่เคยเห็นโค้ง AUC มาก่อนและมาหาฉันเพื่อดูว่าฉันคิดว่ามันถูกต้องหรือไม่ เขามีข้อสงสัย มันกลับกลายเป็นว่าเหมาะสมและฉันอธิบายให้เขาฟังอย่างดีที่สุดเท่าที่จะทำได้

ฉันพยายามบรรยายเกี่ยวกับชีวสถิติกับแพทย์และได้สอนชีวสถิติในโรงเรียนสาธารณสุข ฉันพยายามทำมันให้ดีกว่าที่คนอื่นมีและผลิตหนังสือสำหรับวิชาเอกวิทยาศาสตร์สุขภาพในปี 2545 โดยนักระบาดวิทยาในฐานะผู้เขียนร่วม ไวลีย์ต้องการให้ฉันทำฉบับที่สองตอนนี้ ในปี 2554 ฉันตีพิมพ์หนังสือที่กระชับยิ่งขึ้นซึ่งฉันพยายามปกปิดเฉพาะสิ่งจำเป็นเพื่อให้ MD ที่ยุ่งอาจใช้เวลาอ่านและอ้างอิงอีกครั้ง นั่นคือวิธีที่ฉันจัดการกับมัน บางทีคุณสามารถแบ่งปันเรื่องราวของคุณกับเรา


นี่เป็นจุดที่ดี @Michael ฉันจะเพิ่มบางเรื่อง
Peter Flom - Reinstate Monica

1
@ PeterFlom ฉันคิดว่าเราอาจมีประสบการณ์ที่คล้ายกันมาก ฉันคิดว่าคุณได้รับคำตอบที่ดีมาก ๆ จากคำตอบของคนอื่น
Michael R. Chernick

6

เข้าสู่ระบบ(x); x(1,2)? 


ในอาชีพของฉันฉันทำงานวิจัยแบบสหวิทยาการจำนวนมากและทำให้ฉันทำงานอย่างใกล้ชิดกับนักวิจัยการใช้สารเสพติดนักระบาดวิทยานักชีววิทยานักชีววิทยาและแพทย์ในหลาย ๆ ครั้ง โดยทั่วไปแล้วการวิเคราะห์นี้เกี่ยวข้องกับข้อมูลที่ "กระป๋อง" วิธีการปกติจะล้มเหลวด้วยเหตุผลต่าง ๆ (เช่นการรวมกันของการสุ่มตัวอย่างลำเอียงและกลุ่มรวมยาวและ / หรือดัชนีข้อมูลเชิงพื้นที่) ฉันยังใช้เวลาสองสามปีในการให้คำปรึกษาในบัณฑิตวิทยาลัยซึ่งฉันได้ทำงานกับผู้คนจากหลากหลายสาขา ดังนั้นฉันต้องคิดเกี่ยวกับเรื่องนี้มาก

ประสบการณ์ของฉันคือสิ่งที่สำคัญที่สุดคือการอธิบายว่าทำไมวิธีการบรรจุกระป๋องปกติไม่เหมาะสมและดึงดูดความปรารถนาของบุคคลที่จะทำ ไม่มีนักวิจัยที่มีหน้ามีตาต้องการเผยแพร่สิ่งที่ทำให้เข้าใจผิดอย่างโจ่งแจ้งในบทสรุปเนื่องจากการวิเคราะห์ทางสถิติที่ไม่เหมาะสม ฉันไม่เคยเจอใครบางคนที่พูดอะไรบางอย่างตามแนวของ"ฉันไม่สนใจว่าการวิเคราะห์นั้นถูกต้องหรือไม่ฉันแค่อยากจะตีพิมพ์"แม้ว่าฉันจะแน่ใจว่ามีคนเช่นนี้อยู่ - การตอบสนองของฉันจะต้อง ยุติความสัมพันธ์ทางอาชีพหากเป็นไปได้ ในฐานะนักสถิติเป็นชื่อเสียงของฉันที่อาจเสียหายได้ถ้ามีคนที่รู้ว่าสิ่งที่พวกเขากำลังพูดถึงเกิดขึ้นเพื่ออ่านกระดาษ

ผมยอมรับว่ามันสามารถเป็นสิ่งที่ท้าทายที่จะโน้มน้าวให้คนที่วิเคราะห์โดยเฉพาะอย่างยิ่งไม่เหมาะสม แต่ผมคิดว่าเป็นสถิติที่เราควรจะ(ก)มีความรู้ที่จำเป็นในการรู้ว่าสิ่งที่สามารถไปผิดกับ "กระป๋อง" วิธีการและ(ข)มี ความสามารถในการอธิบายมันเป็นวิธีที่เข้าใจได้อย่างสมเหตุสมผล ส่วนหนึ่งของงานของคุณคือการทำงานกับผู้ที่ไม่ใช่นักสถิติ (และแม้ว่าบางครั้งถ้าคุณเป็นผู้เชี่ยวชาญด้านสถิติ / คณิตศาสตร์) เว้นแต่ว่าคุณกำลังทำงานเป็นสถิติหรืออาจารย์คณิตศาสตร์

เกี่ยวกับ(ก)หากนักสถิติไม่มีความรู้นี้ทำไมพวกเขาถึงไม่ยอมให้วิธีการบรรจุกระป๋อง? หากนักสถิติบอกว่า "ใช้แบบจำลองเอฟเฟกต์แบบสุ่ม" แต่ไม่สามารถอธิบายได้ว่าทำไมการสมมติความเป็นอิสระนั้นเป็นปัญหาพวกเขาก็ไม่ผิดที่จะให้ความเชื่อในแบบเดียวกับที่ลูกค้าเป็น? นักวิจารณ์นักสถิติหรือไม่สามารถวิจารณ์วิพากษ์ของวิธีการสร้างแบบจำลองทางสถิติเพราะเรามาเผชิญหน้ากัน - ทุกรุ่นผิด แต่มันต้องใช้ความเชี่ยวชาญในการรู้ว่าสิ่งที่ผิดพลาด

เกี่ยวกับ(b)ฉันพบว่าภาพกราฟิกที่แสดงถึงสิ่งที่อาจผิดพลาดโดยทั่วไปคือ "hit home" มากที่สุด ตัวอย่าง:

  • x

  • Y=xx(0,1)Y=1x>1พีxY

  • สถานการณ์ทั่วไปอีกอย่าง (ที่กล่าวถึงโดยปีเตอร์) คือการอธิบายว่าทำไมการสมมติความเป็นอิสระเป็นความคิดที่ไม่ดี ตัวอย่างเช่นคุณสามารถแสดงด้วยพล็อตที่โดยอัตโนมัติความสัมพันธ์เชิงบวกมักจะผลิตข้อมูลที่ "คลัสเตอร์" มากกว่าและความแปรปรวนจะประมาทด้วยเหตุผลดังกล่าวโดยให้ปรีชาว่าทำไมข้อผิดพลาดมาตรฐานไร้เดียงสาจึงมีขนาดเล็กเกินไป หรือคุณสามารถพล็อตข้อมูลด้วยเส้นโค้งที่พอดีซึ่งสันนิษฐานว่าเป็นอิสระและสามารถมองเห็นได้ว่ากลุ่มมีผลต่อความพอดีอย่างไร (ลดขนาดตัวอย่างได้อย่างมีประสิทธิภาพ) ในลักษณะที่ไม่ปรากฏในข้อมูลอิสระ

มีตัวอย่างอีกนับล้านตัวอย่าง แต่ฉันกำลังทำงานกับข้อ จำกัด ด้านพื้นที่ / เวลาที่นี่ :) เมื่อรูปภาพไม่ทำอะไรไม่ว่าด้วยเหตุผลใดก็ตาม (เช่นแสดงให้เห็นว่าทำไมวิธีการหนึ่งที่ไม่ได้รับผลกระทบ) จากนั้นตัวอย่างการจำลองก็เป็นตัวเลือก เป็นครั้งคราว


3

บางความคิดแบบสุ่มเพราะนี่เป็นปัญหาที่ซับซ้อน ...

ฉันรู้สึกว่าปัญหาใหญ่คือการขาดการศึกษาคณิตศาสตร์ในหลากหลายสาขาวิชาชีพและหลักสูตรที่สำเร็จการศึกษา

หากไม่มีความเข้าใจทางคณิตศาสตร์เกี่ยวกับสถิติมันจะกลายเป็นกลุ่มของสูตรที่ใช้ตามกรณี

นอกจากนี้เพื่อให้ได้รับความเข้าใจอย่างแท้จริงเกี่ยวกับเรื่องนี้อาจารย์ควรพูดคุยเกี่ยวกับปัญหาดั้งเดิมที่ผู้เขียนต้นฉบับกำลังเผชิญอยู่ในเวลาที่พวกเขาตีพิมพ์แนวทางของพวกเขา หนึ่งสามารถเรียนรู้เพิ่มเติมจากที่นอกเหนือจากการอ่านหนังสือหลายพันเล่มในเรื่อง

สถิติเป็นกล่องเครื่องมือสำหรับการแก้ปัญหา แต่มันก็เป็นงานศิลปะและต้องเผชิญกับปัญหาเดียวกันมากกว่างานศิลปะอื่น ๆ

หนึ่งสามารถเรียนรู้วิธีการทำเสียงด้วยเครื่องมือ แต่ด้วยความสามารถของ"เล่น"เครื่องมือหนึ่งไม่ได้กลายเป็นนักดนตรี

อย่างไรก็ตามไม่ใช่เรื่องแปลกที่จะค้นหาคนที่มองว่าตัวเองเป็นนักดนตรีโดยไม่ต้องศึกษาแนวคิดเรื่องจังหวะทำนองและความสามัคคี

ในบรรทัดเดียวกันสำหรับการตีพิมพ์เอกสารคนส่วนใหญ่ไม่จำเป็นต้องรู้หรือไม่เข้าใจแนวคิดเบื้องหลังสูตร ... ทุกวันนี้นักวิทยาศาสตร์ก็ต้องรู้ว่าพวกเขาต้องกดปุ่มไหนและต้องกดช่วงเวลาไหน

ดังนั้นสิ่งนี้ไม่เกี่ยวข้องกับ "ego" ของ MDs นี่เป็นปัญหาของวัฒนธรรมย่อยปัญหาที่เกี่ยวข้องกับการศึกษาประเพณีและคุณค่าของชุมชนวิทยาศาสตร์มากขึ้น

สิ่งใดที่สามารถคาดหวังได้ในยุคที่มีการตีพิมพ์เอกสารและหนังสือที่ไร้ประโยชน์หลายพันหลายพันฉบับเพื่อตอบสนองความต้องการทางวิชาการ / นโยบายบางอย่าง? ในยุคที่จำนวนเอกสารที่ตีพิมพ์มีความสำคัญมากกว่าคุณภาพของเอกสารเหล่านั้น?

นักวิทยาศาสตร์หลักไม่กังวลเกี่ยวกับวิทยาศาสตร์ที่ดีอีกต่อไป พวกเขาเป็นทาสของตัวเลข พวกเขาได้รับผลกระทบ (หรือติดเชื้อ) จากข้อผิดพลาดด้านการบริหารในยุคของเรา ...

ดังนั้นจากมุมมองของฉันหลักสูตรที่ดีในสถิติควรมีพื้นฐานทางคณิตศาสตร์ประวัติศาสตร์และปรัชญาของวิธีการศึกษาโดยเน้นเส้นทางหลายเส้นทางที่เราสามารถทำได้ ใช้สำหรับการแก้ปัญหาเดียว

ในที่สุดถ้าฉันเป็นอาจารย์ในสถิติ / ความน่าจะเป็นการบรรยายครั้งแรกของฉันจะทุ่มเทให้กับปัญหาเช่นสับไพ่หรือการโยนเหรียญ นั่นจะทำให้ผู้ชมอยู่ในตำแหน่งที่เหมาะสมสำหรับการฟัง ... น่าจะเป็น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.