คำถามติดแท็ก communication

เกี่ยวข้องกับการสื่อสารหรือการอธิบายข้อมูลทางสถิติการวิเคราะห์หรือแนวคิด

4
เราจะอธิบายได้อย่างไรว่าตัวประเมินที่ไม่เอนเอียงคืออะไรสำหรับคนธรรมดา?
สมมติว่าเป็นประมาณการที่เป็นกลางสำหรับ\แล้วแน่นอน\ θE[ θ |θ]=θθ^θ^\hat{\theta}θθ\thetaE[θ^∣θ]=θE[θ^∣θ]=θ\mathbb{E}[\hat{\theta} \mid \theta] = \theta เราอธิบายเรื่องนี้กับคนทั่วไปได้อย่างไร? ในอดีตสิ่งที่ฉันพูดคือถ้าคุณเฉลี่ยค่าของเป็นจำนวนมากเมื่อขนาดตัวอย่างใหญ่ขึ้นคุณจะได้ประมาณดีขึ้น θθ^θ^\hat{\theta}θθ\theta สำหรับฉันแล้วนี่เป็นปัญหา ฉันคิดว่าสิ่งที่ฉันอธิบายจริง ๆ นี่คือปรากฏการณ์ของการเป็นแบบไม่ลำเอียงแบบไม่มีสัญญาณแทนที่จะเป็นแบบไม่เอนเอียงคือ ที่\ hat {\ theta}มีแนวโน้มที่จะขึ้นอยู่กับnlimn→∞E[θ^∣θ]=θ,limn→∞E[θ^∣θ]=θ,\lim_{n \to \infty}\mathbb{E}[\hat{\theta} \mid \theta] = \theta\text{,}θ^θ^\hat{\theta}nnn ดังนั้นเราจะอธิบายได้อย่างไรว่าตัวประมาณที่เป็นกลางคืออะไรกับคนธรรมดา?

2
ตัวอย่างที่ดีของส่วนสถิติในบทความวารสารวิชาการ
ฉันเป็นนักชีวสถิติที่ทำงานในสาขาที่สมัครแล้วและฉันมีหน้าที่รับผิดชอบในการเขียนส่วนวิธีการทางสถิติสำหรับเอกสารที่ฉันทำงานร่วมกัน ในการอ่านบทความทางวิชาการจำนวนมากฉันได้พบตัวอย่างมากมายของสถิติที่เขียนไม่ดี (ส่วนใหญ่พวกเขาน่าเบื่อไม่รู้และขาดความแม่นยำรายละเอียดและความเข้าใจในวิธีการที่ใช้) โดยไม่คำนึงถึงหัวข้อและความซับซ้อนของวิธีการทางสถิติที่ใช้อะไรเป็นตัวอย่างที่ดีของส่วนที่เป็นลายลักษณ์อักษรอย่างดีในบทความวิจัยประยุกต์? วิธีการกำหนด "ดีเขียน" เป็นอัตนัย แต่ฉันจะอธิบายส่วนสถิติเช่นเดียวกับการเขียนถ้ามันชัดเจนให้ (หรือดูเหมือนว่าจะให้) ภาพเต็มรูปแบบของวิธีการวิเคราะห์ได้ดำเนินการที่อยู่สมมติฐานที่ทำในระหว่างการวิเคราะห์ และรวมกระบวนการทางสถิติเข้ากับการไหลของกระดาษ นี่คือตัวอย่างของเอกสารที่ฉันคิดว่ามีส่วนสถิติที่ดี: การฉีดวัคซีนบีซีจีลดความเสี่ยงของการติดเชื้อวัณโรคในแบ๊ดเจ้อวัคซีนและลูกแบดเจอร์ที่ไม่ได้รับวัคซีน รูปแบบการทำนายอัตราการตายในผู้ป่วยกล้ามเนื้อหัวใจตายที่ได้รับการรักษาด้วยการแทรกแซงของหลอดเลือดหัวใจปฐมภูมิขั้นปฐมภูมิเฉียบพลัน: ผลลัพธ์จากการประเมิน Pexelizumab ในการทดลองกล้ามเนื้อหัวใจตายเฉียบพลัน อื่น ๆ ? ความคิดเกี่ยวกับสิ่งที่ควรรวมอยู่ในส่วนของสถิติ "ดี" ด้วย

2
ฉันจะมองเห็นความสำคัญของอินพุตที่แตกต่างกันไปยังการพยากรณ์สำหรับโมเดลที่ไม่ใช่เส้นตรงแบบกล่องดำได้อย่างไร
ฉันกำลังสร้างเครื่องมือพยากรณ์แบบโต้ตอบ (เป็นไพ ธ อน) เพื่อช่วยในการพยากรณ์ที่ทำในองค์กรของฉัน จนถึงปัจจุบันกระบวนการพยากรณ์ได้รับแรงผลักดันจากมนุษย์เป็นส่วนใหญ่โดยนักพยากรณ์จะดูดซึมข้อมูลในเครือข่ายประสาทธรรมชาติของพวกเขาและใช้ความรู้สึกที่ได้เรียนรู้เพื่อคาดการณ์ จากการตรวจสอบการคาดการณ์ระยะยาวและการศึกษาการสร้างแบบจำลองเชิงทำนายที่ฉันทำฉันพบว่าคุณอาจคาดหวัง นักพยากรณ์ที่แตกต่างกันแสดงอคติที่แตกต่างกันผลกระทบของนักทำนายบางคนดูเหมือนจะพูดเกินจริงและคนอื่น ๆ ที่สำคัญดูเหมือนว่าจะถูกเพิกเฉยและโดยทั่วไปประสิทธิภาพของการพยากรณ์นั้นค่อนข้างปานกลาง การคาดการณ์จะยังคงเป็นคู่มือ แต่ฉันกำลังพยายามสร้างเครื่องมือที่มีประโยชน์เพื่อให้นักพยากรณ์ได้ปริมาณที่ดีขึ้นของผลกระทบสัมพัทธ์ของตัวทำนาย นอกจากนี้ยังมีเอฟเฟกต์ที่สำคัญเช่นอิทธิพลตามฤดูกาลที่มักถูกมองข้ามว่าฉันต้องการให้เครื่องมือเน้นไปที่ผู้ใช้ ฉันคาดหวังระดับ backlash และความสงสัยเกี่ยวกับกระบวนการสร้างแบบจำลองจากนักพยากรณ์ 'ที่มีประสบการณ์' บางคน (หลายคนมีความรู้อย่างเป็นทางการเกี่ยวกับสถิติ) ดังนั้นการสื่อสารจึงมีความสำคัญน้อยที่สุดและประสิทธิภาพของตัวแบบในแง่ของ บรรลุการปรับปรุงที่วัดได้ในความถูกต้องของการคาดการณ์ แบบจำลองที่ฉันกำลังพัฒนามีองค์ประกอบถอยหลังอัตโนมัติที่แข็งแกร่งซึ่งบางครั้งก็มีการแก้ไขอย่างมีนัยสำคัญโดยเหตุการณ์ที่แสดงเป็นค่าที่วัดได้ในตัวทำนายบางตัวที่อยู่ในช่วงเวลาที่ไม่ใช่เหตุการณ์ สิ่งนี้สอดคล้องกับโมเดลจิตที่นักพยากรณ์ใช้ ส่วนสำคัญคือความสามารถในการแสดงให้เห็นว่าการวัด 'เหตุการณ์' ใดมีอิทธิพลมากที่สุดในการผลักดันการทำนายออกไปจากค่าการถดถอยอัตโนมัติสำหรับการคาดการณ์ใด ๆ ฉันถ่ายภาพกระบวนการด้วยวิธีนี้ ผู้พยากรณ์ทำนายค่าที่ดีที่สุดของพวกเขาแบบจำลองเสนอสิ่งที่แตกต่างและผู้ทำนายถามว่าทำไม แบบจำลองตอบกลับบางสิ่งเช่น "ดูที่นี่ค่านี้ของตัวทำนายนี้จะเพิ่มค่าการคาดการณ์ในฤดูร้อนถ้าเป็นฤดูหนาวมันจะย้ายไปทางอื่นฉันรู้ว่ามีการวัดอื่น ๆ เหล่านี้ ทีนี้ลองนึกภาพตัวแบบคือการถดถอยเชิงเส้นอย่างง่าย ใคร ๆ ก็จินตนาการได้ว่าการแสดง 'ผล' สัมพัทธ์ของตัวทำนายตามเหตุการณ์โดยการคูณค่าด้วยแบบจำลองประสิทธิภาพร่วมกันและแสดงเป็นแผนภูมิแท่งแบบง่าย แท่งทั้งหมดจากตัวทำนายที่ต่างกันรวมถึงค่าเบี่ยงเบนทั้งหมดจากค่า AR และสิ่งนี้แสดงให้เห็นอย่างชัดเจนและชัดเจนว่าในกรณีนี้มีอิทธิพลอย่างมาก ปัญหาคือกระบวนการคาดการณ์แสดงระดับความไม่เป็นเชิงเส้นในตัวทำนายสูงหรืออย่างน้อยฉันก็ประสบความสำเร็จมากขึ้นกับอัลกอริธึมการเรียนรู้ของเครื่องที่ไม่เป็นเชิงเส้นกล่องดำ (ฟอเรสต์แบบสุ่มและ GBM) ชุดข้อมูลนี้ เป็นการดีที่ฉันต้องการที่จะสามารถเปลี่ยนรูปแบบการทำงาน 'ภายใต้ประทุน' ได้อย่างราบรื่นโดยไม่มีการเปลี่ยนแปลงประสบการณ์ของผู้ใช้ดังนั้นฉันต้องการวิธีการทั่วไปในการแสดงให้เห็นถึงความสำคัญของการวัดที่แตกต่างกันโดยไม่ต้องใช้วิธีเฉพาะ วิธีการปัจจุบันของฉันคือการตั้งค่าผลกระทบเชิงเส้นเสมือนโดยการตั้งค่าทั้งหมดเป็นศูนย์ยกเว้นสำหรับตัวทำนายหนึ่งบันทึกการเบี่ยงเบนที่ทำนายแล้วทำซ้ำสำหรับตัวทำนายทั้งหมดโดยแสดงผลลัพธ์ในแผนภูมิแท่งที่กล่าวถึงข้างต้น …

5
เป็นตัวแทนของข้อมูลการทดลอง
ฉันมีข้อโต้แย้งกับที่ปรึกษาของฉันเกี่ยวกับการสร้างภาพข้อมูล เขาอ้างว่าเมื่อแสดงผลการทดลองค่าควรพล็อตด้วย " เครื่องหมาย " เท่านั้นตามที่แสดงในภาพร้อง ในขณะที่เส้นโค้งควรแสดง " แบบจำลอง " เท่านั้น ในทางกลับกันฉันเชื่อว่าเส้นโค้งไม่จำเป็นในหลายกรณีเพื่อความสะดวกในการอ่านตามที่แสดงในภาพที่สองร้อง: ฉันผิดหรืออาจารย์ของฉัน หากภายหลังเป็นกรณีฉันจะไปรอบ ๆ เพื่ออธิบายสิ่งนี้กับเขาได้อย่างไร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.