คำถามติดแท็ก communication

เกี่ยวข้องกับการสื่อสารหรือการอธิบายข้อมูลทางสถิติการวิเคราะห์หรือแนวคิด

11
อธิบายให้คนทั่วไปเห็นว่าทำไมการบูตสแตรปทำงานได้ดี
ฉันเพิ่งใช้ bootstrapping เพื่อประเมินช่วงความมั่นใจสำหรับโครงการ บางคนที่ไม่ทราบเกี่ยวกับสถิติมากนักเมื่อเร็ว ๆ นี้ขอให้ฉันอธิบายว่าเพราะเหตุใด bootstrapping จึงใช้งานได้เช่นเหตุใดการสุ่มตัวอย่างตัวอย่างซ้ำไปซ้ำมาจึงให้ผลลัพธ์ที่ดี ฉันรู้ว่าถึงแม้ว่าฉันจะใช้เวลามากมายในการทำความเข้าใจวิธีการใช้ แต่ฉันก็ไม่เข้าใจว่าทำไมการบูตสแตรป โดยเฉพาะ: ถ้าเราสุ่มตัวอย่างจากตัวอย่างของเรามันเป็นอย่างไรที่เรากำลังเรียนรู้บางอย่างเกี่ยวกับประชากรมากกว่าเพียงแค่ตัวอย่าง ดูเหมือนว่าจะมีการกระโดดที่นั่นซึ่งค่อนข้างเคาน์เตอร์ง่าย ฉันได้พบคำตอบของคำถามนี้ที่ฉันเข้าใจครึ่ง โดยเฉพาะอย่างยิ่งคนนี้ ฉันเป็นสถิติ "ผู้บริโภค" ไม่ใช่นักสถิติและฉันทำงานกับคนที่รู้สถิติน้อยกว่าฉันมาก ดังนั้นใครบางคนสามารถอธิบายได้โดยมีการอ้างอิงอย่างน้อยที่สุดเกี่ยวกับทฤษฎีบท ฯลฯ เหตุผลพื้นฐานที่อยู่เบื้องหลัง bootstrap? นั่นคือถ้าคุณต้องอธิบายให้เพื่อนบ้านฟังคุณจะพูดว่าอย่างไร

15
คำศัพท์ทางสถิติที่สับสนที่สุด
เรานักสถิติใช้หลายคำในวิธีที่แตกต่างจากวิธีที่ทุกคนใช้ สิ่งนี้ทำให้เกิดปัญหามากมายเมื่อเราสอนหรืออธิบายสิ่งที่เรากำลังทำ ฉันจะเริ่มรายการ (และตอนนี้ฉันจะเพิ่มคำจำกัดความต่อความคิดเห็น): กำลังคือความสามารถในการปฏิเสธสมมติฐานที่ผิดพลาดได้อย่างถูกต้อง โดยปกติจะหมายถึงการพูดว่า "มีอะไรเกิดขึ้น" อย่างถูกต้อง อคติ - สถิติจะลำเอียงหากระบบแตกต่างจากพารามิเตอร์ประชากรที่เกี่ยวข้อง นัยสำคัญ - ผลลัพธ์มีนัยสำคัญทางสถิติในบางเปอร์เซ็นต์ (มักจะ 5%) ในสถานการณ์ต่อไปนี้: หากประชากรที่กลุ่มตัวอย่างมาจากผลกระทบที่แท้จริงของ 0 สถิติอย่างน้อยที่สุดเท่าที่ได้มาจากตัวอย่างเท่านั้นที่จะเกิดขึ้น 5% ของเวลา การโต้ตอบ - ตัวแปรอิสระสองตัวจะโต้ตอบกันหากความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระหนึ่งตัวนั้นแตกต่างกันในระดับต่าง ๆ ของตัวแปรอิสระ แต่จะต้องมีอื่น ๆ อีกมากมาย!

3
จะแสดงผลลัพธ์ของ Lasso โดยใช้ glmnet ได้อย่างไร
ฉันต้องการค้นหาตัวทำนายสำหรับตัวแปรพึ่งพาต่อเนื่องจากชุดของตัวแปรอิสระ 30 ตัว ฉันใช้ Lasso regression ตามที่นำมาใช้ในแพ็คเกจglmnetใน R ต่อไปนี้เป็นตัวอย่างรหัสจำลอง # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) # use crossvalidation to find the best lambda library(glmnet) cv <- cv.glmnet(x,y,alpha=1,nfolds=10) l <- cv$lambda.min alpha=1 # fit the model fits <- glmnet( x, …

10
มีหนังสือวิทยาศาสตร์ยอดนิยมเล่มใดบ้างเกี่ยวกับสถิติหรือการเรียนรู้ของเครื่อง?
มีหนังสือวิทยาศาสตร์ยอดนิยมมากมายที่เกี่ยวข้องกับวิทยาศาสตร์จริงตลอดจนประวัติศาสตร์และเหตุผลเบื้องหลังทฤษฎีปัจจุบันขณะที่ยังคงสนุกกับการอ่าน ตัวอย่างเช่น "Chaos" โดย James Gleick (Chaos, fractals, nonlinearity), "ประวัติย่อของเวลา" โดย Stephen Hawking (ฟิสิกส์ต้นกำเนิดของจักรวาล, เวลา, blackholes) หรือ "The Selfish Gene" โดย Richard Dawkins ( วิวัฒนาการและการคัดเลือกโดยธรรมชาติ) หนังสือเหล่านี้บางเล่มมีข้อโต้แย้ง (ดอว์คินส์) และบางเล่มไม่มี (กลีค) แต่พวกเขาทั้งหมดทำหน้าที่เพื่อให้ง่ายสำหรับพวกเราที่ไม่มีการศึกษาทางวิทยาศาสตร์ในเชิงลึกที่จะเข้าใจแนวคิดที่ยากเป็นอย่างอื่น มีหนังสือประเภทใดบ้างที่เน้นเรื่องสถิติหรือการเรียนรู้ของเครื่องเป็นหลัก? โปรดระบุบทสรุปของหนังสือแต่ละเล่มที่ครอบคลุม

10
คำอธิบายของคนธรรมดาที่คุณชื่นชอบสำหรับแนวคิดทางสถิติที่ยากคืออะไร?
ฉันสนุกกับการฟังคำอธิบายง่ายๆเกี่ยวกับปัญหาที่ซับซ้อน การเปรียบเทียบหรือเรื่องเล็ก ๆ น้อยที่คุณชื่นชอบที่อธิบายแนวคิดทางสถิติที่ยากคืออะไร สิ่งที่ฉันชอบคือคำอธิบายของเมอเรย์ต่อการใช้เครื่องดื่มเมาและสุนัขของเธอ เมอร์เรย์อธิบายว่ากระบวนการสุ่มสองแบบ (เมาค้างและสุนัขโอลิเวอร์) สามารถมีรากของหน่วยได้ แต่ยังคงมีความเกี่ยวข้อง เมาออกจากบาร์กำลังจะเร่ร่อนอย่างไม่มีจุดหมายในการเดินแบบสุ่ม แต่บางครั้งเธอก็พูดว่า "โอลิเวอร์คุณอยู่ที่ไหน" และโอลิเวอร์ก็ขัดจังหวะการเห่าของเขาอย่างไร้จุดหมาย เขาได้ยินเธอ; เธอได้ยินเขา เขาคิดว่า "โอ้ฉันไม่สามารถปล่อยให้เธอออกไปไกลเกินไปเธอจะล็อกฉันไว้" เธอคิดว่า "โอ้ฉันไม่สามารถปล่อยให้เขาไปไกลเกินไปเขาจะปลุกฉันในตอนกลางคืนด้วยเสียงเห่าของเขา" แต่ละคนประเมินว่าอีกฝ่ายอยู่ห่างกันมากแค่ไหนและย้ายไปที่ช่องว่างนั้นเพียงบางส่วน

2
หลักฐานของภาวะโลกร้อนที่มนุษย์สร้างขึ้นได้มาถึง 'มาตรฐานทองคำ': พวกเขาทำเช่นนี้ได้อย่างไร?
ข้อความนี้ในบทความของ Reuter จาก 25.02.2019 ขณะนี้มีอยู่ทั่วข่าว: หลักฐานของภาวะโลกร้อนที่มนุษย์สร้างขึ้นได้รับความนิยม 'มาตรฐานทองคำ' [นักวิทยาศาสตร์] กล่าวว่าความมั่นใจว่ากิจกรรมของมนุษย์กำลังเพิ่มความร้อนที่พื้นผิวโลกได้ถึงระดับ "ห้าซิกม่า" ซึ่งเป็นมาตรวัดทางสถิติซึ่งหมายความว่ามีโอกาสเพียงหนึ่งในล้านเท่านั้นที่สัญญาณจะปรากฏขึ้นหากมี ไม่มีภาวะโลกร้อน ฉันเชื่อว่านี่หมายถึงบทความนี้"ฉลองครบรอบสามเหตุการณ์สำคัญในวิทยาศาสตร์การเปลี่ยนแปลงสภาพภูมิอากาศ"ซึ่งมีพล็อตซึ่งแสดงแผนผังด้านล่าง (เป็นภาพร่างเพราะฉันไม่สามารถหาภาพโอเพนซอร์สสำหรับต้นฉบับที่คล้ายกัน พบรูปภาพฟรีที่นี่ ) บทความอื่นจากกลุ่มการวิจัยเดียวกันซึ่งดูเหมือนว่าจะเป็นแหล่งต้นฉบับมากกว่าอยู่ที่นี่ (แต่ใช้นัยสำคัญ 1% แทน5 σ5σ5\sigma ) พล็อตนำเสนอการวัดจากกลุ่มวิจัยที่แตกต่างกันสามกลุ่ม ได้แก่ ระบบตรวจจับระยะไกล, ศูนย์สำหรับการใช้งานและการวิจัยดาวเทียมและมหาวิทยาลัยอลาบามาที่ Huntsville พล็อตแสดงเส้นโค้งสัญญาณที่เพิ่มขึ้นสามเส้นต่ออัตราส่วนสัญญาณรบกวนเป็นฟังก์ชันของแนวโน้มความยาว 5 σ5σ5\sigma ††^{\dagger}5 σ5σ5\sigma 5 σ5σ5 \sigma ††^\dagger

1
เอกสารที่เขียนอย่างสวยงาม
จากหนังสือของ David Salsburg The Lady tasting tea : แม้ว่าผู้อ่านอาจไม่เชื่อก็ตาม แต่รูปแบบวรรณกรรมมีบทบาทสำคัญในการวิจัยทางคณิตศาสตร์ ผู้เขียนทางคณิตศาสตร์บางคนดูเหมือนจะไม่สามารถผลิตบทความที่เข้าใจง่าย คนอื่น ๆ ดูเหมือนจะมีความสุขที่ผิดปกติจากการสร้างสัญกรณ์สัญลักษณ์หลายบรรทัดดังนั้นเต็มไปด้วยรายละเอียดที่ความคิดทั่วไปหายไปใน Picayune แต่ผู้เขียนบางคนมีความสามารถในการแสดงความคิดที่ซับซ้อนด้วยพลังและความเรียบง่ายที่การพัฒนาดูเหมือนจะชัดเจนในการแสดงออกของพวกเขา เมื่อตรวจสอบสิ่งที่ได้เรียนรู้แล้วผู้อ่านจะตระหนักถึงพลังอันยิ่งใหญ่ของผลลัพธ์ ผู้เขียนคนนี้คือ Jerzy Neyman มันเป็นความสุขที่ได้อ่านเอกสารของเขา ความคิดมีวิวัฒนาการตามธรรมชาติ, โน้ตคือเรียบง่ายและข้อสรุปที่ดูเหมือนจะเป็นธรรมชาติที่คุณพบว่ามันยากที่จะเห็นว่าทำไมไม่มีใครผลิตผลลัพธ์เหล่านี้นานก่อนที่จะ อะไรคือตัวอย่างเฉพาะอื่น ๆ ของเอกสารที่เขียนเป็นอย่างดีเกี่ยวกับสถิติหรือการเรียนรู้ของเครื่อง แนวคิดคือมีรายการเอกสาร "นี่คือวิธีที่คุณควรเขียน" กรุณาพยายามที่จะให้: การอ้างอิงบรรณานุกรมแบบเต็มเช่น: Carl E. Rasmussen " แบบจำลองอนันต์ผสมแบบเกาส์ " ในความก้าวหน้าในระบบประมวลผลข้อมูลเกี่ยวกับประสาท 12 ฉบับที่ 5 12 (2000) ในกรณีที่มีลิงก์ให้ไปยังที่เก็บข้อมูลสาธารณะที่เข้าถึงได้ (เช่นhttp://arxiv.org/ ) บทวิจารณ์สั้น ๆ ที่ไม่เป็นทางการและเข้าใจได้ง่ายเกี่ยวกับกระดาษที่เกี่ยวกับอะไรและทำไมมันจึงเป็นตัวอย่างของกระดาษที่เขียนได้ดีที่สุด

2
วิธีการอธิบายหรือมองเห็นโมเดลการถดถอยเชิงเส้นหลายแบบ
ฉันกำลังพยายามปรับโมเดลการถดถอยเชิงเส้นหลายแบบให้สอดคล้องกับข้อมูลของฉันด้วยพารามิเตอร์อินพุตสองสามตัวบอกว่า 3 F( x )F( x )= A x1+ B x2+ Cx3+ dหรือ= ( A B C )T( x1 x2 x3) + d(ผม)(ii)(i)F(x)=Ax1+Bx2+Cx3+dor(ii)F(x)=(A B C)T(x1 x2 x3)+d\begin{align} F(x) &= Ax_1 + Bx_2 + Cx_3 + d \tag{i} \\ &\text{or} \\ F(x) &= (A\ B\ C)^T (x_1\ x_2\ x_3) + d …

4
วิธีการมองเห็นความแตกต่างที่ดีที่สุดในหลาย ๆ สัดส่วนในสามกลุ่ม?
ฉันพยายามเปรียบเทียบว่าสิ่งพิมพ์ข่าวที่แตกต่างกันสามฉบับครอบคลุมหัวข้อต่าง ๆ อย่างไร (พิจารณาผ่านโมเดลหัวข้อ LDA) ฉันมีสองวิธีที่เกี่ยวข้องในการทำเช่นนั้น แต่ได้รับคำติชมจำนวนมากจากเพื่อนร่วมงานว่านี่ไม่ใช่วิธีที่ง่ายมาก ฉันหวังว่าจะมีใครบางคนที่นั่นมีความคิดที่ดีกว่าสำหรับการแสดงภาพนี้ ในกราฟแรกฉันแสดงสัดส่วนของแต่ละหัวข้อในแต่ละสิ่งพิมพ์เช่น: มันค่อนข้างตรงไปตรงมาและใช้งานง่ายสำหรับคนเกือบทุกคนที่ฉันเคยคุยด้วย อย่างไรก็ตามมันยากที่จะเห็นความแตกต่างระหว่างสิ่งตีพิมพ์ หนังสือพิมพ์ฉบับใดครอบคลุมหัวข้อใดเพิ่มเติม เพื่อให้ได้สิ่งนี้ฉันวาดกราฟความแตกต่างระหว่างการตีพิมพ์ที่มีสัดส่วนหัวข้อสูงสุดและลำดับที่สองสูงที่สุดตามสีของสิ่งพิมพ์ที่มีคะแนนสูงสุด แบบนี้: ยกตัวอย่างเช่นบาร์ขนาดใหญ่สำหรับฟุตบอลคือระยะห่างระหว่างอัลอาห์รามอังกฤษและเดลินิวส์อียิปต์ (อันดับ 2 ในการรายงานข่าวฟุตบอล) และเป็นสีแดงเพราะอัลอาห์รามเป็น # 1 ในทำนองเดียวกันการทดลองมีสีเขียวเนื่องจาก Egypt Independent มีสัดส่วนที่สูงที่สุดและขนาดของแถบคือระยะห่างระหว่าง Egypt Independent และ Daily News Egypt (# 2 อีกครั้ง) ความจริงที่ฉันต้องอธิบายว่าทั้งหมดในสองย่อหน้าเป็นสัญญาณที่ค่อนข้างแน่ใจว่ากราฟล้มเหลวในการทดสอบความพอเพียง มันยากที่จะบอกสิ่งที่เกิดขึ้นจริงโดยเพียงแค่มองมัน คำแนะนำทั่วไปเกี่ยวกับวิธีเน้นสิ่งพิมพ์ที่โดดเด่นสำหรับแต่ละหัวข้อด้วยวิธีที่เข้าใจง่ายกว่านี้? แก้ไข: ข้อมูลจะเล่นกับ:นี่คือdputผลลัพธ์จาก R , เช่นเดียวกับไฟล์ CSV แก้ไข 2:นี่คือเวอร์ชันพล็อตจุดเริ่มต้นโดยมีขนาดของจุดที่เป็นสัดส่วนกับสัดส่วนของหัวข้อในคลังข้อมูล (ซึ่งเป็นวิธีการเรียงลำดับหัวข้อเดิม) แม้ว่าฉันจะต้องปรับแต่งมันเพิ่มอีกนิด แต่ก็รู้สึกได้ง่ายกว่าที่ฉันเคยทำมาก่อน ขอบคุณทุกคน!

3
ความแตกต่างระหว่างการถดถอยโลจิสติกและเปอร์เซ็น
ดังที่ฉันเข้าใจเครือข่ายประสาทเทียมของ perceptron / single-layer ที่มีฟังก์ชั่นการเปิดใช้งาน logistic sigmoid เป็นรูปแบบเดียวกับการถดถอยแบบโลจิสติกส์ ทั้งสองรุ่นได้รับจากสมการ: F(x)=11−e−βXF(x)=11−e−βXF(x) = \frac{1}{1-e^{-\beta X}} อัลกอริธึมการเรียนรู้ perceptron เป็นแบบออนไลน์และขับเคลื่อนด้วยข้อผิดพลาดในขณะที่พารามิเตอร์สำหรับการถดถอยโลจิสติกสามารถเรียนรู้ได้โดยใช้อัลกอริทึมแบบแบทช์รวมถึงการไล่ระดับสีลงและ BFGS หน่วยความจำ จำกัด มีความแตกต่างอื่น ๆ ระหว่างการถดถอยโลจิสติกและ perceptron sigmoid หรือไม่ ผลลัพธ์ของผู้ลงทะเบียนโลจิสติกส์ที่ผ่านการฝึกอบรมกับการไล่ระดับสีแบบสุ่ม Stochastic นั้นคาดว่าจะคล้ายกับ perceptron หรือไม่?

3
คุณจะอธิบายโมเดลเชิงเส้นทั่วไปให้กับผู้ที่ไม่มีพื้นฐานทางสถิติอย่างไร
ฉันมักจะลำบากในการอธิบายเทคนิคทางสถิติให้กับผู้ชมที่ไม่มีพื้นฐานทางสถิติ หากฉันต้องการอธิบายว่า GLM คืออะไรสำหรับผู้ชมดังกล่าว (โดยไม่ทิ้งศัพท์แสงทางสถิติ) สิ่งใดจะเป็นวิธีที่ดีที่สุดหรือมีประสิทธิภาพมากที่สุด ฉันมักจะอธิบาย GLM ด้วยสามส่วน - (1) องค์ประกอบสุ่มซึ่งเป็นตัวแปรตอบสนอง (2) องค์ประกอบของระบบซึ่งเป็นตัวทำนายเชิงเส้นและ (3) ฟังก์ชั่นลิงค์ซึ่งเป็น "กุญแจ" ต่อการเชื่อมต่อ (1) และ (2) จากนั้นฉันจะให้ตัวอย่างของการถดถอยเชิงเส้นหรือโลจิสติกและอธิบายวิธีการเลือกฟังก์ชั่นลิงค์ตามตัวแปรการตอบสนอง ดังนั้นมันทำหน้าที่เป็นกุญแจสำคัญในการเชื่อมต่อสององค์ประกอบ

5
การประมวลผลความรู้ความเข้าใจ / ตีความเทคนิคการสร้างภาพข้อมูล
มีใครรู้บ้างเกี่ยวกับการวิจัยที่ตรวจสอบประสิทธิผล (ความเข้าใจ?) ของเทคนิคการสร้างภาพข้อมูลที่แตกต่างกันหรือไม่? ตัวอย่างเช่นผู้คนเข้าใจว่าการสร้างภาพข้อมูลหนึ่งรูปแบบรวดเร็วกว่าอีกรูปแบบหนึ่งได้อย่างไร การโต้ตอบกับการสร้างภาพข้อมูลช่วยให้ผู้คนจำข้อมูลได้หรือไม่? อะไรก็ได้ตามสายเหล่านั้น ตัวอย่างของการสร้างภาพข้อมูลอาจเป็น: แผนการกระจายกราฟเส้นลำดับเวลาแผนที่ส่วนต่อประสานเชิงโต้ตอบ (เช่นพิกัดขนาน) เป็นต้น ฉันสนใจงานวิจัยโดยเฉพาะในกลุ่มคนทั่วไป

3
วิธีที่ดีที่สุดในการสื่อสารความไม่แน่นอน?
ปัญหาใหญ่ในการสื่อสารผลของการคำนวณทางสถิติกับสื่อและสาธารณะคือวิธีที่เราสื่อสารความไม่แน่นอน แน่นอนว่าสื่อมวลชนส่วนใหญ่ดูเหมือนว่าจะเป็นตัวเลขที่ยากและรวดเร็วถึงแม้ว่าจะมีบางกรณีที่ค่อนข้างน้อย ดังนั้นในฐานะนักสถิติ (หรือนักวิทยาศาสตร์ที่อธิบายงานทางสถิติ) เราจะสื่อสารผลลัพธ์ของเราได้ดีที่สุดในขณะที่รักษาความไม่แน่นอนในการเจรจาต่อรอง ฉันรู้ว่านี่ไม่ใช่คำถามเชิงสถิติ แต่เป็นคำถามทางจิตวิทยาเกี่ยวกับสถิติ แต่เป็นสิ่งที่นักสถิติและนักวิทยาศาสตร์ส่วนใหญ่กังวล ฉันจินตนาการว่าคำตอบที่ดีอาจอ้างอิงการวิจัยทางจิตวิทยามากกว่าตำราสถิติ ... แก้ไข:ตามข้อเสนอแนะของผู้ใช้ 5668458 กรณีศึกษาอาจมีประโยชน์ที่นี่ หากเป็นไปได้โปรดเก็บคำตอบทั่วไปไว้ในพื้นที่อื่น โดยเฉพาะอย่างยิ่งในกรณีที่ฉันสนใจในการทำหน้าที่เป็นตัวอย่างที่ดี: การสื่อสารวิทยาศาสตร์ภูมิอากาศกับนักการเมืองและประชาชนทั่วไปผ่านสื่อมวลชน กล่าวอีกนัยหนึ่งในฐานะนักวิทยาศาสตร์เป็นหน้าที่ของคุณในการถ่ายทอดข้อมูลไปยังนักข่าวในลักษณะที่พวกเขามีความยากลำบากเล็กน้อยในการสื่อข้อมูลนั้นให้กับสาธารณชนได้อย่างถูกต้องนั่นคือความจริงแม้ว่าจะไม่จำเป็นต้องเป็นความจริงทั้งหมดก็ตาม มักจะไม่พอดีกับข่าวกัด ตัวอย่างทั่วไปโดยเฉพาะอย่างยิ่งบางอย่างอาจเป็นการสื่อสารของความไม่แน่นอนในการประมาณระดับของภาวะโลกร้อนในช่วงที่เหลือของศตวรรษหรือในโอกาสที่เพิ่มขึ้นของเหตุการณ์สภาพอากาศรุนแรงเฉพาะ (เช่นในการตอบสนองต่อ "เป็นพายุนี้เกิดจากการเปลี่ยนแปลงสภาพภูมิอากาศ "พิมพ์คำถาม)

3
จำนวนตัวเลขที่สำคัญที่จะรายงาน
มีวิธีการทางวิทยาศาสตร์มากขึ้นในการกำหนดจำนวนตัวเลขที่สำคัญในการรายงานค่าเฉลี่ยหรือช่วงความเชื่อมั่นในสถานการณ์ที่ค่อนข้างเป็นมาตรฐาน - เช่นชั้นปีแรกที่วิทยาลัย ฉันได้เห็นจำนวนตัวเลขที่สำคัญที่จะใส่ในตาราง , ทำไมเราไม่ใช้เลขนัยสำคัญและจำนวนตัวเลขที่สำคัญในตารางพอดีไคแต่เหล่านี้ดูเหมือนจะไม่ใส่นิ้วของพวกเขาในการแก้ปัญหา ในชั้นเรียนของฉันฉันพยายามอธิบายให้นักเรียนของฉันทราบว่าเป็นเรื่องเสียหมึกที่จะรายงานตัวเลข 15 หลักที่สำคัญเมื่อพวกเขามีข้อผิดพลาดมาตรฐานที่กว้างเช่นนี้ในผลลัพธ์ของพวกเขา - ความรู้สึกของฉันคือว่ามันควรจะถูกปัดเศษ0.25นี้ไม่ได้แตกต่างกันเกินไปจากสิ่งที่ถูกกล่าวโดยASTM - การรายงานผลการทดสอบหมายถึง E29 ที่พวกเขาบอกว่ามันควรอยู่ระหว่างและ0.50.25σ0.25σ0.25\sigma0.05σ0.05σ0.05\sigma0.5σ0.5σ0.5\sigma แก้ไข: เมื่อฉันมีชุดตัวเลขxด้านล่างฉันควรใช้ตัวเลขกี่หลักในการพิมพ์ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน set.seed(123) x <- rnorm(30) # default mean=0, sd=1 # R defaults to 7 digits of precision options(digits=7) mean(x) # -0.04710376 - not far off theoretical 0 sd(x) # 0.9810307 - not far from …

7
คุณจะอธิบายความสำคัญทางสถิติต่อผู้ที่ไม่มีพื้นฐานทางสถิติได้อย่างไร
ที่มา: ฉันต้องทำการวิเคราะห์ข้อมูลสำหรับลูกค้า (ทนายความบางประเภท) ซึ่งเป็นผู้เริ่มต้นแน่นอนในสถิติ เขาถามฉันว่าคำว่า "นัยสำคัญทางสถิติ" หมายถึงอะไรและฉันพยายามอธิบายจริงๆ ... แต่เนื่องจากฉันไม่เก่งในการอธิบายสิ่งที่ฉันล้มเหลว;)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.