คำถามติดแท็ก reporting

แนวทางการนำเสนอผลการวิเคราะห์ทางสถิติในเอกสารวิจัยการนำเสนอหรือสำหรับบุคคลทั่วไป

4
วิธีควรเล็ก -values มีการรายงาน? (และทำไม R ใส่ค่าต่ำสุดใน 2.22e-16)
สำหรับการทดสอบบางอย่างในการRมีวงเงินที่ต่ำกว่าในp-valueคำนวณของ16} ฉันไม่แน่ใจว่าทำไมมันเป็นจำนวนนี้ถ้ามีเหตุผลที่ดีสำหรับมันหรือถ้ามันเป็นเพียงโดยพลการ แพ็คเกจสถิติอื่น ๆ มากมายให้ไปดังนั้นนี่คือระดับความแม่นยำที่สูงขึ้นมาก แต่ผมยังไม่ได้เห็นเอกสารจำนวนมากเกินไปรายงานหรือ16}2.22⋅10−162.22⋅10−162.22 \cdot 10^{-16}0.0001p&lt;2.22⋅10−16p&lt;2.22⋅10−16p < 2.22\cdot 10^{-16}p=2.22⋅10−16p=2.22⋅10−16p = 2.22\cdot 10^{-16} เป็นเรื่องปกติ / วิธีปฏิบัติที่ดีที่สุดในการรายงานค่าที่คำนวณนี้หรือเป็นเรื่องปกติมากกว่าที่จะรายงานสิ่งอื่น (เช่นp &lt; 0.000000000000001)

4
จุดประสงค์ของการรายงานสถิติเชิงพรรณนาคืออะไร
ฉันเพิ่งทำการวิเคราะห์ข้อมูลของฉันโดยใช้การถดถอยโลจิสติก แต่ฉันก็จำเป็นต้องมีส่วนสถิติเชิงพรรณนาในรายงานของฉัน ฉันไม่เห็นประเด็นนี้และฉันหวังว่าบางคนอาจอธิบายได้ว่าทำไมถึงจำเป็น ตัวอย่างเช่นถ้าฉันพล็อตฮิสโตแกรมของหนึ่งในตัวแปรอิสระต่อเนื่องของฉันและมันแสดงให้เห็นถึงความปกติหรือมันแสดงให้เห็นความเบ้สิ่งนี้จะเพิ่มมูลค่าให้กับรายงานอย่างไร ข้อมูลของฉันประกอบด้วยตัวแปรตามจริงหรือเท็จในการรับงานและตัวแปรอิสระคือคะแนนในช่วงกลางภาคเรียนเกรดในการสอบปลายภาคและชายหรือหญิง

4
ทำไมเราไม่ใช้ตัวเลขที่สำคัญ?
ความคิดใดที่ทำให้เราไม่ใช้ตัวเลขนัยสำคัญในสถิติ มีบางอย่างในสายงานของเราที่ใช้ประมาณการเพื่อไม่ให้ใช้กฎเกี่ยวกับความแม่นยำ;)
18 reporting 

6
สถิติที่สำคัญยิ่งกว่า: '90 เปอร์เซ็นต์ของผู้หญิงทุกคนรอดชีวิต 'หรือ '90 เปอร์เซ็นต์ของผู้หญิงที่รอดชีวิตมาจากผู้หญิง'?
พิจารณาข้อความต่อไปนี้ที่เขียนว่า Titanic: ข้อสันนิษฐานที่ 1: มีเพียงผู้ชายและผู้หญิงเท่านั้นที่อยู่บนเรือ ข้อสันนิษฐานที่ 2: มีผู้ชายเป็นจำนวนมากเช่นเดียวกับผู้หญิง คำแถลงที่ 1: 90 เปอร์เซ็นต์ของผู้หญิงทุกคนรอดชีวิตมาได้ คำแถลงที่ 2: 90 เปอร์เซ็นต์ของผู้รอดชีวิตทั้งหมดเป็นผู้หญิง คนแรกบ่งชี้ว่าผู้หญิงที่รอดชีวิตอาจมีความสำคัญสูง สถิติที่สองมีประโยชน์เมื่อใด เราสามารถพูดได้ว่าหนึ่งในนั้นมักจะมีประโยชน์มากกว่าอีกหรือไม่

4
ช่วงความเชื่อมั่นเมื่อขนาดตัวอย่างใหญ่มาก
คำถามของฉันสามารถใช้ถ้อยคำใหม่เป็น "วิธีการประเมินข้อผิดพลาดการสุ่มตัวอย่างโดยใช้ข้อมูลขนาดใหญ่" โดยเฉพาะอย่างยิ่งสำหรับสิ่งพิมพ์วารสาร นี่คือตัวอย่างที่แสดงให้เห็นถึงความท้าทาย จากชุดข้อมูลที่มีขนาดใหญ่มาก (ผู้ป่วยที่ไม่ซ้ำกันมากกว่า 100,000 รายและยาที่กำหนดจากโรงพยาบาล 100 แห่ง) ฉันสนใจที่จะประเมินสัดส่วนของผู้ป่วยที่ทานยาโดยเฉพาะ มันตรงไปตรงมาเพื่อให้ได้สัดส่วนนี้ ช่วงความเชื่อมั่นของมัน (เช่นพารามิเตอร์หรือ bootstrap) แน่น / แคบอย่างไม่น่าเชื่อเพราะ n มีขนาดใหญ่มาก ในขณะที่โชคดีที่มีตัวอย่างขนาดใหญ่ฉันยังคงค้นหาวิธีการประเมินนำเสนอและ / หรือแสดงภาพความน่าจะเป็นข้อผิดพลาดบางรูปแบบ ในขณะที่ดูเหมือนว่าไม่ช่วยเหลือ (ถ้าไม่ทำให้เข้าใจผิด) เพื่อใส่ / แสดงช่วงความเชื่อมั่น (เช่น 95% CI: .65878 - .65881) แต่ก็ดูเหมือนว่าเป็นไปไม่ได้ที่จะหลีกเลี่ยงบางข้อความเกี่ยวกับความไม่แน่นอน โปรดแจ้งให้เราทราบว่าคุณคิดอย่างไร ฉันจะขอบคุณวรรณกรรมใด ๆ ในหัวข้อนี้ วิธีในการหลีกเลี่ยงความมั่นใจในข้อมูลแม้จะมีกลุ่มตัวอย่างขนาดใหญ่

2
รายงานองศาอิสระสำหรับ Welch t-test
เวลช์ t-test การแปรปรวนไม่เท่ากัน (หรือเรียกว่าเวลช์-Satterthwaite หรือเวลช์-Aspin) โดยทั่วไปมีองศาที่ไม่ใช่จำนวนเต็มของเสรีภาพ องศาความอิสระเหล่านี้จะถูกอ้างเมื่อรายงานผลการทดสอบได้อย่างไร? "มันเป็นเรื่องธรรมดาที่จะปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดก่อนที่จะปรึกษาตารางมาตรฐาน t" ตามแหล่งต่าง ๆ * - ซึ่งสมเหตุสมผลตามทิศทางของการปัดเศษนี้เป็นแบบอนุรักษ์นิยม ** ซอฟต์แวร์ทางสถิติที่เก่ากว่าจะทำเช่นนี้เช่นกัน 6 ) และบางเครื่องคิดเลขออนไลน์ยังคงทำ หากมีการใช้ขั้นตอนนี้การรายงานระดับความอิสระที่โค้งมนจะเหมาะสม (แม้ว่าการใช้ซอฟต์แวร์ที่ดีกว่านั้นอาจเหมาะสมกว่า!) แต่แพ็คเกจที่ทันสมัยส่วนใหญ่ใช้ประโยชน์จากส่วนที่เป็นเศษส่วนดังนั้นในกรณีนี้ดูเหมือนว่าควรจะอ้างถึงส่วนที่เป็นเศษส่วน ฉันไม่เห็นว่าการอ้างถึงทศนิยมมากกว่าสองตำแหน่งนั้นเหมาะสมหรือไม่เนื่องจากการมีอิสระในระดับหนึ่งพันครั้งจะส่งผลกระทบเพียงเล็กน้อยต่อค่าp เมื่อมองไปรอบ ๆ Google scholar ฉันสามารถดูเอกสารที่อ้างถึง df เป็นจำนวนเต็มทศนิยมหนึ่งตำแหน่งหรือทศนิยมสองตำแหน่ง มีแนวทางใดบ้างเกี่ยวกับความแม่นยำในการใช้งาน? นอกจากนี้หากซอฟต์แวร์ใช้ส่วนที่เป็นเศษส่วนแบบเต็มควร df ที่ยกมาจะถูกปัดเศษลงตามจำนวนตัวเลขที่ต้องการ (เช่นถึง 1 dp หรือ→ 7เป็นจำนวนทั้งหมด) ตามความเหมาะสมกับการคำนวณแบบอนุรักษ์นิยม หรือตามที่ฉันคิดว่าเหมาะสมกว่าฉันปัดเศษตามอัตภาพ ( ใกล้ที่สุด ) ดังนั้น7.5845 ... → 7.6ถึง 1 dp …

1
การรายงานผลของตัวแบบผสมผลกระทบเชิงเส้น
แบบจำลองเชิงเส้นผสมแบบเชิงเส้นไม่ได้ใช้กันทั่วไปในมุมชีววิทยาของฉันและฉันต้องรายงานการทดสอบทางสถิติที่ฉันใช้ในกระดาษที่ฉันพยายามจะเขียน ฉันรู้ว่าการตระหนักถึงการสร้างแบบจำลองหลายระดับเริ่มปรากฏในบางพื้นที่ของวิทยาศาสตร์ชีวภาพ ( วิธีแก้ปัญหาสำหรับการพึ่งพา: ใช้การวิเคราะห์หลายระดับเพื่อรองรับข้อมูลที่ซ้อนกัน ) แต่ฉันยังคงพยายามเรียนรู้วิธีรายงานผลของฉัน! การออกแบบการทดลองโดยสังเขปของฉัน: * ผู้เข้าร่วมการวิจัยได้รับมอบหมายให้หนึ่งในสี่กลุ่มการรักษา * การวัดตัวแปรตามขึ้นอยู่กับหลายวันหลังจากเริ่มการรักษา * การออกแบบไม่สมดุลกัน (จำนวนไม่เท่ากันของกลุ่มการรักษา การวัดสำหรับบางวิชาในบางวัน) * การรักษา A เป็นหมวดหมู่อ้างอิง * ฉันจัดให้อยู่กึ่งกลางข้อมูลในวันสุดท้ายของการรักษา ฉันต้องการทราบว่าการรักษา A (หมวดหมู่อ้างอิง) ให้ผลลัพธ์ที่ดีกว่าการรักษาอื่น ๆ (เมื่อสิ้นสุดการรักษา) หรือไม่ ฉันทำการวิเคราะห์ใน R โดยใช้ nlme: mymodel &lt;- lme(dv ~ Treatment*Day, random = ~1|Subject, data = mydf, na.action = na.omit, + correlation = …

3
จำนวนตัวเลขที่สำคัญที่จะรายงาน
มีวิธีการทางวิทยาศาสตร์มากขึ้นในการกำหนดจำนวนตัวเลขที่สำคัญในการรายงานค่าเฉลี่ยหรือช่วงความเชื่อมั่นในสถานการณ์ที่ค่อนข้างเป็นมาตรฐาน - เช่นชั้นปีแรกที่วิทยาลัย ฉันได้เห็นจำนวนตัวเลขที่สำคัญที่จะใส่ในตาราง , ทำไมเราไม่ใช้เลขนัยสำคัญและจำนวนตัวเลขที่สำคัญในตารางพอดีไคแต่เหล่านี้ดูเหมือนจะไม่ใส่นิ้วของพวกเขาในการแก้ปัญหา ในชั้นเรียนของฉันฉันพยายามอธิบายให้นักเรียนของฉันทราบว่าเป็นเรื่องเสียหมึกที่จะรายงานตัวเลข 15 หลักที่สำคัญเมื่อพวกเขามีข้อผิดพลาดมาตรฐานที่กว้างเช่นนี้ในผลลัพธ์ของพวกเขา - ความรู้สึกของฉันคือว่ามันควรจะถูกปัดเศษ0.25นี้ไม่ได้แตกต่างกันเกินไปจากสิ่งที่ถูกกล่าวโดยASTM - การรายงานผลการทดสอบหมายถึง E29 ที่พวกเขาบอกว่ามันควรอยู่ระหว่างและ0.50.25σ0.25σ0.25\sigma0.05σ0.05σ0.05\sigma0.5σ0.5σ0.5\sigma แก้ไข: เมื่อฉันมีชุดตัวเลขxด้านล่างฉันควรใช้ตัวเลขกี่หลักในการพิมพ์ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน set.seed(123) x &lt;- rnorm(30) # default mean=0, sd=1 # R defaults to 7 digits of precision options(digits=7) mean(x) # -0.04710376 - not far off theoretical 0 sd(x) # 0.9810307 - not far from …

2
ฉันควรรายงานผลลัพธ์ที่ไม่สำคัญหรือไม่
ฉันใช้การทดสอบ Kruskal Wallis และสำหรับบางคำถามค่า p ไม่สำคัญ ฉันจะรายงานสิ่งนี้ในลักษณะเดียวกับที่เป็นสาระสำคัญโดยระบุ df สถิติการทดสอบและค่า p หรือไม่ ดังนั้นมันจะเป็นแบบนี้การทดสอบ Kruskal Wallis ได้ดำเนินการ แต่ผลลัพธ์ไม่พบว่ามีนัยสำคัญ H (3) = 2.119, p&gt; 0.05 (หรือฉันจะระบุค่า p ที่แน่นอนที่นี่ (.548))

2
เหตุใดจึงเป็นเรื่องผิดปกติในการรายงานช่วงเวลาความเชื่อมั่นสำหรับค่ามัธยฐาน?
เหตุใดจึงเป็นเรื่องผิดปกติในการค้นหาช่วงความมั่นใจที่รายงานไว้ในเอกสารจากวิทยาศาสตร์ประยุกต์ ฉันทำงานเกี่ยวกับวิทยาศาสตร์คอมพิวเตอร์เป็นส่วนใหญ่ แต่มักจะอ่านบทความจาก (สังคม) จิตวิทยาสังคมวิทยาและการวางผังเมือง ฉันจำไม่ได้ว่าเคยเห็น CI สำหรับคนกลางรายงาน ในขณะเดียวกันเมื่อศึกษาช่วงความมั่นใจและเป็นเช่นนั้นฉันเห็นได้ชัดว่าในทุกสถานการณ์ที่ค่ามัธยฐานเป็นตัวบ่งชี้ที่ดีกว่าสำหรับข้อมูลของตัวเองนี่เป็นค่าประมาณที่ควรนำเสนอ มีเหตุผลทางทฤษฎีว่าทำไมการนำเสนอ CIs สำหรับค่ามัธยฐานจึงไม่ธรรมดา

3
หมายถึง SD หรือ Median MAD เพื่อสรุปตัวแปรที่เอียงสูงหรือไม่
ฉันกำลังทำงานกับข้อมูลที่เบ้อย่างสูงดังนั้นฉันจึงใช้ค่ามัธยฐานแทนค่าเฉลี่ยเพื่อสรุปแนวโน้มกลาง ฉันต้องการที่จะมีตัวชี้วัดของการกระจายตัวในขณะที่ฉันมักจะเห็นคนรายงานค่าเฉลี่ยเบี่ยงเบนมาตรฐาน±±\pmหรือแบ่งควอไทล์±±\pmเพื่อสรุปแนวโน้มเข้าสู่ส่วนกลางมันก็โอเคที่จะรายงานค่ามัธยฐานแบ่งกระจายสัมบูรณ์ (MAD)±±\pm ? มีปัญหาที่อาจเกิดขึ้นกับวิธีนี้หรือไม่? ฉันจะพบว่าวิธีนี้มีขนาดกะทัดรัดและใช้งานง่ายกว่าการรายงานควอไทล์ที่ต่ำและสูงโดยเฉพาะในตารางขนาดใหญ่ที่เต็มไปด้วยตัวเลข

2
การรายงานผลลัพธ์ของการถดถอยเชิงเส้นอย่างง่าย: มีข้อมูลอะไรให้บ้าง
ฉันเพิ่งทำการถดถอยเชิงเส้นแบบง่าย ๆ (ใน) ใน Genstat และต้องการรวมการสรุปรวบยอดและมีความหมายของผลลัพธ์ในรายงานของฉัน ฉันไม่แน่ใจว่าข้อมูลที่ฉันควรจะรวมหรือจำนวนเท่าใด บิตหลักของเอาต์พุต Genstat ของฉันมีลักษณะเช่นนี้: Summary of analysis Source d.f. s.s. m.s. v.r. F pr. Regression 1 8128935. 8128935. 814.41 &lt;.001 Residual 53 529015. 9981. Total 54 8657950. 160332. Percentage variance accounted for 93.8 Standard error of observations is estimated to be 99.9. Estimates of …

1
คุณรายงานการทดสอบแมนน์ - วิทนีย์ได้อย่างไร
ฉันกำลังทำวิทยานิพนธ์และกำลังทำการทดสอบหลายครั้ง หลังจากใช้การทดสอบ Kruskal – Wallis ฉันมักจะรายงานผลลัพธ์ดังนี้: มีความแตกต่างอย่างมีนัยสำคัญ( χ2( 2 )= 7.448 , p = .024 )(χ(2)2=7.448,p=.024)(\chi^2_{(2)}=7.448, p=.024)ระหว่างวิธีการของ ... แต่ตอนนี้ฉันทำการทดสอบแมนน์ - วิทนีย์และฉันไม่แน่ใจว่าควรนำเสนอสิ่งใด SPSS ให้ Mann – Whitney ยูUU , Wilcoxon WWW , ZZZและPPP value ให้ฉัน ฉันจะแสดงค่าทั้งสี่นี้หรือไม่? หรือไม่เกี่ยวข้องบ้าง

1
เหตุใดจึงมีการรายงานในเอกสารที่ใช้ผลบวกของรูปสี่เหลี่ยมในผลลัพธ์ Anova บ่อยครั้ง
จากประสบการณ์สั้น ๆ ของฉันในสถิติดูเหมือนว่าชนิดของผลรวมของสแควร์ส (ประเภท I, II, III, IV ... ) ที่ใช้ในการรับผลลัพธ์ ANOVA สามารถสร้างความแตกต่างอย่างมากในผลการทดสอบ (โดยเฉพาะรุ่นที่มีปฏิสัมพันธ์ ข้อมูล). อย่างไรก็ตามฉันยังไม่เห็นกระดาษรายงานเลย เหตุผลที่เป็นเช่นนั้น? ฉันจะขอบคุณจริง ๆ หากมีตัวอย่างกระดาษรายงาน (ไม่ใช่สถิติเอง) ไม่ทางใดก็ทางหนึ่งหรือเหตุผลที่ไม่ธรรมดา

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.