คำถามติดแท็ก interpretation

อ้างถึงข้อสรุปที่สำคัญจากผลการวิเคราะห์ทางสถิติ

2
สาขาวิทยาศาสตร์ใดที่ศึกษาว่าผู้คนตีความข้อมูลสรุปเชิงปริมาณและการสร้างภาพข้อมูลได้อย่างไร
มีแหล่งข้อมูลที่รู้จักกันดีมากมายซึ่งให้คำแนะนำเกี่ยวกับการสร้างภาพข้อมูล (เช่น Tufte, Stephen Few และ al , Nathan Yau .) แต่สำหรับสาขาใดที่เราอาจหันไปหาคำตอบของคำถามเช่นนี้ การวิจารณ์แผนภูมิวงกลมเกี่ยวข้องกับการปฏิบัติจริงหรือไม่? คนที่ตีความความยาวสเกลเชิงเส้นได้ดีกว่าความยาวส่วนโค้งมากหรือไม่? ว่าฉันสร้างสรุปดัชนีของชุดของตัวแปรพื้นฐานและอธิบายให้ผู้ชมทั่วไปทราบว่าสหรัฐอเมริกามีค่า 100 ในปี 2010 และ 110 ในปี 2015 คนส่วนใหญ่จะตีความตัวเลขเหล่านี้ได้อย่างไร มีนิสัยทางความคิดตามธรรมชาติที่ฉันควรพิจารณาเมื่อฉันนำเสนอตัวชี้วัดนี้เพื่อยกระดับคำอธิบายที่ดีขึ้นหรือเพื่อป้องกันการตีความที่ผิด? กล่าวอีกนัยหนึ่งว่าเขตข้อมูลทางวิทยาศาสตร์ใดที่สามารถนำเสนอข้อมูลเชิงปริมาณเพื่อค้นหาหลักการที่ชัดเจนและผ่านการทดสอบซึ่งช่วยในการจัดเรียงภาพข้อมูลและคำแนะนำการออกแบบที่มีอยู่มากมายในปัจจุบัน จุดมุ่งหมายไม่ใช่เพื่อหาคำแนะนำความคิดหรือฉันทามติในปัจจุบันเกี่ยวกับวิธีที่ดีที่สุดในการมองเห็นข้อมูลหรือเข้าหาปัญหาการสร้างภาพข้อมูลใหม่ แต่เพื่อเรียนรู้ที่จะมองหาวิทยาศาสตร์ของวิธีการที่คนตีความข้อมูลเชิงปริมาณและ / หรือภาพ (เครดิตพิเศษสำหรับการอ้างอิงวารสารการประชุมและนักวิชาการของสาขา)

5
เป็นวิธีที่ดีของกราฟิกที่แสดงจำนวนดาต้าพอยน์ที่จับคู่จำนวนมากคืออะไร?
ในเขตข้อมูลของฉันวิธีปกติในการพล็อตข้อมูลที่จับคู่นั้นเป็นชุดของส่วนของเส้นที่ลาดเอียงบาง ๆ ซ้อนทับมันด้วยค่ามัธยฐานและ CI ของค่ามัธยฐานของทั้งสองกลุ่ม: อย่างไรก็ตามพล็อตประเภทนี้กลายเป็นเรื่องยากที่จะอ่านเนื่องจากจำนวนดาต้าพอยน์มีขนาดใหญ่มาก (ในกรณีของฉันฉันมีตามลำดับ 10,000 คู่): การลดอัลฟ่าช่วยได้บ้าง แต่ก็ยังไม่ดีนัก ในขณะที่ค้นหาวิธีแก้ปัญหาฉันพบบทความนี้และตัดสินใจลองใช้ 'เส้นคู่ขนานพล็อต' อีกครั้งมันทำงานได้ดีมากสำหรับดาต้าพอยน์จำนวนน้อย: แต่มันก็ยิ่งยากที่จะทำให้เรื่องแบบนี้ดูดีเมื่อมีขนาดใหญ่มาก:ยังไม่มีข้อความยังไม่มีข้อความN ฉันคิดว่าฉันสามารถแสดงการแจกแจงของทั้งสองกลุ่มแยกต่างหากเช่นกับบ็อกซ์พล็อตหรือไวโอลินและพล็อตบรรทัดที่มีแถบข้อผิดพลาดด้านบนแสดงสองค่ามัธยฐาน / CIs แต่ฉันไม่ชอบความคิดนั้น ลักษณะการจับคู่ของข้อมูล ฉันยังไม่กระตือรือร้นในความคิดของพล็อตกระจาย 2D: ฉันต้องการการเป็นตัวแทนที่กะทัดรัดกว่าและเป็นแนวคิดหนึ่งที่ค่าของทั้งสองกลุ่มถูกพล็อตตามแกนเดียวกัน เพื่อความสมบูรณ์นี่คือข้อมูลที่มีลักษณะเหมือนการกระจายแบบสองมิติ: ไม่มีใครรู้วิธีที่ดีกว่าในการแสดงข้อมูลที่จับคู่กับขนาดตัวอย่างที่มีขนาดใหญ่มาก? คุณสามารถเชื่อมโยงฉันกับตัวอย่างได้ไหม แก้ไข ขออภัยฉันชัดเจนว่าไม่ได้ทำงานได้ดีพอที่จะอธิบายสิ่งที่ฉันกำลังมองหา ใช่พล็อตกระจายแบบ 2D ทำงานได้และมีหลายวิธีที่สามารถปรับปรุงให้ดีขึ้นเพื่อถ่ายทอดความหนาแน่นของคะแนนได้ดีขึ้น - ฉันสามารถกำหนดรหัสจุดตามการประมาณความหนาแน่นของเคอร์เนลได้ฉันสามารถสร้างฮิสโตแกรม 2D ได้ ฉันสามารถพล็อตรูปทรงที่ด้านบนของจุดเป็นต้น ฯลฯ ... อย่างไรก็ตามฉันคิดว่านี่เกินความจริงสำหรับข้อความที่ฉันพยายามสื่อ ฉันไม่สนใจเกี่ยวกับการแสดงความหนาแน่นของคะแนน 2 มิติต่อ se - ทั้งหมดที่ฉันต้องทำคือการแสดงให้เห็นว่าค่าสำหรับ 'บาร์' โดยทั่วไปมีขนาดใหญ่กว่าที่สำหรับ 'จุด' ในวิธีที่ง่ายและชัดเจนที่สุดเท่าที่จะทำได้ และโดยไม่สูญเสียธรรมชาติของข้อมูลที่จับคู่ …

2
ข้อสรุปจากผลลัพธ์ของการวิเคราะห์องค์ประกอบหลัก
ฉันพยายามเข้าใจผลลัพธ์ของการวิเคราะห์องค์ประกอบหลักที่ดำเนินการดังนี้ > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa > res = prcomp(iris[1:4], scale=T) > …
9 r  pca  interpretation 

4
ช่วยแปลพล็อตปฏิสัมพันธ์หรือไม่
ฉันมีปัญหาในการตีความแผนการโต้ตอบเมื่อมีการโต้ตอบระหว่างตัวแปรอิสระสองตัว กราฟต่อไปนี้มาจากไซต์นี้ : ที่นี่และเป็นตัวแปรอิสระและเป็นตัวแปรตามAAABBBD VDVDV คำถาม: มีปฏิสัมพันธ์และผลกระทบหลักของแต่ไม่มีผลกระทบหลักของAAABBB ฉันสามารถดูว่าสูงกว่าค่าของมูลค่าของสูงให้ B เป็นที่มิฉะนั้นเป็นค่าคงที่โดยไม่คำนึงถึงความคุ้มค่าของ ดังนั้นจึงมีการทำงานร่วมกันระหว่างและและผลกระทบหลักของ (เนื่องจากสูงกว่านำไปสู่สูงขึ้นโดยที่ค่าคงที่ )AAAD VDVDVB1B1B_1DVDVDVAAAAAABBBAAAAAADVDVDVBBBB1B1B_1 นอกจากนี้ผมจะเห็นว่าระดับที่แตกต่างของจะนำไปสู่ระดับที่แตกต่างกันของถือค่าคงที่ ดังนั้นจึงมีผลกระทบหลักของ B. แต่นี่ไม่ใช่กรณี ดังนั้นนี่ต้องหมายความว่าฉันตีความพล็อตปฏิสัมพันธ์อย่างไม่ถูกต้อง ผมทำอะไรผิดหรือเปล่า?BBBDVDVDVAAA ฉันแปลพล็อต 6-8 ผิดด้วย ตรรกะที่ฉันใช้ในการตีความพวกเขาเป็นแบบเดียวกับที่ฉันใช้ข้างต้นดังนั้นถ้าฉันรู้ข้อผิดพลาดที่ฉันทำด้านบนฉันควรจะสามารถตีความส่วนที่เหลือได้อย่างถูกต้อง มิฉะนั้นฉันจะอัปเดตคำถามนี้

1
ความหมายของ p-value ของตัวแปรตัวแบบการถดถอยโลจิสติก
ดังนั้นฉันจึงทำงานกับแบบจำลองการถดถอยโลจิสติกในอาร์แม้ว่าฉันจะยังใหม่กับสถิติฉันรู้สึกว่าฉันมีความเข้าใจเล็กน้อยเกี่ยวกับแบบจำลองการถดถอยในตอนนี้ แต่ยังมีบางสิ่งที่รบกวนฉัน: เมื่อมองไปที่รูปภาพที่เชื่อมโยงคุณจะเห็นสรุป R พิมพ์สำหรับรุ่นตัวอย่างที่ฉันสร้างขึ้น รูปแบบการพยายามที่จะคาดการณ์ว่าอีเมลในชุดข้อมูลที่จะได้รับการ refound หรือไม่ (ตัวแปรไบนารีisRefound) และชุดข้อมูลที่มีสองตัวแปรที่เกี่ยวข้องอย่างใกล้ชิดกับisRefoundคือnext24และnext7days- เหล่านี้เป็นยังไบนารีและบอกได้ว่า mail จะได้รับการคลิกในครั้งต่อไป 24 ชั่วโมง / 7 วันถัดจากจุดปัจจุบันในบันทึก ค่า p สูงควรระบุว่าผลกระทบที่ตัวแปรนี้มีต่อการทำนายแบบจำลองนั้นค่อนข้างสุ่มใช่ไหม? จากนี้ฉันไม่เข้าใจว่าทำไมความแม่นยำของแบบจำลองการคาดการณ์จึงลดลงต่ำกว่า 10% เมื่อตัวแปรสองตัวนี้ไม่ได้อยู่ในสูตรการคำนวณ หากตัวแปรเหล่านี้แสดงความสำคัญต่ำทำไมการลบออกจากแบบจำลองมีผลกระทบอย่างมาก ขอแสดงความนับถือและขอขอบคุณล่วงหน้า Rickyfox แก้ไข: ครั้งแรกที่ฉันลบเฉพาะ next24 ซึ่งควรให้ผลกระทบต่ำเพราะ coef มันค่อนข้างเล็ก ตามที่คาดไว้มีการเปลี่ยนแปลงเล็กน้อย - ไม่ต้องอัปโหลดรูปภาพสำหรับสิ่งนั้น การลบรุ่นถัดไป 7 วันมีผลกระทบอย่างมากต่อโมเดล: AIC 200k ขึ้นไปความแม่นยำลดลงถึง 16% และเรียกคืนได้ถึง 73%

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
จะตีความผลลัพธ์ของการลดขนาด / การปรับหลายมิติได้อย่างไร
ฉันทำการแยกย่อย SVD และมาตราส่วนหลายมิติของเมทริกซ์ข้อมูล 6 มิติเพื่อทำความเข้าใจโครงสร้างของข้อมูลให้ดีขึ้น น่าเสียดายที่ค่าเอกพจน์ทั้งหมดนั้นอยู่ในลำดับเดียวกันซึ่งหมายความว่าขนาดของข้อมูลเป็นจริง 6 อย่างไรก็ตามฉันอยากจะตีความค่าของเวกเตอร์เอกพจน์ได้ ตัวอย่างเช่นคนแรกดูเหมือนจะมากหรือน้อยเท่ากันในแต่ละมิติ (เช่น(1,1,1,1,1,1)) และที่สองก็มีโครงสร้างที่น่าสนใจ (เช่น(1,-1,1,-1,-1,1)) ฉันจะตีความเวกเตอร์เหล่านี้ได้อย่างไร คุณช่วยชี้ให้ฉันดูวรรณกรรมในเรื่องนี้ได้ไหม

2
ฉันจะตีความผลลัพธ์ของการทดสอบ Breusch – Pagan ได้อย่างไร
ในRฉันสามารถทำการทดสอบ Breusch – Pagan สำหรับ heteroscedasticity โดยใช้ncvTestฟังก์ชันของcarแพ็คเกจ การทดสอบ Breusch – Pagan เป็นประเภทของการทดสอบไคสแควร์ ฉันจะตีความผลลัพธ์เหล่านี้ได้อย่างไร: > require(car) > set.seed(100) > x1 = runif(100, -1, 1) > x2 = runif(100, -1, 1) > ncvTest(lm(x1 ~ x2)) Non-constant Variance Score Test Variance formula: ~ fitted.values Chisquare = 0.2343406 Df = 1 p = 0.6283239 …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.