คำถามติดแท็ก data-visualization

การสร้างข้อมูลกราฟิกที่เป็นประโยชน์และมีประโยชน์ (หากคำถามของคุณเกี่ยวกับวิธีการรับซอฟต์แวร์เฉพาะเพื่อสร้างเอฟเฟกต์เฉพาะอาจเป็นไปได้ว่าไม่ใช่หัวข้อที่นี่)

3
ซอฟต์แวร์สร้างภาพข้อมูลโอเพ่นซอร์สที่ดีที่สุดที่จะใช้กับ PowerPoint
ซอฟต์แวร์สร้างภาพข้อมูลโอเพ่นซอร์สที่ดีที่สุดคืออะไร? ฉันต้องการสิ่งต่อไปนี้: สามารถนำเข้าข้อมูลจาก Microsoft Excel (การนำเข้าข้อมูลจากฐานข้อมูล Oracle ก็ดีเช่นกัน แต่ไม่จำเป็น) ชาร์ตที่สร้างโดยซอฟต์แวร์สามารถส่งออกไปยัง Microsoft PowerPoint (คัดลอกและวางได้ดีกับฉัน) โอเพ่นซอร์ส & ใช้งานง่าย

3
การทำความเข้าใจกลุ่มความเชื่อมั่นจากการถดถอยพหุนาม
ฉันพยายามเข้าใจผลลัพธ์ที่เห็นในกราฟด้านล่าง โดยปกติแล้วฉันมักจะใช้ Excel และรับเส้นการถดถอยเชิงเส้น แต่ในกรณีด้านล่างฉันใช้ R และฉันได้รับการถดถอยพหุนามด้วยคำสั่ง: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() ดังนั้นคำถามของฉันถึงกับ: พื้นที่สีเทา (ลูกศร # 1) รอบ ๆ เส้นการถดถอยสีน้ำเงินคืออะไร นี่คือค่าเบี่ยงเบนมาตรฐานของการถดถอยพหุนามหรือไม่? ฉันสามารถพูดได้ไหมว่าสิ่งที่อยู่นอกพื้นที่สีเทา (ลูกศร # 2) คือ 'ผิดเพี้ยน' และอะไรก็ตามที่อยู่ในพื้นที่สีเทา (ลูกศร # 3) อยู่ในส่วนเบี่ยงเบนมาตรฐาน?

5
ลบจุดที่ไม่เกี่ยวข้องใกล้กับจุดศูนย์กลางของ QQ-plot
ฉันพยายามพล็อต QQ-plot ด้วยชุดข้อมูลสองชุดประมาณ 1.2 ล้านจุดใน R (ใช้ qqplot และป้อนข้อมูลลงใน ggplot2) การคำนวณนั้นง่ายพอ แต่กราฟผลลัพธ์นั้นโหลดช้าอย่างเจ็บปวดเนื่องจากมีหลายจุด ฉันได้ลองใช้การประมาณเชิงเส้นเพื่อลดจำนวนคะแนนเป็น 10,000 (นี่คือสิ่งที่ฟังก์ชั่น qqplot ทำอยู่แล้วถ้าหนึ่งในชุดข้อมูลของคุณมีขนาดใหญ่กว่าอีกชุดหนึ่ง) แต่คุณสูญเสียรายละเอียดจำนวนมากในหาง จุดข้อมูลส่วนใหญ่ที่อยู่ตรงกลางนั้นไร้ประโยชน์ - มันซ้อนทับกันมากจนอาจมีประมาณ 100 ต่อพิกเซล มีวิธีง่ายๆในการลบข้อมูลที่อยู่ใกล้กันเกินไปโดยไม่ปล่อยข้อมูลที่กระจัดกระจายไปทางหางหรือไม่?

3
วิธีการปรับขนาดไวโอลินสำหรับการเปรียบเทียบ?
ฉันกำลังพยายามวาดไวโอลินและสงสัยว่ามีวิธีปฏิบัติที่ดีที่สุดที่ยอมรับได้สำหรับการปรับขนาดพวกมันข้ามกลุ่มหรือไม่ นี่คือสามตัวเลือกที่ฉันได้ลองใช้mtcarsชุดข้อมูลR (Motor Trend Cars จากปี 1973 พบได้ที่นี่ ) ความกว้างเท่ากัน ดูเหมือนจะเป็นสิ่งที่กระดาษต้นฉบับ * ทำและสิ่งที่ R vioplotทำ ( ตัวอย่าง ) ดีสำหรับการเปรียบเทียบรูปร่าง พื้นที่ที่เท่าเทียมกัน ให้ความรู้สึกถูกต้องเนื่องจากแต่ละพล็อตเป็นพล็อตความน่าจะเป็นดังนั้นพื้นที่ของแต่ละอันควรเท่ากับ 1.0 ในพื้นที่ประสานงานบางแห่ง ดีสำหรับการเปรียบเทียบความหนาแน่นภายในแต่ละกลุ่ม แต่ดูเหมือนจะเหมาะสมกว่าหากมีการวางทับ พื้นที่ถ่วงน้ำหนัก ชอบพื้นที่เท่ากัน แต่ถ่วงน้ำหนักตามจำนวนการสังเกต 6 สูบค่อนข้างบางลงเนื่องจากมีรถยนต์น้อยกว่า ดีสำหรับการเปรียบเทียบความหนาแน่นข้ามกลุ่ม * พล็อตไวโอลิน: Synergis พล็อตกล่องความหนาแน่นของการติดตาม (DOI: 10.2307 / 2685478)

3
วิธีที่ดีที่สุดในการใส่ฮิสโตแกรมสองตัวในระดับเดียวกัน?
สมมติว่าฉันมีการแจกแจงสองแบบที่ฉันต้องการเปรียบเทียบในรายละเอียดนั่นคือในวิธีที่ทำให้รูปร่างขนาดและการเปลี่ยนแปลงมองเห็นได้ง่าย วิธีหนึ่งที่ดีในการทำเช่นนี้คือการพล็อตฮิสโตแกรมสำหรับการแจกแจงแต่ละครั้งวางไว้ในระดับ X ที่เหมือนกัน เมื่อทำเช่นนี้จะต้องทำอย่างไรให้เกิดความผิดพลาด? ฮิสโทแกรมทั้งสองควรใช้ขอบเขตของช่องเก็บเดียวกันแม้ว่าการกระจายครั้งเดียวจะกระจายมากกว่าที่อื่น ๆ อย่างเช่นในภาพที่ 1 ด้านล่าง? ควรทำการแยกกันอย่างอิสระสำหรับฮิสโตแกรมแต่ละชิ้นก่อนซูมเช่นเดียวกับในภาพที่ 2 ด้านล่าง? เรื่องนี้มีกฎง่ายๆหรือไม่?

4
ทรัพยากรสำหรับการเรียนรู้ที่จะใช้ (/ สร้าง) การสร้างภาพข้อมูลเชิงสถิติแบบไดนามิก (/ แบบโต้ตอบ)
ฉันต้องการเรียนรู้เพิ่มเติมเล็กน้อยเกี่ยวกับการสร้างภาพข้อมูลแบบอินเทอร์แอคทีฟ (การซูมการชี้การแปรงการทำแผนที่จุดเป็นต้น) ฉันยินดีต้อนรับทุกคน: บทช่วยสอน / คู่มือ / หนังสือ (?) / วิดีโอเกี่ยวกับวิธีการใช้วิธีดังกล่าวสำหรับการสำรวจทางสถิติ ตัวชี้สำหรับแพ็กเกจ data-viz แบบโต้ตอบที่ดี / น่าสนใจ(ใน R และภายนอก) เพียงแค่การเริ่มต้นกลิ้งบอล, ฉันรู้ว่าใน R มีหลายวิธีที่จะได้รับการสร้างภาพแบบโต้ตอบเช่นrggobiใหม่แพคเกจ googleViz Rที่แพคเกจนิเมชั่นและบางคนอื่น ๆ แต่ถ้ามีแพ็กเกจอื่น ๆ ที่ควรค่าแก่การสำรวจ (เสนอสิ่งที่ R ไม่ได้) ฉันยินดีที่จะรู้เกี่ยวกับพวกเขา (เช่น jmp, mathlab, spss, sas, excel, และอื่น ๆ ) PS: นี่เป็นคำถามแรกที่ใช้แท็ก "การสร้างภาพเชิงโต้ตอบ"

1
วิธีที่จะทำให้ปิรามิดอายุเหมือนพล็อตใน R?
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ Age pyramid มีลักษณะดังนี้: ฉันต้องการทำสิ่งที่คล้ายกันนั่นคือ 2 barplots (ไม่ใช่ histograms) ที่มีหมวดหมู่เดียวกันหมุนในแนวตั้งและขยายไปทั้งสองด้านเหมือนกับในปิรามิด มันเป็นวิธีง่ายๆในการทำเช่นนี้ใน R? มันก็ดีที่จะควบคุมสีของแต่ละแท่ง

4
ติดตามผล: ในแบบผสมภายในระหว่างการวางแผน ANOVA ประมาณ SEs หรือ SE จริง
ขณะนี้ฉันกำลังเขียนบทความและสะดุดกับคำถามนี้เมื่อวานนี้ซึ่งทำให้ฉันตั้งคำถามเดียวกันกับตัวเอง มันจะดีกว่าหรือไม่ที่จะให้กราฟกับข้อผิดพลาดมาตรฐานจริงจากข้อมูลหรือประมาณจาก ANOVA ของฉัน เนื่องจากคำถามจากเมื่อวานค่อนข้างไม่เจาะจงและของฉันค่อนข้างเจาะจงฉันคิดว่ามันเหมาะสมที่จะถามคำถามติดตามนี้ รายละเอียด: ฉันได้ทำการทดลองในโดเมนจิตวิทยาเกี่ยวกับความรู้ความเข้าใจ (การใช้เหตุผลเชิงเงื่อนไข) เปรียบเทียบสองกลุ่ม (คำแนะนำแบบอุปนัยและนิรนัยคือการยักย้ายระหว่างอาสาสมัคร) กับการแก้ไขภายในสองวิชา (ประเภทปัญหาและเนื้อหาของปัญหาแต่ละรายการด้วย สองระดับปัจจัย) ผลลัพธ์มีลักษณะเช่นนี้ (แผงด้านซ้ายที่มีการประมาณค่า SE จาก ANOVA เอาท์พุท, แผงด้านขวาที่มีการประมาณค่า SE จากข้อมูล): โปรดสังเกตว่าบรรทัดที่แตกต่างกันแสดงถึงกลุ่มที่แตกต่างกันสองกลุ่ม (เช่น การปรับเปลี่ยนวิชาจะถูกพล็อตบนแกน x (เช่นระดับปัจจัย 2x2) ในข้อความที่ฉันให้ผลลัพธ์ตามความต้องการของ ANOVA และแม้แต่การเปรียบเทียบที่วางแผนไว้สำหรับการโต้ตอบข้ามที่สำคัญตรงกลาง SE อยู่ที่นั่นเพื่อให้คำแนะนำผู้อ่านเกี่ยวกับความแปรปรวนของข้อมูล ฉันชอบ SEs มากกว่าส่วนเบี่ยงเบนมาตรฐานและช่วงความเชื่อมั่นเนื่องจากไม่ใช่เรื่องธรรมดาที่จะพล็อต SD และมีปัญหาที่รุนแรงเมื่อเปรียบเทียบ CIs ภายในและระหว่างวิชา จากพวกเขา). หากต้องการทำซ้ำคำถามของฉัน: จะดีกว่าที่จะวางแผน SEs ที่ประเมินจาก ANOVA หรือฉันควรจะแปลง SEs ที่ประเมินจากข้อมูลดิบ? ปรับปรุง: …

9
ซอฟต์แวร์สร้างภาพข้อมูลสำหรับการทำคลัสเตอร์
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการรวมกลุ่ม ~ 22,000 คะแนน อัลกอริทึมการจัดกลุ่มจำนวนมากทำงานได้ดีขึ้นด้วยการเดาเริ่มต้นที่มีคุณภาพสูงขึ้น มีเครื่องมืออะไรบ้างที่สามารถให้ความคิดที่ดีเกี่ยวกับรูปทรงคร่าวๆของข้อมูล ฉันต้องการเลือกการวัดระยะทางของฉันเองดังนั้นโปรแกรมที่ฉันสามารถป้อนรายการระยะทางตามเข็มคู่เพื่อให้ใช้ได้ ฉันต้องการที่จะทำบางสิ่งบางอย่างเช่นไฮไลต์ภูมิภาคหรือคลัสเตอร์บนจอแสดงผลและรับรายการจุดข้อมูลที่อยู่ในพื้นที่นั้น ต้องการซอฟต์แวร์ฟรี แต่ฉันมี SAS และ MATLAB อยู่แล้ว

4
เทคนิคกราฟิกใดที่ใช้ในการสร้างแบบจำลองสมการโครงสร้าง?
ฉันอยากรู้ว่ามีเทคนิคแบบกราฟิกที่เฉพาะเจาะจงหรือเหมาะสมกับการสร้างแบบจำลองสมการโครงสร้าง ฉันเดาว่าสิ่งนี้อาจอยู่ในหมวดหมู่สำหรับเครื่องมือสำรวจสำหรับการวิเคราะห์ความแปรปรวนร่วมหรือการวินิจฉัยเชิงกราฟิกสำหรับการประเมินโมเดล SEM (ฉันไม่ได้คิดถึงแผนภาพเส้นทาง / กราฟที่นี่จริง ๆ )

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

1
GAM กับ LOESS และ splines
บริบท : ผมอยากจะวาดเส้นใน scatterplot ที่ไม่ปรากฏพาราดังนั้นฉันใช้geom_smooth()ในในggplot Rมันจะส่งคืนโดยอัตโนมัติที่geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.ฉันรวบรวม GAM มาสำหรับโมเดลเสริมทั่วไปและใช้ลูกบาศก์อิสระ การรับรู้ต่อไปนี้ถูกต้องหรือไม่ ดินเหลืองคาดการณ์การตอบสนองที่ค่าเฉพาะ เส้นโค้งเป็นการประมาณที่เชื่อมต่อฟังก์ชั่นที่แตกต่างกันที่เหมาะสมกับข้อมูล (ซึ่งประกอบเป็นแบบจำลองการเติมทั่วไป) และลูกบาศก์ Splines เป็นประเภทของเส้นโค้งที่ใช้เฉพาะที่นี่ ในที่สุดควรใช้ splines เมื่อใดควรใช้ LOESS เมื่อใด

4
พล็อตนี้ชื่ออะไรที่ใช้เส้นแนวตั้งเพื่อแสดงการกระจาย?
มีชื่ออย่างเป็นทางการสำหรับพล็อตที่ง่ายมากนี้ซึ่งเส้นแนวตั้งระบุการกระจายตัวของตัวอย่างบางส่วนในช่วงหรือไม่?

4
พล็อตกล่องข้อมูลใดให้ข้อมูลว่าฮิสโตแกรมไม่มี?
ฮิสโทแกรมให้ความรู้สึกที่ดีเกี่ยวกับการกระจายตัวของตัวแปร พล็อตกล่องพยายามทำสิ่งเดียวกัน แต่อย่าให้ภาพการกระจายตัวของตัวแปรนี้เป็นอย่างดี ฉันไม่เข้าใจว่าทำไมคนถึงใช้กล่องแปลง ฮิสโทแกรมดีกว่าในทุกด้าน มีเหตุผลที่ฉันจะใช้ทั้งคู่หรือไม่ สิ่งเดียวที่ฉันคิดว่าพล็อตกล่องให้คือ: ค่าผิดปกติ! มันบอกเราว่าการสังเกตใดที่อาจเป็นค่าผิดปกติ

4
สร้างกราฟตัวอย่างขนาดเล็ก
ฉันมีชุดข้อมูลขนาดเล็กจำนวน 14 ครั้งเพื่อให้งานเสร็จสมบูรณ์ อย่างไรก็ตามฉันมีปัญหาในการหากราฟที่เหมาะสมเพื่อใช้ในการทำกราฟข้อมูล หากตัวอย่างมีขนาดใหญ่กว่าฉันจะใช้พล็อตกล่องหรือฮิสโตแกรม แต่ไม่แน่ใจว่าควรใช้ในกรณีนี้เมื่อกลุ่มตัวอย่างมีขนาดเล็กหรือไม่ อัปเดต: เวลาคือ 5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.9,4.9,4.9,4.9,4.2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.