คำถามติดแท็ก data-visualization

การสร้างข้อมูลกราฟิกที่เป็นประโยชน์และมีประโยชน์ (หากคำถามของคุณเกี่ยวกับวิธีการรับซอฟต์แวร์เฉพาะเพื่อสร้างเอฟเฟกต์เฉพาะอาจเป็นไปได้ว่าไม่ใช่หัวข้อที่นี่)

1
การแสดงสัดส่วนอย่างต่อเนื่อง
ฉันพยายามที่จะเห็นภาพข้อมูลผู้บริโภคบางส่วนซึ่งมี 4 หมวดหมู่ ผู้ใช้สามารถสลับไปมาระหว่างหมวดหมู่ต่างๆได้ฟรี ฉันต้องการเห็นสวิตช์สามหรือสี่อันล่าสุดสำหรับแต่ละคน ดังนั้นเราจะเริ่มต้นด้วยพล็อตที่มีคอลัมน์ที่มีสัดส่วน 4 แบบซ้อนกัน หลังจากนั้นเราก็จะได้ 16 เพราะแต่ละหมวดหมู่แบ่งออกเป็นสิ่งที่คนทำในครั้งก่อนแล้ว 64 และต่อ ๆ ไปจนกว่าถังขยะจะเล็กเกินไปที่จะเป็นประโยชน์ ฉันกำลังคิดว่าจะอยู่ระหว่างแผนภูมิ marimekko กับ barchart ที่ซ้อนกันหรือ dendro กรัมควรทำงานได้ แต่ฉันไม่รู้ด้วยซ้ำว่าจะเรียกว่าอะไร! หากใครสามารถช่วยกับประเภทของพล็อตที่ฉันควรจะใช้และถ้าคุณต้องการที่จะดีเป็นพิเศษวิธีการใช้ใน R แล้วฉันจะขอบคุณมาก

4
ปรับขนาดข้อมูลที่มีขนาดต่างกันสำหรับการวางแผน
ดูที่ชุดข้อมูลต่อไปนี้: Date Visits Carts carts Orders Created converted Created 2011-11-11 12277 161 9 36 2011-11-12 11871 93 5 19 2011-11-13 13072 107 8 8 2011-11-14 13594 112 4 34 2011-11-15 12741 129 8 43 2011-11-16 15491 261 16 57 2011-11-17 13418 186 17 42 ฉันถูกขอให้พล็อตเรื่องนี้บนกราฟโดยใช้วันที่มีแกน X และข้อมูลส่วนที่เหลือบนแกน Y ปัญหาคือขนาดของข้อมูลแตกต่างกันอย่างมาก ที่การเข้าชมอยู่ในหลักพันและคำสั่งซื้อที่สร้างขึ้นนั้นอยู่ในระดับต่ำ …

7
ชุดข้อมูลสำหรับตัวอย่างการสร้างภาพข้อมูลการสอนและการวิจัย
ฉันกำลังค้นหาชุดข้อมูลที่มีอยู่ที่เราสามารถใช้เพื่อทดสอบเทคนิคหลายชุดข้อมูลที่เรากำลังทำการวิจัย ฉันรู้ว่ามีทรัพยากรหลายอย่างเช่นที่รวมอยู่ใน R (ลองplot(Orange)หรือดูที่นี่ ) แต่ฉันต้องการก้าวไปข้างหน้าหนึ่งก้าว: ชุดข้อมูลใดในโลกแห่งความจริงที่ดีที่สุดในการทดสอบเครื่องมือสร้างภาพข้อมูล คุณใช้ชุดข้อมูลใดในเอกสารวิชาการหรือสไลด์การสอนเกี่ยวกับชุดข้อมูล ตัวอย่างที่ดีที่สุดจากโลกแห่งความจริงที่จะแสดงให้เห็นข้อดีของการสร้างกราฟคืออะไร?

3
แนวทางการค้นหาความรู้ใหม่ในข้อมูล
ฉันพล็อตเรื่องเพื่อชี้ให้ตัวเองหรือคนอื่น โดยปกติแล้วคำถามจะเริ่มต้นกระบวนการนี้และบ่อยครั้งที่บุคคลนั้นขอความหวังเพื่อหาคำตอบเฉพาะ ฉันจะเรียนรู้สิ่งที่น่าสนใจเกี่ยวกับข้อมูลในแบบที่มีอคติน้อยลงได้อย่างไร ตอนนี้ฉันทำตามวิธีนี้อย่างคร่าวๆ: สถิติสรุป Stripchart พล็อตกระจาย อาจทำซ้ำกับชุดย่อยของข้อมูลที่น่าสนใจ แต่นั่นดูเหมือนจะไม่เป็นระเบียบหรือเป็นวิทยาศาสตร์เพียงพอ มีแนวทางหรือขั้นตอนการปฏิบัติตามที่เปิดเผยข้อมูลเกี่ยวกับข้อมูลที่ฉันไม่คิดว่าจะถามหรือไม่? ฉันจะรู้ได้อย่างไรว่าได้ทำการวิเคราะห์อย่างเพียงพอแล้ว

4
ข้อผิดพลาดมาตรฐานที่ใช้คืออะไร
ฉันใช้บทช่วยสอนที่ฉันพบและวางแผนค่าเฉลี่ยพร้อมกับข้อผิดพลาดมาตรฐานเพื่อแสดงข้อมูลของฉัน แต่ฉันมีปัญหาเกี่ยวกับผลลัพธ์ พล็อตของฉันดังที่แสดงด้านล่าง: ข้อผิดพลาดมาตรฐานบางอย่าง (แสดงเป็นแถบข้อผิดพลาด) แตกต่างกันมากและบางข้อก็ใกล้เคียงกับศูนย์มาก

6
ชื่อสามัญที่ดีสำหรับแผนภูมิของสิ่งต่าง ๆ ตามเวลาของวันคืออะไร
เรากำลังสร้างแผนภูมิที่แสดงปริมาณการใช้งานตามช่วงเวลาของวันในช่วงเวลาที่กำหนด ดังนั้นแกน y คือการรับส่งข้อมูล, แกน x คือเที่ยงคืน, 1am, 2am, และมันอาจเป็นวันในสัปดาห์ ชื่อสามัญของแผนภูมิประเภทนี้คืออะไร? ฉันมากับ "แผนภูมิวงกลม" เป็นมาตรฐานหรือไม่ มีไหม ปรับปรุง: เพียงเพิ่มความชัดเจนมากขึ้นสิ่งที่แสดงในแผนภูมิบนสุดไม่ใช่วันเดียวเป็นการรวมหลายวัน เช่นเมื่อเดือนที่แล้วมีค่าเฉลี่ย 6 โมงเช้าต่ำกว่าเที่ยง ในทำนองเดียวกันในแผนภูมิด้านล่างในปีที่ผ่านมาการจราจรลดลงในวันเสาร์

7
วิธีการคำนวณการวัดจากศูนย์กลางในเครือข่าย 4 ล้าน edge โดยใช้ R?
ฉันมีไฟล์ CSV กับ 4 ล้านขอบของเครือข่ายผู้กำกับที่เป็นตัวแทนของคนสื่อสารกับแต่ละอื่น ๆ (เช่นจอห์นส่งข้อความไปยังแมรี่แมรี่ส่งข้อความไปยังแอนจอห์นส่งอีกข้อความถึงแมรี่, ฯลฯ ) ฉันต้องการทำสองสิ่ง: ค้นหาการศึกษาระดับปริญญา, ระหว่างและ (อาจ) มาตรการศูนย์กลาง eigenvector สำหรับแต่ละคน รับภาพของเครือข่าย ฉันต้องการทำสิ่งนี้ในบรรทัดคำสั่งบนเซิร์ฟเวอร์ Linux เนื่องจากแล็ปท็อปของฉันมีพลังงานไม่มาก ฉันได้ติดตั้ง R ไว้บนเซิร์ฟเวอร์นั้นและไลบรารี statnet ฉันพบโพสต์ของคนที่มีความสามารถมากกว่าฉันที่พยายามทำสิ่งเดียวกันและมีปัญหา ดังนั้นฉันจึงสงสัยว่าถ้ามีคนอื่นที่มีพอยน์เตอร์เกี่ยวกับวิธีการทำเช่นนี้โดยเฉพาะอย่างยิ่งพาฉันทีละขั้นตอนเพราะฉันรู้วิธีการโหลดไฟล์ CSV และไม่มีอะไรอื่น เพียงให้แนวคิดแก่คุณนี่คือลักษณะของไฟล์ CSV ของฉัน: $ head comments.csv "src","dest" "6493","139" "406705","369798" $ wc -l comments.csv 4210369 comments.csv

2
R: อัปเดตกราฟแบบไดนามิก [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน8 เดือนที่ผ่านมา นี่เป็นคำถามการสร้างภาพข้อมูล ฉันมีฐานข้อมูลที่มีข้อมูลบางอย่างที่มีการแก้ไขอย่างต่อเนื่อง (อัพเดตออนไลน์) อะไรคือวิธีที่ดีที่สุดใน R ในการอัปเดตกราฟทุกครั้งที่บอกว่า 5 หรือ 10 วินาที (โดยไม่ต้องวางแผนใหม่ทุกสิ่งเป็นไปได้)? เฟร็ด

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

3
วิธีการพล็อตแฟนคลับ (Polar) Dendrogram ใน R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันหมายถึงสิ่งนี้: ชุดข้อมูลที่แนะนำสำหรับการแสดงวิธีแก้ไข: data(mtcars) plot(hclust(dist(mtcars)))

10
คุณจะวาดโมเดลสมการเชิงโครงสร้าง / MPLUS ได้อย่างไร
ฉันกำลังมองหาเครื่องมือซอฟต์แวร์ (โดยเฉพาะโอเพนซอร์ซ) เพื่อวาดสมการเชิงโครงสร้าง / แบบผสมอย่างมีประสิทธิภาพและสวยงาม หลังจากดูเป็น xfig และ graphviz ตอนนี้ฉันติดอยู่กับแพ็คเกจกราฟิกแบบเวกเตอร์ทั่วไปinkscapeเพราะดูเหมือนยืดหยุ่นที่สุด ฉันต้องการสำรวจชุมชน stat.stackexchange: คุณจะวาดสมการโครงสร้าง / ตัวแบบผสมได้อย่างไร คุณใช้ซอฟต์แวร์อะไร

2
ฉันจะจัดเรียงกราฟสองกราฟในแนวตั้งด้วยระดับ x ที่เหมือนกัน แต่มาตราส่วน y ที่แตกต่างใน R ได้อย่างไร
ทักทาย, ขณะนี้ฉันกำลังทำสิ่งต่อไปนี้ใน R: require(zoo) data <- read.csv(file="summary.csv",sep=",",head=TRUE) cum = zoo(data$dcomp, as.Date(data$date)) data = zoo(data$compressed, as.Date(data$date)) data <- aggregate(data, identity, tail, 1) cum <- aggregate(cum, identity, sum, 1) days = seq(start(data), end(data), "day") data2 = na.locf(merge(data, zoo(,days))) plot(data2,xlab='',ylab='compressed bytes',col=rgb(0.18,0.34,0.55)) lines(cum,type="h",col=rgb(0,0.5,0)) สนิปของ summary.csv: date,revision,file,lines,nclass,nattr,nrel,bytes,compressed,diff,dcomp 2007-07-25,16,model.xml,96,11,22,5,4035,991,0,0 2007-07-27,17,model.xml,115,16,26,6,4740,1056,53,777 2007-08-09,18,model.xml,106,16,26,7,4966,1136,47,761 2007-08-10,19,model.xml,106,16,26,7,4968,1150,4,202 2007-09-06,81,model.xml,111,16,26,7,5110,1167,13,258 ... เส้นสองเส้นสุดท้ายเขียนข้อมูลที่ฉันต้องการและผลลัพธ์คล้ายกับสิ่งต่อไปนี้: เส้นสีน้ำเงินคือเอนโทรปีของสิ่งประดิษฐ์ที่ฉันสนใจ …

2
การแสดง "ฮิสโตแกรม" หลายรายการ (แผนภูมิแท่ง)
ฉันมีปัญหาในการเลือกวิธีที่ถูกต้องในการมองเห็นข้อมูล สมมติว่าเรามีร้านหนังสือที่ขายหนังสือและหนังสือทุกเล่มที่มีอย่างน้อยหนึ่งหมวดหมู่ สำหรับร้านหนังสือถ้าเรานับหมวดหนังสือทั้งหมดเราจะได้ฮิสโตแกรมที่แสดงจำนวนหนังสือที่จัดอยู่ในหมวดหมู่เฉพาะสำหรับร้านหนังสือนั้น ฉันต้องการเห็นภาพพฤติกรรมของร้านหนังสือฉันต้องการดูว่าพวกเขาชอบหมวดหมู่มากกว่าหมวดหมู่อื่นหรือไม่ ฉันไม่ต้องการดูว่าพวกเขานิยม sci-fi ทั้งหมดหรือไม่ แต่ฉันต้องการดูว่าพวกเขาปฏิบัติต่อทุกหมวดหมู่อย่างเท่าเทียมกันหรือไม่ ฉันมีร้านหนังสือประมาณ 1 ล้าน ฉันคิดถึงวิธีการ 4 วิธี: ตัวอย่างข้อมูลแสดงฮิสโตแกรมของร้านหนังสือเพียง 500 แสดงใน 5 หน้าแยกโดยใช้ตาราง 10x10 ตัวอย่างของตาราง 4x4: เหมือนกับ # 1 แต่คราวนี้จัดเรียงค่าแกน x ตามจำนวนนับของพวกเขาดังนั้นหากมีความนิยมมันจะเห็นได้ง่าย ลองนึกภาพการใส่ฮิสโตแกรมใน # 2 เข้าด้วยกันเหมือนสำรับและแสดงมันในแบบ 3 มิติ บางสิ่งเช่นนี้ แทนที่จะใช้สีแกนที่สามฟ้องร้องเพื่อเป็นตัวแทนของสีดังนั้นการใช้แผนที่ความร้อน (2D ฮิสโตแกรม): ถ้าโดยทั่วไปร้านหนังสือต้องการบางหมวดหมู่ให้ผู้อื่นมันจะแสดงเป็นไล่ระดับสีที่ดีจากซ้ายไปขวา คุณมีแนวคิด / เครื่องมือสร้างภาพอื่น ๆ เพื่อเป็นตัวแทนของฮิสโตแกรมหลายรายการหรือไม่?


10
แนะนำการสร้างภาพไลบรารีสำหรับแอปพลิเคชันแบบสแตนด์อโลน
คุณต้องการแนะนำให้แสดงภาพไลบรารีใดในแปลง (พล็อตกราฟ ... ) ในแอปพลิเคชันแบบสแตนด์อโลน (Linux, .Net, Windows หรืออะไรก็ตาม) ประสิทธิภาพที่เหมาะสมจะดีเช่นกัน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.