คำถามติดแท็ก data-visualization

การสร้างข้อมูลกราฟิกที่เป็นประโยชน์และมีประโยชน์ (หากคำถามของคุณเกี่ยวกับวิธีการรับซอฟต์แวร์เฉพาะเพื่อสร้างเอฟเฟกต์เฉพาะอาจเป็นไปได้ว่าไม่ใช่หัวข้อที่นี่)

2
ความแตกต่างระหว่าง PCA และการจัดกลุ่มสเปกตรัมสำหรับชุดตัวอย่างขนาดเล็กของคุณลักษณะบูลีน
ฉันมีชุดข้อมูลจำนวน 50 ตัวอย่าง แต่ละตัวอย่างประกอบด้วยคุณลักษณะบูลีน 11 (อาจมีความสัมพันธ์) ฉันต้องการที่จะเห็นภาพตัวอย่างเหล่านี้ในพล็อต 2D และตรวจสอบว่ามีกลุ่ม / กลุ่มใน 50 ตัวอย่างหรือไม่ ฉันได้ลองสองวิธีต่อไปนี้: (a) เรียกใช้ PCA บนเมทริกซ์ 50x11 และเลือกสององค์ประกอบหลักแรก ฉายข้อมูลลงบนพล็อต 2 มิติและรัน K-mean อย่างง่ายเพื่อระบุกลุ่ม (b) สร้างเมทริกซ์ความคล้ายคลึงกัน 50x50 (โคไซน์) เรียกใช้การจัดกลุ่มสเปกตรัมเพื่อลดมิติตามด้วย K-mean อีกครั้ง อะไรคือแนวคิดที่แตกต่างระหว่างการทำ PCA โดยตรงกับการใช้ค่าลักษณะเฉพาะของเมทริกซ์ความเหมือนกัน? ดีกว่าอีกไหม? นอกจากนี้ยังมีวิธีที่ดีกว่าในการแสดงภาพข้อมูลในแบบ 2D หรือไม่? เนื่องจากขนาดตัวอย่างของฉันถูก จำกัด ไว้ที่ 50 เสมอและชุดคุณลักษณะของฉันอยู่ในช่วง 10-15 เสมอฉันยินดีที่จะลองใช้วิธีการต่างๆแบบทันทีและเลือกที่ดีที่สุด คำถามที่เกี่ยวข้อง: การ จัดกลุ่มตัวอย่างโดยการทำคลัสเตอร์หรือ PCA

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

3
มีขีด จำกัด สูงสุดของจำนวนช่วงเวลาในฮิสโตแกรมหรือไม่?
ฉันได้อ่านหลายบทความและเนื้อหาจากหนังสือที่อธิบายถึงวิธีการเลือกที่ดีจำนวนของช่วง (ถังขยะ) สำหรับ histogram ของชุดข้อมูล แต่ฉันสงสัยว่าถ้ามีความยากสูงสุดจำนวนช่วงเวลาที่อยู่กับจำนวนของคะแนนใน ชุดข้อมูลหรือเกณฑ์อื่น ๆ ความเป็นมา:เหตุผลที่ฉันถามคือฉันพยายามเขียนซอฟต์แวร์ตามขั้นตอนจากรายงานการวิจัย ขั้นตอนหนึ่งในกระบวนการนี้คือการสร้างฮิสโตแกรมหลาย ๆ อันจากชุดข้อมูลจากนั้นเลือกความละเอียดที่เหมาะสมที่สุดตามฟังก์ชั่นลักษณะ (กำหนดโดยผู้เขียนบทความ) ปัญหาของฉันคือผู้เขียนไม่ได้กล่าวถึงขอบเขตบนสำหรับช่วงเวลาที่จะทดสอบ (ฉันมีหลายร้อยชุดข้อมูลในการวิเคราะห์และแต่ละคนสามารถมีความแตกต่างกัน "ที่ดีที่สุด" จำนวนของถังขยะ. นอกจากนี้มันเป็นสิ่งสำคัญที่ดีที่สุดจำนวนถังขยะจะถูกเลือกเพื่อให้ตนเองดูที่ผลลัพธ์และการเลือกที่ดีจะไม่ งาน.) การกำหนดจำนวนช่วงเวลาสูงสุดเพียงเพื่อให้เป็นจำนวนคะแนนในชุดข้อมูลเป็นแนวทางที่ดีหรือมีเกณฑ์อื่น ๆ ที่มักใช้ในสถิติหรือไม่

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
วิธีสร้างไดอะแกรมบาร์พล็อตโดยที่บาร์อยู่เคียงข้างกันใน R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการสร้าง bardiagram สำหรับข้อมูลเหล่านี้ใน R (อ่านจากไฟล์ CVS): Experiment_Name MetricA MetricB Just_X 2 10 Just_X_and_Y 3 20 ที่จะมีแผนภาพต่อไปนี้: ฉันเป็นผู้เริ่มต้นและฉันไม่รู้ว่าจะเริ่มต้นอย่างไร

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
ฉันจะเน้นเสียงแก้ไขที่มีเสียงดังในอนุกรมเวลาได้อย่างไร
ฉันมีข้อมูลอนุกรมเวลาจำนวนมาก - ระดับน้ำและความเร็วเทียบกับเวลา มันเป็นผลลัพธ์จากการจำลองแบบไฮดรอลิก เป็นส่วนหนึ่งของกระบวนการตรวจสอบเพื่อยืนยันว่าแบบจำลองทำงานได้ตามที่คาดหวังฉันต้องวางแผนในแต่ละช่วงเวลาเพื่อให้แน่ใจว่าไม่มี "การโยกเยก" ในข้อมูล (ดูตัวอย่างการโยกเยกเล็กน้อยด้านล่าง) การใช้ UI ของซอฟต์แวร์การสร้างแบบจำลองเป็นวิธีที่ค่อนข้างช้าและลำบากในการตรวจสอบข้อมูลนี้ ฉันจึงเขียนแมโคร VBA สั้น ๆ เพื่อนำเข้าบิตข้อมูลต่าง ๆ จากแบบจำลองรวมถึงผลลัพธ์ลงใน Excel และพล็อตพวกมันทั้งหมดในครั้งเดียว ฉันหวังว่าจะเขียนแมโคร VBA สั้น ๆ อีกชุดเพื่อวิเคราะห์ข้อมูลอนุกรมเวลาและเน้นส่วนที่สงสัย สิ่งเดียวที่ฉันคิดก็คือฉันสามารถวิเคราะห์ความชันของข้อมูลได้บ้าง ทุกที่ที่ความชันเปลี่ยนแปลงอย่างรวดเร็วจากการเป็นค่าบวกเป็นค่าลบหลายครั้งภายในหน้าต่างการค้นหาที่ระบุอาจถูกจัดประเภทว่าไม่เสถียร ฉันพลาดเทคนิคที่ง่ายกว่านี้ไหม? โดยพื้นฐานแล้วการจำลอง "เสถียร" ควรให้เส้นโค้งที่ราบรื่นมาก การเปลี่ยนแปลงอย่างฉับพลันใด ๆ มีแนวโน้มที่จะเป็นผลมาจากความไม่แน่นอนในการคำนวณ

1
รูปร่างคล้ายลิ่มของพล็อต PCA ระบุว่าอะไร?
ในของพวกเขาบนกระดาษ autoencoders สำหรับการจำแนกข้อความฮินตันและ Salakhutdinov แสดงให้เห็นถึงพล็อตที่ผลิตโดย 2 มิติ LSA (ซึ่งเป็นเรื่องที่เกี่ยวข้องอย่างใกล้ชิดกับ PCA): การใช้ PCA กับข้อมูลมิติสูงแตกต่างกันเล็กน้อยฉันได้รับพล็อตที่คล้ายกัน: (ยกเว้นในกรณีนี้ฉันอยากรู้ว่ามีโครงสร้างภายในหรือไม่) หากเราป้อนข้อมูลแบบสุ่มลงใน PCA เราจะได้รับดิสก์รูปหยดดังนั้นรูปทรงลิ่มนี้ไม่ได้สุ่ม มันหมายถึงอะไรด้วยตัวเอง?

2
สาขาวิทยาศาสตร์ใดที่ศึกษาว่าผู้คนตีความข้อมูลสรุปเชิงปริมาณและการสร้างภาพข้อมูลได้อย่างไร
มีแหล่งข้อมูลที่รู้จักกันดีมากมายซึ่งให้คำแนะนำเกี่ยวกับการสร้างภาพข้อมูล (เช่น Tufte, Stephen Few และ al , Nathan Yau .) แต่สำหรับสาขาใดที่เราอาจหันไปหาคำตอบของคำถามเช่นนี้ การวิจารณ์แผนภูมิวงกลมเกี่ยวข้องกับการปฏิบัติจริงหรือไม่? คนที่ตีความความยาวสเกลเชิงเส้นได้ดีกว่าความยาวส่วนโค้งมากหรือไม่? ว่าฉันสร้างสรุปดัชนีของชุดของตัวแปรพื้นฐานและอธิบายให้ผู้ชมทั่วไปทราบว่าสหรัฐอเมริกามีค่า 100 ในปี 2010 และ 110 ในปี 2015 คนส่วนใหญ่จะตีความตัวเลขเหล่านี้ได้อย่างไร มีนิสัยทางความคิดตามธรรมชาติที่ฉันควรพิจารณาเมื่อฉันนำเสนอตัวชี้วัดนี้เพื่อยกระดับคำอธิบายที่ดีขึ้นหรือเพื่อป้องกันการตีความที่ผิด? กล่าวอีกนัยหนึ่งว่าเขตข้อมูลทางวิทยาศาสตร์ใดที่สามารถนำเสนอข้อมูลเชิงปริมาณเพื่อค้นหาหลักการที่ชัดเจนและผ่านการทดสอบซึ่งช่วยในการจัดเรียงภาพข้อมูลและคำแนะนำการออกแบบที่มีอยู่มากมายในปัจจุบัน จุดมุ่งหมายไม่ใช่เพื่อหาคำแนะนำความคิดหรือฉันทามติในปัจจุบันเกี่ยวกับวิธีที่ดีที่สุดในการมองเห็นข้อมูลหรือเข้าหาปัญหาการสร้างภาพข้อมูลใหม่ แต่เพื่อเรียนรู้ที่จะมองหาวิทยาศาสตร์ของวิธีการที่คนตีความข้อมูลเชิงปริมาณและ / หรือภาพ (เครดิตพิเศษสำหรับการอ้างอิงวารสารการประชุมและนักวิชาการของสาขา)

5
เป็นวิธีที่ดีของกราฟิกที่แสดงจำนวนดาต้าพอยน์ที่จับคู่จำนวนมากคืออะไร?
ในเขตข้อมูลของฉันวิธีปกติในการพล็อตข้อมูลที่จับคู่นั้นเป็นชุดของส่วนของเส้นที่ลาดเอียงบาง ๆ ซ้อนทับมันด้วยค่ามัธยฐานและ CI ของค่ามัธยฐานของทั้งสองกลุ่ม: อย่างไรก็ตามพล็อตประเภทนี้กลายเป็นเรื่องยากที่จะอ่านเนื่องจากจำนวนดาต้าพอยน์มีขนาดใหญ่มาก (ในกรณีของฉันฉันมีตามลำดับ 10,000 คู่): การลดอัลฟ่าช่วยได้บ้าง แต่ก็ยังไม่ดีนัก ในขณะที่ค้นหาวิธีแก้ปัญหาฉันพบบทความนี้และตัดสินใจลองใช้ 'เส้นคู่ขนานพล็อต' อีกครั้งมันทำงานได้ดีมากสำหรับดาต้าพอยน์จำนวนน้อย: แต่มันก็ยิ่งยากที่จะทำให้เรื่องแบบนี้ดูดีเมื่อมีขนาดใหญ่มาก:ยังไม่มีข้อความยังไม่มีข้อความN ฉันคิดว่าฉันสามารถแสดงการแจกแจงของทั้งสองกลุ่มแยกต่างหากเช่นกับบ็อกซ์พล็อตหรือไวโอลินและพล็อตบรรทัดที่มีแถบข้อผิดพลาดด้านบนแสดงสองค่ามัธยฐาน / CIs แต่ฉันไม่ชอบความคิดนั้น ลักษณะการจับคู่ของข้อมูล ฉันยังไม่กระตือรือร้นในความคิดของพล็อตกระจาย 2D: ฉันต้องการการเป็นตัวแทนที่กะทัดรัดกว่าและเป็นแนวคิดหนึ่งที่ค่าของทั้งสองกลุ่มถูกพล็อตตามแกนเดียวกัน เพื่อความสมบูรณ์นี่คือข้อมูลที่มีลักษณะเหมือนการกระจายแบบสองมิติ: ไม่มีใครรู้วิธีที่ดีกว่าในการแสดงข้อมูลที่จับคู่กับขนาดตัวอย่างที่มีขนาดใหญ่มาก? คุณสามารถเชื่อมโยงฉันกับตัวอย่างได้ไหม แก้ไข ขออภัยฉันชัดเจนว่าไม่ได้ทำงานได้ดีพอที่จะอธิบายสิ่งที่ฉันกำลังมองหา ใช่พล็อตกระจายแบบ 2D ทำงานได้และมีหลายวิธีที่สามารถปรับปรุงให้ดีขึ้นเพื่อถ่ายทอดความหนาแน่นของคะแนนได้ดีขึ้น - ฉันสามารถกำหนดรหัสจุดตามการประมาณความหนาแน่นของเคอร์เนลได้ฉันสามารถสร้างฮิสโตแกรม 2D ได้ ฉันสามารถพล็อตรูปทรงที่ด้านบนของจุดเป็นต้น ฯลฯ ... อย่างไรก็ตามฉันคิดว่านี่เกินความจริงสำหรับข้อความที่ฉันพยายามสื่อ ฉันไม่สนใจเกี่ยวกับการแสดงความหนาแน่นของคะแนน 2 มิติต่อ se - ทั้งหมดที่ฉันต้องทำคือการแสดงให้เห็นว่าค่าสำหรับ 'บาร์' โดยทั่วไปมีขนาดใหญ่กว่าที่สำหรับ 'จุด' ในวิธีที่ง่ายและชัดเจนที่สุดเท่าที่จะทำได้ และโดยไม่สูญเสียธรรมชาติของข้อมูลที่จับคู่ …

2
วิธีแสดงการใช้งาน kWh เป็นรายปีเทียบกับอุณหภูมิเฉลี่ย?
เพียงเพื่อความสนุกฉันต้องการจัดทำแผนภูมิการใช้พลังงานในครัวเรือนรายเดือนของฉันทุกปี อย่างไรก็ตามฉันต้องการรวมการอ้างอิงถึงอุณหภูมิรายเดือนเพื่อให้ฉันสามารถตรวจสอบว่าบ้านหรือพฤติกรรมของฉันดีขึ้นแย่ลงหรือคงที่เกี่ยวกับการใช้งาน kWh ข้อมูลที่ฉันทำงานด้วย: +----------+--------+-----------+----------------+----------+-----------+------------+ | Month | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. | +----------+--------+-----------+----------------+----------+-----------+------------+ | Mar 2015 | 32 | 1048 | 33 | 40 | 60 | 50 | | Feb 2015 | 29 | …

3
ฟังก์ชันถ่ายโอนในแบบจำลองการพยากรณ์ - การตีความ
ฉันถูกครอบครองโดยการสร้างแบบจำลองของ ARIMA ซึ่งเสริมด้วยตัวแปรภายนอกสำหรับวัตถุประสงค์ในการสร้างแบบจำลองการส่งเสริมการขายและฉันมีเวลาอธิบายให้ผู้ใช้ทางธุรกิจยาก ในบางกรณีแพคเกจซอฟต์แวร์จะสิ้นสุดลงด้วยฟังก์ชั่นการถ่ายโอนอย่างง่ายเช่นพารามิเตอร์ * ตัวแปรภายนอก ในกรณีนี้การตีความเป็นเรื่องง่ายเช่นกิจกรรมส่งเสริมการขาย X (แสดงโดยตัวแปรไบนารีภายนอก) ส่งผลต่อตัวแปรตาม (เช่นความต้องการ) ด้วยจำนวน Y ดังนั้นในแง่ธุรกิจเราสามารถพูดได้ว่ากิจกรรมส่งเสริมการขาย X ส่งผลให้ความต้องการหน่วย Y เพิ่มขึ้น บางครั้งฟังก์ชันถ่ายโอนมีความซับซ้อนมากขึ้นเช่นการแบ่งส่วนของพหุนาม * ตัวแปรภายนอก สิ่งที่ฉันสามารถทำได้คือการแบ่งส่วนของพหุนามเพื่อหาค่าสัมประสิทธิ์การถดถอยแบบไดนามิกทั้งหมดและกล่าวว่าเช่นกิจกรรมส่งเสริมการขายไม่เพียง แต่ส่งผลต่อความต้องการในช่วงเวลาที่เกิดขึ้น แต่ยังอยู่ในช่วงเวลาในอนาคต แต่เนื่องจากซอฟต์แวร์ฟังก์ชันถ่ายโอนเอาต์พุตเป็นส่วนหนึ่งของผู้ใช้ทางธุรกิจที่มีหลายชื่อไม่สามารถตีความได้อย่างง่ายดาย มีอะไรบ้างที่เราสามารถพูดได้เกี่ยวกับฟังก์ชั่นการถ่ายโอนที่ซับซ้อนโดยไม่ต้องทำการหาร? พารามิเตอร์ของรุ่นที่เกี่ยวข้องและฟังก์ชั่นการถ่ายโอนที่เกี่ยวข้องมีดังนี้: ค่าคงที่ = 4200, AR (1), ค่าสัมประสิทธิ์กิจกรรมส่งเสริมการขาย 30, Num1 = -15, Num2 = 1.62, Den1 = 0.25 ดังนั้นฉันเดาว่าถ้าเราทำกิจกรรมส่งเสริมการขายในช่วงเวลานี้ระดับความต้องการจะเพิ่มขึ้น 30 หน่วย นอกจากนี้เนื่องจากมีฟังก์ชันถ่ายโอน (การแบ่งส่วนของพหุนาม) กิจกรรมส่งเสริมการขายจะมีผลกระทบไม่เพียง แต่กับช่วงเวลาปัจจุบันเท่านั้น …

2
กราฟ“ United States of Reddit” นี้ถูกสร้างขึ้นอย่างไร
ด้านล่างเป็นกราฟจาก p 202 ของDataclysmของ Christian Rudder ถึงแม้ว่า James Dowdell จะสร้างขึ้นมาก็ตาม มันแสดงให้เห็นถึงความสัมพันธ์ระหว่างเว็บไซต์ย่อย 200 อันดับแรกซึ่งเป็นพื้นที่ที่น่าสนใจบนreddit.comซึ่งผู้ใช้สามารถส่งลิงค์ความคิดเห็นและคะแนนโหวต สิ่งเหล่านี้คล้ายกับแท็กในไซต์นี้ ขนาดของภูมิภาค subreddit แสดงถึงความนิยม subreddits ถูกจัดกลุ่มโดยการแสดงความคิดเห็นข้ามและโทนสีเข้มแสดงถึงเปอร์เซ็นต์ของคนที่อยู่ใน subreddit นั้นและไม่โพสต์ถึงผู้อื่น นี่เป็นเพียงการแบ่งพาร์ติชัน Voronoi มาตรฐานที่มีการระบายสีเพื่อความโดดเดี่ยวหรือมีส่วนเกี่ยวข้องมากกว่านี้หรือไม่? เราจะทำสิ่งเหล่านี้ได้อย่างไร?

2
สรุปความยุ่งเหยิงของส่วนของเส้นตรงที่มองเห็นได้
ฉันมีชุดข้อมูลของส่วนของเส้นตรงกำกับหลายล้านชุด ส่วนของเส้นตรงเป็นลำดับ - เป็นตัวแปรภูมิอากาศ (ความร้อนที่เหมาะสม) โดยมีค่าที่สังเกตและจำลองในช่วงเวลาครึ่งชั่วโมง ฉันพยายามค้นหารูปแบบในการจำลองการทำงาน ฉันกำลังดูโครงเรื่องของ Obs เทียบกับค่าการจำลองและการเชื่อมโยงพวกมันเข้ากับส่วนของเส้นตรง (ลูกศรแสดงทิศทางของเวลา) หากฉันพล็อตพวกเขาฉันแค่สับสนเบลอที่ไม่สามารถตีความได้เช่นนี้ นี่เป็นส่วนย่อยของ 10,000 บรรทัดโดยละเอียดและมีความทึบต่ำ: ggplot(d, aes(x=Qh_obs, xend=lead(Qh_obs), y=Qh_sim, yend=lead(Qh_sim))) + geom_segment(size=0.1, alpha=0.2, arrow=arrow(length=unit(2, units='mm'))) dput() ของข้อมูล 700 แถวแรก (ถูก จำกัด โดยความยาวโพสต์): structure( list( Qh_sim = c( 56.401439666748, 33.9568634033203, 16.2147789001465, 0.797790050506592, -3.19529962539673, -10.3250732421875, -11.6082448959351, -21.5074787139893, -21.5963478088379, -21.4389324188232, -19.8912830352783, -18.5908279418945, -19.2523441314697, …

4
ช่วยแปลพล็อตปฏิสัมพันธ์หรือไม่
ฉันมีปัญหาในการตีความแผนการโต้ตอบเมื่อมีการโต้ตอบระหว่างตัวแปรอิสระสองตัว กราฟต่อไปนี้มาจากไซต์นี้ : ที่นี่และเป็นตัวแปรอิสระและเป็นตัวแปรตามAAABBBD VDVDV คำถาม: มีปฏิสัมพันธ์และผลกระทบหลักของแต่ไม่มีผลกระทบหลักของAAABBB ฉันสามารถดูว่าสูงกว่าค่าของมูลค่าของสูงให้ B เป็นที่มิฉะนั้นเป็นค่าคงที่โดยไม่คำนึงถึงความคุ้มค่าของ ดังนั้นจึงมีการทำงานร่วมกันระหว่างและและผลกระทบหลักของ (เนื่องจากสูงกว่านำไปสู่สูงขึ้นโดยที่ค่าคงที่ )AAAD VDVDVB1B1B_1DVDVDVAAAAAABBBAAAAAADVDVDVBBBB1B1B_1 นอกจากนี้ผมจะเห็นว่าระดับที่แตกต่างของจะนำไปสู่ระดับที่แตกต่างกันของถือค่าคงที่ ดังนั้นจึงมีผลกระทบหลักของ B. แต่นี่ไม่ใช่กรณี ดังนั้นนี่ต้องหมายความว่าฉันตีความพล็อตปฏิสัมพันธ์อย่างไม่ถูกต้อง ผมทำอะไรผิดหรือเปล่า?BBBDVDVDVAAA ฉันแปลพล็อต 6-8 ผิดด้วย ตรรกะที่ฉันใช้ในการตีความพวกเขาเป็นแบบเดียวกับที่ฉันใช้ข้างต้นดังนั้นถ้าฉันรู้ข้อผิดพลาดที่ฉันทำด้านบนฉันควรจะสามารถตีความส่วนที่เหลือได้อย่างถูกต้อง มิฉะนั้นฉันจะอัปเดตคำถามนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.