คำถามติดแท็ก interpolation

กำหนดชุดของข้อมูลสองตัวแปร (x, y) เพื่อกำหนดค่า y ที่สอดคล้องกับค่า x บางค่าที่ไม่มีการวัดค่า y เรียกว่าการแก้ไขถ้าค่าของ x อยู่ในช่วงของค่าที่วัดได้ของ x.

4
การประมาณค่าโวลต์การประมาณค่า
อะไรคือความแตกต่างระหว่างการประมาณและการประมาณและวิธีที่แม่นยำที่สุดในการใช้คำเหล่านี้คืออะไร? ตัวอย่างเช่นฉันได้เห็นคำสั่งในกระดาษโดยใช้การแก้ไขเป็น: "ขั้นตอน interpolates รูปร่างของฟังก์ชั่นโดยประมาณระหว่างจุดถังขยะ" ประโยคที่ใช้ทั้งการคาดการณ์และการแก้ไขคือตัวอย่างเช่น: ขั้นตอนก่อนหน้านี้ที่เราประมาณค่าฟังก์ชันสอดแทรกโดยใช้วิธีเคอร์เนลไปทางด้านซ้ายและด้านขวาของอุณหภูมิ ใครสามารถให้วิธีที่ชัดเจนและง่ายต่อการแยกแยะพวกเขาและแนะนำวิธีการใช้คำเหล่านี้อย่างถูกต้องด้วยตัวอย่าง?

2
อะไรคือข้อดี / ข้อเสียของการใช้เส้นโค้ง, เส้นโค้งเรียบและตัวเลียนแบบกระบวนการ Gaussian?
ฉันสนใจที่จะเรียนรู้ (และการนำไปใช้) เป็นทางเลือกในการแก้ไขพหุนาม อย่างไรก็ตามฉันมีปัญหาในการหาคำอธิบายที่ดีเกี่ยวกับวิธีการทำงานของวิธีการที่เกี่ยวข้องและวิธีเปรียบเทียบ ฉันขอขอบคุณอินพุตของคุณเกี่ยวกับข้อดี / ข้อเสีย / เงื่อนไขซึ่งวิธีการหรือทางเลือกเหล่านี้จะมีประโยชน์ แต่การอ้างอิงที่ดีบางอย่างเกี่ยวกับข้อความสไลด์หรือพอดคาสต์ก็เพียงพอแล้ว

1
ฉันจะค้นหาค่าที่ไม่ได้ระบุใน (ตารางสอดแทรก) ในตารางสถิติได้อย่างไร
บ่อยครั้งที่ผู้คนใช้โปรแกรมเพื่อรับค่า p แต่บางครั้งด้วยเหตุผลใดก็ตามอาจจำเป็นต้องได้รับคุณค่าที่สำคัญจากชุดของตาราง ให้ตารางสถิติที่มีระดับนัยสำคัญที่ จำกัด และจำนวนองศาอิสระที่ จำกัด ฉันจะรับค่าวิกฤตที่ระดับความสำคัญอื่น ๆ หรือองศาอิสระได้อย่างไร (เช่นกับตาราง , chi-square หรือ ) ?FtttFFF นั่นคือฉันจะค้นหาค่า "ในระหว่าง" ค่าในตารางได้อย่างไร

8
การแก้ไขเกี่ยวข้องกับแนวคิดของการถดถอยอย่างไร
อธิบายสั้น ๆ การแก้ไขหมายถึงอะไรมันเกี่ยวข้องกับแนวคิดของการถดถอยอย่างไร? การแก้ไขคือศิลปะของการอ่านระหว่างบรรทัดของตารางและในคณิตศาสตร์ระดับประถมศึกษาคำศัพท์มักจะหมายถึงกระบวนการคำนวณค่ากลางของฟังก์ชันจากชุดของค่าที่กำหนดหรือตารางของฟังก์ชันนั้น ฉันไม่สามารถตอบคำถามที่สองได้ กรุณาช่วย

3
เหมาะสมหลายตัวแปรลูกบาศก์ธรรมชาติ
หมายเหตุ: หากไม่มีคำตอบที่ถูกต้องหลังจากผ่านไปหนึ่งเดือนฉันได้โพสต์ข้อความใหม่เป็นSO พื้นหลัง ฉันมีแบบจำลองที่Y = f ( X )fffY=f(X)Y=f(X)Y=f(\textbf{X}) คือเมทริกซ์ n × mของตัวอย่างจากพารามิเตอร์ mและ Yคือ n × 1XX\textbf{X}n×mn×mn \times mmmmYYYn×1n×1n \times 1เวกเตอร์ของเอาต์พุตโมเดล มีการคำนวณอย่างเข้มข้นดังนั้นฉันจึงต้องการประมาณ fโดยใช้ลูกบาศก์หลายตัวแปรผ่านจุด ( X , Y )เพื่อให้ฉันสามารถประเมิน Yที่จุดจำนวนมากffffff(X,Y)(X,Y)(X,Y)YYY คำถาม มีฟังก์ชั่น R ที่จะคำนวณความสัมพันธ์โดยพลการระหว่าง X และ Y หรือไม่? โดยเฉพาะฉันกำลังมองหารุ่นหลายตัวแปรของsplinefunฟังก์ชั่นซึ่งสร้างฟังก์ชั่น spline สำหรับกรณี univariate เช่นนี้เป็นวิธีการsplinefunทำงานสำหรับกรณี univariate x <- 1:10 y <- runif(10) …

2
เหตุผลทางสถิติของการแก้ไขคืออะไร?
สมมติว่าเรามีสองจุด (รูปต่อไปนี้: วงกลมสีดำ) และเราต้องการหาค่าสำหรับจุดที่สามระหว่างพวกเขา (ข้าม) อันที่จริงเราจะประมาณโดยอ้างอิงจากผลการทดลองของเราจุดดำ กรณีที่ง่ายที่สุดคือการวาดเส้นแล้วหาค่า (เช่นการแก้ไขเชิงเส้น) หากเรามีจุดรองรับเช่นจุดสีน้ำตาลในทั้งสองด้านเราต้องการได้รับประโยชน์จากพวกเขาและพอดีกับเส้นโค้งที่ไม่ใช่เชิงเส้น (เส้นโค้งสีเขียว) คำถามคืออะไรคือเหตุผลเชิงสถิติในการทำเครื่องหมายกากบาทสีแดงเป็นวิธีการแก้ปัญหา? เหตุใดไม้กางเขนอื่น (เช่นสีเหลือง) จึงไม่ได้รับคำตอบว่าจะเป็นได้อย่างไร การอนุมานหรือ (?) ผลักเราให้ยอมรับสีแดง ฉันจะพัฒนาคำถามเดิมของฉันตามคำตอบที่ได้รับสำหรับคำถามง่ายๆนี้

4
การแก้ไขข้อมูลไข้หวัดใหญ่ที่รักษาค่าเฉลี่ยรายสัปดาห์
แก้ไข ฉันได้พบกระดาษอธิบายขั้นตอนที่ฉันต้องการ ความแตกต่างเพียงอย่างเดียวคือกระดาษ interpolates ข้อมูลค่าเฉลี่ยรายเดือนเพื่อรายวันในขณะที่รักษาค่าเฉลี่ยรายเดือน Rฉันมีปัญหาในการดำเนินการวิธีการใน คำแนะนำใด ๆ ที่ชื่นชม เป็นต้นฉบับ สำหรับแต่ละสัปดาห์ฉันมีข้อมูลนับต่อไปนี้ (หนึ่งค่าต่อสัปดาห์): จำนวนที่ปรึกษาแพทย์ จำนวนผู้ป่วยไข้หวัดใหญ่ เป้าหมายของฉันคือการได้รับข้อมูลรายวันโดยการแก้ไข (ฉันคิดว่าเส้นโค้งเชิงเส้นหรือตัดทอน) สิ่งสำคัญคือฉันต้องการประหยัดค่าเฉลี่ยรายสัปดาห์นั่นคือค่าเฉลี่ยของข้อมูลที่ถูกแก้ไขทุกวันควรเท่ากับค่าที่บันทึกไว้ของสัปดาห์นี้ นอกจากนี้การแก้ไขควรจะราบรื่น ปัญหาหนึ่งที่อาจเกิดขึ้นคือหนึ่งสัปดาห์มีเวลาน้อยกว่า 7 วัน (เช่นตอนต้นหรือปลายปี) ฉันจะขอบคุณสำหรับคำแนะนำในเรื่องนี้ ขอบคุณมาก. นี่คือชุดข้อมูลตัวอย่างสำหรับปี 1995 ( อัพเดท ): structure(list(daily.ts = structure(c(9131, 9132, 9133, 9134, 9135, 9136, 9137, 9138, 9139, 9140, 9141, 9142, 9143, 9144, 9145, 9146, 9147, 9148, 9149, …

1
LARS เทียบกับโคตรของโคตร
ข้อดีและข้อเสียของการใช้ LARS [1] เมื่อเทียบกับการใช้โคตรของพิกัดสำหรับการถดถอยเชิงเส้นแบบ L1 ที่เหมาะสมคืออะไร ฉันสนใจในเรื่องของประสิทธิภาพเป็นหลัก (ปัญหาของฉันมักจะNอยู่ในหลักแสนและp<20) อย่างไรก็ตามข้อมูลเชิงลึกอื่น ๆ ก็จะได้รับการชื่นชมเช่นกัน แก้ไข: เนื่องจากฉันได้โพสต์คำถาม, chl ได้ชี้ให้เห็นกระดาษ [2] โดย Friedman และคณะที่พิกัดโคตรถูกแสดงว่าเร็วกว่าวิธีอื่นมาก หากเป็นกรณีนี้ฉันควรเป็นผู้ประกอบการเพียงแค่ลืมเกี่ยวกับ LARS ในความโปรดปรานของการสืบเชื้อสายมาประสานงาน? [1] Efron, Bradley; Hastie เทรเวอร์; Johnstone, Iain และ Tibshirani, Robert (2004) "การถดถอยมุมน้อยที่สุด" พงศาวดารของสถิติ 32 (2): pp 407–499 [2] Jerome H. Friedman, Trevor Hastie, Rob Tibshirani, "เส้นทางการทำให้เป็นมาตรฐานสำหรับตัวแบบเชิงเส้นทั่วไปผ่านพิกัดโคตร", วารสารซอฟท์แวร์สถิติ, อัตรา …

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Kriging Interpolation ทำงานอย่างไร
ฉันกำลังทำงานกับปัญหาที่ฉันต้องใช้ Kriging เพื่อทำนายค่าของตัวแปรบางตัวตามตัวแปรโดยรอบบางตัว ฉันต้องการติดตั้งรหัสด้วยตนเอง ดังนั้นฉันจึงต้องอ่านเอกสารมากเกินไปเพื่อให้เข้าใจว่ามันทำงานอย่างไร แต่ฉันก็สับสนมาก โดยทั่วไปฉันเข้าใจว่ามันเป็นค่าเฉลี่ยถ่วงน้ำหนัก แต่ฉันไม่เข้าใจกระบวนการคำนวณน้ำหนักอย่างสมบูรณ์จากนั้นจึงทำนายค่าของตัวแปร ทุกคนสามารถอธิบายให้ฉันในแง่ง่ายด้านคณิตศาสตร์ของวิธีการแก้ไขนี้และวิธีการทำงานหรือไม่

1
การแก้ไขฟูริเยร์ / ตรีโกณมิติ
พื้นหลัง ในกระดาษจาก Epstein (1991): ในการรับค่า climatological รายวันจากค่าเฉลี่ยรายเดือนสูตรและอัลกอริทึมสำหรับการคำนวณการแก้ไขฟูริเยร์สำหรับค่าระยะและแม้กระทั่งระยะจะได้รับ ในกระดาษเป้าหมายคือการได้รับค่ารายวันจากวิธีการรายเดือนโดยการแก้ไข กล่าวโดยสรุปคือสันนิษฐานว่าค่ารายวันที่ไม่รู้จักสามารถถูกแสดงด้วยผลรวมของส่วนประกอบฮาร์มอนิก: ในกระดาษ (เวลา) แสดงเป็นเดือนy(t)=a0+∑j[ajcos(2πjt/12)+bjsin(2πjt/12)]y(t)=a0+∑j[ajcos⁡(2πjt/12)+bjsin⁡(2πjt/12)] y(t) = a_{0} + \sum_{j}\left[a_{j}\,\cos(2\pi jt/12)+b_{j}\,\sin(2\pi jt/12)\right] ttt หลังจากเบี่ยงเบนไปบางส่วนก็แสดงให้เห็นว่าสามารถคำนวณเงื่อนไขได้โดย: โดยที่แทนค่าเฉลี่ยรายเดือนและเดือนa0ajbja6b6=∑TYT/12=[(πj/12)/sin(πj/12)]×∑T[YTcos(2πjT/12)/6] j=1,…,5=[(πj/12)/sin(πj/12)]×∑T[YTsin(2πjT/12)/6] j=1,…,5=[(πj/12)/sin(πj/12)]×∑T[YTcos(πT)/12]=0a0=∑TYT/12aj=[(πj/12)/sin⁡(πj/12)]×∑T[YTcos⁡(2πjT/12)/6] j=1,…,5bj=[(πj/12)/sin⁡(πj/12)]×∑T[YTsin⁡(2πjT/12)/6] j=1,…,5a6=[(πj/12)/sin⁡(πj/12)]×∑T[YTcos⁡(πT)/12]b6=0 \begin{align} a_{0} &= \sum_{T}Y_{T}/12 \\ a_{j} &= \left[ (\pi j/12)/\sin(\pi j/12)\right] \times \sum_{T}\left[Y_{T}\,\cos(2\pi jT/12)/6 \right]~~~~~~~j=1,\ldots, 5 \\ b_{j} &= \left[ (\pi j/12)/\sin(\pi j/12)\right] \times …

2
ความสับสนเกี่ยวกับ kriging
ฉันอ่านบทความวิกิพีเดียที่เกี่ยวข้องกับการดึงดูด ฉันไม่เข้าใจตอนที่มันบอกว่า Kriging คำนวณตัวประมาณค่าแบบเส้นตรง Z^(x0)Z^(x0)\hat Z (x_0)ของ Z(x0)Z(x0)Z(x_0)เช่นนั้นความแปรปรวน kriging ของจะลดลงด้วยสภาพที่เป็นกลาง ฉันไม่ได้รับมาและวิธีลดความแปรปรวน ข้อเสนอแนะใด ๆ พิเศษฉันไม่ได้รับส่วนที่ใช้ลดลงภายใต้เงื่อนไขที่เป็นกลาง ฉันคิดว่ามันควรจะเป็น E [Z '(x0) -Z (x0)] แทน E [Z' (x) -Z (x)] ใช่ไหม 'เทียบเท่ากับหมวกในบทความ wiki นอกจากนี้ฉันไม่เข้าใจว่าข้อผิดพลาดเกิดขึ้นได้อย่างไร

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.