คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

3
Auto.arima พร้อมข้อมูลรายวัน: วิธีจับฤดูกาลและช่วงเวลา
ฉันเหมาะสมกับโมเดล ARIMA ในซีรีย์เวลารายวัน ข้อมูลจะถูกรวบรวมทุกวันตั้งแต่ 02-01-2010 ถึง 30-07-2011 และเกี่ยวกับการขายหนังสือพิมพ์ เนื่องจากสามารถหารูปแบบการขายรายสัปดาห์ได้ (โดยปกติปริมาณการขายต่อวันโดยทั่วไปจะเหมือนกันทุกวันจันทร์ถึงศุกร์จากนั้นเพิ่มขึ้นในวันเสาร์และวันอาทิตย์) ฉันพยายามจับภาพ "ฤดูกาล" นี้ รับข้อมูลการขาย "ข้อมูล" ฉันสร้างอนุกรมเวลาดังนี้ salests<-ts(data,start=c(2010,1),frequency=365) จากนั้นฉันใช้ฟังก์ชั่น auto.arima (.) เพื่อเลือกรุ่น ARIMA ที่ดีที่สุดผ่านเกณฑ์ AIC ผลลัพธ์จะเป็นโมเดล ARIMA ที่ไม่ใช่ฤดูกาลเสมอ แต่ถ้าฉันลองใช้แบบจำลอง SARIMAs ด้วยไวยากรณ์ต่อไปนี้เป็นตัวอย่าง: sarima1<-arima(salests, order = c(2,1,2), seasonal = list(order = c(1, 0, 1), period = 7)) ฉันสามารถรับผลลัพธ์ที่ดีกว่า มีอะไรผิดปกติในข้อกำหนดคุณสมบัติคำสั่ง ts / arima หรือไม่ …

1
การติดตั้งแบบจำลองเลขชี้กำลังเข้ากับข้อมูล
คำถามนี้ถูกโยกย้ายจาก Stack Overflow เพราะสามารถตอบได้ในการตรวจสอบข้าม อพยพ 8 ปีที่ผ่านมา ฉันมี 2 ตัวแปรทั้งจากคลาส "numeric": > head(y) [1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567 > head(x) [1] 59.32820 68.46436 80.76974 132.90824 216.75995 153.25551 ฉันวางแผนพวกเขาและตอนนี้ฉันต้องการให้พอดีกับรูปแบบเลขชี้กำลังในข้อมูล (และเพิ่มลงในพล็อต) แต่ฉันไม่สามารถหาข้อมูลเกี่ยวกับตัวแบบที่เหมาะสมกับข้อมูลหลายตัวแปรใน R! มีเพียงข้อมูลที่ไม่ได้รับการแก้ไขใครบางคนสามารถช่วยได้หรือไม่ ฉันไม่รู้ด้วยซ้ำว่าจะเริ่มต้นอย่างไร ... ขอบคุณ!
21 r 

2
จะใช้ตุ้มน้ำหนักในฟังก์ชั่น lm ใน R ได้อย่างไร?
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ใครช่วยเสนอตัวชี้วิธีการใช้weightsอาร์กิวเมนต์ในlmฟังก์ชั่นของ R ? ตัวอย่างเช่นคุณกำลังพยายามปรับนางแบบให้สอดคล้องกับข้อมูลการจราจรและคุณมีหลายร้อยแถวซึ่งแต่ละเมืองเป็นตัวแทนของเมือง (มีประชากรแตกต่างกัน) หากคุณต้องการให้แบบจำลองปรับอิทธิพลสัมพัทธ์ของการสังเกตแต่ละครั้งตามขนาดประชากรคุณสามารถระบุได้weights=[the column containing the city's population]หรือไม่ นั่นคือการเรียงตัวของเวกเตอร์ที่สามารถเข้าไปได้weightsหรือไม่? หรือคุณจะต้องใช้ฟังก์ชั่น R / แพ็คเกจ / แนวทางอื่นโดยสิ้นเชิง? อยากรู้ว่าคนจัดการเรื่องนี้อย่างไร - ไม่เห็นว่ามันครอบคลุมในบทเรียนการสร้างแบบจำลองเชิงเส้นใด ๆ ที่ฉันเห็นที่นั่น ขอบคุณ!
21 r  regression 

1
การสร้างตัวแปรสุ่มที่มีความสัมพันธ์แบบทวินาม
ฉันสงสัยว่ามันอาจจะเป็นไปได้ที่จะสร้างตัวแปรทวินามแบบสหสัมพันธ์โดยใช้วิธีการแปลงเชิงเส้นหรือไม่? ด้านล่างฉันลองทำอะไรง่ายๆใน R แล้วมันสร้างความสัมพันธ์กันบ้าง แต่ฉันสงสัยว่ามีวิธีการทำเช่นนี้หรือไม่ X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ; X3 = rbinom(1e4, 6, .5) ; a = .5 Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated cor(Y1, Y2)

2
วิธีการแปลงผกผันทำงานอย่างไร
วิธีการผกผันทำงานอย่างไร สมมติว่าฉันมีตัวอย่างสุ่มมีความหนาแน่นมากกว่าและดังนั้นจึงมี CDFใน(0,1)แล้วตามด้วยวิธีการผกผันที่ฉันได้รับการกระจายของเป็นF_X X1,X2,...,XnX1,X2,...,XnX_1,X_2,...,X_nf(x;θ)=1θx(1−θ)θf(x;θ)=1θx(1−θ)θf(x;\theta)={1\over \theta} x^{(1-\theta)\over \theta} 0&lt;x&lt;10&lt;x&lt;10<x<1FX(x)=x1/θFX(x)=x1/θF_X(x)=x^{1/\theta}(0,1)(0,1)(0,1)XXXF−1X(u)=uθFX−1(u)=uθF_X^{-1}(u)=u^\theta ดังนั้นมีการกระจายของ ? นี่เป็นวิธีการกลับด้านหรือไม่uθuθu^\thetaXXX u&lt;-runif(n) x&lt;-u^(theta)

1
ทำไม quasi-Poisson ใน GLM จึงไม่ถือว่าเป็นกรณีพิเศษของทวินามลบ
ฉันกำลังพยายามจัดวางโมเดลเชิงเส้นแบบทั่วไปกับชุดข้อมูลนับจำนวนหนึ่งที่อาจหรือไม่อาจใช้เกินขนาด การแจกแจงแบบบัญญัติทั้งสองที่ใช้ในที่นี้คือ Poisson และ Negative Binomial (Negbin) พร้อม EVและความแปรปรวนμμ\mu VRP= μVarP=μVar_P = \mu VRยังไม่มีข้อความB= μ + μ2θVarNB=μ+μ2θVar_{NB} = \mu + \frac{\mu^2}{\theta} ซึ่งสามารถติดตั้งในการใช้ R glm(..,family=poisson)และglm.nb(...)ตามลำดับ นอกจากนี้ยังมีquasipoissonครอบครัวซึ่งในความเข้าใจของฉันเป็นปัวซองปรับด้วย EV และความแปรปรวนเดียวกัน VRคิวพี= ϕ μVarQP=ϕμVar_{QP} = \phi\mu , เช่นตกบางแห่งระหว่าง Poisson และ Negbin ปัญหาหลักของครอบครัว quasipoisson คือไม่มีความเกี่ยวข้องกันดังนั้นจึงมีการทดสอบทางสถิติที่มีประโยชน์อย่างมากและใช้มาตรการที่เหมาะสม (AIC, LR etcetera) ถ้าคุณเปรียบเทียบ QP และ Negbin แปรปรวนคุณอาจสังเกตเห็นว่าคุณสามารถถือเอาพวกเขาโดยการวางtheta} ดำเนินการต่อในตรรกะนี้คุณสามารถลองแสดงการแจกแจง quasipoisson …

4
จะทดสอบได้อย่างไรว่าการกระจายตัวของฉันนั้นต่อเนื่องหลายรูปแบบ?
เมื่อฉันพล็อตฮิสโตแกรมของข้อมูลของฉันมันมีสองจุด: นั่นหมายความว่าอาจมีการกระจายแบบหลายโหมดหรือไม่? ฉันวิ่งdip.testใน R ( library(diptest)) และผลลัพธ์คือ: D = 0.0275, p-value = 0.7913 ฉันสามารถสรุปได้ว่าข้อมูลของฉันมีการกระจายหลายโหมด? ข้อมูล 10346 13698 13894 19854 28066 26620 27066 16658 9221 13578 11483 10390 11126 13487 15851 16116 24102 30892 25081 14067 10433 15591 8639 10345 10639 15796 14507 21289 25444 26149 23612 19671 12447 13535 10667 …

3
วิธีการคำนวณความดีของความพอดีใน glm (R)
คำถามนี้ถูกโยกย้ายจาก Stack Overflow เพราะสามารถตอบได้ในการตรวจสอบข้าม อพยพ 6 ปีที่แล้ว ฉันมีผลลัพธ์ต่อไปนี้จากการเรียกใช้ฟังก์ชัน glm ฉันจะตีความค่าต่อไปนี้ได้อย่างไร: ความเบี่ยงเบนว่างเปล่า ความเบี่ยงเบนตกค้าง AIC พวกเขามีบางสิ่งที่เกี่ยวข้องกับความดีงามของร่างกายหรือไม่? ฉันสามารถคำนวณความพอดีที่ได้จากผลลัพธ์เหล่านี้เช่น R-square หรือการวัดอื่น ๆ ได้หรือไม่? Call: glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 + as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7) Deviance Residuals: Min 1Q Median 3Q Max -0.52628 -0.24781 -0.02916 0.25581 0.48509 Coefficients: …

1
บทบาทของพารามิเตอร์ n.minobsinnode ของ GBM ใน R [ปิด]
คำถามนี้ไม่น่าจะช่วยผู้เข้าชมในอนาคต มันเกี่ยวข้องเฉพาะกับพื้นที่ทางภูมิศาสตร์ขนาดเล็กช่วงเวลาที่เฉพาะเจาะจงหรือสถานการณ์ที่แคบเป็นพิเศษซึ่งโดยทั่วไปไม่สามารถใช้ได้กับผู้ชมทั่วโลกของอินเทอร์เน็ต สำหรับความช่วยเหลือในการทำคำถามนี้มากขึ้นบังคับในวงกว้างไปที่ศูนย์ช่วยเหลือ ปิดให้บริการใน7 ปีที่ผ่านมา ฉันต้องการทราบว่าพารามิเตอร์n.minobsinnode มีความหมายอย่างไรในแพ็คเกจ GBM ฉันอ่านคู่มือ แต่ไม่ชัดเจนว่ามันทำอะไร ตัวเลขนั้นควรเล็กหรือใหญ่เพื่อปรับปรุงผลลัพธ์
21 r  gbm 

3
เหตุใด nls () ให้ข้อผิดพลาด“ เมตริกซ์การไล่ระดับสีเอกพจน์ที่ประมาณการพารามิเตอร์เริ่มต้น” ให้ฉัน
ฉันมีข้อมูลพื้นฐานเกี่ยวกับการลดการปล่อยก๊าซและราคาต่อคัน: q24 &lt;- read.table(text = "reductions cost.per.car 50 45 55 55 60 62 65 70 70 80 75 90 80 100 85 200 90 375 95 600 ",header = TRUE, sep = "") ฉันรู้ว่านี่เป็นฟังก์ชั่นเอ็กซ์โปเนนเชียลดังนั้นฉันคาดหวังว่าจะสามารถหาแบบจำลองที่เหมาะกับ: model &lt;- nls(cost.per.car ~ a * exp(b * reductions) + c, data = q24, start = …

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
คำเตือน“ แบบจำลองล้มเหลวในการรวมตัวกัน” ใน lmer ()
ด้วยชุดข้อมูลต่อไปนี้ฉันต้องการดูว่าการตอบสนอง (ผล) เปลี่ยนแปลงเกี่ยวกับเว็บไซต์ฤดูกาลระยะเวลาและการโต้ตอบของพวกเขาหรือไม่ ฟอรัมออนไลน์บางแห่งเกี่ยวกับสถิติแนะนำให้ฉันไปใช้โมเดลตัวผสมผลกระทบเชิงเส้น แต่ปัญหาคือเนื่องจากการจำลองแบบถูกสุ่มภายในแต่ละสถานีฉันมีโอกาสน้อยที่จะรวบรวมตัวอย่างจากจุดเดียวกันในฤดูกาลที่ต่อเนื่องกัน (ตัวอย่างเช่น repl-1 ของ s1 ของ post-monsoon อาจไม่เหมือนกับของ monsoon) มันแตกต่างจากการทดลองทางคลินิก (ด้วยการออกแบบภายในเรื่อง) ที่คุณวัดหัวเรื่องเดียวกันซ้ำ ๆ ตลอดฤดูกาล อย่างไรก็ตามการพิจารณาไซต์และซีซันเป็นปัจจัยสุ่มฉันรันคำสั่งต่อไปนี้และได้รับข้อความเตือน: Warning messages: 1: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : unable to evaluate scaled gradient 2: In checkConv(attr(opt, "derivs"), optpar,ctrl=controlpar,ctrl=controlcheckConv, : Model failed to converge: degenerate Hessian with 1 negative eigenvalues ใครช่วยฉันแก้ปัญหาได้บ้าง รหัสได้รับด้านล่าง: …

4
วิธีการสร้างเมทริกซ์ความแปรปรวนร่วมโดยพลการ
ยกตัวอย่างเช่นในRการMASS::mvrnorm()ฟังก์ชั่นจะเป็นประโยชน์สำหรับการสร้างข้อมูลที่แสดงให้เห็นถึงสิ่งต่างๆในสถิติ มันต้องใช้Sigmaอาร์กิวเมนต์ที่จำเป็นซึ่งเป็นเมทริกซ์สมมาตรซึ่งระบุเมทริกซ์ความแปรปรวนร่วมของตัวแปร ฉันจะสร้างเมทริกซ์สมมาตรด้วยรายการตามอำเภอใจได้อย่างไรn×nn×nn\times n

1
lme () และ lmer () ให้ผลลัพธ์ที่ขัดแย้งกัน
ฉันทำงานกับข้อมูลบางอย่างที่มีปัญหากับการวัดซ้ำ ๆ ในการทำเช่นนั้นฉันสังเกตเห็นพฤติกรรมที่แตกต่างกันมากระหว่างlme()และlmer()ใช้ข้อมูลทดสอบของฉันและต้องการทราบสาเหตุ ชุดข้อมูลปลอมที่ฉันสร้างขึ้นนั้นมีการวัดส่วนสูงและน้ำหนักสำหรับ 10 วิชาถ่ายสองครั้ง ฉันตั้งค่าข้อมูลเพื่อให้ระหว่างวิชาจะมีความสัมพันธ์เชิงบวกระหว่างความสูงและน้ำหนัก แต่ความสัมพันธ์เชิงลบระหว่างการวัดซ้ำภายในแต่ละบุคคล set.seed(21) Height=1:10; Height=Height+runif(10,min=0,max=3) #First height measurement Weight=1:10; Weight=Weight+runif(10,min=0,max=3) #First weight measurement Height2=Height+runif(10,min=0,max=1) #second height measurement Weight2=Weight-runif(10,min=0,max=1) #second weight measurement Height=c(Height,Height2) #combine height and wight measurements Weight=c(Weight,Weight2) DF=data.frame(Height,Weight) #generate data frame DF$ID=as.factor(rep(1:10,2)) #add subject ID DF$Number=as.factor(c(rep(1,10),rep(2,10))) #differentiate between first and second measurement นี่คือพล็อตของข้อมูลที่มีเส้นเชื่อมต่อการวัดทั้งสองจากแต่ละบุคคล …

3
ค้นหาวิธีการจำลองตัวเลขสุ่มสำหรับการแจกแจงนี้
ฉันพยายามเขียนโปรแกรมใน R ที่จำลองตัวเลขสุ่มหลอกจากการแจกจ่ายด้วยฟังก์ชันการแจกแจงสะสม: F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)=1−exp⁡(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 โดยที่a,b&gt;0,p∈(0,1)a,b&gt;0,p∈(0,1)a,b>0, p \in (0,1) ฉันพยายามสุ่มตัวอย่างการแปลงผกผัน แต่การผกผันดูเหมือนจะไม่สามารถแก้ไขได้ ฉันจะดีใจถ้าคุณสามารถแนะนำวิธีแก้ปัญหานี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.