คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
ความแตกต่างระหว่าง wilcox.test และ coin :: wilcox_test in R คืออะไร?
ฟังก์ชันทั้งสองนี้มีอยู่ใน R แต่ฉันไม่รู้ความแตกต่าง มันดูเหมือนว่าพวกเขาจะกลับมาเหมือนเดิม P-ค่าเมื่อโทรwilcox.testด้วยcorrect=FALSEและwilcox_test(ในแพคเกจเหรียญ) distribution="aymptotic"ด้วย สำหรับค่าอื่น ๆ พวกเขากลับค่า p ที่แตกต่างกัน นอกจากนี้ยังwilcox.testส่งคืน W = 0 สำหรับชุดข้อมูลของฉันเสมอโดยไม่ขึ้นกับการตั้งค่าพารามิเตอร์: x = c(1, 1, 1, 3, 3, 3, 3) และ y = c(4, 4, 6, 7, 7, 8, 10) นอกจากนี้เมื่อฉันลองใช้เครื่องมือต่าง ๆ นอกเหนือจาก R (บางออนไลน์พร้อมใช้งานอื่น ๆ เป็น Add-on ของ Excel) บางครั้งพวกเขารายงานค่า p ที่แตกต่างกัน ดังนั้นฉันจะรู้ได้อย่างไรว่าเครื่องมือใดที่ให้ค่า p …

2
สร้างตัวอย่างข้อมูลจากการถดถอยปัวซอง
ฉันสงสัยว่าคุณจะสร้างข้อมูลจากสมการการถดถอยปัวซองใน R ได้อย่างไร? ฉันสับสนวิธีจัดการกับปัญหา ดังนั้นถ้าผมถือว่าเรามีสองทำนายและซึ่งกระจาย(0,1) และการสกัดกั้นคือ 0 และสัมประสิทธิ์ทั้งสองเท่ากัน 1 จากนั้นค่าประมาณของฉันคือ:X1X1X_1X2X2X_2ยังไม่มีข้อความ( 0 , 1) )ยังไม่มีข้อความ(0,1)N(0,1) เข้าสู่ระบบ( Y) = 0 + 1 ⋅ X1+ 1 ⋅ X2เข้าสู่ระบบ⁡(Y)=0+1⋅X1+1⋅X2\log(Y) = 0+ 1\cdot X_1 + 1\cdot X_2 แต่เมื่อฉันคำนวณ log (Y) - ฉันจะสร้างจำนวนปัวซองตามนั้นได้อย่างไร พารามิเตอร์ rate สำหรับการแจกแจงปัวซองคืออะไร? ถ้าใครสามารถเขียนสคริปต์ R สั้น ๆ ที่สร้างตัวอย่างการถดถอยปัวซองที่น่ากลัว!

1
ลูกศรใน PCA biplot หมายถึงอะไร
พิจารณา PCA biplot ต่อไปนี้: library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) มีลูกศรสีแดงจำนวนหนึ่งพล็อตพวกมันหมายถึงอะไร ฉันรู้ว่าลูกศรแรกที่มีป้ายกำกับ "Var1" ควรชี้ทิศทางที่แตกต่างกันมากที่สุดของชุดข้อมูล (ถ้าเราคิดว่ามันเป็นจุดข้อมูล 2,000 จุดแต่ละอันเป็นเวกเตอร์ขนาด 6) ฉันอ่านจากที่อื่นทิศทางที่แตกต่างกันมากที่สุดควรเป็นทิศทางของเวกเตอร์ไอเกนลำดับที่ 1 อย่างไรก็ตามการอ่านรหัส biplot ใน R บรรทัดเกี่ยวกับลูกศรคือ: if(var.axes) arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L], yเมทริกการโหลดอยู่ที่ไหน, …
14 r  pca  linear-algebra  biplot 

2
ฟังก์ชัน Gradient descent vs lm () ใน R?
ฉันกำลังดูวิดีโอในหลักสูตรการเรียนรู้ภาษาออนไลน์ของ Andrew Ng ที่ Stanford เขากล่าวถึง Gradient Descent เป็นอัลกอริทึมในการแก้ปัญหาการถดถอยเชิงเส้นและการเขียนฟังก์ชั่นในระดับแปดเสียงเพื่อดำเนินการ สมมุติว่าฉันสามารถเขียนฟังก์ชันเหล่านั้นใน R ใหม่ได้ แต่คำถามของฉันไม่ใช่ฟังก์ชัน lm () ให้ผลลัพธ์ของการถดถอยเชิงเส้นแล้ว ทำไมฉันต้องการเขียนฟังก์ชันการไล่ระดับสีของตัวเอง มีข้อได้เปรียบหรือว่าเป็นแบบฝึกหัดการเรียนรู้เท่านั้น? lm () ทำโคตรลาดชันหรือไม่?

2
การตีความและการตรวจสอบความถูกต้องของรูปแบบการถดถอยอันตรายตามสัดส่วนของ Cox โดยใช้ R เป็นภาษาอังกฤษแบบธรรมดา
มีใครช่วยอธิบายโมเดล Cox ของฉันให้ฉันฟังเป็นภาษาอังกฤษธรรมดาได้ไหม ฉันติดตั้งโมเดลการถดถอยของ Cox ต่อไปนี้กับข้อมูลทั้งหมดของฉันโดยใช้cphฟังก์ชั่น Dataข้อมูลของฉันจะถูกบันทึกไว้ในวัตถุที่เรียกว่า ตัวแปรw, xและyมีความต่อเนื่อง zเป็นปัจจัยสองระดับ เวลามีหน่วยวัดเป็นเดือน ผู้ป่วยบางรายของฉันขาดข้อมูลสำหรับตัวแปรz( หมายเหตุ : ฉันได้ระบุไว้อย่างชัดเจนว่าคำแนะนำของดร. ฮาร์เรลด้านล่างนี้ว่าฉันใส่ค่าเหล่านี้เพื่อหลีกเลี่ยงการทำให้ลำเอียงแบบของฉันและจะทำในอนาคต) > fit <- cph(formula = Surv(time, event) ~ w + x + y + z, data = Data, x = T, y = T, surv = T, time.inc = 12) Cox Proportional Hazards Model …

4
การประมาณจุดพักในตัวแบบเชิงเส้นแท่ง / เศษชิ้นส่วนที่มีเอฟเฟกต์แบบสุ่มใน R [รวมรหัสและเอาท์พุท]
ใครช่วยบอกฉันหน่อยได้ไหมว่าจะให้ R ประมาณจุดแตกหักในแบบจำลองเชิงเส้นแบบต่อเนื่อง (เป็นพารามิเตอร์คงที่หรือแบบสุ่ม) เมื่อฉันต้องประมาณผลกระทบแบบสุ่มอื่น ๆ ด้วยหรือไม่ ฉันได้รวมตัวอย่างของเล่นด้านล่างที่เหมาะกับไม้ฮอกกี้ / การถดถอยแบบแท่งหักด้วยความแปรปรวนแบบสุ่มและความแปรปรวนแบบสุ่มตัดแกน y สำหรับจุดพักที่ 4 ฉันต้องการประเมินจุดพักแทนการระบุ มันอาจเป็นผลแบบสุ่ม (ดีกว่า) หรือผลคงที่ library(lme4) str(sleepstudy) #Basis functions bp = 4 b1 <- function(x, bp) ifelse(x < bp, bp - x, 0) b2 <- function(x, bp) ifelse(x < bp, 0, x - bp) #Mixed effects model with …

1
ANOVA คำนวณอย่างไรสำหรับการออกแบบการวัดซ้ำ: aov () vs lm () ใน R
ชื่อกล่าวมันทั้งหมดและฉันสับสน ต่อไปนี้ใช้มาตรการ aov () ซ้ำในอาร์และเรียกใช้สิ่งที่ฉันคิดว่าเป็นการเรียก lm () เทียบเท่า แต่พวกเขากลับค่าความผิดพลาดที่แตกต่างกัน (แม้ว่าจำนวนสแควร์สจะเท่ากัน) เห็นได้ชัดว่าค่าตกค้างและค่าติดตั้งจาก aov () เป็นค่าที่ใช้ในแบบจำลองเนื่องจากผลรวมของกำลังสองของพวกเขารวมกันในแต่ละรูปแบบ / ผลรวมที่เหลือของกำลังสองที่รายงานโดยสรุป (my.aov) ดังนั้นโมเดลเชิงเส้นจริงที่ใช้กับการออกแบบการวัดซ้ำคืออะไร set.seed(1) # make data frame, # 5 participants, with 2 experimental factors, each with 2 levels # factor1 is A, B # factor2 is 1, 2 DF <- data.frame(participant=factor(1:5), A.1=rnorm(5, 50, 20), …

4
การคำนวณ AUPR ใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน8 เดือนที่ผ่านมา มันง่ายที่จะหาแพคเกจการคำนวณพื้นที่ภายใต้ ROC แต่มีแพคเกจที่คำนวณพื้นที่ภายใต้เส้นโค้งการเรียกคืนความแม่นยำหรือไม่?

2
ใครบางคนสามารถแยกแสงกับเอฟเฟกต์แบบเชิงเส้นตรงและแบบไม่เชิงเส้นได้
ฉันกำลังจะดำน้ำในการเรียนรู้ R และโครงการการเรียนรู้ของฉันจะนำมาซึ่งการประยุกต์ใช้การถดถอยแบบผสมหรือแบบสุ่มกับชุดข้อมูลเพื่อพัฒนาสมการพยากรณ์ ฉันแบ่งปันความกังวลของนักเขียนในโพสต์นี้ วิธีการเลือกไลบรารี nlme หรือ lme4 R สำหรับโมเดลเอฟเฟกต์ผสม? ในการสงสัยว่า NLME หรือ LME4 เป็นแพ็คเกจที่ดีกว่าที่จะทำความคุ้นเคยกับ คำถามพื้นฐานเพิ่มเติมคืออะไรคือความแตกต่างระหว่างการสร้างโมเดลเอฟเฟกต์แบบเชิงเส้นและไม่เชิงเส้น สำหรับพื้นหลังฉันใช้การสร้างแบบจำลอง ME ในการวิจัย MS ของฉัน (ใน MATLAB ไม่ใช่ R) ดังนั้นฉันจึงคุ้นเคยกับวิธีปฏิบัติกับตัวแปรสุ่มและแบบคงที่ แต่ฉันไม่แน่ใจว่างานที่ฉันทำนั้นถือว่าเป็นเชิงเส้นหรือไม่เชิงเส้นฉัน มันเป็นเพียงรูปแบบการทำงานของสมการที่ใช้หรืออย่างอื่น?

3
ความแตกต่างระหว่างการใช้ aov () และ lme () ในการวิเคราะห์ชุดข้อมูลระยะยาวคืออะไร?
ใครสามารถบอกฉันถึงความแตกต่างระหว่างการใช้aov()และlme()การวิเคราะห์ข้อมูลระยะยาวและวิธีการตีความผลลัพธ์จากทั้งสองวิธีได้หรือไม่ ด้านล่างผมวิเคราะห์ชุดข้อมูลเดียวกันโดยใช้aov()และlme()และได้ผลที่แตกต่างกัน 2 ด้วยaov()ฉันได้รับผลอย่างมีนัยสำคัญในเวลาโดยการโต้ตอบการรักษา แต่เหมาะสมกับรูปแบบการผสมเชิงเส้นเวลาโดยการโต้ตอบการรักษาไม่สำคัญ > UOP.kg.aov <- aov(UOP.kg~time*treat+Error(id), raw3.42) > summary(UOP.kg.aov) Error: id Df Sum Sq Mean Sq F value Pr(>F) treat 1 0.142 0.1421 0.0377 0.8471 Residuals 39 147.129 3.7725 Error: Within Df Sum Sq Mean Sq F value Pr(>F) time 1 194.087 194.087 534.3542 < 2e-16 *** …

3
ฉันจะใส่ข้อมูลที่มีค่าและอนุพันธ์อันดับที่ 1/2 ได้อย่างไร
ฉันมีชุดข้อมูลที่ประกอบด้วยกล่าวคือการวัดตำแหน่งความเร็วและความเร่ง ทั้งหมดมาจาก "การทำงาน" ที่เหมือนกัน ฉันสามารถสร้างระบบเชิงเส้นและพอดีกับพหุนามกับการวัดทั้งหมด แต่ฉันสามารถทำเช่นเดียวกันกับเส้นโค้ง? วิธี 'R' ในการทำเช่นนี้คืออะไร? นี่คือข้อมูลจำลองที่ฉันต้องการให้มี: f <- function(x) 2+x-0.5*x^2+rnorm(length(x), mean=0, sd=0.1) df <- function(x) 1-x+rnorm(length(x), mean=0, sd=0.3) ddf <- function(x) -1+rnorm(length(x), mean=0, sd=0.6) x_f <- runif(5, 0, 5) x_df <- runif(8, 3, 8) x_ddf <- runif(10, 4, 9) data <- data.frame(type=rep('f'), x=x_f, y=f(x_f)) data <- …

4
ทำไมเราถึงพูดว่า“ ข้อผิดพลาดมาตรฐานที่ตกค้าง”?
มีข้อผิดพลาดมาตรฐานคือประมาณค่าเบี่ยงเบนมาตรฐานσ ( θ )ของประมาณการθสำหรับพารามิเตอร์θσ^(θ^)σ^(θ^)\hat \sigma(\hat\theta)θ^θ^\hat\thetaθθ\theta ทำไมค่าเบี่ยงเบนมาตรฐานโดยประมาณของส่วนที่เหลือเรียกว่า "ข้อผิดพลาดมาตรฐานส่วนที่เหลือ" (เช่นในผลลัพธ์ของsummary.lmฟังก์ชันR ) และไม่ใช่ "ค่าเบี่ยงเบนมาตรฐานส่วนที่เหลือ"? เราประมาณค่าพารามิเตอร์ที่จัดให้มีข้อผิดพลาดมาตรฐานที่นี่? เราพิจารณาแต่ละค่าส่วนที่เหลือเป็นตัวประมาณสำหรับข้อผิดพลาด "ของ" และประเมินข้อผิดพลาดมาตรฐาน "รวม" ของตัวประมาณเหล่านี้ทั้งหมดหรือไม่

1
การพยากรณ์อนุกรมเวลาของ Arima (auto.arima) ที่มีตัวแปรที่แปลกประหลาดหลายตัวใน R
ฉันต้องการดำเนินการคาดการณ์ตามแบบอนุกรมเวลา ARIMA หลายรุ่นพร้อมกับตัวแปรที่แปลกประหลาดหลายตัว เนื่องจากฉันไม่ใช่ทักษะที่เกี่ยวข้องกับสถิติและ RI ที่ไม่ต้องการเก็บไว้เป็นเรื่องง่ายที่สุดเท่าที่จะทำได้ (การพยากรณ์แนวโน้ม 3 เดือนก็เพียงพอแล้ว) ฉันมีอนุกรมเวลา 1 ชุดและอนุกรมเวลาตัวทำนาย 3-5 ชุดข้อมูลรายเดือนทั้งหมดไม่มีช่องว่าง "ขอบฟ้า" ในเวลาเดียวกัน ฉันพบฟังก์ชัน auto.arima และถามตัวเองว่านี่จะเป็นวิธีการแก้ปัญหาที่เหมาะสมสำหรับปัญหาของฉันหรือไม่ ฉันมีราคาสินค้าโภคภัณฑ์ที่แตกต่างและราคาของผลิตภัณฑ์ที่ทำจากพวกเขา ข้อมูลดิบทั้งหมดไม่อยู่นิ่ง แต่ผ่านความแตกต่างในการสั่งซื้อครั้งแรกพวกเขาทั้งหมดกลายเป็นข้อมูลนิ่ง ADF, KPSS ระบุสิ่งนี้ (ซึ่งหมายความว่าฉันได้ทดสอบการรวมระบบแล้วใช่ไหม) คำถามของฉันคือ: ฉันจะใช้สิ่งนี้กับฟังก์ชั่น auto.arima และ ARIMA เป็นวิธีการที่ถูกต้องได้อย่างไร? ppl บางคนแนะนำให้ฉันใช้ VAR แล้ว แต่เป็นไปได้ไหมกับ ARIMA ด้วย? ตารางต่อไปนี้เป็นข้อมูลของฉัน ที่จริงแล้วชุดข้อมูลขึ้นไป 105 ข้อสังเกต แต่ 50 แรกจะทำ เทรนด์และฤดูกาลเป็นที่สนใจอย่างชัดเจนที่นี่ ขอบคุณสำหรับคำแนะนำและความช่วยเหลือ! เฟรดริก
14 r  time-series  arima 

1
วิธีการตีความความสัมพันธ์อัตโนมัติ
ฉันคำนวณความสัมพันธ์อัตโนมัติในข้อมูลอนุกรมเวลาเกี่ยวกับรูปแบบการเคลื่อนที่ของปลาตามตำแหน่ง: X ( x.ts) และY ( y.ts) เมื่อใช้ R ฉันจะใช้งานฟังก์ชั่นต่อไปนี้และสร้างแปลงต่อไปนี้: acf(x.ts,100) acf(y.ts,100) คำถามของฉันคือฉันจะตีความแปลงเหล่านี้ได้อย่างไร ข้อมูลใดที่จำเป็นสำหรับการรายงานรูปแบบใด ๆ ฉันท่องอินเทอร์เน็ตและยังไม่พบวิธีรัดกุมที่อธิบายได้อย่างมีประสิทธิภาพ นอกจากนี้คุณจะตัดสินใจจำนวนความล่าช้าที่ถูกต้องในการใช้งานได้อย่างไร ฉันใช้ 100 แต่ฉันไม่แน่ใจว่ามันมากเกินไป

5
การหาจุดผันใน R จากข้อมูลที่ราบเรียบ
loessผมมีข้อมูลบางอย่างที่ผมเรียบใช้ ฉันต้องการหาจุดเบี่ยงเบนของเส้นที่เรียบ เป็นไปได้ไหม ฉันแน่ใจว่ามีคนทำวิธีแฟนซีเพื่อแก้ปัญหานี้ ... ฉันหมายถึง ... หลังจากทั้งหมดมันคือ R! ฉันพอใจกับการเปลี่ยนฟังก์ชั่นปรับให้เรียบที่ฉันใช้ ฉันเพิ่งใช้loessเพราะนั่นคือสิ่งที่ฉันเคยใช้ในอดีต แต่ฟังก์ชั่นการปรับให้เรียบนั้นใช้ได้ ฉันรู้ว่าจุดเปลี่ยนผันจะขึ้นอยู่กับฟังก์ชันการปรับให้เรียบที่ฉันใช้ ฉันไม่เป็นไร ฉันต้องการเริ่มต้นด้วยการมีฟังก์ชั่นการปรับให้เรียบซึ่งสามารถช่วยแยกจุดที่ทำให้เกิดการเว้าออกได้ นี่คือรหัสที่ฉันใช้: x = seq(1,15) y = c(4,5,6,5,5,6,7,8,7,7,6,6,7,8,9) plot(x,y,type="l",ylim=c(3,10)) lo <- loess(y~x) xl <- seq(min(x),max(x), (max(x) - min(x))/1000) out = predict(lo,xl) lines(xl, out, col='red', lwd=2)
14 r  smoothing  loess 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.