คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
วิธีการทำการวิเคราะห์ความแปรปรวนแบบผสมขนาด 4 คูณ 4 ด้วยความแตกต่างระหว่างและภายในเรื่องโดยใช้ R?
ผู้ใช้ระดับเริ่มต้นของ R ที่นี่ต้องดิ้นรนกับมาตรการ ANOVA ซ้ำ ๆ ฉันมีชุดข้อมูลที่ประกอบด้วยหนึ่งระหว่างปัจจัยของกลุ่มวิชาที่มี 4 ระดับ (เขียนเป็นตัวแปรเดียวที่เรียกว่า 'กลุ่ม') และอีกหนึ่งรายการอยู่ในกลุ่มวิชาที่มี 4 ระดับ (เขียนเป็นตัวแปรแยกกันสี่ชุดคือ 'DV1', 'DV2', 'DV3 ',' DV4 ') ฉันมีวัตถุประสงค์ดังต่อไปนี้: ใช้มาตรการ ANOVA ซ้ำ ๆ โดยรวม เปรียบเทียบกลุ่มโดยใช้ความแตกต่างที่กำหนดเอง (เช่นในคำสั่ง LMATRIX ใน SPSS) เปรียบเทียบระดับต่างๆของ DV โดยใช้ความแตกต่างที่กำหนดเอง (เช่นในคำสั่ง MMATRIX ใน SPSS) ทำการรวมกันของ 2) และ 3) พร้อมกันดังนั้นฉันจึงเปรียบเทียบเฉพาะบางกลุ่มในระดับที่แน่นอนของปัจจัยภายในเรื่อง ใช้ชุดความแตกต่างที่ไม่รวมกับศูนย์ ฉันรู้ว่าฉันสามารถทำสิ่งนี้ใน SPSS ได้โดยไม่มีปัญหา แต่ฉันไม่สามารถเข้าใจวิธีการทำเช่นนี้ได้ใน R. …

1
การจัดการชุดข้อมูลขนาดใหญ่ในแบบฝึกหัดแนวปฏิบัติที่เหมาะสม ฯลฯ
ฉันเป็น Noob R ที่จำเป็นต้องทำการวิเคราะห์ชนิดต่าง ๆ บนชุดข้อมูลขนาดใหญ่ใน R ดังนั้นเมื่อมองไปรอบ ๆ ไซต์นี้และที่อื่น ๆ ปรากฏว่าสำหรับฉันมีปัญหาลึกลับและเป็นที่รู้จักน้อยมากที่เกี่ยวข้องกับที่นี่ - แพคเกจที่จะใช้เมื่อใดการแปลงเป็น (ไม่) ใช้กับข้อมูล ฯลฯ ฉันแค่สงสัยว่ามีหนังสือ / กวดวิชา / คู่มือที่ demystifies ทั้งหมดนี้และนำเสนอข้อมูลอย่างเป็นระบบหรือไม่? ฉันชอบทำสิ่งนี้แทนที่จะมองไปรอบ ๆ และรวบรวมข้อมูลจากแหล่งต่าง ๆ ทางออนไลน์ ขอบคุณล่วงหน้า.
11 r  large-data 

1
แปลงรหัส SAS NLMIXED สำหรับการถดถอยแกมม่าที่ไม่ต้องพองตัวเป็น R
ฉันพยายามเรียกใช้การถดถอยที่ไม่ต้องเสียค่าศูนย์สำหรับตัวแปรตอบสนองต่อเนื่องใน R. ฉันทราบว่ามีการใช้งาน gamlss แต่ฉันอยากลองใช้อัลกอริทึมนี้โดย Dale McLerran ซึ่งเป็นแนวคิดที่ค่อนข้างตรงไปตรงมามากกว่า น่าเสียดายที่รหัสนั้นอยู่ใน SAS และฉันไม่แน่ใจว่าจะเขียนใหม่สำหรับ nlme ได้อย่างไร รหัสดังต่อไปนี้: proc nlmixed data=mydata; parms b0_f=0 b1_f=0 b0_h=0 b1_h=0 log_theta=0; eta_f = b0_f + b1_f*x1 ; p_yEQ0 = 1 / (1 + exp(-eta_f)); eta_h = b0_h + b1_h*x1; mu = exp(eta_h); theta = exp(log_theta); r = mu/theta; …
11 r  sas  gamlss 

2
ความเหมาะสมของ Wilcoxon ลงนามทดสอบระดับ
ฉันแหย่ไปรอบ ๆ ในจดหมายเหตุตรวจสอบความถูกต้องของ Cross และดูเหมือนจะไม่พบคำตอบสำหรับคำถามของฉัน คำถามของฉันมีดังต่อไปนี้: Wikipedia ให้ข้อสมมติฐานสามข้อที่จำเป็นสำหรับการทดสอบระดับวิลคอกซันที่ลงนาม (แก้ไขเล็กน้อยสำหรับคำถามของฉัน): ให้ Zi = Xi-Yi สำหรับ i = 1, ... , n ความแตกต่างของ Zi นั้นถือว่าเป็นอิสระ (a.) Zi แต่ละคนมาจากประชากรที่ต่อเนื่องกันและ (b.) Zi แต่ละคนมีความสมมาตรเกี่ยวกับค่ามัธยฐานทั่วไป ค่าที่ตัวแทน Xi และ Yi ถูกสั่ง ... ดังนั้นการเปรียบเทียบ 'มากกว่า', 'น้อยกว่า' และ 'เท่ากับ' มีประโยชน์ เอกสารประกอบสำหรับ? wilcox.test ใน R อย่างไรก็ตามดูเหมือนว่าบ่งชี้ว่า (2.b) เป็นสิ่งที่ทดสอบโดยขั้นตอนจริง: "... หากทั้ง …

2
Gaussian แบบหลายตัวแปรที่ทนทานใน R
ฉันต้องพอดีกับการแจกแจงแบบเกาส์ทั่วไปกับคลาวด์ 7-point ที่บรรจุค่าผิดปกติจำนวนมากและมีเลเวอเรจสูง คุณรู้จักแพ็คเกจ R ที่ดีสำหรับงานนี้หรือไม่?

2
จัดระเบียบแผนภูมิการจัดหมวดหมู่ (ใน rpart) เป็นชุดของกฎหรือไม่
มีวิธีที่เมื่อต้นไม้การจำแนกที่ซับซ้อนถูกสร้างขึ้นโดยใช้ rpart (ใน R) เพื่อจัดระเบียบกฎการตัดสินใจสำหรับแต่ละชั้นหรือไม่? ดังนั้นแทนที่จะได้รับต้นไม้ใหญ่หนึ่งต้นเราจะได้ชุดของกฎสำหรับแต่ละชั้นเรียน (ถ้าเป็นเช่นนั้นได้อย่างไร) นี่คือตัวอย่างรหัสง่ายๆที่จะแสดงตัวอย่างใน: fit <- rpart(Kyphosis ~ Age + Number + Start, data=kyphosis) ขอบคุณ
11 r  classification  cart  rpart 

3
วิธีการเปรียบเทียบสองชุดข้อมูลกับพล็อต QQ โดยใช้ ggplot2?
ในฐานะที่เป็นทั้งสถิติและสามเณร R ฉันมีช่วงเวลาที่ยากลำบากมากที่พยายามสร้าง qqplots ด้วยอัตราส่วนกว้างยาว 1: 1 ggplot2 ดูเหมือนว่าจะให้การควบคุมการวางแผนมากกว่าแพ็คเกจการวางแผน R เริ่มต้น แต่ฉันไม่เห็นวิธีทำ qqplot ใน ggplot2 เพื่อเปรียบเทียบชุดข้อมูลสองชุด ดังนั้นคำถามของฉัน ggplot2 เทียบเท่ากับอะไรเช่น: qqplot(datset1,dataset2)

3
มีห้องสมุดใดบ้างสำหรับวิธีการแบบ CART ที่ใช้ตัวทำนายและการตอบสนองแบบกระจัดกระจาย?
ฉันกำลังทำงานกับชุดข้อมูลขนาดใหญ่บางอย่างโดยใช้แพ็คเกจ gbm ในอาร์ทั้งเมทริกซ์ตัวทำนายของฉันและเวกเตอร์การตอบสนองของฉันค่อนข้างเบาบาง (เช่นรายการส่วนใหญ่เป็นศูนย์) ฉันหวังว่าจะสร้างแผนภูมิการตัดสินใจโดยใช้อัลกอริทึมที่ใช้ประโยชน์จากความกระจัดกระจายตามที่ทำไว้ที่นี่ ) ในบทความดังกล่าวในสถานการณ์ของฉันรายการส่วนใหญ่มีคุณลักษณะที่เป็นไปได้เพียงไม่กี่รายการเท่านั้นดังนั้นพวกเขาจึงสามารถหลีกเลี่ยงการคำนวณจำนวนมากที่สูญเสียไปโดยสมมติว่ารายการของพวกเขาขาดคุณสมบัติที่กำหนดเว้นแต่ข้อมูลจะระบุอย่างชัดเจน ความหวังของฉันคือฉันสามารถเร่งความเร็วที่คล้ายกันโดยใช้อัลกอริทึมแบบนี้ (จากนั้นจึงใส่อัลกอริทึมการเร่งรอบ ๆ มันเพื่อปรับปรุงความแม่นยำในการทำนายของฉัน) เนื่องจากพวกเขาดูเหมือนจะไม่เผยแพร่รหัสของพวกเขาฉันสงสัยว่ามีแพ็คเกจโอเพนซอร์ซหรือไลบรารี (ในภาษาใด ๆ ) ที่ได้รับการปรับให้เหมาะกับกรณีนี้หรือไม่ เป็นการดีที่ฉันต้องการบางอย่างที่Matrixสามารถดึงเมทริกซ์แบบเบาบางได้โดยตรงจากแพ็คเกจของ R แต่ฉันจะทำตามที่ฉันจะได้ ฉันได้ดูไปรอบ ๆ และดูเหมือนว่าสิ่งนี้ควรจะอยู่ที่นั่น: นักเคมีดูเหมือนจะพบปัญหานี้มาก (กระดาษที่ฉันเชื่อมโยงข้างต้นเกี่ยวกับการเรียนรู้ที่จะหาสารประกอบยาใหม่) แต่การใช้งานที่ฉันพบได้นั้นเป็นกรรมสิทธิ์หรือมีความเชี่ยวชาญสูงสำหรับการวิเคราะห์ทางเคมี เป็นไปได้ว่าหนึ่งในนั้นอาจถูกนำมาใช้ซ้ำได้ การจัดหมวดหมู่เอกสารดูเหมือนจะเป็นพื้นที่ที่การเรียนรู้จากการเว้นช่องว่างคุณลักษณะมีประโยชน์ (เอกสารส่วนใหญ่ไม่มีคำมากที่สุด) ตัวอย่างเช่นมีการอ้างอิงแบบเอียงในการใช้งาน C4.5 (อัลกอริทึมคล้าย CART) ในเอกสารนี้แต่ไม่มีรหัส จากรายการส่งจดหมาย WEKA สามารถรับข้อมูลที่กระจัดกระจายได้ แต่ไม่เหมือนกับวิธีการในเอกสารที่ฉันลิงก์ด้านบน WEKA ไม่ได้รับการปรับให้เหมาะสมเพื่อใช้ประโยชน์จากมันจริง ๆ ในแง่ของการหลีกเลี่ยงวงจร CPU ที่สิ้นเปลือง ขอบคุณล่วงหน้า!

1
การปรับเปลี่ยนการจำลองแบบ linear ballistic accumulator (LBA) ใน R
โมเดล "Linear Ballistic Accumulator" (LBA) เป็นแบบจำลองที่ค่อนข้างประสบความสำเร็จสำหรับพฤติกรรมมนุษย์ในการตัดสินใจงานง่าย ๆ Donkin, et al (2009, PDF ) ให้รหัสที่ใบอนุญาตประมาณค่าพารามิเตอร์ของรูปแบบการให้ข้อมูลพฤติกรรมของมนุษย์และผมได้คัดลอกโค้ดนี้ (กับเล็กน้อยบางรูปแบบการเปลี่ยนแปลง) เพื่อสรุปสาระสำคัญที่นี่ อย่างไรก็ตามฉันต้องการทำการดัดแปลงเล็กน้อยกับโมเดล แต่ฉันไม่แน่ใจว่าจะได้รับการปรับเปลี่ยนนี้อย่างไรในโค้ด ในการเริ่มต้นด้วยรูปแบบที่เป็นที่ยอมรับ LBA หมายถึงทางเลือกในการตอบสนองแต่ละข้อในฐานะคู่แข่งในการแข่งขันที่ค่อนข้างแปลกประหลาดซึ่งคู่แข่งสามารถแตกต่างกันในลักษณะดังต่อไปนี้: ตำแหน่งเริ่มต้น: สิ่งนี้แตกต่างจากการแข่งขันไปยังการแข่งขันตามการกระจายเครื่องแบบที่ล้อมรอบด้วย U (0, X1) ความเร็ว: สิ่งนี้จะถูกเก็บไว้อย่างคงที่ภายในการแข่งขันที่กำหนด (ไม่เร่งความเร็ว) แต่จะแตกต่างกันไปตามการแข่งขันตามการแจกแจงแบบเกาส์ที่กำหนดโดย N (X2, X3) ตำแหน่งเส้นชัย (X4) ดังนั้นผู้แข่งขันแต่ละคนจึงมีค่าเป็นของตนเองสำหรับ X1, X2, X3 และ X4 การแข่งขันซ้ำหลายครั้งโดยผู้ชนะและเวลาที่บันทึกไว้หลังจากการแข่งขันแต่ละครั้ง ค่าคงที่ของ X5 จะถูกเพิ่มเข้าไปในทุกครั้งที่ชนะ ตอนนี้การดัดแปลงที่ฉันต้องการจะทำคือการสลับความแปรปรวนในจุดเริ่มต้นไปยังเส้นชัย นั่นคือฉันต้องการจุดเริ่มต้นที่จะเป็นศูนย์สำหรับคู่แข่งและการแข่งขันทั้งหมดดังนั้นจึงกำจัด X1 แต่ฉันต้องการเพิ่มพารามิเตอร์ X6 …

2
วิธีการวาดพล็อตปฏิสัมพันธ์ที่มีช่วงความมั่นใจได้อย่างไร
ความพยายามของฉัน: ฉันไม่สามารถรับช่วงความมั่นใจได้ interaction.plot() และในทางตรงกันข้ามplotmeans()จากแพ็คเกจ 'gplot' จะไม่แสดงกราฟสองกราฟ นอกจากนี้ฉันไม่สามารถกำหนดplotmeans()กราฟสองกราฟที่ด้านบนของอีกอันหนึ่งได้เนื่องจากโดยค่าเริ่มต้นแกนจะแตกต่างกัน ฉันประสบความสำเร็จในการใช้plotCI()จากแพ็คเกจ 'gplot' และวางกราฟสองตัวไว้ แต่การจับคู่ของแกนยังไม่สมบูรณ์ คำแนะนำเกี่ยวกับวิธีการทำพล็อตการโต้ตอบกับช่วงความมั่นใจ? ทั้งโดยฟังก์ชั่นเดียวหรือคำแนะนำเกี่ยวกับวิธีการวางซ้อนplotmeans()หรือplotCI()กราฟ ตัวอย่างรหัส br=structure(list(tangle = c(140L, 50L, 40L, 140L, 90L, 70L, 110L, 150L, 150L, 110L, 110L, 50L, 90L, 140L, 110L, 50L, 60L, 40L, 40L, 130L, 120L, 140L, 70L, 50L, 140L, 120L, 130L, 50L, 40L, 80L, 140L, 100L, 60L, 70L, …

1
ความน่าจะเป็นที่ครอบคลุมของช่วงความมั่นใจบูตพื้นฐาน
ฉันมีคำถามต่อไปนี้สำหรับหลักสูตรที่ฉันกำลังทำอยู่: ดำเนินการศึกษา Monte Carlo เพื่อประเมินความน่าจะเป็นที่ครอบคลุมของช่วงความมั่นใจบูตมาตรฐานและช่วงความเชื่อมั่นเริ่มต้นพื้นฐาน ตัวอย่างจากประชากรปกติและตรวจสอบอัตราความครอบคลุมเชิงประจักษ์สำหรับค่าเฉลี่ยตัวอย่าง ความน่าจะเป็นของการครอบคลุมสำหรับ bootstrap CI มาตรฐานทั่วไปนั้นง่าย: n = 1000; alpha = c(0.025, 0.975); x = rnorm(n, 0, 1); mu = mean(x); sqrt.n = sqrt(n); LNorm = numeric(B); UNorm = numeric(B); for(j in 1:B) { smpl = x[sample(1:n, size = n, replace = TRUE)]; xbar = mean(smpl); …

4
เส้นตรงหมายถึงอะไรในการถดถอยเชิงเส้น
ใน R ถ้าฉันเขียน lm(a ~ b + c + b*c) นี่จะเป็นการถดถอยเชิงเส้นหรือไม่? วิธีการถดถอยแบบอื่น ๆ ใน R? ฉันจะขอบคุณคำแนะนำสำหรับหนังสือหรือแบบฝึกหัดใดบ้าง?
11 r  regression 

4
การติดฉลาก boxplots ใน R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการสร้าง boxplot โดยไม่มีแกนและเพิ่มลงในพล็อตปัจจุบัน (ROC curve) แต่ฉันต้องการเพิ่มข้อมูลข้อความเพิ่มเติมลงใน boxplot: เลเบลสำหรับ min และ max บรรทัดปัจจุบันของรหัสอยู่ด้านล่าง (กราฟปัจจุบันด้วย) ขอบคุณมากสำหรับความช่วยเหลือ boxplot(data, horizontal = TRUE, range = 0, axes=FALSE, col = "grey", add = TRUE) อีกวิธีคือเพิ่มบรรทัดจาก 0 ถึง 1 (แทนแกน x) แต่ฉันต้องการให้ผ่านเส้นกลาง ... ตัวอย่างเช่นกราฟิกนี้
11 r  boxplot 

2
การทำนายล่วงหน้า 1 ขั้นตอนด้วยแพ็คเกจ Dynlm R
ฉันพอดีกับโมเดลที่มีตัวแปรอิสระหลายตัวซึ่งหนึ่งในนั้นก็คือความล่าช้าของตัวแปรตามโดยใช้แพ็คเกจ dynlm สมมติว่าฉันมีการคาดการณ์ล่วงหน้า 1 ขั้นตอนสำหรับตัวแปรอิสระของฉันฉันจะรับการคาดการณ์ล่วงหน้า 1 ขั้นตอนสำหรับตัวแปรตามของฉันได้อย่างไร นี่คือตัวอย่าง: library(dynlm) y<-arima.sim(model=list(ar=c(.9)),n=10) #Create AR(1) dependant variable A<-rnorm(10) #Create independant variables B<-rnorm(10) C<-rnorm(10) y<-y+.5*A+.2*B-.3*C #Add relationship to independant variables data=cbind(y,A,B,C) #Fit linear model model<-dynlm(y~A+B+C+L(y,1),data=data) #Forecast A<-c(A,rnorm(1)) #Assume we already have 1-step forecasts for A,B,C B<-c(B,rnorm(1)) C<-c(C,rnorm(1)) y=window(y,end=end(y)+c(1,0),extend=TRUE) newdata<-cbind(y,A,B,C) predict(model,newdata) และนี่คือตัวอย่างการใช้แพคเกจ dyn ซึ่งใช้งานได้ library(dyn) …

6
ทำนายค่าหลังจากเรียกใช้ฟังก์ชัน mlogit ใน R
นี่คือสิ่งที่ฉันต้องการทำ แต่ดูเหมือนจะไม่มีpredictวิธีสำหรับ mlogit ความคิดใด ๆ library(mlogit) data("Fishing", package = "mlogit") Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") Fish_fit<-Fish[-1,] Fish_test<-Fish[1,] m <- mlogit(mode ~price+ catch | income, data = Fish_fit) predict(m,newdata=Fish_test)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.