คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '


3
มีวิธีการเพิ่ม / ลดฟังก์ชั่นที่กำหนดเองใน R หรือไม่?
ฉันกำลังพยายามลดฟังก์ชั่นที่กำหนดเอง ควรยอมรับห้าพารามิเตอร์และชุดข้อมูลและทำการคำนวณทุกประเภทโดยสร้างตัวเลขเดียวเป็นเอาต์พุต ฉันต้องการค้นหาการรวมกันของพารามิเตอร์อินพุตห้าตัวซึ่งให้ผลลัพธ์ที่เล็กที่สุดของฟังก์ชันของฉัน
18 r  optimization 

3
การคำนวณอันดับไทล์ไทล์ใน R [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน3 ปีที่ผ่านมา ฉันจะเพิ่มตัวแปรใหม่ลงในกรอบข้อมูลซึ่งจะเป็นเปอร์เซนต์ไทล์ของตัวแปรตัวใดตัวหนึ่งได้อย่างไร ฉันสามารถทำสิ่งนี้ใน Excel ได้อย่างง่ายดาย แต่ฉันต้องการทำอย่างนั้นในอาร์ ขอบคุณ
18 r  quantiles 

5
แพ็คเกจ R สำหรับการสร้างแบบจำลองสมการโครงสร้างหลายระดับ?
ฉันต้องการทดสอบแบบจำลองเส้นทางแบบหลายขั้นตอน (เช่น A คาดการณ์ B, B ทำนาย C, C คาดการณ์ D) ซึ่งตัวแปรทั้งหมดของฉันคือการสังเกตการณ์แบบซ้อนภายในกลุ่ม จนถึงตอนนี้ฉันได้ทำสิ่งนี้ผ่านการวิเคราะห์หลายระดับที่ไม่ซ้ำกันใน R ฉันต้องการใช้เทคนิคเช่น SEM ที่ให้ฉันทดสอบหลายเส้นทางในเวลาเดียวกัน (A -> B -> C -> D) และยังคงรองรับ 2 ระดับ (บุคคลในกลุ่ม) อย่างถูกต้อง ฉันเข้าใจว่า MPLUS สามารถจัดการสิ่งนี้ได้ ฉันสามารถใช้แพ็คเกจ R ได้หรือไม่?

8
แพคเกจร่วมกันสำหรับ R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ คุณช่วยแนะนำแพ็คเกจการวิเคราะห์ร่วมที่ใช้งานง่ายหรือครอบคลุมสำหรับ R ได้หรือไม่?

3
การรับสูตรสำหรับการ จำกัด การทำนายในตัวแบบเชิงเส้น (เช่น: ช่วงการทำนาย)
ลองมาตัวอย่างต่อไปนี้: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) สิ่งนี้สร้างรูปแบบของ y โดยยึดตาม x1 และ x2 โดยใช้การถดถอยแบบ OLS ถ้าเราต้องการที่จะคาดการณ์ปีสำหรับให้ x_vec summary(fit)เราก็สามารถใช้สูตรที่เราได้รับจาก อย่างไรก็ตามถ้าเราต้องการที่จะทำนายการคาดการณ์ที่ต่ำกว่าและบนของ y? (สำหรับระดับความเชื่อมั่นที่กำหนด) แล้วเราจะสร้างสูตรได้อย่างไร

1
พล็อตประกายไฟใน R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการใช้ R เพื่อพล็อตอะไรแบบนี้: ดูเหมือนว่าจะเป็นไปได้ แต่มีความซับซ้อนสูงในการติดตามพิกัดความกว้างความสูง ฯลฯ โดยสังหรณ์ใจมันจะเป็นการดีที่สุดที่จะปฏิบัติต่อแต่ละเซลล์เป็นพล็อตใหม่และแปลงพิกัดสำหรับแต่ละเซลล์ มีวิธีทำเช่นนี้ใน R หรือไม่? ขอบคุณ!

3
แหล่งข้อมูลสำหรับผู้ใช้ R ที่ต้องเรียนรู้ SAS
ฉันใช้อาร์ทุกวัน ฉันคิดว่าในแง่ของ data.frames, ตระกูล Apply () ของฟังก์ชัน, การเขียนโปรแกรมเชิงวัตถุ, vectorization, และ ggplot2 geoms / aesthetics ฉันเพิ่งเริ่มทำงานให้กับองค์กรที่ใช้ SAS เป็นหลัก ฉันรู้ว่ามีหนังสือเกี่ยวกับการเรียนรู้ R สำหรับผู้ใช้ SASแต่แหล่งข้อมูลที่ดีสำหรับผู้ใช้ R ที่ไม่เคยใช้ SAS คืออะไร
18 r  sas 

4
การลบเส้นขอบในแปลง R เพื่อให้ได้แกนของ Tufte
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ พิจารณากราฟต่อไปนี้: x <- 1:100 y1 <- rnorm(100) y2 <- rnorm(100)+100 par(mar=c(5,5,5,5)) plot(x,y1,pch=0,type="b",col="red",yaxt="n",ylim=c(-8,2),ylab="") axis(side=2, at=c(-2,0,2)) mtext("red line", side = 2, line=2.5, at=0) par(new=T) plot(x,y2,pch=1,type="b",col="blue",yaxt="n",ylim=c(98,108), ylab="") axis(side=4, at=c(98,100,102), labels=c("98%","100%","102%")) mtext("blue line", side=4, line=2.5, at=100) ฉันจะลบเส้นขอบที่สร้างขึ้นโดยอัตโนมัติและเก็บรักษาเส้นแกนไว้เพื่อให้ได้สไตล์ของ Tufte ได้อย่างไร

5
ใช้ lmer สำหรับการทำนาย
สวัสดีฉันมีสองปัญหาที่ฟังเหมือนผู้สมัครทั่วไปสำหรับรุ่นหลายระดับ / ผสมซึ่งฉันไม่เคยใช้ ง่ายขึ้นและสิ่งที่ฉันหวังว่าจะลองเป็นการแนะนำมีดังนี้: ข้อมูลดูเหมือนหลายแถวของแบบฟอร์ม x y innergroup outergroup โดยที่ x คือ covariate ที่เป็นตัวเลขซึ่งฉันต้องการถดถอย y (ตัวแปรตัวเลขอื่น), y แต่ละตัวเป็นของกลุ่มอินเนอร์กรุปและกลุ่มอินเทอร์เนชันแต่ละกลุ่มจะซ้อนกันในกลุ่มนอก (เช่นทั้งหมดในกลุ่มที่อยู่ในกลุ่มเดียวกัน) . น่าเสียดายที่ Innergroup มีหลายระดับ (หลายพันคน) และแต่ละระดับมีการสังเกตการณ์ค่อนข้างน้อยดังนั้นฉันคิดว่ารูปแบบนี้อาจเหมาะสม คำถามของฉันคือ ฉันจะเขียนสูตรหลายระดับได้อย่างไร เมื่อlmer เข้ากับโมเดลแล้วจะมีวิธีการทำนายอย่างไร ฉันมีตัวอย่างของเล่นที่เรียบง่ายขึ้น แต่ไม่พบฟังก์ชันทำนาย () คนส่วนใหญ่ดูเหมือนจะสนใจในการอนุมานมากกว่าการทำนายด้วยเทคนิคแบบนี้ ฉันมีหลายล้านแถวดังนั้นการคำนวณอาจเป็นปัญหา แต่ฉันสามารถลดได้ตามความเหมาะสม ฉันไม่ต้องการทำสิ่งที่สองในบางครั้ง แต่ฉันก็อาจเริ่มคิดเกี่ยวกับมันและเล่นกับมัน ผมมีข้อมูลที่คล้ายกันเหมือน แต่ก่อน แต่ไม่มี x, y และในขณะนี้คือตัวแปรทวินามของแบบฟอร์มNK) y ยังมีการทับซ้อนจำนวนมากแม้ในกลุ่มผู้ใช้ ส่วนใหญ่ของไม่เกิน 2 หรือ 3 (หรือน้อยกว่า) …

1
ฉันคำนวณอัตราส่วนความน่าจะเป็นได้เหล่านี้ถูกต้องหรือไม่
ฉันเป็นผู้เขียนแพ็กเกจ ezสำหรับ R และฉันกำลังดำเนินการอัปเดตเพื่อรวมการคำนวณอัตโนมัติของอัตราส่วนความน่าจะเป็น (LRs) ในผลลัพธ์ของ ANOVAs ความคิดคือการให้ LR สำหรับแต่ละผลที่คล้ายกับการทดสอบของผลกระทบที่ ANOVA ประสบความสำเร็จ ตัวอย่างเช่น LR สำหรับเอฟเฟ็กต์หลักหมายถึงการเปรียบเทียบโมเดลโมฆะกับโมเดลที่มีเอฟเฟกต์หลัก LR สำหรับการโต้ตอบแสดงถึงการเปรียบเทียบของโมเดลที่มีเอฟเฟกต์หลักทั้งสองส่วนประกอบกับโมเดลที่มีเอฟเฟกต์หลักและปฏิสัมพันธ์ของพวกเขา ฯลฯ ตอนนี้ความเข้าใจของฉันเกี่ยวกับการคำนวณ LR มาจากGlover & Dixon ( PDF ) ซึ่งครอบคลุมการคำนวณพื้นฐานรวมถึงการแก้ไขความซับซ้อนและภาคผนวกของBortolussi & Dixon ( ภาคผนวก PDF ) ซึ่งครอบคลุมการคำนวณที่เกี่ยวข้องกับตัวแปรการวัดซ้ำ เพื่อทดสอบความเข้าใจของฉันฉันได้พัฒนาสเปรดชีตนี้ซึ่งใช้ dfs & SS จากตัวอย่าง ANOVA (สร้างจากการออกแบบ 2 * 2 * 3 * 4 โดยใช้ข้อมูลปลอม) และขั้นตอนในการคำนวณ …

3
วิธีการดำเนินการแปลงภาพอัตราส่วนภาพสามมิติ
ฉันมีข้อมูลเกี่ยวกับพฤติกรรมการเคลื่อนไหว (เวลาที่ใช้ในการนอนหลับอยู่ประจำที่และทำกิจกรรมทางกาย) ซึ่งมีจำนวนถึง 24 (เช่นในชั่วโมงต่อวัน) ฉันต้องการสร้างตัวแปรที่ใช้เวลาสัมพัทธ์ที่ใช้ในพฤติกรรมเหล่านี้ - ฉันได้รับแจ้งว่าการเปลี่ยนแปลงอัตราส่วนการบันทึกภาพสามมิติจะทำให้สิ่งนี้สำเร็จ ดูเหมือนว่าฉันควรใช้ฟังก์ชั่น ilr ใน R แต่ไม่สามารถหาตัวอย่างที่แท้จริงด้วยรหัสได้ ฉันจะเริ่มที่ไหน ตัวแปรที่ฉันมีคือเวลานอนหลับเวลานั่งนิ่งเฉลี่ยกิจกรรมออกกำลังกายเบา ๆ โดยเฉลี่ยกิจกรรมออกกำลังกายปานกลางปานกลางและออกกำลังกายแข็งแรงโดยเฉลี่ย รายงานการนอนหลับด้วยตนเองในขณะที่คนอื่น ๆ เป็นค่าเฉลี่ยจากวันที่ถูกต้องของข้อมูล accelerometer ดังนั้นสำหรับตัวแปรเหล่านี้เคสจะไม่รวมเท่ากับ 24 ฉันเดาว่าฉันทำงานใน SAS แต่ดูเหมือนว่า R จะใช้งานได้ง่ายกว่าสำหรับส่วนนี้ ดังนั้นการนำเข้าข้อมูลก่อนโดยมีเพียงตัวแปรที่น่าสนใจ จากนั้นใช้ฟังก์ชั่น acomp () จากนั้นฉันไม่สามารถหาไวยากรณ์สำหรับฟังก์ชัน ilr () ได้ ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมมาก

5
ความแปรปรวนในผลลัพธ์ cv.glmnet
ฉันใช้cv.glmnetเพื่อค้นหาผู้ทำนาย การตั้งค่าที่ฉันใช้มีดังนี้: lassoResults&lt;-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda&lt;-lassoResults$lambda.min results&lt;-predict(lassoResults,s=bestlambda,type="coefficients") choicePred&lt;-rownames(results)[which(results !=0)] set.seed(1)เพื่อให้แน่ใจว่าผลจะทำซ้ำฉัน ผลลัพธ์มีความแปรปรวนสูง ฉันใช้รหัสเดียวกัน 100 เพื่อดูว่าผลลัพธ์เป็นอย่างไร ในการวิ่ง 98/100 มีตัวพยากรณ์หนึ่งตัวเลือกเสมอ (บางครั้งก็เป็นของตัวเอง); มีการเลือกตัวทำนายอื่น ๆ (co-efficient เป็น non-zero) โดยปกติ 50/100 ครั้ง ดังนั้นมันบอกกับฉันว่าทุกครั้งที่การตรวจสอบความถูกต้องไขว้ทำงานมันอาจจะเป็นการเลือกแลมบ์ดาที่ดีที่สุดเพราะการสุ่มเริ่มต้นของโฟลเดอร์สำคัญ คนอื่น ๆ ได้เห็นปัญหานี้ ( ผลลัพธ์ CV.glmnet ) แต่ไม่มีวิธีการแก้ไขที่แนะนำ ฉันคิดว่าบางทีสิ่งที่แสดงให้เห็นว่า 98/100 น่าจะสัมพันธ์กับคนอื่น ๆ ผลจะมีเสถียรภาพถ้าฉันเพียงแค่เรียกใช้ LOOCV ( fold-size=nfold-size=n\text{fold-size} = n ) แต่ผมอยากรู้ว่าทำไมพวกเขาจึงตัวแปรเมื่อnfold&lt;nnfold&lt;n\text{nfold} < n n

2
สี่แกนใน PCA biplot คืออะไร
เมื่อคุณสร้าง biplot สำหรับการวิเคราะห์ PCA คุณจะได้คะแนนองค์ประกอบหลัก PC1 จากคะแนน x-axis และ PC2 บนแกน y แต่อีกสองแกนทางด้านขวาและด้านบนของหน้าจอคืออะไร?
18 r  pca  biplot 

2
ใช้น้ำหนักใน svyglm vs glm
ฉันต้องการทราบว่าการรักษาน้ำหนักแตกต่างกันระหว่างsvyglmและอย่างไรglm ฉันใช้twangแพ็คเกจใน R เพื่อสร้างคะแนนความชอบซึ่งใช้เป็นน้ำหนักดังต่อไปนี้ (รหัสนี้มาจากtwangเอกสารประกอบ): library(twang) library(survey) set.seed(1) data(lalonde) ps.lalonde &lt;- ps(treat ~ age + educ + black + hispan + nodegree + married + re74 + re75, data = lalonde) lalonde$w &lt;- get.weights(ps.lalonde, stop.method="es.mean") design.ps &lt;- svydesign(ids=~1, weights=~w, data=lalonde) glm1 &lt;- svyglm(re78 ~ treat, design=design.ps) summary(glm1) ... Coefficients: Estimate …
18 r  survey 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.