คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

2
การกระจายข้อผิดพลาดรอบ ๆ ข้อมูลการเติบโตของโลจิสติกคืออะไร
ในระบบนิเวศน์เรามักใช้สมการการเติบโตโลจิสติกส์: Nt=KN0ertK+N0ert−1Nt=KN0ertK+N0ert−1 N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}} หรือ Nt=KN0N0+(K−N0)e−rtNt=KN0N0+(K−N0)e−rt N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}} ที่ไหน KKK คือขีดความสามารถในการบรรทุก (ถึงความหนาแน่นสูงสุด) N0N0N_0 คือความหนาแน่นเริ่มต้น rrr คืออัตราการเติบโต ttt เป็นเวลาตั้งแต่เริ่มต้น คุณค่าของ NtNtN_t มีขอบบนที่อ่อนนุ่ม (K)(K)(K) และขอบเขตที่ต่ำกว่า (N0)(N0)(N_0)มีขอบเขตล่างที่แข็งแกร่งที่ 000. นอกจากนี้ในบริบทเฉพาะของฉันการวัดของ NtNtN_t จะทำโดยใช้ความหนาแน่นของแสงหรือการเรืองแสงซึ่งทั้งสองมีทฤษฎีสูงสุดและทำให้ขอบเขตที่แข็งแกร่ง ข้อผิดพลาดรอบ ๆ NtNtN_t ดังนั้นจึงอาจอธิบายได้ดีที่สุดโดยการแจกแจงแบบมีขอบเขต ที่ค่าน้อย NtNtN_tการกระจายอาจมีความเบ้เป็นบวกอย่างมากขณะที่ค่าของ NtNtN_tเมื่อเข้าหา K …
10 r  distributions  pdf  ecology 

2
วิธีการจำลองผลลัพธ์หลายตัวแปรใน R?
ส่วนของสถานการณ์เราจะจัดการกับผลตอบสนอง / ตัวแปรเช่น+ อย่างไรก็ตามในบางสถานการณ์โดยเฉพาะอย่างยิ่งในข้อมูลทางคลินิกตัวแปรผลลัพธ์อาจเป็นมิติสูง / หลายตัวแปร เช่นโดยที่มีตัวแปร Y_1 , Y_2และY_3และผลลัพธ์เหล่านี้ล้วนมีความสัมพันธ์กัน หากxแทนการรับการรักษา (ใช่ / ไม่ใช่) ฉันจะจำลองข้อมูลประเภทนี้ใน R ได้อย่างไร?Y= a + b x + ϵy=a+bx+ϵy = a + bx +\epsilonY =βx + ϵY=βx+ϵ\mathsf{Y} = \beta{x} + \mathsf{\epsilon}YY\mathsf{Y}Y1Y1Y_1Y2Y2Y_2Y3Y3Y_3xxx ตัวอย่างในชีวิตจริงผู้ป่วยแต่ละรายได้รับการผ่าตัดบายพาสหนึ่งใน 2 ประเภทและนักวิจัยวัดผู้ป่วยแต่ละรายเกี่ยวกับความเจ็บปวดบวมความเหนื่อยล้า ... ฯลฯ หลังการผ่าตัดบายพาส ฉัน "ถือว่า" ผลลัพธ์ (ความรุนแรงของอาการ) เป็นหลายตัวแปรปกติ หวังว่าตัวอย่างจริงนี้สามารถทำให้คำถามของฉันชัดเจนขึ้น ขอบคุณมากล่วงหน้า

3
การถดถอยเชิงเส้นกับปัจจัยใน R
ฉันพยายามที่จะเข้าใจว่าปัจจัยการทำงานในอาร์ว่ากันว่าฉันต้องการที่จะเรียกใช้การถดถอยโดยใช้ข้อมูลตัวอย่างบางอย่างใน R: > data(CO2) > colnames(CO2) [1] "Plant" "Type" "Treatment" "conc" "uptake" > levels(CO2$Type) [1] "Quebec" "Mississippi" > levels(CO2$Treatment) [1] "nonchilled" "chilled" > lm(uptake ~ Type + Treatment, data = CO2) Call: lm(formula = uptake ~ Type + Treatment, data = CO2) Coefficients: (Intercept) TypeMississippi Treatmentchilled 36.97 -12.66 -6.86 ฉันเข้าใจว่าTypeMississippiและTreatmentchilledได้รับการปฏิบัติเหมือนเป็นบูลีน: …

3
วิธีทดสอบสมมติฐานว่าสหสัมพันธ์เท่ากับค่าที่กำหนดโดยใช้ R อย่างไร
มีฟังก์ชั่นในการทดสอบสมมติฐานว่าสหสัมพันธ์ของเวกเตอร์สองตัวมีค่าเท่ากับตัวเลขที่กำหนดหรือไม่พูดว่า 0.75? การใช้ cor.test ฉันสามารถทดสอบ cor = 0 และฉันเห็นได้ว่า 0.75 อยู่ในช่วงความมั่นใจหรือไม่ แต่มีฟังก์ชั่นในการคำนวณค่า p สำหรับ cor = 0.75 หรือไม่? x <- rnorm(10) y <- x+rnorm(10) cor.test(x, y)
10 r  correlation 

2
ไม่ว่าจะใช้การชดเชยในการถดถอยปัวซองเมื่อทำนายเป้าหมายการทำงานทั้งหมดที่ผู้เล่นฮอกกี้ทำคะแนน
ฉันมีคำถามเกี่ยวกับสิ่งที่ดีกว่าหรือไม่ใช้การชดเชย สมมติว่าเป็นโมเดลที่ง่ายมากที่คุณต้องการอธิบายจำนวนเป้าหมาย (โดยรวม) ในฮอกกี้ ดังนั้นคุณมีเป้าหมายจำนวนเกมที่เล่นและตัวแปรดัมมี่ "กองหน้า" ซึ่งเท่ากับ 1 หากผู้เล่นเป็นกองหน้าและ 0 อย่างอื่น ดังนั้นรุ่นใดต่อไปนี้ที่ระบุไว้ถูกต้อง? เป้าหมาย = เกม + กองหน้าหรือ เป้าหมาย = ชดเชย (เกม) + กองหน้า อีกครั้งเป้าหมายคือเป้าหมายโดยรวมและจำนวนเกมเป็นเกมโดยรวมสำหรับผู้เล่นคนเดียว ตัวอย่างเช่นอาจมีผู้เล่นที่หยิบขึ้นมาที่มี 50 เป้าหมายใน 100 เกมและผู้เล่นอีกคนที่มี 20 เป้าหมายใน 50 เกมเป็นต้น ฉันควรทำอย่างไรเมื่อฉันต้องการประเมินจำนวนเป้าหมาย จำเป็นหรือไม่ที่จะใช้การชดเชยตรงนี้ อ้างอิง: ดูคำถามก่อนหน้านี้ที่พูดถึงเมื่อใช้ offsets ในการถดถอยปัวซองโดยทั่วไป

2
ฉันจะอธิบายความแปรปรวนเชิงพื้นที่ในรูปแบบเชิงเส้นได้อย่างไร
พื้นหลัง ฉันมีข้อมูลจากการศึกษาภาคสนามซึ่งมีสี่ระดับการรักษาและหกซ้ำในแต่ละช่วงตึก (4x6x2 = 48 การสังเกต) บล็อกอยู่ห่างกันประมาณ 1 ไมล์และภายในบล็อกมีตารางของ 42, 2m x 4m แปลงและทางเดินกว้าง 1m; การศึกษาของฉันใช้เพียง 24 แปลงในแต่ละบล็อก ฉันต้องการประเมินความแปรปรวนร่วมเชิงพื้นที่ นี่คือตัวอย่างการวิเคราะห์โดยใช้ข้อมูลจากบล็อกเดียวโดยไม่มีการบัญชีสำหรับความแปรปรวนร่วมเชิงพื้นที่ ในชุดข้อมูลplotคือ id ของพล็อตxคือตำแหน่ง x และyตำแหน่ง y ของแต่ละพล็อตที่มีพล็อต 1 อยู่ตรงกลางที่ 0, 0 levelคือระดับการรักษาและresponseเป็นตัวแปรตอบกลับ layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L, 17L, 18L, 22L, 23L, 26L, …

4
จะรับค่าที่ใช้ใน plot.gam เป็น mgcv ได้อย่างไร?
ฉันต้องการทราบค่าที่(x, y)ใช้ในการลงจุดplot(b, seWithMean=TRUE)ในแพ็คเกจmgcv ไม่มีใครรู้ว่าฉันสามารถแยกหรือคำนวณค่าเหล่านี้ได้อย่างไร นี่คือตัวอย่าง: library(mgcv) set.seed(0) dat <- gamSim(1, n=400, dist="normal", scale=2) b <- gam(y~s(x0), data=dat) plot(b, seWithMean=TRUE)

4
รับโซ่ 10D MCMC ฉันจะกำหนดโหมดหลังได้อย่างไรใน R
คำถาม:ด้วยห่วงโซ่ MCMC แบบ 10 มิติสมมติว่าฉันพร้อมที่จะมอบเมทริกซ์การจับ: 100,000 ซ้ำ (แถว) โดย 10 พารามิเตอร์ (คอลัมน์) ฉันจะระบุโหมดหลังได้ดีที่สุดอย่างไร ฉันกังวลเป็นพิเศษกับหลายโหมด พื้นหลัง:ฉันคิดว่าตัวเองเป็นนักสถิติที่มีความชำนาญ แต่เมื่อเพื่อนร่วมงานถามคำถามนี้กับฉันฉันรู้สึกละอายใจที่ไม่สามารถหาคำตอบที่เหมาะสมได้ ข้อกังวลหลักคืออาจมีหลายโหมดปรากฏขึ้น แต่หากพิจารณาอย่างน้อยแปดหรือมากกว่านั้นในสิบส่วนข้อมูล ความคิดแรกของฉันคือการใช้การประมาณความหนาแน่นของเคอร์เนล แต่การค้นหาผ่าน R เปิดเผยว่าไม่มีอะไรน่ากังวลสำหรับปัญหาที่มีขนาดเกินกว่าสามมิติ เพื่อนร่วมงานได้เสนอกลยุทธ์เฉพาะกิจในสิบมิติและค้นหาสูงสุด แต่ข้อกังวลของฉันคือแบนด์วิดท์อาจนำไปสู่ปัญหาการกระจัดกระจายที่สำคัญหรือขาดความละเอียดในการแยกแยะหลายโหมด ที่กล่าวว่าฉันยินดีรับข้อเสนอแนะสำหรับคำแนะนำแบนด์วิดธ์อัตโนมัติลิงก์ไปยังตัวประมาณความหนาแน่นเคอร์เนล 10 ตัวหรือสิ่งอื่นที่คุณรู้ ความกังวลเกี่ยวกับ: เราเชื่อว่าการกระจายอาจเบ้ค่อนข้าง ดังนั้นเราต้องการระบุโหมดด้านหลังไม่ใช่วิธีหลัง เรากังวลว่าอาจมีโหมดหลังหลายโหมด หากเป็นไปได้เราต้องการคำแนะนำจาก R แต่อัลกอริทึมใด ๆ ที่จะทำตราบเท่าที่มันไม่ยากอย่างไม่น่าเชื่อที่จะใช้ ฉันเดาว่าฉันไม่ต้องการใช้ตัวประมาณความหนาแน่นของเคอร์เนลด้วยการเลือกแบนด์วิดท์อัตโนมัติตั้งแต่เริ่มต้น

5
Omega กำลังสองสำหรับการวัดผลกระทบใน R
หนังสือสถิติที่ฉันกำลังอ่านแนะนำให้โอเมก้ากำลังสองเพื่อวัดผลกระทบของการทดลองของฉัน ฉันได้พิสูจน์แล้วว่าใช้การออกแบบการแบ่งส่วน (ผสมผสานระหว่างการออกแบบภายในและระหว่างวิชา) ว่าปัจจัยภายในเรื่องของฉันมีความสำคัญทางสถิติด้วย p <0.001 และ F = 17 ตอนนี้ฉันกำลังมองหาว่าความแตกต่างใหญ่แค่ไหน ... มีการใช้โอเมก้ากำลังสองหา R (หรือ python หรือไม่ฉันรู้ว่า ... ใครจะฝันได้;) การค้นหาบนอินเทอร์เน็ตสำหรับสิ่งที่เกี่ยวข้องกับ R คือ เจ็บปวด*ฉันไม่รู้ว่าฉันจะหาสิ่งของด้วย C ได้อย่างไร ขอบคุณ!

1
เอาต์พุตของโมเดลโลจิสติกใน R
ฉันพยายามตีความโมเดลโลจิสติกส์ประเภทต่อไปนี้: mdl <- glm(c(suc,fail) ~ fac1 + fac2, data=df, family=binomial) ผลลัพธ์ของpredict(mdl)อัตราความสำเร็จที่คาดหวังสำหรับแต่ละจุดข้อมูลเป็นเท่าใด มีวิธีง่าย ๆ ในการกำหนดอัตราเดิมพันสำหรับแต่ละระดับของโมเดลแทนที่จะเป็นจุดข้อมูลทั้งหมดหรือไม่

2
การทดสอบตามฤดูกาลของอนุกรมเวลา
การทดสอบฤดูกาลที่ง่ายที่สุดสำหรับอนุกรมเวลาคืออะไร? เฉพาะเจาะจงมากขึ้นฉันต้องการทดสอบว่าspecific time series the seasonal componentมีความหมายหรือไม่ แพ็คเกจที่แนะนำใน Python / R คืออะไร?

3
วิธีสร้างไดอะแกรมบาร์พล็อตโดยที่บาร์อยู่เคียงข้างกันใน R
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันต้องการสร้าง bardiagram สำหรับข้อมูลเหล่านี้ใน R (อ่านจากไฟล์ CVS): Experiment_Name MetricA MetricB Just_X 2 10 Just_X_and_Y 3 20 ที่จะมีแผนภาพต่อไปนี้: ฉันเป็นผู้เริ่มต้นและฉันไม่รู้ว่าจะเริ่มต้นอย่างไร

3
แบคทีเรียหยิบขึ้นมาบนนิ้วมือหลังจากสัมผัสพื้นผิวหลายครั้ง: ข้อมูลที่ไม่ปกติการวัดซ้ำผู้เข้าร่วมข้าม
Intro ฉันมีผู้เข้าร่วมที่สัมผัสพื้นผิวที่ปนเปื้อนด้วยเชื้ออีโคไลในสองเงื่อนไข ( A = สวมถุงมือB = ไม่มีถุงมือ) ฉันต้องการทราบว่ามีความแตกต่างระหว่างปริมาณของแบคทีเรียที่ปลายนิ้วของพวกเขาด้วยและไม่ต้องใส่ถุงมือ แต่ยังรวมถึงจำนวนผู้ติดต่อด้วย ปัจจัยทั้งสองนี้มีส่วนร่วมภายใน วิธีการทดลอง: ผู้เข้าร่วม (n = 35) แตะที่ช่องสี่เหลี่ยมหนึ่งครั้งด้วยนิ้วเดียวกันสำหรับผู้ติดต่อได้สูงสุด 8 ราย (ดูรูปที่ a) จากนั้นฉันกวาดนิ้วของผู้เข้าร่วมและวัดแบคทีเรียที่ปลายนิ้วหลังจากการสัมผัสแต่ละครั้ง จากนั้นใช้นิ้วใหม่เพื่อสัมผัสจำนวนพื้นผิวที่แตกต่างกันและจาก 1 ถึง 8 รายชื่อ (ดูรูป b) นี่คือข้อมูลจริง : ข้อมูลจริง ข้อมูลไม่ปกติดังนั้นดูการกระจายของแบคทีเรียที่ขอบ | NumberContacts ด้านล่าง x = แบคทีเรีย แต่ละด้านคือจำนวนผู้ติดต่อที่แตกต่างกัน MODEL ลองจากlme4 :: glmerตามคำแนะนำของอะมีบาโดยใช้ Gamma (link = "log") และพหุนามสำหรับ NumberContacts: …

2
ทำไมขั้นตอนของฉันถึงเล็กลงเมื่อใช้ขนาดขั้นตอนคงที่ในการไล่ระดับสีแบบลาดชัน
สมมติว่าเรากำลังทำตัวอย่างของเล่นในการไล่ระดับสีที่ดีลดฟังก์ชันกำลังสองโดยใช้ขั้นตอนขนาดคงที่\( )xTAxxTAxx^TAxα=0.03α=0.03\alpha=0.03A=[10,2;2,3]A=[10,2;2,3]A=[10, 2; 2, 3] ถ้าเราพล็อตการติดตามของในการวนซ้ำแต่ละครั้งเราจะได้ตัวเลขดังต่อไปนี้ ทำไมคะแนนจึงมีความหนาแน่นสูงเมื่อเราใช้ขนาดขั้นตอนคงที่ โดยสังหรณ์ใจมันไม่ได้ดูเหมือนขนาดขั้นตอนคงที่ แต่ขนาดขั้นตอนลดลงxxx PS: รหัส R รวมถึงพล็อต A=rbind(c(10,2),c(2,3)) f <-function(x){ v=t(x) %*% A %*% x as.numeric(v) } gr <-function(x){ v = 2* A %*% x as.numeric(v) } x1=seq(-2,2,0.02) x2=seq(-2,2,0.02) df=expand.grid(x1=x1,x2=x2) contour(x1,x2,matrix(apply(df, 1, f),ncol=sqrt(nrow(df))), labcex = 1.5, levels=c(1,3,5,10,20,40)) grid() opt_v=0 alpha=3e-2 x_trace=c(-2,-2) x=c(-2,-2) while(abs(f(x)-opt_v)>1e-6){ x=x-alpha*gr(x) …

3
จะทำอย่างไรกับสหสัมพันธ์แบบสุ่มที่มีค่าเท่ากับ 1 หรือ -1
ไม่ใช่เรื่องแปลกที่เกิดขึ้นเมื่อต้องรับมือกับตัวแบบผสมที่ซับซ้อนสูงสุด (การประมาณค่าเอฟเฟกต์แบบสุ่มที่เป็นไปได้ทั้งหมดสำหรับข้อมูลและตัวแบบที่กำหนด) นั้นสมบูรณ์แบบ (+1 หรือ -1) หรือสัมพันธ์ที่สมบูรณ์แบบ สำหรับวัตถุประสงค์ของการสนทนาเรามาดูรูปแบบและสรุปแบบจำลองต่อไปนี้ Model: Y ~ X*Cond + (X*Cond|subj) # Y = logit variable # X = continuous variable # Condition = values A and B, dummy coded; the design is repeated # so all participants go through both Conditions # subject = random effects …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.