คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

3
เปรียบเทียบแบบจำลองที่ไม่ซ้อนกับ AIC
สมมติว่าเราต้องใช้ GLMM mod1 <- glmer(y ~ x + A + (1|g), data = dat) mod2 <- glmer(y ~ x + B + (1|g), data = dat) โมเดลเหล่านี้ไม่ซ้อนในความหมายปกติของ: a <- glmer(y ~ x + A + (1|g), data = dat) b <- glmer(y ~ x + A + B + (1|g), …

1
คำนวณและทำกราฟขอบเขตการตัดสินใจของ LDA
ฉันเห็นพล็อต LDA (การวิเคราะห์จำแนกเชิงเส้น) ที่มีขอบเขตการตัดสินใจจากองค์ประกอบของการเรียนรู้ทางสถิติ : ฉันเข้าใจว่ามีการฉายข้อมูลลงในพื้นที่ย่อยที่มีมิติน้อย อย่างไรก็ตามฉันต้องการทราบว่าเราจะได้รับขอบเขตการตัดสินใจในมิติเดิมอย่างไรเพื่อให้ฉันสามารถฉายขอบเขตการตัดสินใจลงในพื้นที่ย่อยที่มีมิติต่ำกว่า (ชอบเส้นสีดำในภาพด้านบน) มีสูตรที่ฉันสามารถใช้คำนวณขอบเขตการตัดสินใจในมิติเดิม (สูงกว่า) ได้หรือไม่ ถ้าใช่แล้วสูตรนี้ต้องการปัจจัยอะไร?

2
เป็นถ่วงน้ำหนัก
ฉันประเมินโมเดลเชิงเส้นที่ทนทานRด้วยน้ำหนัก MM โดยใช้rlm()แพคเกจ MASS `R`` ไม่ได้ให้ค่าสำหรับแบบจำลอง แต่ฉันต้องการให้มีค่าหากเป็นปริมาณที่มีความหมาย ฉันยังสนใจที่จะทราบว่ามีความหมายใด ๆ ในการมีค่าR 2ที่ชั่งน้ำหนักความแปรปรวนทั้งหมดและส่วนที่เหลือในลักษณะเดียวกับที่การสังเกตนั้นมีน้ำหนักในการถดถอยที่แข็งแกร่งหรือไม่ ความคิดทั่วไปของฉันคือถ้าสำหรับวัตถุประสงค์ของการถดถอยเรามีน้ำหนักที่ให้อิทธิพลน้อยกว่าเพราะพวกมันมีค่าผิดปกติในทางใดทางหนึ่งบางทีอาจจะเพื่อการคำนวณr 2เราควรให้ค่าเหล่านั้นด้วย ประมาณการเดียวกันมีอิทธิพลน้อยลงหรือไม่R2R2R^2R2R2R^2r2r2r^2 ฉันเขียนฟังก์ชันง่าย ๆ สองอย่างสำหรับและR 2ถ่วงน้ำหนักพวกมันอยู่ด้านล่าง ฉันยังรวมผลลัพธ์ของการเรียกใช้ฟังก์ชันเหล่านี้สำหรับแบบจำลองของฉันซึ่งเรียกว่า HI9 แก้ไข: ฉันพบหน้าเว็บของ Adelle Coster ของ UNSW ที่ให้สูตรสำหรับการรวมเวกเตอร์ตุ้มน้ำหนักในการคำนวณการคำนวณของทั้งสองและอย่างที่ฉันทำและขอให้เธออ้างอิงอย่างเป็นทางการเพิ่มเติม: http: //web.maths unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html (ยังคงต้องการความช่วยเหลือจาก Cross Validated เกี่ยวกับวิธีการตีความน้ำหนักr 2นี้)R2R2R^2R2R2R^2R2SSeSStr2r2r^2 #I used this function to calculate a basic r-squared from the robust linear model r2 …

1
วิธีการแสดงภาพฟังก์ชั่นความหนาแน่น 3 มิติ
อะไรคือวิธีที่ดีที่สุดในการแสดงภาพกราฟิกด้วยฟังก์ชั่นความหนาแน่น 3 มิติ ในขณะที่ฉันต้องการเห็นภาพ Z= fX, วาย( x , y)Z=ฉX,Y(x,Y)z=f_{X,Y}(x,y) ? ไม่จำเป็น แต่Rรหัสสำหรับสิ่งนี้จะดีมาก

1
รับค่า p สำหรับ“ multinom” ใน R (แพ็คเกจ nnet)
ฉันจะรับค่า p โดยใช้multinomฟังก์ชันของnnetแพ็คเกจได้Rอย่างไร ฉันมีชุดข้อมูลซึ่งประกอบด้วย“ คะแนนพยาธิวิทยา” (ขาด, อ่อน, รุนแรง) เป็นตัวแปรผลลัพธ์และสองผลหลัก: อายุ (สองปัจจัย: ยี่สิบ / สามสิบวัน) และกลุ่มการรักษา (สี่ปัจจัย: การติดเชื้อโดยไม่ต้อง ATB; ATB1; ที่ติดเชื้อ + ATB2; ที่ติดเชื้อ + ATB3) ก่อนอื่นฉันพยายามจัดรูปแบบการถดถอยตามลำดับซึ่งดูเหมือนจะเหมาะสมกว่าเนื่องจากลักษณะของตัวแปรตาม (ลำดับ) ของฉัน อย่างไรก็ตามข้อสันนิษฐานของอัตราต่อรองถูกละเมิดอย่างรุนแรง (กราฟิก) ซึ่งทำให้ฉันใช้โมเดล multinomial แทนโดยใช้nnetแพ็คเกจ ก่อนอื่นฉันเลือกระดับผลลัพธ์ที่ฉันต้องใช้เป็นหมวดหมู่พื้นฐาน: Data$Path <- relevel(Data$Path, ref = "Absent") จากนั้นฉันต้องตั้งค่าหมวดหมู่พื้นฐานสำหรับตัวแปรอิสระ: Data$Age <- relevel(Data$Age, ref = "Twenty") Data$Treat <- relevel(Data$Treat, …

2
ความสำคัญของตัวพยากรณ์เชิงหมวดหมู่ในการถดถอยโลจิสติกส์
ฉันมีปัญหาในการตีความค่า z สำหรับตัวแปรเด็ดขาดในการถดถอยโลจิสติก ในตัวอย่างด้านล่างฉันมีตัวแปรเด็ดขาดที่มี 3 คลาสและตามค่า z CLASS2 อาจมีความเกี่ยวข้องในขณะที่คนอื่นไม่ได้ แต่ตอนนี้สิ่งนี้หมายความว่าอย่างไร ฉันจะรวมคลาสอื่น ๆ เข้าด้วยกันได้หรือไม่ ตัวแปรทั้งหมดอาจไม่ใช่ตัวทำนายที่ดีใช่มั้ย นี่เป็นเพียงตัวอย่างและค่า z ที่แท้จริงที่นี่ไม่ได้มาจากปัญหาจริงฉันแค่มีปัญหาเกี่ยวกับการตีความของพวกเขา Estimate Std. Error z value Pr(>|z|) CLASS0 6.069e-02 1.564e-01 0.388 0.6979 CLASS1 1.734e-01 2.630e-01 0.659 0.5098 CLASS2 1.597e+00 6.354e-01 2.514 0.0119 *

1
วิธีที่ค่า 'NA' ถูกใช้ใน glm ใน R
ฉันมีตารางข้อมูล T1 ที่มีเกือบหนึ่งพันตัวแปร (V1) และประมาณ 200 ล้านจุดข้อมูล ข้อมูลเบาบางและรายการส่วนใหญ่เป็น NA แต่ละดาต้าพ้อยท์มี id และคู่ที่ไม่ซ้ำกันเพื่อแยกความแตกต่าง ฉันมีอีกตาราง T2 ซึ่งมีชุดตัวแปร (V2) แยกกัน ตารางนี้ยังมีคู่ id และวันที่ที่ระบุรายการใน T2 โดยไม่ซ้ำกัน เราสงสัยว่าข้อมูลใน T1 สามารถใช้ในการทำนายค่าของตัวแปรใน T2 เพื่อพิสูจน์สิ่งนี้ฉันคิดว่าจะใช้โมเดล 'glm' ใน R และตรวจสอบว่าเราสามารถหาตัวแปรใน T2 ที่ขึ้นอยู่กับตัวแปรใน T1 หรือไม่ สำหรับแต่ละตัวแปรใน T2 ฉันเริ่มดึงข้อมูลทั้งหมดใน T1 ที่มี id และคู่วันเดียวกันซึ่งทำให้จุดข้อมูลเล็กกว่า ~ 50K สำหรับตัวแปรทดสอบบางตัว ปัญหาที่ฉันเผชิญในขณะนี้ด้วยการประยุกต์ใช้ glm มีดังนี้ ในบางกรณีมันแสดงให้ฉันเห็นข้อผิดพลาด 'พอดีไม่พบ' …


3
การตีความ“ รูปแบบผสม” สามรูปแบบ
มีความแตกต่างที่สะดุดฉันกับโมเดลผสมและฉันสงสัยว่าฉันจะได้รับความชัดเจนในนั้น สมมติว่าคุณมีรูปแบบข้อมูลนับรวมกัน มีตัวแปรที่คุณรู้ว่าคุณต้องการเป็นเอฟเฟกต์คงที่ (A) และตัวแปรอีกตัวสำหรับเวลา (T) จัดกลุ่มโดยพูดว่าตัวแปร "ไซต์" ตามที่ฉันเข้าใจ glmer(counts ~ A + T, data=data, family="Poisson") เป็นโมเดลเอฟเฟกต์คงที่ glmer(counts ~ (A + T | Site), data=data, family="Poisson") เป็นโมเดลเอฟเฟกต์แบบสุ่ม คำถามของฉันคือเมื่อคุณมีสิ่งที่ชอบ: glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")T คืออะไร มันเป็นผลแบบสุ่มหรือไม่? ผลคงที่? การทำให้สำเร็จด้วยการใส่ T ในทั้งสองแห่งคืออะไร เมื่อสิ่งที่ควรเท่านั้นที่ปรากฏในส่วนผลกระทบแบบสุ่มของสูตรรูปแบบ?

5
ฉันจะศึกษา“ ความสัมพันธ์” ระหว่างตัวแปรต่อเนื่องและตัวแปรเด็ดขาดได้อย่างไร
การวัด "สหสัมพันธ์" ที่มีความหมายเพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรทั้งสองประเภทนี้คืออะไร? ใน R ทำอย่างไร?


8
การจัดกลุ่มข้อมูลชนิดผสมด้วย R
ล็อคแล้ว คำถามและคำตอบนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ฉันสงสัยว่าเป็นไปได้หรือไม่ที่จะดำเนินการภายใน R การจัดกลุ่มข้อมูลที่มีตัวแปรข้อมูลแบบผสม กล่าวอีกนัยหนึ่งฉันมีชุดข้อมูลที่ประกอบด้วยตัวแปรตัวเลขและหมวดหมู่ภายในและฉันกำลังค้นหาวิธีที่ดีที่สุดในการจัดกลุ่มพวกเขา ใน SPSS ฉันจะใช้คลัสเตอร์สองขั้นตอน ฉันสงสัยว่าใน R ฉันสามารถหาเทคนิคที่คล้ายกันได้หรือไม่ ฉันได้รับแจ้งเกี่ยวกับแพคเกจ poLCA แต่ฉันไม่แน่ใจ ...

1
การใช้ข้อผิดพลาดมาตรฐานของการกระจาย bootstrap
(เพิกเฉยต่อรหัส R หากจำเป็นเนื่องจากคำถามหลักของฉันคือภาษาที่ไม่ขึ้นต่อกัน) หากฉันต้องการดูความแปรปรวนของสถิติอย่างง่าย (เช่นค่าเฉลี่ย) ฉันรู้ว่าฉันสามารถทำได้ผ่านทางทฤษฎีเช่น: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) หรือด้วย bootstrap เช่น: library(boot) # Estimate standard error from bootstrap (x.bs = boot(x, function(x, inds) mean(x[inds]), 1000)) # which is simply the standard *deviation* of the bootstrap distribution... …

1
การวิเคราะห์การไกล่เกลี่ยหลายใน R
ฉันสงสัยว่าถ้าใครรู้วิธีเรียกใช้โมเดลการไกล่เกลี่ยหลาย ๆ แบบในอาร์ฉันรู้ว่าแพ็คเกจการไกล่เกลี่ยอนุญาตให้ใช้แบบจำลองการไกล่เกลี่ยหลายแบบได้ง่าย แต่ฉันต้องการเรียกใช้โมเดลหนึ่งที่ประเมินโมเดลการไกล่เกลี่ยหลายแบบพร้อมกัน ฉันสมมติว่าฉันสามารถทำได้ในกรอบ SEM (การวิเคราะห์เส้นทาง) แต่ก็สงสัยว่าใครใหม่ของแพคเกจที่คำนวณสถิติทั่วไปของการวิเคราะห์การไกล่เกลี่ยสำหรับผู้ไกล่เกลี่ยหลายคน (ผลทางอ้อมสัดส่วนของผลรวมผ่านการไกล่เกลี่ย ฯลฯ ) และสามารถใช้ประโยชน์จากความร่วมมือ ฉันรู้ว่านี่เป็นช็อตยาว แต่คิดว่าฉันควรถามก่อนลงทุนเวลาพัฒนาตั้งแต่เริ่มต้น อัปเดต: (11/11/2013) ตั้งแต่ถามคำถามนี้เมื่อสองสามปีที่แล้วฉันได้เรียนรู้การใช้ลาวาแพ็คเกจ R ที่ยอดเยี่ยมเพื่อทำหน้าที่เป็นสื่อกลางหลายอย่าง นี่คือตัวอย่างรหัส: model <- ' # outcome model outcomeVar ~ c*xVar + b1*medVar1 + b2*medVar2 # mediator models medVar1 ~ a1*xVar medVar2 ~ a2*xVar # indirect effects (IDE) medVar1IDE := a1*b1 medVar2IDE …

3
อะไรคือความแตกต่างระหว่าง lm () และ rlm ()
ฉันเพิ่งพบ "การติดตั้งอุปกรณ์ที่มีประสิทธิภาพเชิงเส้นรุ่น" rlm() ฟังก์ชั่นในMASSห้องสมุด ฉันต้องการทราบความแตกต่างระหว่างฟังก์ชันนี้กับฟังก์ชันถดถอยเชิงเส้นมาตรฐาน, lm(). ใครช่วยอธิบายสั้น ๆ ให้ฉันได้บ้าง
19 r  regression 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.