คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

2
ทางเลือกในการแปลงตะแกรง / โมเสคสำหรับตารางฉุกเฉิน
ครั้งหนึ่งฉันเคยเจอพล็อตประเภทหนึ่งสำหรับข้อมูลเชิงหมวดหมู่ (เช่นตารางฉุกเฉิน) บนอินเทอร์เน็ตซึ่งฉันชอบจริง ๆ แต่ฉันไม่เคยพบมันอีกเลยและไม่รู้ด้วยซ้ำว่าเป็นชื่ออะไร มันเป็นเหมือนพล็อตตะแกรงโดยที่ความสูงของแถวและความกว้างของคอลัมน์นั้นถูกปรับสัดส่วนเมื่อเทียบกับความน่าจะเป็นที่ขอบ ดังนั้นแต่ละกล่องจะถูกปรับสัดส่วนให้สอดคล้องกับความถี่สัมพัทธ์ที่คาดหวังภายใต้ความเป็นอิสระ อย่างไรก็ตามมันแตกต่างจากพล็อตตะแกรงในที่นั้นแทนที่จะพล็อตการฟักข้ามในแต่ละกล่องมันพล็อตจุด (เช่นใน scatterplot) ที่ตำแหน่งสุ่มเลือกจากชุด bivariate สำหรับการสังเกตแต่ละครั้ง ด้วยวิธีนี้ความหนาแน่นของคะแนนจะแสดงให้เห็นว่าการนับที่สังเกตได้นั้นตรงกับจำนวนที่คาดหวังมากเพียงใด นั่นคือถ้าความหนาแน่นมีความคล้ายคลึงกันในทุกช่องโมเดลแบบ null นั้นสมเหตุสมผล ) อาจไม่น่าเป็นไปได้มากนักภายใต้โมเดลว่าง เนื่องจากมีการพล็อตจุดแทนการฟักไข่จึงมีความสอดคล้องและเข้าใจง่ายระหว่างองค์ประกอบการวางแผนและการนับที่สังเกตซึ่งไม่จำเป็นต้องเป็นจริงสำหรับแปลงตะแกรง (ดูด้านล่าง) ยิ่งไปกว่านั้นการวางตำแหน่งของคะแนนแบบสุ่มให้ความรู้สึก 'อินทรีย์' นอกจากนี้สีสามารถใช้เพื่อเน้นกล่อง / เซลล์ที่แตกต่างอย่างมากจากตัวแบบ null และพล็อตเมทริกซ์สามารถใช้เพื่อตรวจสอบความสัมพันธ์แบบคู่ระหว่างตัวแปรต่าง ๆ มากมายดังนั้นจึงสามารถรวมข้อดีของพล็อตที่คล้ายกัน ฉัน, Jผม,Ji,j ไม่มีใครรู้ว่าพล็อตนี้เรียกว่าอะไร? มีแพ็คเกจ / ฟังก์ชั่นที่จะทำสิ่งนี้ได้อย่างง่ายดายใน R หรือซอฟต์แวร์อื่น ๆ (เช่น Mondrian)? ฉันไม่สามารถหาอะไรเช่นนั้นในซีดี แน่นอนว่ามันยากที่จะเขียนโค้ดตั้งแต่เริ่มต้น แต่นั่นอาจเป็นความเจ็บปวด นี่เป็นตัวอย่างง่ายๆของพล็อตตะแกรงสังเกตว่ามันง่ายที่จะเห็นว่าจำนวนนับที่คาดไว้สำหรับหมวดหมู่ที่แตกต่างกันควรเล่นในรูปแบบ null แต่ยากที่จะกระทบยอดฟักข้ามกับตัวเลขจริงทำให้พล็อตที่ไม่ใช่ค่อนข้างง่ายต่อการอ่านและน่ารังเกียจ: B ~B A …

3
ตัวแปรที่ต่อเนื่องขึ้นอยู่กับตัวแปรอิสระลำดับ
ด้วยตัวแปรy ที่ขึ้นต่อเนื่องและตัวแปรอิสระรวมถึงตัวแปรลำดับX 1ฉันจะพอดีกับตัวแบบเชิงเส้นได้Rอย่างไร? มีเอกสารเกี่ยวกับรูปแบบประเภทนี้หรือไม่?

2
ตารางฉุกเฉิน: การทดสอบจะทำอย่างไรและเมื่อไหร่?
ฉันต้องการที่จะเห็นส่วนขยายของการอภิปรายของการอภิปรายทดสอบไคส์สแควร์และฟิชเชอร์ที่แน่นอนขึ้นโดยขยายขอบเขตออกไปเล็กน้อย มีการทดสอบมากมายสำหรับการโต้ตอบในตารางฉุกเฉินเพียงพอที่จะทำให้หัวของฉันหมุน ฉันหวังว่าจะได้รับคำอธิบายเกี่ยวกับการทดสอบที่ฉันควรใช้และเมื่อใดและแน่นอนว่าคำอธิบายว่าทำไมการทดสอบหนึ่งควรจะดีกว่าอีกการทดสอบหนึ่ง ปัญหาปัจจุบันของฉันคือกรณีคลาสสิกแต่คำตอบเกี่ยวกับมิติที่สูงกว่ายินดีต้อนรับเช่นเดียวกับเคล็ดลับสำหรับการดำเนินการแก้ปัญหาต่าง ๆ ใน R อย่างน้อยในกรณีที่ไม่ชัดเจนว่าจะดำเนินการอย่างไรn × mn×ม.n \times m ด้านล่างนี้เป็นรายการการทดสอบทั้งหมดที่ฉันรู้ ฉันหวังว่าด้วยการเปิดเผยข้อผิดพลาดของฉันพวกเขาสามารถแก้ไขได้ χ2χ2\chi^2 2 เครื่องแสตนด์บายเก่า มีสามตัวเลือกที่สำคัญที่นี่: การแก้ไขที่สร้างขึ้นใน R สำหรับตาราง 2x2: "ครึ่งหนึ่งถูกลบออกจากทั้งหมดความแตกต่าง" ฉันควรทำสิ่งนี้ตลอดเวลาหรือไม่?| O-E||O-E||O-E| การทดสอบ " "ไม่แน่ใจว่าจะทำอย่างไรใน Rยังไม่มีข้อความ- 1ยังไม่มีข้อความ-1N-1χ2χ2\chi^2 การจำลอง Monte Carlo สิ่งนี้ดีที่สุดเสมอหรือ ทำไม R ไม่ให้ df กับฉันเมื่อฉันทำสิ่งนี้? การทดสอบที่แน่นอนฟิชเชอร์ โดยทั่วไปแล้วเมื่อเซลล์ใดคาดว่าจะ <4 แต่เห็นได้ชัดว่ามีข้อโต้แย้งบางอย่างสำหรับคำแนะนำนี้ สมมติฐาน (มักเป็นเท็จ) ว่าระยะขอบได้รับการแก้ไขแล้วเป็นปัญหาที่ใหญ่ที่สุดในการทดสอบนี้หรือไม่? การทดสอบที่แน่นอนของ Barnard การทดสอบอื่นที่แน่นอนยกเว้นฉันไม่เคยได้ยินมาก่อน การถดถอยปัวซอง …

2
วิธีทำโมเดลเชิงเส้นทั่วไปที่มีตัวแปรตามหลายตัวใน R?
ฉันมีตัวแปรตามหกตัว (นับข้อมูล) และตัวแปรอิสระหลายตัวฉันเห็นว่าใน MMR สคริปต์จะเป็นดังนี้: my.model <- lm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn) แต่เนื่องจากข้อมูลของฉันมีการนับฉันต้องการใช้โมเดลเชิงเส้นแบบทั่วไปและฉันลองทำสิ่งนี้: my.model <- glm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn, family="poisson") และปรากฏข้อความข้อผิดพลาดนี้: Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …

4
ยืนยันการกระจายตัวของสารตกค้างในการถดถอยเชิงเส้น
สมมติว่าเราใช้การถดถอยเชิงเส้นอย่างง่ายบันทึกเศษเหลือ^ u iและวาดฮิสโตแกรมของการกระจายตัวของเศษซาก หากเราได้สิ่งที่ดูเหมือนการแจกแจงที่คุ้นเคยเราสามารถสันนิษฐานได้ว่าข้อผิดพลาดของเรามีการกระจายตัวนี้หรือไม่? สมมติว่าถ้าเราพบว่าเศษเหลือคล้ายการแจกแจงแบบปกติมันสมเหตุสมผลหรือไม่ที่จะถือว่าความเป็นบรรทัดฐานของคำผิดพลาดในประชากร? ฉันคิดว่ามันสมเหตุสมผล แต่จะเป็นธรรมได้อย่างไรy=β0+β1x+uY=β0+β1x+ยูy=\beta_0+\beta_1x+uui^ยูผม^\hat{u_i}

3
สัมประสิทธิ์ตามเวลาใน R - จะทำอย่างไร?
อัปเดต : ขออภัยสำหรับการอัปเดตอื่น แต่ฉันพบวิธีแก้ปัญหาที่เป็นไปได้ด้วยพหุนามเศษส่วนและแพ็คเกจเสี่ยงการแข่งขันที่ฉันต้องการความช่วยเหลือ ปัญหา ฉันไม่สามารถหาวิธีง่าย ๆ ในการวิเคราะห์ค่าสัมประสิทธิ์เวลาได้ใน R ฉันต้องการให้สามารถใช้สัมประสิทธิ์ตัวแปรของฉันและทำมันเป็นค่าสัมประสิทธิ์ขึ้นอยู่กับเวลา (ไม่ใช่ตัวแปร) แล้วพล็อตการเปลี่ยนแปลงกับเวลา: βม. Y_ v a r i a b l e= β0+ β1∗ t + β2∗ t2. . .βม.Y_โวลต์aRผมaขล.อี=β0+β1* * * *เสื้อ+β2* * * *เสื้อ2...\beta_{my\_variable}=\beta_0+\beta_1*t+\beta_2*t^2... การแก้ปัญหาที่เป็นไปได้ 1) การแยกชุดข้อมูล ฉันได้ดูตัวอย่างนี้ (Se ส่วนที่ 2 ของเซสชันแล็บ) แต่การสร้างชุดข้อมูลแยกต่างหากดูเหมือนซับซ้อนซับซ้อนคำนวณค่าใช้จ่ายและไม่ง่ายมาก ... 2) Reduced Rank models …

1
วิธีสร้างตารางสีด้วย Sweave และ xtable [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามดังนั้นจึงเป็นหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน2 ปีที่ผ่านมา ฉันใช้ Sweave และxtableเพื่อสร้างรายงาน ฉันต้องการเพิ่มสีลงบนโต๊ะ แต่ฉันไม่สามารถหาวิธีสร้างตารางสีด้วย xtable ได้ มีตัวเลือกอื่น ๆ อีกไหม?

2
การวิเคราะห์แบบเบส์แบบไม่มีพารามิเตอร์ใน R
ฉันกำลังมองหาบทช่วยสอนที่ดีเกี่ยวกับการจัดกลุ่มข้อมูลในการRใช้กระบวนการดีริชเลต์แบบลำดับชั้น (HDP) (หนึ่งในวิธีการแบบเบส์แบบ nonparametric ล่าสุดและเป็นที่นิยม) มีDPpackage(IMHO, ครอบคลุมมากที่สุดของทั้งหมดที่มีอยู่) ในRการวิเคราะห์แบบเบส์แบบไม่มีพารามิเตอร์ แต่ฉันไม่สามารถเข้าใจตัวอย่างที่มีให้ในR Newsหรือในคู่มืออ้างอิงแพ็คเกจได้ดีพอที่จะใช้รหัส HDP ความช่วยเหลือหรือตัวชี้ใด ๆ ที่ชื่นชม การใช้งาน C ++ ของ HDP สำหรับการสร้างแบบจำลองหัวข้อมีอยู่ที่นี่ (โปรดดูที่ด้านล่างสำหรับรหัส C ++)

6
R: คำนวณความสัมพันธ์โดยกลุ่ม
ล็อคแล้ว คำถามและคำตอบของคำถามนี้ถูกล็อคเนื่องจากคำถามอยู่นอกหัวข้อ แต่มีความสำคัญทางประวัติศาสตร์ ขณะนี้ไม่ยอมรับคำตอบหรือการโต้ตอบใหม่ ใน R ฉันมีกรอบข้อมูลประกอบไปด้วยฉลากระดับC (ปัจจัย) และสองวัดM1และM2 ฉันจะคำนวณความสัมพันธ์ระหว่างM1และM2ในแต่ละชั้นเรียนได้อย่างไร โดยหลักการแล้วฉันจะได้กรอบข้อมูลกลับมาหนึ่งแถวสำหรับแต่ละชั้นเรียนและสองคอลัมน์นั่นคือป้ายชื่อชั้นCและสหสัมพันธ์
17 r  correlation 

1
ANOVA ผสมเอฟเฟกต์แบบไม่สมดุลสำหรับการวัดซ้ำ
ฉันมีข้อมูลจากผู้ป่วยที่รักษาด้วยวิธีการรักษา 2 แบบในระหว่างการผ่าตัด ฉันต้องวิเคราะห์ผลของมันต่ออัตราการเต้นของหัวใจ การวัดอัตราการเต้นของหัวใจจะดำเนินการทุก 15 นาที เนื่องจากความยาวของการผ่าตัดอาจแตกต่างกันสำหรับผู้ป่วยแต่ละรายผู้ป่วยแต่ละรายสามารถวัดอัตราการเต้นของหัวใจได้ระหว่าง 7 และ 10 ดังนั้นควรใช้การออกแบบที่ไม่สมดุล ฉันทำการวิเคราะห์โดยใช้ R และใช้แพ็คเกจ ez เพื่อวัด ANOVA เอฟเฟกต์แบบผสมซ้ำหลายครั้ง แต่ฉันไม่ทราบวิธีการวิเคราะห์ข้อมูลที่ไม่สมดุล ใครช่วยได้บ้าง ข้อเสนอแนะเกี่ยวกับวิธีการวิเคราะห์ข้อมูลที่ได้รับการต้อนรับ อัปเดต: ตามที่แนะนำฉันทำการติดตั้งข้อมูลโดยใช้lmerฟังก์ชั่นและพบว่ารุ่นที่ดีที่สุดคือ: heart.rate~ time + treatment + (1|id) + (0+time|id) + (0+treatment|time) ด้วยผลลัพธ์ต่อไปนี้: Random effects: Groups Name Variance Std.Dev. Corr id time 0.00037139 0.019271 id (Intercept) 9.77814104 3.127002 …

1
ในฟอเรสต์แบบสุ่ม% IncMSE ที่ใหญ่กว่านั้นจะดีกว่าหรือแย่กว่านั้น?
เมื่อฉันได้สร้าง (ถดถอย) รุ่นป่าสุ่มใน R โทรrf$importanceให้ผมด้วยสองมาตรการสำหรับแต่ละตัวแปรทำนายและ%IncMSE IncNodePurityการตีความตัวแปรทำนายที่มี%IncMSEค่าน้อยกว่าสำคัญกว่าตัวแปรพยากรณ์ที่มี%IncMSEค่ามากกว่าหรือไม่ เกี่ยวกับเพื่อIncNodePurity?

2
พหุนามตัดกันสำหรับการถดถอย
ฉันไม่เข้าใจการใช้ความแตกต่างพหุนามในการถดถอยเชิงเส้น โดยเฉพาะอย่างยิ่งฉันหมายถึงการเข้ารหัสที่ใช้โดยRเพื่อแสดงตัวแปรช่วงเวลา (ตัวแปรลำดับที่มีระดับเว้นระยะเท่ากัน) อธิบายไว้ในหน้านี้ ในตัวอย่างของหน้านั้นถ้าฉันเข้าใจอย่างถูกต้อง R เหมาะกับโมเดลสำหรับตัวแปรช่วงเวลาคืนค่าสัมประสิทธิ์บางอย่างซึ่งให้น้ำหนักแนวโน้มเชิงเส้นการกำลังสองหรือลูกบาศก์ ดังนั้นรูปแบบการติดตั้งควรเป็น: write=52.7870+14.2587X−0.9680X2−0.1554X3,write=52.7870+14.2587X−0.9680X2−0.1554X3,{\rm write} = 52.7870 + 14.2587X - 0.9680X^2 - 0.1554X^3, โดยที่XXXควรรับค่า111 , 222 , 333หรือ444ตามระดับที่แตกต่างกันของตัวแปรช่วงเวลา ถูกต้องหรือไม่ และถ้าเป็นเช่นนั้นแล้วอะไรคือจุดประสงค์ของการตัดกันของพหุนาม

2
ฉันจะเรียกใช้การวิเคราะห์การถดถอยโลจิสติกแบบ Ordinal ใน R ด้วยค่าตัวเลข / หมวดหมู่ได้อย่างไร
ฐานข้อมูล : ฉันมีคนประมาณ 1,000 คนที่มีการประเมินผล: '1,' [ดี] '2,' [กลาง] หรือ '3' [ไม่ดี] - นี่คือค่าที่ฉันพยายามทำนายสำหรับคนในอนาคต . นอกจากนั้นฉันยังมีข้อมูลด้านประชากรศาสตร์: เพศ (หมวดหมู่: M / F) อายุ (ตัวเลข: 17-80) และเชื้อชาติ (หมวดหมู่: ดำ / ผิวขาว / ลาติน) ฉันส่วนใหญ่มีสี่คำถาม: ตอนแรกฉันพยายามเรียกใช้ชุดข้อมูลที่อธิบายไว้ข้างต้นเป็นการวิเคราะห์ถดถอยหลายครั้ง แต่เมื่อเร็ว ๆ นี้ฉันได้เรียนรู้ว่าเนื่องจากการพึ่งพาของฉันเป็นปัจจัยที่สั่งและไม่ใช่ตัวแปรต่อเนื่องฉันควรใช้การถดถอยแบบลอจิสติกอันดับสำหรับสิ่งนี้ ตอนแรกฉันใช้บางอย่างที่mod <- lm(assessment ~ age + gender + race, data = dataset)ใครสามารถชี้ให้ฉันไปในทิศทางที่ถูกต้อง? จากตรงนั้นสมมติว่าฉันได้ค่าสัมประสิทธิ์ที่ฉันรู้สึกสบายใจฉันเข้าใจวิธีการใส่ค่าตัวเลขเพียงอย่างเดียวใน x1, …

2
ฉันจะตีความพล็อตส่วนที่เหลือเทียบกับส่วนที่เหลือนี้ได้อย่างไร
ฉันไม่เข้าใจความแตกต่างอย่างแท้จริง ฉันต้องการทราบว่าโมเดลของฉันเหมาะสมหรือไม่ตามพล็อตนี้

2
เป็นไปได้อย่างไรที่ Poisson GLM ยอมรับหมายเลขที่ไม่ใช่จำนวนเต็ม?
ฉันตกตะลึงกับความจริงที่ว่า Poisson GLM ยอมรับตัวเลขที่ไม่ใช่จำนวนเต็ม! ดู: ข้อมูล (เนื้อหาของdata.txt): 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 สคริปต์ R: t <- read.table("data.txt") names(t) <- c('site', 'year', 'count', 'weight') tm <- glm(count ~ 0 + as.factor(site) + …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.