คำถามติดแท็ก regression

เทคนิคในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร "dependent" และตัวแปร "อิสระ" หนึ่งตัว

2
การตีความเอาต์พุต drop1 ใน R
ใน R drop1คำสั่งจะให้ผลลัพธ์ที่เรียบร้อย คำสั่งทั้งสองนี้ควรให้ผลลัพธ์บางอย่างแก่คุณ: example(step)#-> swiss drop1(lm1, test="F") ฉันมีลักษณะเช่นนี้: > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC F value Pr(F) <none> 2105.0 190.69 Agriculture 1 307.72 2412.8 195.10 5.9934 0.018727 * Examination 1 53.03 …

3
วิธีการตรวจสอบเมื่อแบบจำลองการถดถอยมีความเหมาะสมมากเกินไป?
เมื่อคุณเป็นคนหนึ่งในการทำงานตระหนักถึงสิ่งที่คุณกำลังทำอยู่คุณพัฒนาความรู้สึกเมื่อคุณมีแบบจำลองที่พอดี สิ่งหนึ่งที่คุณสามารถติดตามแนวโน้มหรือการเสื่อมสภาพได้ใน Adjusted R Square ของโมเดล คุณสามารถติดตามการเสื่อมสภาพที่คล้ายกันในค่า p ของสัมประสิทธิ์การถดถอยของตัวแปรหลัก แต่เมื่อคุณเพิ่งอ่านคนอื่นศึกษาและคุณไม่มีความเข้าใจในกระบวนการพัฒนาแบบจำลองภายในของพวกเขาเองคุณจะสามารถตรวจพบอย่างชัดเจนว่าแบบจำลองนั้นเหมาะสมหรือไม่อย่างไร

3
โมเดลรถเข็นสามารถสร้างความแข็งแกร่งได้หรือไม่?
เพื่อนร่วมงานคนหนึ่งในสำนักงานของฉันพูดกับฉันในวันนี้ว่า "แบบจำลองต้นไม้ไม่ดีเพราะพวกเขาถูกจับด้วยการสังเกตอย่างหนัก" การค้นหาที่นี่ส่งผลให้เธรดนี้รองรับการอ้างสิทธิ์โดยทั่วไป ข้อใดทำให้ฉันมีคำถาม - โมเดลรถเข็น CART ในสถานการณ์ใดจะมีประสิทธิภาพและจะแสดงได้อย่างไร?

4
LOESS ที่ช่วยให้ไม่ต่อเนื่อง
มีเทคนิคการสร้างแบบจำลองเช่นLOESSที่อนุญาตให้มีศูนย์ไม่ต่อเนื่องหนึ่งหรือมากกว่านั้นซึ่งเวลาที่ไม่ต่อเนื่องไม่เป็นที่รู้จัก apriori? หากเทคนิคมีอยู่จะมีการนำไปใช้ใน R หรือไม่?

1
ความแตกต่างระหว่างแบบจำลองที่มีหรือไม่มีการสกัดกั้นในการถดถอยแบบโลจิสติกส์
ฉันชอบที่จะเข้าใจความแตกต่างระหว่างแบบจำลองที่มีหรือไม่มีการสกัดกั้นในการถดถอยโลจิสติก มีความแตกต่างระหว่างพวกเขายกเว้นว่ามีการสกัดกั้นค่าสัมประสิทธิ์พิจารณาล็อก (อัตราส่วนอัตราต่อรอง) เทียบกับกลุ่มพื้นฐานและไม่มีการสกัดกั้นพวกเขาถือว่าเป็นบันทึก (อัตราต่อรอง)? จากสิ่งที่ฉันได้เห็นสัมประสิทธิ์เหมือนกันในทั้งสองกรณี แต่ความสำคัญไม่เหมือนกันเสมอไปและไม่เข้าใจว่าทำไม .. จึงเป็นเช่นนั้นนอกจากนี้ในกรณีใดจะถูกต้องที่จะใช้แบบจำลองที่ไม่มีการสกัดกั้น? นี่คือแบบจำลองของฉัน: glm(NeverReturn ~ factor(Network) * TotalPrice , family = binomial)และฉันไม่แน่ใจเกี่ยวกับการสกัดกั้นออกหรือไม่เพราะที่ "คำจริง" ราคารวมไม่เกิน 50 แต่อย่างใด แต่ความน่าจะเป็นที่ 1 จะไม่เป็น 0 ดังนั้นฉันจึงสับสน

3
วิธีการหาค่าสัมประสิทธิ์การถดถอย
ในการถดถอยสันฟังก์ชันวัตถุประสงค์ที่จะลดลงคือRSS+λ∑β2j.RSS+λ∑βj2.\text{RSS}+\lambda \sum\beta_j^2. สิ่งนี้สามารถเพิ่มประสิทธิภาพโดยใช้วิธีการเพิ่มทวีคูณ หรือมันคือความแตกต่างตรง?

3
ใน GLM ความเป็นไปได้ของบันทึกของโมเดลอิ่มตัวมักเป็นศูนย์หรือไม่?
ในฐานะที่เป็นส่วนหนึ่งของเอาท์พุทของตัวแบบเชิงเส้นแบบทั่วไปนั้นการเบี่ยงเบนแบบ null และส่วนที่เหลือจะถูกใช้ในการประเมินแบบจำลอง ฉันมักจะเห็นสูตรสำหรับปริมาณเหล่านี้แสดงในแง่ของโอกาสในการเข้าสู่ระบบของรูปแบบอิ่มตัวเช่น: /stats//a/113022/22199 , ถดถอยโลจิสติ: วิธีการที่จะได้รับรูปแบบการอิ่มตัว แบบจำลองที่อิ่มตัวตามที่ฉันเข้าใจเป็นแบบจำลองที่เหมาะสมกับการตอบสนองที่สังเกตได้อย่างสมบูรณ์แบบ ดังนั้นในสถานที่ส่วนใหญ่ที่ฉันเคยเห็นความเป็นไปได้ของแบบจำลองความอิ่มตัวจะได้รับเป็นศูนย์เสมอ ทว่าวิธีการกำหนดสูตรการเบี่ยงเบนแสดงให้เห็นว่าบางครั้งปริมาณนี้ไม่ใช่ศูนย์ (ราวกับว่ามันเป็นศูนย์เสมอทำไมต้องรวมมันด้วย) ในกรณีใดบ้างที่ไม่เป็นศูนย์ ถ้าไม่ใช่ศูนย์ไม่ใช่ทำไมรวมไว้ในสูตรสำหรับการเบี่ยงเบน

5
ฉันจะ detrend อนุกรมเวลาได้อย่างไร
ฉันจะ detrend อนุกรมเวลาได้อย่างไร มันโอเคที่จะเริ่มต้นความแตกต่างและทำการทดสอบ Dickey ฟุลเลอร์และถ้าเป็นเครื่องเขียนเราดีหรือไม่? ฉันยังพบทางออนไลน์ที่ฉันสามารถ detrend ชุดเวลาโดยทำเช่นนี้ใน Stata: reg lncredit time predict u_lncredit, residuals twoway line u_lncredit time dfuller u_lncredit, drift regress lags(0) วิธีที่ดีที่สุดในการทำลายลำดับเวลา


4
อะไรคือความหมายของรูปแบบที่ลดลง?
ในเศรษฐมิติสิ่งที่มีความหมายโดยรูปแบบลดลง? นอกจากนี้สิ่งที่ผู้คนกำลังมองหาเมื่อพวกเขาพูดว่า "ฉันต้องการที่จะเห็นประมาณการแบบฟอร์มที่ลดลง" สิ่งนี้เกิดขึ้นจากการทำงานและคำอธิบายของแต่ละบุคคลและการค้นหาของ Google นั้นเป็นเรื่องทางเทคนิคมากเกินไป หวังว่าใครบางคนที่สามารถยกตัวอย่างง่ายๆ

3
คำนวณความแปรปรวนที่อธิบายโดยตัวทำนายแต่ละตัวในการถดถอยหลายครั้งโดยใช้ R
ฉันใช้การถดถอยหลายครั้งซึ่งโมเดลโดยรวมมีความสำคัญและอธิบายความแปรปรวนประมาณ 13% อย่างไรก็ตามฉันต้องการค้นหาจำนวนความแปรปรวนที่อธิบายโดยตัวทำนายสำคัญแต่ละตัว ฉันจะทำสิ่งนี้โดยใช้ R ได้อย่างไร นี่คือตัวอย่างข้อมูลและรหัส: D = data.frame( dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, 1.00, 1.00, 0.75, 0.50 ), iv1 = c( 0.75, 1.00, 1.00, 0.75, 0.75, 1.00, 0.50, 0.50, 0.75, 0.25 ), iv2 = c( 0.882, 0.867, 0.900, 0.333, 0.875, 0.500, 0.882, 0.875, 0.778, …
14 r  regression  variance 

1
อัตราส่วนในการถดถอยหรือที่เรียกว่าคำถามเกี่ยวกับ Kronmal
เมื่อเร็ว ๆ นี้คำถามการสืบค้นแบบสุ่มทำให้เกิดความทรงจำเกี่ยวกับความเห็นนอกมือจากอาจารย์คนหนึ่งของฉันเมื่อสองสามปีก่อนเตือนเกี่ยวกับการใช้อัตราส่วนในแบบจำลองการถดถอย ดังนั้นฉันจึงเริ่มอ่านสิ่งนี้นำไปสู่ ​​Kronmal 1993 ในที่สุด ฉันต้องการตรวจสอบให้แน่ใจว่าฉันตีความคำแนะนำของเขาเกี่ยวกับวิธีการสร้างแบบจำลองเหล่านี้อย่างถูกต้อง สำหรับโมเดลที่มีอัตราส่วนซึ่งมีตัวหารเดียวกันทั้งในส่วนที่ขึ้นกับและอิสระ: Z- 1Y= Z- 11nβ0+ Z- 1XβX+ βZ+ Z- 1εZ-1Y=Z-11nβ0+Z-1XβX+βZ+Z-1ε Z^{-1}Y = Z^{-1}1_n\beta_0 + Z^{-1}X\beta_X + \beta_Z + Z^{-1}\epsilon ถอยหลังอัตราส่วนที่พึ่งพาในตัวแปรตัวหาร (ผกผัน) นอกเหนือจากอัตราส่วนอื่น ๆ น้ำหนักโดยตัวแปรตัวหาร (ผกผัน) สำหรับโมเดลที่มีตัวแปรตามเป็นอัตราส่วน: Y= β0+ βXX+ Z1nα0+ ZXαX+ Z- 1εY=β0+βXX+Z1nα0+ZXαX+Z-1ε Y = \beta_0 + \beta_XX + Z1_n\alpha_0 + ZX\alpha_X …

1
Poisson Regression มีข้อผิดพลาดหรือไม่?
ฉันแค่สงสัยว่าปัวซงถดถอยนั้นมีข้อผิดพลาดหรือไม่? การถดถอยของปัวซองนั้นมีผลแบบสุ่มและมีข้อผิดพลาดหรือไม่? ฉันสับสนเกี่ยวกับประเด็นนี้ ในการถดถอยโลจิสติกไม่มีคำผิดพลาดเพราะตัวแปรผลลัพธ์ของคุณเป็นไบนารี นั่นเป็นรุ่น glm เดียวที่ไม่มีเทอมหรือเปล่า?

2
คณิตศาสตร์ที่อยู่เบื้องหลังการจำแนกและต้นไม้การถดถอย
ใครช่วยอธิบายคณิตศาสตร์บางส่วนที่อยู่ในการจัดประเภทในรถเข็นได้บ้าง ฉันกำลังมองหาที่จะเข้าใจว่าสองขั้นตอนหลักเกิดขึ้นได้อย่างไร เช่นฉันฝึกตัวแยกประเภท CART บนชุดข้อมูลและใช้ชุดข้อมูลการทดสอบเพื่อทำเครื่องหมายประสิทธิภาพการทำนาย แต่: รากแรกของต้นไม้ถูกเลือกอย่างไร ทำไมแต่ละสาขาจึงเกิดขึ้น? ชุดข้อมูลของฉันเป็นระเบียน 400,000 รายการที่มี 15 คอลัมน์และ 23 คลาสที่ได้รับความถูกต้อง 100% จากเมทริกซ์ความสับสนฉันใช้การข้ามค่าช่วงเวลา 10 เท่าของชุดข้อมูล ฉันจะยิ่งใหญ่จริง ๆ ถ้าใครสามารถช่วยอธิบายขั้นตอนของการจัดประเภทรถเข็นได้

1
สมมติฐานของโมเดลเชิงเส้นทั่วไป
ฉันสร้างโมเดลเชิงเส้นแบบทั่วไปพร้อมตัวแปรตอบกลับเดียว (กระจายต่อเนื่อง / ปกติ) และตัวแปรอธิบาย 4 ตัว (3 ตัวซึ่งเป็นปัจจัยและตัวที่สี่คือจำนวนเต็ม) ฉันใช้การแจกแจงข้อผิดพลาดแบบเกาส์กับฟังก์ชั่นลิงค์ตัวตนแล้ว ขณะนี้ฉันกำลังตรวจสอบว่าแบบจำลองเป็นไปตามสมมติฐานของโมเดลเชิงเส้นทั่วไปซึ่ง ได้แก่ : ความเป็นอิสระของ Y ฟังก์ชั่นลิงค์ที่ถูกต้อง สเกลที่ถูกต้องของการวัดตัวแปรอธิบาย ไม่มีข้อสังเกตที่มีอิทธิพล คำถามของฉันคือฉันจะตรวจสอบว่าแบบจำลองตรงตามสมมติฐานเหล่านี้ได้อย่างไร ดูเหมือนว่าจุดเริ่มต้นที่ดีที่สุดคือการวางแผนการตอบสนองต่อตัวแปรอธิบายแต่ละตัว อย่างไรก็ตามตัวแปรอธิบาย 3 ตัวนั้นจัดอยู่ในหมวดหมู่ (ที่มีระดับ 1-4) ดังนั้นฉันควรมองหาอะไรในแปลง นอกจากนี้ฉันต้องตรวจสอบความหลากหลายและความสัมพันธ์ระหว่างตัวแปรอธิบายหรือไม่? ถ้าใช่ฉันจะทำสิ่งนี้กับตัวแปรอธิบายอย่างละเอียดได้อย่างไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.