คำถามติดแท็ก regression

เทคนิคในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร "dependent" และตัวแปร "อิสระ" หนึ่งตัว

1
ทำไมเราไม่สามารถใช้สำหรับการแปลงของตัวแปรตาม
ลองนึกภาพเรามีรูปแบบการถดถอยเชิงเส้นที่มีตัวแปรตามYเราได้พบกับสิ่งRตอนนี้เราทำถดถอยอีก แต่คราวนี้และเช่นเดียวกันสิ่ง(y)} ฉันถูกบอกว่าฉันไม่สามารถเปรียบเทียบทั้งเพื่อดูว่าแบบจำลองใดเหมาะสมกว่า ทำไมถึงเป็นอย่างนั้น? เหตุผลที่ทำให้ฉันคือเราจะเปรียบเทียบความแปรปรวนของปริมาณที่แตกต่างกัน (ตัวแปรตามต่างกัน) ฉันไม่แน่ใจว่านี่ควรเป็นเหตุผลเพียงพอสำหรับเรื่องนี้yyyR2yRy2R^2_ylog(y)log⁡(y)\log(y)R2log(y)Rlog⁡(y)2R^2_{\log(y)}R2R2R^2 นอกจากนี้ยังมีวิธีที่จะทำให้เป็นระเบียบนี้หรือไม่? ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม

1
ระบบการตั้งชื่อทางซ้ายและทางขวาในโมเดลการถดถอย
Y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} ภาษาที่ใช้อธิบายแบบจำลองการถดถอยเช่นการถดถอยเชิงเส้นอย่างง่ายที่ระบุไว้ข้างต้นมักจะแตกต่างกันไปและรูปแบบดังกล่าวมักจะมีการเปลี่ยนแปลงเล็กน้อยในความหมาย ตัวอย่างเช่นส่วนหนึ่งของแบบจำลองทางด้านซ้ายมือของสมการอาจถูกเรียก (ในหมู่คนอื่นที่ฉันไม่รู้) ด้วยความหมายและ denotations ในวงเล็บ: ตัวแปรที่ขึ้นอยู่กับ (คำแนะนำที่การพึ่งพาสาเหตุ) ตัวแปรที่คาดการณ์ (หมายถึงตัวแบบการคาดการณ์ / ทำการคาดการณ์) ตัวแปรตอบสนอง (หมายถึงเวรกรรมหรืออย่างน้อยที่สุดลำดับเวลา) ตัวแปรผลลัพธ์ (บอกถึงสาเหตุ) การเปลี่ยนแปลงในระบบการตั้งชื่อก็เป็นจริงเช่นกันที่ด้านขวามือของสมการ (ข้อจำกัดความรับผิดชอบเดียวกับที่ฉันเป็นผู้เพิกเฉยเกี่ยวกับเงื่อนไขอื่น ๆ ): ตัวแปรอิสระ (หมายถึงลำดับความสำคัญเชิงสาเหตุคำแนะนำในการออกแบบการทดลอง) ตัวแปร Predictor (บอกเป็นนัยถึงการคาดการณ์หมายถึงว่าตัวแปรนั้นมีการประมาณค่าพารามิเตอร์ที่ไม่เป็นศูนย์ซึ่งเกี่ยวข้องกับมัน) ในหลักสูตรของการเสนอ vetting หรือการสื่อสารการวิจัยฉันมีโอกาสที่จะไม่เพียง แต่เรียกว่าการใช้หนึ่งคำหรืออื่น แต่ต่อมาจะเรียกในระยะที่ฉันเลือกที่จะแทนที่ด้วย ในขณะที่ผู้คนที่โทรเข้ามานั้นดูเหมือนว่าเป็นคนช่างพูด (NB: ฉันเป็นคนอวดรู้มืออาชีพดังนั้นฉันก็เห็นอกเห็นใจ) เพราะแน่นอนว่าพวกเราทุกคนเข้าใจในสิ่งที่กำลังสื่อสารกันอยู่ฉันก็ยังสงสัยว่า: มีคำศัพท์ที่ใช้กันทั่วไปสำหรับตัวแปรทางซ้ายและมือขวาในตัวแบบการถดถอยที่ไม่เชื่อเรื่องพระเจ้าที่เกี่ยวกับ (a) การใช้ภายนอกของแบบจำลอง (b) ความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรและ (c) แง่มุมของการศึกษา การออกแบบที่ใช้ในการผลิตตัวแปรตัวเอง? หมายเหตุ: …

1
วิธีการคำนวณจากตัวอย่าง R กำลังสอง?
ฉันรู้ว่าอาจมีการพูดถึงที่อื่น แต่ฉันไม่สามารถหาคำตอบที่ชัดเจนได้ ฉันกำลังพยายามใช้สูตรเพื่อคำนวณ -ตัวอย่างของการถดถอยเชิงเส้นโดยที่คือผลรวมของส่วนที่เหลือกำลังสองและคือผลรวมของกำลังสองทั้งหมด สำหรับชุดฝึกอบรมนั้นเป็นที่ชัดเจนว่าR2=1−SSR/SSTR2=1−SSR/SSTR^2 = 1 - SSR/SSTR2R2R^2SSRSSRSSRSSTSSTSST SST=Σ(y−y¯train)2SST=Σ(y−y¯train)2 SST = \Sigma (y - \bar{y}_{train})^2 ชุดทดสอบมีอะไรบ้าง ฉันควรใช้สำหรับตัวอย่างหรือใช้แทนหรือไม่y¯trainy¯train\bar{y}_{train}yyyy¯testy¯test\bar{y}_{test} ฉันพบว่าถ้าฉันใช้ผลลัพธ์อาจเป็นลบได้ในบางครั้ง สิ่งนี้สอดคล้องกับคำอธิบายฟังก์ชั่นของ sklearn โดยที่พวกเขาใช้ (ซึ่งยังใช้โดยฟังก์ชันlinear_model ของพวกเขาสำหรับการทดสอบตัวอย่าง) พวกเขากล่าวว่า "แบบจำลองค่าคงที่ที่ทำนายค่า y ที่คาดไว้เสมอโดยไม่คำนึงถึงคุณลักษณะอินพุตจะได้รับคะแนน R ^ 2 เท่ากับ 0.0"y¯testy¯test\bar{y}_{test}R2R2R^2r2_score()y¯testy¯test\bar{y}_{test}score() อย่างไรก็ตามในที่อื่น ๆ ผู้คนใช้แบบนี้และที่นี่ (คำตอบที่สองโดย dmi3kno) ดังนั้นฉันสงสัยว่าสิ่งใดที่เหมาะสมกว่า ความคิดเห็นใด ๆ จะได้รับการชื่นชมอย่างมาก!y¯trainy¯train\bar{y}_{train}

1
เป็นค่าเศษซากที่นักเรียนได้รับ v / s ที่เหลือเป็นค่ามาตรฐานในรูปแบบ lm
"เศษเหลือของนักเรียน" และ "เศษซากมาตรฐาน" เหมือนกันในแบบจำลองการถดถอยหรือไม่ ฉันสร้างแบบจำลองการถดถอยเชิงเส้นใน R และต้องการพล็อตกราฟของค่าติดตั้ง Studentized v / s ที่ติดตั้งไว้ แต่ไม่พบวิธีอัตโนมัติในการทำเช่นนี้ใน R สมมติว่าฉันมีรูปแบบ library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) จากนั้นการใช้plot(lm.fit)ไม่ได้ให้พล็อตใด ๆ ของค่าเศษ Studentized เทียบกับค่าติดตั้ง แต่ยังให้ค่าพล็อตค่ามาตรฐานกับค่าที่ติดตั้ง ฉันใช้plot(lm.fit$fitted.values,studres(lm.fit)แล้วมันจะพล็อตกราฟที่ต้องการดังนั้นเพียงแค่ต้องการยืนยันว่าฉันกำลังไปทางที่ถูกต้องและส่วนที่เหลือเป็นนักเรียนและมาตรฐานไม่ใช่สิ่งเดียวกัน หากพวกเขาแตกต่างกันโปรดให้คำแนะนำในการคำนวณพวกเขาและคำจำกัดความของพวกเขา ฉันค้นหาผ่านเน็ตและพบว่ามันสับสนเล็กน้อย

3
วิธีการถดถอยสันที่ไม่เป็นลบ
วิธีการถดถอยสันที่ไม่เป็นลบ บาศแบบไม่เป็นค่าลบมีให้บริการscikit-learnแต่สำหรับสันเขาฉันไม่สามารถบังคับใช้แบบไม่ลบล้างของเบต้าและแน่นอนฉันได้รับค่าสัมประสิทธิ์เชิงลบ ไม่มีใครรู้ว่าทำไมถึงเป็นเช่นนี้? นอกจากนี้ฉันสามารถใช้สันในแง่ของกำลังสองน้อยที่สุดได้หรือไม่? ย้ายสิ่งนี้ไปยังคำถามอื่น: ฉันสามารถใช้การถดถอยแบบสันในแง่ของการถดถอยแบบ OLS ได้หรือไม่?

2
คำอธิบายที่ชัดเจนสำหรับ "เสถียรภาพเชิงตัวเลขของเมทริกซ์ผกผัน" ในการถดถอยของสันเขาและบทบาทในการลดความพอดี
ฉันเข้าใจว่าเราสามารถใช้การทำให้เป็นมาตรฐานในปัญหาการถดถอยกำลังสองน้อยที่สุดเช่น w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2 \right] และปัญหานี้มีวิธีแก้ปัญหาแบบปิดเป็น: w^=(XTX+λI)−1XTy.w^=(XTX+λI)−1XTy.\hat{\boldsymbol{w}} = (\boldsymbol{X}^T\boldsymbol{X}+\lambda\boldsymbol{I})^{-1}\boldsymbol{X}^T\boldsymbol{y}. เราเห็นว่าในสมการที่ 2 การทำให้เป็นมาตรฐานนั้นเป็นการเพิ่มλλ\lambdaไปยังแนวทแยงของXTXXTX\boldsymbol{X}^T\boldsymbol{X}ซึ่งทำเพื่อปรับปรุงเสถียรภาพเชิงตัวเลขของการผกผันเมทริกซ์ ความเข้าใจ 'หยาบ' ปัจจุบันของฉันเกี่ยวกับเสถียรภาพเชิงตัวเลขคือถ้าฟังก์ชั่นมากขึ้น 'เสถียรภาพเชิงตัวเลข' ดังนั้นเอาต์พุตของมันจะได้รับผลกระทบน้อยลงอย่างมากจากเสียงรบกวนในอินพุต ฉันมีปัญหาเกี่ยวกับแนวคิดของความเสถียรเชิงตัวเลขที่ได้รับการปรับปรุงให้ดีขึ้นเพื่อภาพรวมที่ใหญ่ขึ้นว่าจะหลีกเลี่ยง / ลดปัญหาการ overfitting อย่างไร ฉันลองดูที่Wikipediaและเว็บไซต์มหาวิทยาลัยอื่น ๆ ไม่กี่แห่ง แต่พวกเขาก็ไม่ได้อธิบายอย่างลึกซึ้งว่าทำไมถึงเป็นเช่นนั้น

3
ใช้การถดถอยกับโครงการนอกช่วงข้อมูลตกลงหรือไม่ ไม่เคยตกลง บางครั้งก็โอเค?
คุณคิดอย่างไรเกี่ยวกับการใช้การถดถอยกับโครงการนอกช่วงข้อมูล หากเราแน่ใจว่ามันเป็นไปตามรูปแบบเชิงเส้นหรือพลังงานรูปแบบนั้นจะไม่เป็นประโยชน์นอกเหนือจากช่วงข้อมูลหรือไม่ เช่นฉันมีปริมาณการขับเคลื่อนด้วยราคา เราควรจะสามารถคาดการณ์ราคานอกช่วงข้อมูลที่ฉันเชื่อ ความคิดของคุณ? VOL PRICE 3044 4.97 2549 4.97 3131 4.98 2708 4.98 2860 4.98 2907 4.98 3107 4.98 3194 4.98 2753 4.98 3228 4.98 3019 4.98 3077 4.99 2597 4.99 2706 4.99 3000 4.99 3022 4.99 3084 4.99 3973 4.99 3675 4.99 3065 4.99 3407 4.99 2359 …

2
แนวโน้มอัตราการรอดชีวิตในกรณีศึกษาการควบคุม
ฉันส่งบทความที่ถูกปฏิเสธเนื่องจากวิธีการวิเคราะห์การเอาตัวรอดที่ไม่เหมาะสม ผู้ชี้ขาดไม่มีรายละเอียดหรือคำอธิบายอื่นใดนอกเหนือจาก: "การวิเคราะห์การเอาชีวิตรอดตามแนวโน้มเวลาต้องใช้วิธีการเซ็นเซอร์ที่ซับซ้อนยิ่งขึ้น" คำถาม: ความเสี่ยงส่วนเกินของการเสียชีวิตของผู้สูบบุหรี่ลดลงในทศวรรษที่ผ่านมาหรือไม่? ข้อมูล: ผู้สูบบุหรี่ 25,000 คนในเยอรมนี พวกเขาลงทะเบียนในการศึกษาในช่วงเวลาระหว่างปี 1995 และ 2014 แต่ละสูบบุหรี่ได้รับการจับคู่ (ในช่วงเวลาของการลงทะเบียน) กับเพศและอายุการจับคู่การควบคุมจากประชากรทั่วไป (ที่ไม่สูบบุหรี่) ฉันมีเวลาที่แน่นอนของการเสียชีวิตสำหรับทุกคนที่เสียชีวิตในช่วงระยะเวลาการศึกษาทั้งหมด คนที่ไม่ตายระหว่างการติดตามจะถูกเซ็นเซอร์ การศึกษานี้มีจุดประสงค์เพื่อตรวจสอบความเสี่ยงส่วนเกินของการเสียชีวิตของผู้สูบบุหรี่ในแต่ละปีตั้งแต่ปี 2538-2557 จุดมุ่งหมายคือการคำนวณ: อัตราอุบัติการณ์การเสียชีวิตของผู้สูบบุหรี่และผู้ไม่สูบบุหรี่ในแต่ละปีและตรวจสอบแนวโน้มเหล่านี้ ความเสี่ยงส่วนเกินของการเสียชีวิตในหมู่ผู้สูบบุหรี่ในแต่ละปี (หรือระยะเวลาไม่กี่ปีติดต่อกัน) ควรวิเคราะห์ข้อมูลอย่างไร จำได้ไหมว่าคนที่รวมอยู่ในปี 1998 อาจเสียชีวิตในปี 2558 แนวทางที่ถูกต้องในการใช้รูปแบบกระบวนการนับด้วยการเริ่มต้นและหยุดการอัปเดตสำหรับแต่ละปีหรือไม่ นี่คือวิธีการที่ผู้ตัดสินไม่ชอบ: อัตราอุบัติการณ์ถูกคำนวณโดยวิธีการปัวซงถดถอย เรารวมเวลาติดตามเป็นตัวชดเชยในโมเดลและรวมอายุเพศสถานะการสูบบุหรี่และช่วงเวลาตามปฏิทิน (รวมสองปีติดต่อกัน) เป็นตัวทำนายในโมเดล จากนั้นคำนวณอัตราต่อ 1,000 คนต่อปีโดยใช้ฟังก์ชั่นทำนาย () ของอาร์ระยะเวลาชดเชย (ติดตามผล) คือระยะเวลาการสังเกตทั้งหมดของบุคคล (วัน) จากการลงทะเบียน ใช้แบบจำลอง Cox เพื่อประเมินความเสี่ยงสัมพัทธ์สำหรับผู้สูบบุหรี่ในแต่ละช่วงเวลาตั้งแต่ต้นจนจบการศึกษา เพื่อความง่ายเราเปรียบเทียบอัตราส่วนอันตรายในช่วงแรกกับอัตราส่วนอันตรายในช่วงสุดท้าย ปัญหา: …

1
การตรวจสอบความถดถอยแบบไขว้ใน R
ฟังก์ชัน R cv.glm (ไลบรารี่: บูต) คำนวณข้อผิดพลาดในการทำนายการตรวจสอบความถูกต้องข้ามแบบ K-fold สำหรับโมเดลเชิงเส้นทั่วไปและส่งกลับเดลต้า มันเหมาะสมหรือไม่ที่จะใช้ฟังก์ชั่นนี้สำหรับการถดถอยแบบ lasso (ไลบรารี่: glmnet) และถ้าเป็นเช่นนั้นจะสามารถดำเนินการได้อย่างไร? ไลบรารี glmnet ใช้ cross-validation เพื่อให้ได้พารามิเตอร์การกลึงที่ดีที่สุด แต่ฉันไม่พบตัวอย่างใด ๆ ที่ cross-validates สมการ glmnet สุดท้าย

3
ความสัมพันธ์ระหว่างของการถดถอยอย่างง่ายและการถดถอยหลายครั้ง
คำถามพื้นฐานที่เกี่ยวข้องกับการถดถอย OLS ของR2R2R^2 เรียกใช้ OLS regression y ~ x1 เรามีบอกว่า 0.3R2R2R^2 รัน OLS regression y ~ x2 เรามีอีกอันบอกว่า 0.4R2R2R^2 ตอนนี้เราเรียกใช้การถดถอย y ~ x1 + x2 ค่า R ของการถดถอยนี้มีค่าเท่าไหร่ ฉันคิดว่ามันชัดเจนว่าสำหรับการถดถอยหลายครั้งไม่ควรน้อยกว่า 0.4 แต่เป็นไปได้หรือที่จะมากกว่า 0.7?R2R2R^2

2
ประเมินการกระจายการทำนายหลังในการถดถอยเชิงเส้นแบบเบย์
ฉันสับสนเกี่ยวกับวิธีการประเมินการกระจายการทำนายหลังสำหรับการถดถอยเชิงเส้นแบบเบย์ผ่านกรณีพื้นฐานที่อธิบายไว้ที่นี่ในหน้า 3 และคัดลอกด้านล่าง p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y)p(y~∣y)=∫p(y~∣β,σ2)p(β,σ2∣y) p(\tilde y \mid y) = \int p(\tilde y \mid \beta, \sigma^2) p(\beta, \sigma^2 \mid y) กรณีพื้นฐานคือตัวแบบการถดถอยเชิงเส้น: y=Xβ+ϵ,y∼N(Xβ,σ2)y=Xβ+ϵ,y∼N(Xβ,σ2) y = X \beta + \epsilon, \hspace{10mm} y \sim N(X \beta, \sigma^2) ถ้าเราใช้ทั้งเครื่องแบบก่อนหน้าโดยมีมาตราส่วน-Invก่อนหน้าบนหรือค่าผกผันแกมมาปกติก่อนหน้า (ดูที่นี่ ) การกระจายการทำนายหลังเป็นแบบวิเคราะห์และเป็นนักเรียน t ββ\betaχ2χ2\chi^2σ2σ2\sigma^2 แล้วรุ่นนี้ล่ะ? y=Xβ+ϵ,y∼N(Xβ,Σ)y=Xβ+ϵ,y∼N(Xβ,Σ) y = X \beta + \epsilon, \hspace{10mm} y \sim …

2
มีวิธีที่ฉลาด / ชาญฉลาดในการทำความเข้าใจตัวตนถดถอยเชิงเส้นนี้สำหรับหลาย ๆ
ในการถดถอยเชิงเส้นฉันได้พบผลลัพธ์ที่น่ายินดีว่าถ้าเราพอดีกับแบบจำลอง E[Y]=β1X1+β2X2+c,E[Y]=β1X1+β2X2+c,E[Y] = \beta_1 X_1 + \beta_2 X_2 + c, แล้วถ้าเราสร้างมาตรฐานและศูนย์ ,และข้อมูลYYYX1X1X_1X2X2X_2 R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R^2 = \mathrm{Cor}(Y,X_1) \beta_1 + \mathrm{Cor}(Y, X_2) \beta_2. สิ่งนี้ทำให้ฉันรู้สึกเหมือนเป็นตัวแปร 2 รุ่นของสำหรับการถดถอยซึ่งเป็นที่ชื่นชอบR2=Cor(Y,X)2R2=Cor(Y,X)2R^2 = \mathrm{Cor}(Y,X)^2y=mx+cy=mx+cy=mx+c แต่ข้อพิสูจน์เดียวที่ฉันรู้ไม่ได้อยู่ในเชิงสร้างสรรค์หรือลึกซึ้ง (ดูด้านล่าง) และยังมองมันรู้สึกว่าควรเข้าใจได้ง่าย ตัวอย่างความคิด: และพารามิเตอร์ให้เรา 'สัดส่วนของและβ1β1\beta_1β2β2\beta_2X1X1X_1X2X2X_2ในYYYและดังนั้นเราจึงได้สัดส่วนตามความสัมพันธ์ของพวกเขา ... ββ\betas มีความสัมพันธ์บางส่วน R2R2R^2 คือความสัมพันธ์หลายกำลังสอง ... ความสัมพันธ์คูณด้วยความสัมพันธ์บางส่วน ... ถ้าเราปรับมุมฉากก่อนจากนั้น ββ\betaจะเป็น Cov/VarCov/Var\mathrm{Cov}/\mathrm{Var}... ผลลัพธ์นี้มีความหมายทางเรขาคณิตหรือไม่? ดูเหมือนว่าไม่มีหัวข้อใดที่จะนำพาฉันไปได้ทุกที่ ทุกคนสามารถให้คำอธิบายที่ชัดเจนเกี่ยวกับวิธีการเข้าใจผลลัพธ์นี้ หลักฐานไม่น่าพอใจ R2=SSregSSTot=SSregN=⟨(β1X1+β2X2)2⟩=⟨β21X21⟩+⟨β22X22⟩+2⟨β1β2X1X2⟩R2=SSregSSTot=SSregN=⟨(β1X1+β2X2)2⟩=⟨β12X12⟩+⟨β22X22⟩+2⟨β1β2X1X2⟩\begin{equation} R^2 = \frac{SS_{reg}}{SS_{Tot}} …

3
ความสำคัญของหมวกเมทริกซ์คืออะไรในการถดถอยเชิงเส้น?
ความสำคัญของเมทริกซ์ของหมวกคืออะไรในการวิเคราะห์การถดถอยH=X(X′X)−1X′H=X(X′X)−1X′H=X(X^{\prime}X )^{-1}X^{\prime} มันเป็นเพียงการคำนวณง่ายขึ้น?

5
การใช้ deciles เพื่อหาความสัมพันธ์เป็นแนวทางที่ถูกต้องทางสถิติหรือไม่?
ฉันมีตัวอย่างของจุดข้อมูล 1,449 จุดที่ไม่สัมพันธ์กัน (r-squared 0.006) เมื่อวิเคราะห์ข้อมูลฉันค้นพบว่าการแบ่งค่าตัวแปรอิสระออกเป็นกลุ่มเชิงบวกและเชิงลบดูเหมือนว่าจะมีความแตกต่างอย่างมีนัยสำคัญในค่าเฉลี่ยของตัวแปรตามสำหรับแต่ละกลุ่ม การแบ่งคะแนนออกเป็น 10 ถังขยะ (deciles) โดยใช้ค่าตัวแปรอิสระดูเหมือนว่าจะมีความสัมพันธ์กันมากขึ้นระหว่างหมายเลข decile และค่าตัวแปรขึ้นอยู่กับค่าเฉลี่ย (r-squared 0.27) ฉันไม่รู้เกี่ยวกับสถิติมากนักดังนั้นนี่เป็นคำถามสองสามข้อ: นี่เป็นวิธีทางสถิติที่ถูกต้องหรือไม่? มีวิธีการหาจำนวนที่ดีที่สุดของถังขยะหรือไม่? คำที่เหมาะสมสำหรับแนวทางนี้คืออะไรฉันจึงสามารถใช้ Google ได้ มีแหล่งข้อมูลเบื้องต้นอะไรบ้างที่จะเรียนรู้เกี่ยวกับวิธีการนี้ มีวิธีอื่นใดอีกบ้างที่ฉันสามารถใช้เพื่อค้นหาความสัมพันธ์ในข้อมูลนี้ นี่คือข้อมูลช่วงชั้นสำหรับการอ้างอิง: https://gist.github.com/georgeu2000/81a907dc5e3b7952bc90 แก้ไข: นี่คือภาพของข้อมูล: โมเมนตัมของอุตสาหกรรมเป็นตัวแปรอิสระคุณภาพของจุดเข้าใช้งานขึ้นอยู่กับ

2
การถดถอยโลจิสติกและตัวแปรอิสระอันดับ
ฉันได้พบโพสต์นี้: ใช่. สัมประสิทธิ์สะท้อนการเปลี่ยนแปลงของอัตราต่อรองสำหรับการเพิ่มขึ้นของการเปลี่ยนแปลงในตัวทำนายลำดับ ข้อมูลจำเพาะรุ่น (ทั่วไปมาก) นี้จะถือว่าผู้ทำนายมีผลกระทบเชิงเส้นในส่วนที่เพิ่มขึ้น ในการทดสอบสมมติฐานคุณสามารถเปรียบเทียบแบบจำลองที่คุณใช้ตัวแปรลำดับเป็นตัวทำนายเดียวกับแบบที่คุณไม่เห็นการตอบสนองและปฏิบัติต่อพวกมันเป็นตัวทำนายหลาย ๆ ตัว หากโมเดลหลังไม่ส่งผลให้มีขนาดพอดีดีขึ้นอย่างมีนัยสำคัญจากนั้นดำเนินการเพิ่มขึ้นแต่ละครั้งเนื่องจากการมีเอฟเฟกต์แบบเชิงเส้นนั้นสมเหตุสมผล - @ dmk38 12 ธ.ค. 53 ที่ 5:21 คุณช่วยบอกฉันได้ไหมว่าจะหาสิ่งที่เผยแพร่ที่สนับสนุนการอ้างสิทธิ์นี้ได้ที่ไหน ฉันทำงานกับข้อมูลและฉันต้องการใช้ตัวแปรอิสระตามลำดับในการถดถอยโลจิสติก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.