คำถามติดแท็ก linear

สำหรับหัวข้อทางสถิติที่เกี่ยวข้องกับสมมติฐานของความเป็นเชิงเส้นตัวอย่างเช่นการถดถอยเชิงเส้นหรือแบบจำลองเชิงเส้นผสมหรือสำหรับการอภิปรายเกี่ยวกับพีชคณิตเชิงเส้นที่ใช้กับสถิติ

1
การแปลงเชิงเส้นของตัวแปรสุ่มโดยเมทริกซ์สี่เหลี่ยมสูง
สมมติว่าเรามีความสุ่มเวกเตอร์ , ดึงออกมาจากการกระจายกับฟังก์ชั่นความหนาแน่นของความน่าจะเป็น{x}) ถ้าเราแปลงเชิงเส้นโดยอันดับเต็มเมทริกซ์เพื่อรับดังนั้นความหนาแน่นของจะถูกกำหนดโดยX⃗ ∈RnX→∈Rn\vec{X} \in \mathbb{R}^nfX⃗ (x⃗ )fX→(x→)f_\vec{X}(\vec{x})n×nn×nn \times nAAAY⃗ =AX⃗ Y→=AX→\vec{Y} = A\vec{X}Y⃗ Y→\vec{Y}fY⃗ (y⃗ )=1|detA|fX⃗ (A−1y⃗ ).fY→(y→)=1|detA|fX→(A−1y→). f_{\vec{Y}}(\vec{y}) = \frac{1}{\left|\det A\right|}f_{\vec{X}}(A^{-1}\vec{y}). ตอนนี้บอกว่าเราเปลี่ยนX⃗ X→\vec{X}แทนโดยm×nm×nm \times nเมทริกซ์BBBกับm>nm>nm > nให้Z⃗ =BX⃗ Z→=BX→\vec{Z} = B\vec{X}{X} เห็นได้ชัดว่าZ∈RmZ∈RmZ \in \mathbb{R}^mแต่มัน "ชีวิตในที่" nnnมิติสเปซG⊂RmG⊂RmG \subset \mathbb{R}^mเมตร อะไรคือความหนาแน่นของเงื่อนไขของZ⃗ Z→\vec{Z}ให้ที่เรารู้ว่ามันอยู่ในGGG ? สัญชาตญาณแรกของฉันคือการใช้หลอกผกผันของBBBBถ้าB=USVTB=USVTB = U S V^Tคือการสลายตัวมูลค่าเอกพจน์BBBแล้วB+=VS+UTB+=VS+UTB^+ = …

5
ควรใช้แบบผสมเอฟเฟกต์เมื่อใด?
ตัวแบบผสมผลกระทบเชิงเส้นเป็นส่วนขยายของตัวแบบการถดถอยเชิงเส้นสำหรับข้อมูลที่รวบรวมและสรุปในกลุ่ม ข้อได้เปรียบที่สำคัญคือสัมประสิทธิ์อาจแตกต่างกันไปตามตัวแปรของกลุ่มหนึ่งตัวหรือมากกว่า อย่างไรก็ตามฉันกำลังดิ้นรนกับเวลาที่จะใช้รูปแบบผสมแบบผสม? ฉันจะทำอย่างละเอียดคำถามของฉันโดยใช้ตัวอย่างของเล่นกับกรณีที่รุนแรง สมมติว่าเราต้องการสร้างแบบจำลองความสูงและน้ำหนักสำหรับสัตว์และเราใช้สปีชีส์เป็นตัวแปรในการจัดกลุ่ม หากกลุ่ม / สายพันธุ์ที่แตกต่างกันแตกต่างกันจริงๆ พูดสุนัขและช้าง ฉันคิดว่าไม่มีจุดใช้โมเดลเอฟเฟกต์แบบผสมเราควรสร้างแบบจำลองสำหรับแต่ละกลุ่ม หากกลุ่ม / สปีชีส์ต่างกันมีความคล้ายคลึงกันจริงๆ พูดว่าสุนัขตัวเมียกับหมาตัวผู้ ฉันคิดว่าเราอาจต้องการใช้เพศเป็นตัวแปรเด็ดขาดในโมเดล ดังนั้นฉันคิดว่าเราควรใช้โมเดลเอฟเฟกต์ผสมในกรณีกลาง? บอกเด็ก ๆ ว่ากลุ่มคือแมวสุนัขกระต่ายพวกมันเป็นสัตว์ขนาดใกล้เคียงกัน แต่ต่างกัน มีข้อโต้แย้งอย่างเป็นทางการใด ๆ ที่จะแนะนำเมื่อใช้โมเดลเอฟเฟกต์แบบผสมเช่นวิธีการวาดเส้น แบบจำลองอาคารสำหรับแต่ละกลุ่ม แบบผสมลักษณะพิเศษ ใช้กลุ่มเป็นตัวแปรเด็ดขาดในการถดถอย ความพยายามของฉัน: วิธีที่ 1 เป็น "รูปแบบที่ซับซ้อน" ที่สุด / มีระดับความเป็นอิสระน้อยลงและวิธีที่ 3 คือรูปแบบที่ง่ายที่สุด "/ ระดับที่อิสระมากขึ้น และโมเดลเอฟเฟกต์ผสมอยู่ตรงกลาง เราอาจพิจารณาจำนวนข้อมูลและข้อมูลที่ซับซ้อนที่เราต้องเลือกแบบจำลองที่เหมาะสมตาม Bais Variance Trade Off

1
การเพิ่มตัวทำนายการถดถอยเชิงเส้นจะลด R กำลังสอง
ชุดข้อมูลของฉัน (ยังไม่มีข้อความ≈ 10 , 000ยังไม่มีข้อความ≈10,000N \approx 10,000) มีตัวแปรตาม (DV), "baseline" อิสระห้าตัวแปร (P1, P2, P3, P4, P5) และหนึ่งตัวแปรอิสระที่น่าสนใจ (Q) ฉันใช้การถดถอยเชิงเส้น OLS สำหรับรุ่นสองรุ่นต่อไปนี้: DV ~ 1 + P1 + P2 + P3 + P4 + P5 -> R-squared = 0.125 DV ~ 1 + P1 + P2 + P3 + P4 + …

4
ฉันจะตีความกราฟความอยู่รอดของโมเดลอันตราย Cox ได้อย่างไร
คุณจะตีความเส้นโค้งการอยู่รอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ได้อย่างไร ในตัวอย่างของเล่นนี้สมมติว่าเรามีโมเดลอันตรายตามสัดส่วนในageตัวแปรในkidneyข้อมูลและสร้างเส้นโค้งการอยู่รอด library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() ตัวอย่างเช่น ณ เวลาคำสั่งใดเป็นจริง หรือทั้งสองอย่างผิดปกติ?200200200 คำแถลงที่ 1: เราจะเหลือวิชา 20% (เช่นถ้าเรามีคนโดยวันที่เราควรเหลืออีกประมาณ ) 100010001000200200200200200200 งบ 2: สำหรับคนที่ได้รับหนึ่งเขา / เธอมีมีโอกาสที่จะอยู่รอดได้ในวันที่20020%20%20\%200200200 ความพยายามของฉัน: ฉันไม่คิดว่าทั้งสองงบจะเหมือนกัน (แก้ไขฉันถ้าฉันผิด) เนื่องจากเราไม่ได้มีการสันนิษฐาน iid (เวลารอดสำหรับทุกคนไม่ได้มาจากการกระจายอย่างอิสระ) มันคล้ายกับการถดถอยโลจิสติกในคำถามของฉันที่นี่อัตราความเป็นอันตรายของแต่ละคนขึ้นอยู่กับสำหรับบุคคลนั้นβTxβTx\beta^Tx

2
การรวมกันเชิงเส้นของสองแบบที่ไม่ใช่บรรทัดฐานแบบสุ่มที่ยังคงเป็นสมาชิกของตระกูลเดียวกัน
เป็นที่ทราบกันดีว่าการรวมกันเชิงเส้นของตัวแปรปกติแบบสุ่ม 2 ตัวนั้นก็เป็นตัวแปรแบบสุ่มด้วยเช่นกัน มีตระกูลการแจกจ่ายที่ไม่ธรรมดาทั่วไป (เช่น Weibull) ที่ใช้คุณสมบัตินี้ด้วยหรือไม่ ดูเหมือนจะมีตัวอย่างมากมาย ตัวอย่างเช่นการรวมกันเชิงเส้นของเครื่องแบบมักไม่เหมือนกัน โดยเฉพาะมีตระกูลการกระจายที่ไม่ปกติซึ่งทั้งสองอย่างต่อไปนี้เป็นจริง: การรวมกันเชิงเส้นของตัวแปรสุ่มสองตัวจากตระกูลนั้นเทียบเท่ากับการกระจายตัวบางอย่างในตระกูลนั้น พารามิเตอร์ผลลัพธ์สามารถระบุได้ว่าเป็นฟังก์ชันของพารามิเตอร์ดั้งเดิมและค่าคงที่ในชุดค่าผสมเชิงเส้น ฉันสนใจชุดค่าผสมเชิงเส้นนี้เป็นพิเศษ: Y=X1⋅ w +X2⋅( 1 -W2)-------√Y=X1⋅W+X2⋅(1-W2)Y = X_1 \cdot w + X_2 \cdot \sqrt{(1-w^2)} ที่ไหน X1X1X_1 และ X2X2X_2 ถูกสุ่มตัวอย่างจากบางตระกูลที่ไม่ปกติโดยมีพารามิเตอร์ θ1θ1\theta_1 และ θ2θ2\theta_2และ YYY มาจากตระกูลเดียวกันที่ไม่ปกติพร้อมพารามิเตอร์ θY= f(θ1,θ2, w )θY=ฉ(θ1,θ2,W)\theta_Y = f(\theta_1, \theta_2, w). ฉันกำลังอธิบายตระกูลการแจกจ่ายด้วยพารามิเตอร์ 1 ตัวเพื่อความง่าย แต่ฉันเปิดให้ตระกูลการแจกจ่ายที่มีพารามิเตอร์หลายตัว นอกจากนี้ฉันกำลังมองหาตัวอย่างที่มีพื้นที่พารามิเตอร์มากมาย θ1θ1\theta_1 …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.