คำถามติดแท็ก covariance-matrix

เมทริกซ์ของ covariances ระหว่างคู่ทั้งหมดของตัวแปรสุ่ม มันเรียกว่าเมทริกซ์ความแปรปรวนร่วมหรือความแปรปรวนร่วมเพียงแค่เมทริกซ์ความแปรปรวนร่วม k×kk

3
เมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมใน lmer
ฉันรู้ว่าข้อดีอย่างหนึ่งของแบบผสมคือพวกมันอนุญาตให้ระบุเมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมสำหรับข้อมูล (สมมาตรผสม, อัตชีวประวัติ, ไม่มีโครงสร้าง, ฯลฯ ) อย่างไรก็ตามlmerฟังก์ชันใน R ไม่อนุญาตสเปคง่ายของเมทริกซ์นี้ ไม่มีใครรู้ว่าโครงสร้างที่lmerใช้โดยค่าเริ่มต้นและทำไมไม่มีวิธีการระบุได้อย่างง่ายดาย?

3
การวิเคราะห์องค์ประกอบหลัก“ ย้อนหลัง”: อธิบายความแปรปรวนของข้อมูลโดยชุดค่าผสมเชิงเส้นที่กำหนดของตัวแปรอย่างไร
ผมได้ดำเนินการวิเคราะห์องค์ประกอบหลักหกตัวแปร, B , C , D , EและF ถ้าฉันเข้าใจอย่างถูกต้อง PC1 ที่ไม่ได้ทำการบอกจะบอกสิ่งที่การรวมกันเชิงเส้นของตัวแปรเหล่านี้อธิบาย / อธิบายความแปรปรวนมากที่สุดในข้อมูลและ PC2 บอกฉันว่าการรวมกันเชิงเส้นของตัวแปรเหล่านี้จะอธิบายความแปรปรวนมากที่สุดต่อไปของข้อมูลAABBCCDDEEFF ฉันแค่อยากรู้อยากเห็น - มีวิธีการทำ "ย้อนกลับ" นี้หรือไม่? สมมติว่าฉันเลือกชุดค่าผสมเชิงเส้นของตัวแปรเหล่านี้เช่นA + 2 B + 5 CA+2B+5CA+2B+5Cฉันจะคำนวณความแปรปรวนของข้อมูลที่อธิบายได้หรือไม่

1
PCA ที่แข็งแกร่งเทียบกับระยะทาง Mahalanobis ที่แข็งแกร่งสำหรับการตรวจจับค่าผิดปกติ
PCA แข็งแกร่ง (ตามที่พัฒนาโดยCandes et al, 2009หรือดีกว่ายังNetrepalli et al, 2014 ) เป็นวิธีที่นิยมใช้สำหรับการตรวจสอบค่าผิดปกติหลายตัวแปรแต่ Mahalanobis ระยะนอกจากนี้ยังสามารถนำมาใช้สำหรับการตรวจสอบขอบเขตที่กำหนดแข็งแกร่งประมาณการ regularized ของเมทริกซ์ความแปรปรวนร่วม ฉันอยากรู้เกี่ยวกับข้อดี (dis) ของการใช้วิธีหนึ่งกับอีกวิธีหนึ่ง สัญชาตญาณของฉันบอกฉันว่าความแตกต่างที่ยิ่งใหญ่ที่สุดระหว่างสองคือเมื่อข้อมูลชุด "เล็ก" (ในความหมายทางสถิติ), PCA ที่แข็งแกร่งจะให้ความแปรปรวนร่วมอันดับที่ต่ำกว่าในขณะที่การประมาณค่าความแปรปรวนร่วมที่แข็งแกร่งจะแทน อันดับความแปรปรวนเนื่องจากการทำให้เป็นปกติ Ledoit-Wolf สิ่งนี้จะส่งผลกระทบต่อการตรวจหาค่าผิดปกติอย่างไร

2
เป็นตำแหน่งของความแปรปรวนเมทริกซ์ที่มากที่สุดทำไม
ตามที่ระบุในคำถามนี้อันดับสูงสุดของเมทริกซ์ความแปรปรวนร่วมคือn−1n−1n-1โดยที่nnnคือขนาดตัวอย่างและดังนั้นหากมิติของเมทริกซ์ความแปรปรวนร่วมเท่ากับขนาดตัวอย่างมันจะเป็นเอกพจน์ ผมไม่เข้าใจว่าทำไมเราลบ111จากการจัดอันดับสูงสุดnnnความแปรปรวนร่วมเมทริกซ์

5
การวัด“ ความแปรปรวน” จากเมทริกซ์ความแปรปรวนร่วม?
หากข้อมูลเป็น 1d ความแปรปรวนจะแสดงขอบเขตที่จุดข้อมูลแตกต่างกัน หากข้อมูลเป็นหลายมิติเราจะได้เมทริกซ์ความแปรปรวนร่วม มีการวัดที่ให้จำนวนจุดข้อมูลแตกต่างกันโดยทั่วไปสำหรับข้อมูลหลายมิติหรือไม่? ฉันรู้สึกว่าอาจมีวิธีแก้ไขมากมายอยู่แล้ว แต่ฉันไม่แน่ใจว่าคำที่ถูกต้องที่จะใช้ในการค้นหาพวกเขา บางทีฉันอาจทำบางอย่างเช่นการเพิ่มค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วมได้, นั่นฟังดูสมเหตุสมผลหรือไม่?

2
ค่าเฉลี่ยของเมทริกซ์บวกแน่นอนมีค่าบวกแน่นอนเช่นกันหรือไม่?
ค่าเฉลี่ยของเมทริกซ์บวก - แน่นอนหลายค่าจำเป็นต้องมีค่าบวกกึ่งบวกหรือกึ่งบวกแน่นอน? ค่าเฉลี่ยคือค่าเฉลี่ยขององค์ประกอบที่ฉลาด

5
สร้างตัวเลขสุ่มที่กระจายแบบกระจายด้วยเมทริกซ์ความแปรปรวนร่วมแบบไม่แน่นอนที่แน่นอน
ฉันประเมินเมทริกซ์ความแปรปรวนร่วมตัวอย่างของตัวอย่างและรับเมทริกซ์สมมาตร ด้วย , ผมอยากจะสร้าง -variate rn กระจายปกติ แต่เพราะฉะนั้นเราจึงจำเป็นต้องมีการสลายตัว Cholesky ของCฉันควรทำอย่างไรถ้าไม่แน่นอนแน่นอนC n CCCCCCCnnnCCCCCC

1
ฉันจะตีความเมทริกซ์ความแปรปรวนร่วมได้อย่างไรจากเส้นโค้งที่พอดี
ฉันไม่ค่อยเก่งเรื่องสถิติดังนั้นขอโทษถ้านี่เป็นคำถามง่าย ๆ ฉันกำลังกระชับโค้งให้ข้อมูลบางส่วนและบางครั้งข้อมูลของฉันพอดีดีที่สุดชี้แจงเชิงลบในรูปแบบ* E ( - ข* x ) + Cและบางครั้งพอดีอยู่ใกล้กับ* E ( - ข* x 2 ) +ค อย่างไรก็ตามบางครั้งทั้งสองล้มเหลวและฉันต้องการที่จะถอยกลับไปเป็นแบบเชิงเส้น คำถามของฉันคือฉันจะทราบได้อย่างไรว่าแบบจำลองใดที่เหมาะกับข้อมูลชุดใดชุดหนึ่งที่ดีที่สุดจากเมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมที่ส่งคืนจากa ∗ e( - b ∗ x )+ ca* * * *อี(-ข* * * *x)+คa * e^{(-b * x)} + ca ∗ e( - b ∗ x2)+ ca* …

1
การวินิจฉัยลู่และลู่เข้าแบบเจลแมนและรูบินวิธีทั่วไปในการทำงานกับเวกเตอร์เป็นอย่างไร
การวินิจฉัย Gelman และ Rubin ใช้เพื่อตรวจสอบการลู่เข้าของเชน mcmc หลาย ๆ ตัวที่ทำงานแบบขนาน มันเปรียบเทียบความแปรปรวนภายในห่วงโซ่กับความแปรปรวนระหว่างห่วงโซ่การแสดงออกอยู่ด้านล่าง: ขั้นตอน (สำหรับแต่ละพารามิเตอร์): เรียกใช้ m ≥ 2 กลุ่มที่มีความยาว 2n จากค่าเริ่มต้นที่กระจายเกินพิกัด ยกเลิกการดึง n แรกในแต่ละเชน คำนวณความแปรปรวนภายในโซ่และระหว่างห่วงโซ่ คำนวณค่าความแปรปรวนโดยประมาณของพารามิเตอร์เป็นผลรวมถ่วงน้ำหนักของความแปรปรวนภายในห่วงโซ่และระหว่างห่วงโซ่ คำนวณปัจจัยการลดขนาดที่อาจเกิดขึ้น รายการสินค้า ฉันต้องการใช้สถิตินี้ แต่ตัวแปรที่ฉันต้องการใช้คือเวกเตอร์แบบสุ่ม มันสมเหตุสมผลไหมที่จะใช้ค่าเฉลี่ยของเมทริกซ์ความแปรปรวนร่วมในกรณีนี้?

1
การสร้างแบบจำลองผลกระทบเชิงเส้นผสมกับข้อมูลการศึกษาคู่
สมมติว่าฉันมีตัวแปรตอบสนองบางอย่างที่วัดจากพี่น้องคนที่ในครอบครัวที่นอกจากนี้ข้อมูลพฤติกรรมบางอย่างถูกรวบรวมในเวลาเดียวกันจากแต่ละเรื่อง ฉันพยายามวิเคราะห์สถานการณ์ด้วยโมเดลผสมผลกระทบเชิงเส้นต่อไปนี้: j ฉันx ฉันjyijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} โดยที่และเป็นจุดตัดและความชันคงที่ตามลำดับ คือความชันแบบสุ่มและคือส่วนที่เหลือα 1 δ 1 i ε i jα0α0\alpha_0α1α1\alpha_1δ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} สมมติฐานสำหรับผลกระทบแบบสุ่มและส่วนที่เหลือคือ (สมมติว่ามีพี่น้องเพียงสองคนเท่านั้นในแต่ละครอบครัว) ε ฉันjδ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} δ1 ฉัน( εฉัน1, εฉัน2)T~dยังไม่มีข้อความ( 0 , τ2)~dยังไม่มีข้อความ( ( 0 , 0 )T, R )δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T …

1
ความแปรปรวนร่วมประเภทต่าง ๆ สำหรับแบบจำลองส่วนผสมของเกาส์เซียน
ในขณะที่ลองแบบจำลองการผสมแบบเกาส์ที่นี่ฉันพบโควาเรียส 4 ประเภทนี้ 'full' (each component has its own general covariance matrix), 'tied' (all components share the same general covariance matrix), 'diag' (each component has its own diagonal covariance matrix), 'spherical' (each component has its own single variance). ฉันค้นหารายละเอียดเพิ่มเติมเกี่ยวกับแต่ละประเภทเหล่านี้มาก แต่พบคำอธิบายระดับสูงมาก (เช่นนี้ ) เท่านั้น ขอบคุณถ้ามีคนช่วยฉันเข้าใจสิ่งเหล่านี้หรืออย่างน้อยก็พาฉันไปที่ที่ฉันสามารถอ่านเกี่ยวกับสิ่งเหล่านี้ได้

3
จะทดสอบว่าเมทริกซ์ความแปรปรวนร่วมมีการเปลี่ยนแปลงในช่วงเวลาสองจุดได้อย่างไร?
งานของฉันคือการทดสอบว่ามีการเปลี่ยนแปลงในเมทริกซ์ความแปรปรวนร่วมของตัวแปร 6 ตัวหรือไม่ ค่าของตัวแปร 6 ตัวจะถูกวัดสองครั้งจากตัวแบบเดียวกัน (3 ปีระหว่างการวัด) ฉันจะทำสิ่งนั้นได้อย่างไร ฉันทำงานส่วนใหญ่ด้วย SAS

2
เมทริกซ์ความแปรปรวนร่วมแบบไม่ดีในการถดถอยของ GP สำหรับการปรับให้เหมาะสมแบบเบย์
ความเป็นมาและปัญหา ฉันใช้กระบวนการแบบเกาส์ (GP) สำหรับการถดถอยและการปรับให้เหมาะสมแบบเบย์ (BO) ในภายหลัง สำหรับการถดถอยฉันใช้แพ็คเกจgpmlสำหรับ MATLAB ที่มีการแก้ไขที่กำหนดเองหลายอย่าง แต่ปัญหาเป็นเรื่องทั่วไป มันเป็นความจริงที่รู้จักกันดีว่าเมื่ออินพุตการฝึกอบรมสองอันอยู่ใกล้กับพื้นที่อินพุตมากเกินไปเมทริกซ์ความแปรปรวนร่วมอาจไม่แน่นอนแน่นอน (มีคำถามหลายข้อเกี่ยวกับมันในเว็บไซต์นี้) เป็นผลให้การสลายตัว Cholesky ของเมทริกซ์ความแปรปรวนร่วมที่จำเป็นสำหรับการคำนวณ GP ต่างๆอาจล้มเหลวเนื่องจากข้อผิดพลาดเชิงตัวเลข เรื่องนี้เกิดขึ้นกับฉันในหลายกรณีเมื่อดำเนินการ BO พร้อมกับฟังก์ชั่นวัตถุประสงค์ที่ฉันใช้และฉันต้องการแก้ไข โซลูชันที่เสนอ AFAIK โซลูชันมาตรฐานเพื่อบรรเทาอาการป่วยไข้คือการเพิ่มสันเขาหรือนักเก็ตในแนวทแยงของเมทริกซ์ความแปรปรวนร่วม สำหรับการถดถอย GP จำนวนเสียงนี้จะเพิ่ม (หรือเพิ่มขึ้นหากมีอยู่) เสียงการสังเกต จนถึงตอนนี้ดีมาก ฉันปรับเปลี่ยนรหัสสำหรับการอนุมานที่แน่นอนของgpmlดังนั้นเมื่อใดก็ตามที่การสลายตัวของ Cholesky ล้มเหลวฉันพยายามที่จะแก้ไขเมทริกซ์ความแปรปรวนร่วมกับเมทริกซ์สมการเชิงบวกสมมาตร (SPD) ที่ใกล้เคียงที่สุดในบรรทัดฐาน Frobenius แรงบันดาลใจจากรหัส MATLABโดย John d'Errico เหตุผลคือเพื่อลดการแทรกแซงในเมทริกซ์เดิม วิธีแก้ปัญหานี้ทำงานได้ แต่ฉันสังเกตเห็นว่าประสิทธิภาพของ BO ลดลงอย่างมากสำหรับบางฟังก์ชั่น - อาจเป็นได้ทุกครั้งที่อัลกอริทึมจำเป็นต้องซูมเข้าในบางพื้นที่ (เช่นเนื่องจากใกล้เข้าใกล้ระดับต่ำสุด ปัญหามีขนาดเล็กไม่สม่ำเสมอ) พฤติกรรมนี้เหมาะสมเมื่อฉันเพิ่มสัญญาณรบกวนอย่างมีประสิทธิภาพเมื่อใดก็ตามที่จุดอินพุตสองจุดเข้าใกล้เกินไป แต่แน่นอนว่ามันไม่เหมาะ …

2
การตีความเมทริกซ์ความแปรปรวนร่วม -
สมมติว่าเรามีโมเดลเชิงเส้นModel1และvcov(Model1)ให้เมทริกซ์ต่อไปนี้: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 สำหรับตัวอย่างนี้เมทริกซ์นี้แสดงอะไร? สมมติฐานอะไรที่เราสามารถสร้างโมเดลของเราได้อย่างปลอดภัยและเป็นตัวแปรอิสระ

2
ผลรวมและผลผลิตของเมทริกซ์ความแปรปรวนร่วมสองตัวนั้นเป็นเมทริกซ์ความแปรปรวนร่วมหรือไม่?
สมมติว่าฉันมีความแปรปรวนเมทริกซ์และYตัวเลือกใดในตัวเลือกเหล่านี้คือเมทริกซ์ความแปรปรวนร่วมเช่นกันYXXXYYY X+YX+YX+Y X2X2X^2 XYXYXY ฉันมีปัญหานิดหน่อยที่จะเข้าใจว่าอะไรคือสิ่งที่จำเป็นสำหรับเมทริกซ์ความแปรปรวนร่วม ฉันคิดว่ามันมีความหมายว่าเช่นถ้าและที่ 1 จริงถือเราควรมีโดยที่และเป็นตัวแปรสุ่มอื่น ๆ อย่างไรก็ตามฉันไม่สามารถมองเห็นสาเหตุที่จะถือเป็นจริงสำหรับหนึ่งในสามตัวเลือก ข้อมูลเชิงลึกใด ๆ จะได้รับการพิจารณาY = cov ( Y 1 , Y 2 ) cov ( X 1 , X 2 ) + cov ( Y 1 , Y 2 ) = cov ( Z 1 , Z 2 ) Z 1 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.