คำถามติดแท็ก covariance

ความแปรปรวนร่วมเป็นปริมาณที่ใช้วัดความแข็งแรงและทิศทางของความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว ความแปรปรวนร่วมนั้นไม่มีการลดขนาดดังนั้นบ่อยครั้งที่ยากต่อการตีความ เมื่อปรับขนาดด้วย SD ของตัวแปรมันจะกลายเป็นค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน

10
คุณจะอธิบายความแปรปรวนร่วมกับคนที่เข้าใจเฉพาะค่าเฉลี่ยได้อย่างไร
... สมมติว่าฉันสามารถเพิ่มพูนความรู้เกี่ยวกับความแปรปรวนในรูปแบบที่เข้าใจง่าย (การทำความเข้าใจ "ความแปรปรวน" อย่างสังหรณ์ใจ ) หรือโดยการพูดว่า: มันเป็นระยะทางเฉลี่ยของค่าข้อมูลจาก 'เฉลี่ย' - และเนื่องจากความแปรปรวนอยู่ในตาราง หน่วยเราใช้สแควร์รูทเพื่อให้หน่วยเดียวกันและที่เรียกว่าส่วนเบี่ยงเบนมาตรฐาน สมมติว่าเรื่องนี้ชัดเจนมากและหวังว่าจะเข้าใจโดย 'ผู้รับ' ทีนี้ความแปรปรวนร่วมคืออะไรและจะอธิบายได้อย่างไรในภาษาอังกฤษง่าย ๆ โดยไม่ใช้คำศัพท์ / สูตรทางคณิตศาสตร์ใด ๆ (เช่นคำอธิบายที่เข้าใจง่าย;) โปรดทราบ: ฉันรู้สูตรและคณิตศาสตร์ที่อยู่เบื้องหลังแนวคิด ฉันต้องการที่จะ 'อธิบาย' สิ่งเดียวกันในรูปแบบที่เข้าใจง่ายโดยไม่รวมคณิตศาสตร์ เช่น 'ความแปรปรวนร่วม' หมายถึงอะไร

7
PCA เกี่ยวกับสหสัมพันธ์หรือความแปรปรวนร่วม?
อะไรคือความแตกต่างที่สำคัญระหว่างการวิเคราะห์องค์ประกอบหลัก (PCA) ในเมทริกซ์สหสัมพันธ์และเมทริกซ์ความแปรปรวนร่วม? พวกเขาให้ผลลัพธ์เดียวกันหรือไม่

6
คุณจะอธิบายความแตกต่างระหว่างสหสัมพันธ์และความแปรปรวนร่วมได้อย่างไร
การติดตามคำถามนี้คุณจะอธิบายความแปรปรวนร่วมของคนที่เข้าใจค่าเฉลี่ยได้อย่างไร ซึ่งกล่าวถึงปัญหาของการอธิบายความแปรปรวนร่วมกับบุคคลทั่วไปทำให้เกิดคำถามคล้ายกันขึ้นมาในใจ หนึ่งจะอธิบายให้ neophyte สถิติความแตกต่างระหว่างความแปรปรวนร่วมและสหสัมพันธ์อย่างไร ดูเหมือนว่าทั้งสองอ้างถึงการเปลี่ยนแปลงในตัวแปรหนึ่งที่เชื่อมโยงกลับไปยังตัวแปรอื่น คล้ายกับคำถามที่อ้างถึงการขาดสูตรจะดีกว่า

2
ความแปรปรวนร่วมในภาษาธรรมดาคืออะไร?
ความแปรปรวนในภาษาธรรมดาคืออะไรและวิธีการที่จะเชื่อมโยงกับเงื่อนไขการพึ่งพาอาศัยกัน , ความสัมพันธ์และโครงสร้างความแปรปรวนความแปรปรวนที่เกี่ยวกับการออกแบบซ้ำมาตรการ?

9
การปรับมาตรฐานและการปรับขนาดคุณสมบัติทำงานอย่างไรและทำไม
ฉันเห็นว่าอัลกอริทึมการเรียนรู้ของเครื่องจำนวนมากทำงานได้ดีขึ้นด้วยการยกเลิกค่าเฉลี่ยและการทำให้เท่ากันความแปรปรวนร่วม ตัวอย่างเช่นโครงข่ายประสาทมีแนวโน้มที่จะมาบรรจบกันเร็วขึ้นและโดยทั่วไป K-Means จะให้การจัดกลุ่มที่ดีขึ้นด้วยคุณสมบัติที่ประมวลผลล่วงหน้า ฉันไม่เห็นปรีชาที่อยู่เบื้องหลังขั้นตอนการประมวลผลล่วงหน้าเหล่านี้นำไปสู่การปรับปรุงประสิทธิภาพ มีคนอธิบายเรื่องนี้กับฉันได้ไหม

4
ความแปรปรวนและความเป็นอิสระ?
ฉันอ่านจากตำราเรียนว่าไม่รับประกันว่า X และ Y จะเป็นอิสระ แต่ถ้าพวกเขาเป็นอิสระความแปรปรวนร่วมของพวกเขาจะต้องเป็น 0 ฉันไม่สามารถนึกถึงตัวอย่างที่เหมาะสมได้ มีคนให้หรือไม่cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0

2
เมทริกซ์ความแปรปรวนร่วมเป็นบวกแน่นอนหรือไม่?
ฉันเดาว่าคำตอบควรเป็นใช่ แต่ฉันยังรู้สึกว่าบางสิ่งไม่ถูกต้อง ควรมีผลลัพธ์ทั่วไปในวรรณคดีมีใครช่วยฉันบ้าง

2
ค่าผกผันของเมทริกซ์ความแปรปรวนร่วมพูดถึงข้อมูลอย่างไร (สัญชาตญาณ)
ฉันอยากรู้เกี่ยวกับธรรมชาติของΣ−1Σ−1\Sigma^{-1} 1 ใครสามารถบอกอะไรบางอย่างที่ใช้งานง่ายเกี่ยวกับ "อะไรΣ−1Σ−1\Sigma^{-1}พูดเกี่ยวกับข้อมูล?" แก้ไข: ขอบคุณสำหรับการตอบกลับ หลังจากเรียนจบหลักสูตรที่ยอดเยี่ยมฉันต้องการเพิ่มคะแนน: มันเป็นตัวชี้วัดของข้อมูลเช่นxTΣ−1xxTΣ−1xx^T\Sigma^{-1}xคือปริมาณของข้อมูลตามทิศทางxxxx ความเป็นคู่:เนื่องจากΣΣ\Sigmaเป็นค่าบวกแน่นอนดังนั้นจึงเป็นΣ−1Σ−1\Sigma^{-1}ดังนั้นพวกมันจึงเป็นบรรทัดฐานของดอทโปรดัคยิ่งแม่นยำกว่าพวกเขาจึงเป็นสองมาตรฐานของกันและกันดังนั้นเราสามารถหาเฟนเนลคู่สำหรับปัญหากำลังสองน้อยที่สุด ปัญหา. เราสามารถเลือกอย่างใดอย่างหนึ่งของพวกเขาขึ้นอยู่กับเงื่อนไขของพวกเขา พื้นที่ Hilbert:คอลัมน์ (และแถว) ของΣ−1Σ−1\Sigma^{-1}และΣΣ\Sigmaขยายพื้นที่เดียวกัน ดังนั้นจึงไม่มีข้อได้เปรียบใด ๆ (อื่น ๆ ที่เมื่อหนึ่งในเมทริกซ์เหล่านี้ไม่มีเงื่อนไข) ระหว่างการแสดงด้วยΣ−1Σ−1\Sigma^{-1}หรือΣΣ\Sigma Σ−1Σ−1\Sigma^{-1}∥Σ−1∥→0‖Σ−1‖→0\|\Sigma^{-1}\|\rightarrow 0 สถิติผู้ใช้บ่อย:มันเกี่ยวข้องอย่างใกล้ชิดกับข้อมูลฟิชเชอร์โดยใช้Cramér – Rao ในความเป็นจริงเมทริกซ์ข้อมูลการตกปลา (ผลิตภัณฑ์ชั้นนอกของการไล่ระดับสีของความน่าจะเป็นกับตัวมันเอง) คือCramér – Rao ผูกไว้นั่นคือ (wrt บวกกึ่งกรวยแน่นอน ellipsoids) ดังนั้นเมื่อตัวประมาณความเป็นไปได้สูงสุดนั้นมีประสิทธิภาพนั่นคือข้อมูลสูงสุดที่มีอยู่ในข้อมูล ในคำที่ง่ายขึ้นสำหรับฟังก์ชั่นความเป็นไปได้บางอย่าง (โปรดทราบว่ารูปแบบการทำงานของความน่าจะเป็นล้วนขึ้นอยู่กับแบบจำลอง probablistic ซึ่งสร้างข้อมูลที่รู้จักกันว่าแบบจำลองกำเนิด) aka ความน่าจะเป็นที่มีประสิทธิภาพสูงสุด (ขออภัยที่ทำให้มากเกินไป)Σ−1⪯FΣ−1⪯F\Sigma^{-1}\preceq \mathcal{F}Σ−1=FΣ−1=F\Sigma^{-1}=\mathcal{F}

6
ทำไมตัวหารของตัวประมาณความแปรปรวนร่วมไม่ควรเป็น n-2 แทนที่จะเป็น n-1
ตัวหารของตัวประมาณค่าความแปรปรวน (ไม่เอนเอียง) คือเนื่องจากมีการสังเกตและมีการประมาณเพียงหนึ่งพารามิเตอร์เท่านั้นn−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} ในทำนองเดียวกันฉันสงสัยว่าทำไมตัวหารความแปรปรวนร่วมไม่ควรเป็นเมื่อมีการประมาณสองพารามิเตอร์?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

5
เมทริกซ์ความแปรปรวนร่วมตัวอย่างเป็นสมมาตรและแน่นอนแน่นอนเสมอใช่หรือไม่
เมื่อคำนวณเมทริกซ์ความแปรปรวนร่วมของตัวอย่างจะมีการรับประกันว่าจะได้เมทริกซ์สมมาตรและบวกแน่นอนหรือไม่ ปัจจุบันปัญหาของฉันมีตัวอย่างของเวกเตอร์สังเกต 4600 และ 24 มิติ

3
ทำไมการแปรผกผันของเมทริกซ์ความแปรปรวนร่วมจึงให้สหสัมพันธ์บางส่วนระหว่างตัวแปรสุ่ม
ผมได้ยินมาว่าบางส่วนความสัมพันธ์ระหว่างตัวแปรสุ่มสามารถพบได้โดย inverting เมทริกซ์ความแปรปรวนและการเซลล์ที่เหมาะสมจากที่เกิดเช่นความแม่นยำเมทริกซ์ (ความเป็นจริงนี้ถูกกล่าวถึงในhttp://en.wikipedia.org/wiki/Partial_correlationแต่ไม่มีหลักฐาน) . เหตุใดจึงเป็นเช่นนี้

4
วิธีการตรวจสอบคุณสมบัติของเมทริกซ์ความแปรปรวนร่วมเมื่อปรับโมเดลปกติหลายตัวแปรโดยใช้ความน่าจะเป็นสูงสุด
สมมติว่าฉันมีรูปแบบดังต่อไปนี้ yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i ที่ , เป็นเวกเตอร์ของตัวแปรอธิบายเป็นพารามิเตอร์ของฟังก์ชันเชิงเส้น - ไม่ใช่และโดยที่ตามธรรมชาติคือคูณเมทริกซ์yi∈RKyi∈RKy_i\in \mathbb{R}^Kxixix_iθθ\thetafffεi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma)ΣΣ\SigmaK×KK×KK\times K เป้าหมายคือตามปกติในการประมาณการθθ\thetaและΣΣΣ\Sigmaตัวเลือกที่ชัดเจนคือวิธีความน่าจะเป็นสูงสุด Log-โอกาสสำหรับรุ่นนี้ (สมมติว่าเรามีตัวอย่าง(yi,xi),i=1,...,n(yi,xi),i=1,...,n(y_i,x_i),i=1,...,n ) ลักษณะเช่น l(θ,Σ)=−n2log(2π)−n2logdetΣ−∑i=1n(yi−f(xi,θ))′Σ−1(y−f(xi,θ)))l(θ,Σ)=−n2log⁡(2π)−n2log⁡detΣ−∑i=1n(yi−f(xi,θ))′Σ−1(y−f(xi,θ)))l(\theta,\Sigma)=-\frac{n}{2}\log(2\pi)-\frac{n}{2} \log\det\Sigma-\sum_{i=1}^n(y_i-f(x_i,\theta))'\Sigma^{-1}(y-f(x_i,\theta))) ตอนนี้ดูเหมือนง่ายบันทึกความน่าจะเป็นมีการระบุใส่ข้อมูลและใช้อัลกอริทึมบางอย่างสำหรับการเพิ่มประสิทธิภาพที่ไม่ใช่เชิงเส้น ปัญหาคือวิธีการตรวจสอบให้แน่ใจว่าΣΣ\Sigmaเป็นผลบวกแน่นอน การใช้ตัวอย่างoptimใน R (หรืออัลกอริทึมการเพิ่มประสิทธิภาพที่ไม่ใช่เชิงเส้นอื่น ๆ ) จะไม่รับประกันฉันว่าΣΣ\Sigmaนั้นแน่นอนแน่นอน ดังนั้นคำถามคือจะมั่นใจได้อย่างไรว่าΣΣ\Sigmaยังคงเป็นไปในทางบวกแน่นอน? ฉันเห็นทางออกที่เป็นไปได้สองข้อ: ซ่อมแซมΣΣ\Sigmaเป็น RR′RR′RR'โดยที่RRRคือเมทริกซ์รูปสามเหลี่ยมบนหรือสมมาตร จากนั้นΣΣ\Sigmaจะเป็นค่าบวกแน่นอนเสมอและRRRสามารถควบคุมได้ ใช้ความน่าจะเป็นของโปรไฟล์ สืบทอดมาสูตรสำหรับθ^(Σ)θ^(Σ)\hat\theta(\Sigma)และΣ^(θ)Σ^(θ)\hat{\Sigma}(\theta)theta) เริ่มต้นด้วยθ0θ0\theta_0และวนΣ^j=Σ^(θ^j−1)Σ^j=Σ^(θ^j−1)\hat{\Sigma}_j=\hat\Sigma(\hat\theta_{j-1}) , θ^j=θ^(Σ^j−1)θ^j=θ^(Σ^j−1)\hat{\theta}_j=\hat\theta(\hat\Sigma_{j-1})จนกระทั่งการบรรจบกัน มีวิธีอื่นอีกหรือไม่และวิธีการเกี่ยวกับ 2 วิธีนี้พวกเขาจะทำงานได้มาตรฐานหรือไม่ ดูเหมือนว่าจะเป็นปัญหามาตรฐาน แต่การค้นหาอย่างรวดเร็วไม่ได้ให้คำแนะนำใด ๆ แก่ฉัน ฉันรู้ว่าการประมาณแบบเบย์จะเป็นไปได้เช่นกัน แต่ในตอนนี้ฉันไม่ต้องการมีส่วนร่วม

3
เมทริกซ์ความแปรปรวนแปรปรวนเชิงบวกที่ไม่แน่นอนบอกอะไรฉันได้บ้างเกี่ยวกับข้อมูลของฉัน
ฉันมีการสังเกตหลายตัวแปรหลายครั้งและต้องการประเมินความหนาแน่นของความน่าจะเป็นของตัวแปรทั้งหมด สันนิษฐานว่าเป็นข้อมูลที่กระจายตามปกติ ที่ตัวแปรจำนวนต่ำทุกอย่างทำงานได้ตามที่คาดหวัง แต่การย้ายไปหาจำนวนที่มากขึ้นส่งผลให้เมทริกซ์ความแปรปรวนร่วมแปรเปลี่ยนเป็นค่าบวกแน่นอน ฉันได้ลดปัญหาใน Matlab ไปที่: load raw_data.mat; % matrix number-of-values x number of variables Sigma = cov(data); [R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf. หากข้อผิดพลาด> 0 แสดงว่า Sigma ไม่ใช่ค่าบวกแน่นอน มีอะไรที่ฉันสามารถทำได้เพื่อประเมินข้อมูลการทดลองของฉันในระดับที่สูงขึ้นหรือไม่ มันบอกฉันว่ามีอะไรที่เป็นประโยชน์เกี่ยวกับข้อมูลของฉันหรือไม่? ฉันค่อนข้างเป็นผู้เริ่มต้นในพื้นที่นี้ดังนั้นจึงขออภัยถ้าฉันพลาดบางสิ่งที่ชัดเจน

2
เมื่อความแปรปรวนทางไกลมีความเหมาะสมน้อยกว่าความแปรปรวนเชิงเส้นตรงหรือไม่
ฉันได้รับการแนะนำเพียง (ราง) เพื่อBrownian / ระยะทางแปรปรวน ดูเหมือนว่ามีประโยชน์โดยเฉพาะอย่างยิ่งในสถานการณ์ที่ไม่ใช่เชิงเส้นเมื่อทำการทดสอบเพื่อการพึ่งพา แต่ดูเหมือนว่าจะไม่ได้ใช้บ่อยนักถึงแม้ว่าความแปรปรวนร่วม / ความสัมพันธ์มักใช้กับข้อมูลที่ไม่เป็นเชิงเส้น / ไม่เป็นระเบียบ ฉันคิดว่าอาจมีข้อเสียเปรียบในการแปรปรวนระยะทาง แล้วพวกมันคืออะไรและทำไมทุกคนไม่ใช้ความแปรปรวนแบบระยะทางเสมอ

2
ความแปรปรวนร่วมของเวกเตอร์สุ่มหลังจากการแปลงเชิงเส้น
ถ้าเป็นเวกเตอร์แบบสุ่มและเป็นเมทริกซ์คงที่ใครบางคนสามารถอธิบายได้ว่าทำไมZZ\mathbf {Z}AAAc o v [A Z ]=A c o v [ Z ] A⊤.คโอโวลต์[AZ]=Aคโอโวลต์[Z]A⊤.\mathrm{cov}[A \mathbf {Z}]= A \mathrm{cov}[\mathbf {Z}]A^\top.
20 covariance 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.