มันเป็นสิ่งที่แน่นอน เพื่อค้นหาเราจำเป็นต้องตรวจสอบสิ่งที่เรารู้เกี่ยวกับความสัมพันธ์ของตัวเอง
เมทริกซ์สหสัมพันธ์ของตัวแปรสุ่มเวกเตอร์X=(X1,X2,…,Xp)เป็นเมทริกซ์ความแปรปรวนความแปรปรวนหรือ "แปรปรวน" ของรุ่นมาตรฐานของXXนั่นคือแต่ละXiจะถูกแทนที่ด้วยเวอร์ชันที่ได้รับการปรับสภาพใหม่
ความแปรปรวนร่วมของXiและXjคือความคาดหวังของผลิตภัณฑ์ของรุ่นที่มีศูนย์กลาง นั่นคือการเขียนX′i=Xi−E[Xi]และX′j=Xj−E[Xj]เรามี
Cov(Xi,Xj)=E[X′iX′j].
ความแปรปรวนของซึ่งฉันจะเขียนVar ( X )ไม่ใช่ตัวเลขเดียว มันเป็นอาร์เรย์ของค่า Var ( X ) ฉันJ = Cov ( X ฉัน , X J )XVar(X)
Var(X)ij=Cov(Xi,Xj).
วิธีการคิดของความแปรปรวนสำหรับลักษณะทั่วไปมีจุดมุ่งหมายคือการคิดว่ามันเป็นเมตริกซ์ นั่นหมายความว่าเป็นชุดของปริมาณทั้งหมด , จัดทำดัชนีโดยiและjตั้งแต่1ถึงpซึ่งค่าจะเปลี่ยนไปในวิธีที่คาดการณ์ได้ง่ายโดยเฉพาะเมื่อXผ่านการแปลงเชิงเส้น โดยเฉพาะให้Y = ( Y 1 , Y 2 , … , Y q )เป็นตัวแปรสุ่มที่มีค่าเวกเตอร์อีกตัวที่กำหนดโดยvijij1pXY =( Y1, วาย2, … , YQ)
Yผม= ∑j = 1พีaJผมXJ.
ค่าคง (iและjเป็นindexes-jไม่ใช่พลัง) ก่อให้เกิดอาร์เรย์q×pA=(aaJผมผมJJQ× p,J=1,...,Pและฉัน=1,...,Q เส้นตรงของความคาดหมายA =( aJผม)j = 1 , … , pi = 1 , … , q
var( Y )ฉันเจ= ∑ akผมaล.Jvar( X )k ลิตร.
ในสัญกรณ์เมทริกซ์
Var(Y)=AVar(X)A′.
ส่วนประกอบทั้งหมดของจริงแล้วเป็นความแปรปรวนแบบไม่แปรเปลี่ยนเนื่องจากโพลาไรซ์เอกลักษณ์Var(X)
4Cov(Xi,Xj)=Var(Xi+Xj)−Var(Xi−Xj).
สิ่งนี้บอกเราว่าถ้าคุณเข้าใจความแปรปรวนของตัวแปรสุ่มที่ไม่แปรคุณจะเข้าใจความแปรปรวนร่วมของตัวแปรตัวแปรที่แปรผันกันแล้วพวกมันคือการรวมเชิงเส้นของความแปรปรวนเชิงเส้น
การแสดงออกในคำถามจะคล้ายคลึงอย่างสมบูรณ์แบบ: ตัวแปรได้รับมาตรฐานในขณะที่( 1 ) เราสามารถเข้าใจในสิ่งที่มันหมายถึงโดยพิจารณาสิ่งที่มันหมายถึงการใด ๆตัวแปรมาตรฐานหรือไม่ เราจะแทนที่X iแต่ละอันด้วยเวอร์ชันกึ่งกลางเช่นเดียวกับใน( 2 )และจัดรูปแบบปริมาณที่มีสามดัชนีXi(1)Xi(2)
μ3(X)ijk=E[X′iX′jX′k].
เหล่านี้เป็นกลาง (หลายตัวแปร) ช่วงเวลาของการศึกษาระดับปริญญา3 3 เช่นเดียวกับในพวกเขาสร้างเมตริกซ์: เมื่อY = A Xแล้ว( 4 )Y=AX
μ3(Y)ijk=∑l,m,naliamjankμ3(X)lmn.
ดัชนีอยู่ในช่วงสามจำนวนนี้กว่ารวมกันทั้งหมดของจำนวนเต็มจากผ่านหน้า1p
อะนาล็อกของโพลาไรเซชันเอกลักษณ์คือ
24μ3(X)ijk=μ3(Xi+Xj+Xk)−μ3(Xi−Xj+Xk)−μ3(Xi+Xj−Xk)+μ3(Xi−Xj−Xk).
ทางด้านขวามือหมายถึงช่วงเวลาที่สาม (univariate) ตอนกลางที่สาม: ค่าที่คาดหวังของคิวบ์ของตัวแปรกึ่งกลาง เมื่อตัวแปรมีมาตรฐานในขณะนี้มักจะเรียกว่าเบ้ ดังนั้นเราอาจคิดว่าμ 3 ( X )ในฐานะที่เป็นเบ้หลายตัวแปรของX มันเป็นเมตริกซ์ของการจัดอันดับสาม (นั่นคือมีสามดัชนี) ที่มีค่าเป็นผลรวมเชิงเส้นของ skewnesses ของผลรวมที่หลากหลายและความแตกต่างของXฉัน ถ้าเราต้องแสวงหาการตีความเราก็จะคิดว่าองค์ประกอบเหล่านี้เป็นตัววัดในpμ3μ3(X)XXipมิติใดก็ตามที่ความเบ้วัดในมิติเดียว ในหลายกรณี,
ช่วงเวลาแรกทำการวัดตำแหน่งของการแจกแจง
ช่วงเวลาที่สอง (เมทริกซ์ความแปรปรวนแปรปรวน) วัดของการแพร่กระจาย ;
ช่วงเวลามาตรฐานที่สอง (ความสัมพันธ์) บ่งชี้ว่าการแพร่กระจายแตกต่างกันในพื้นที่ -dimensional อย่างไร และp
ช่วงเวลาที่สามและสี่ที่เป็นมาตรฐานจะถูกนำมาใช้เพื่อวัดรูปร่างของการแจกแจงที่สัมพันธ์กับการแพร่กระจาย
ในการอธิบายอย่างละเอียดเกี่ยวกับสิ่งที่รูปร่าง "หลายมิติ" อาจหมายถึงสังเกตว่าเราสามารถเข้าใจ PCA เป็นกลไกในการลดการกระจายหลายตัวแปรใด ๆ ให้เป็นรุ่นมาตรฐานซึ่งตั้งอยู่ที่จุดกำเนิดและกระจายอย่างเท่าเทียมกันในทุกทิศทาง หลังจากดำเนินการ PCA แล้วจะให้ตัวชี้วัดที่ง่ายที่สุดของรูปทรงหลายมิติของการแจกแจง แนวคิดเหล่านี้ใช้กับข้อมูลได้ดีพอ ๆ กับตัวแปรสุ่มเนื่องจากสามารถวิเคราะห์ข้อมูลในแง่ของการกระจายเชิงประจักษ์ได้เสมอμ3
การอ้างอิง
Alan Stuart & J. Keith Ord, ทฤษฎีขั้นสูงทางสถิติของเคนดัลล์ ฉบับที่ห้า, เล่มที่ 1: ทฤษฎีการกระจาย ; บทที่ 3 ช่วงเวลาและ Cumulants สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด (2530)
ภาคผนวก: หลักฐานการแสดงตนของโพลาไรเซชัน
ให้เป็นตัวแปรพีชคณิต มี2 nวิธีในการเพิ่มและลบทั้งหมดnของพวกเขา เมื่อเรายกแต่ละเหล่านี้จำนวนเงินและความแตกต่างให้กับn THอำนาจรับสัญญาณที่เหมาะสมสำหรับแต่ละผลลัพธ์เหล่านั้นและเพิ่มขึ้นเราจะได้รับหลายของx 1 x 2 ⋯ x nx1,…,xn2nnnthx1x2⋯xn
อีกอย่างเป็นทางการให้เป็นชุดของทั้งหมดn -tuples ของ± 1เพื่อให้องค์ประกอบใด ๆs ∈ Sเป็นเวกเตอร์s = ( s 1 , s 2 , ... , s n )ที่มี ค่าสัมประสิทธิ์มีทั้งหมด± 1 การเรียกร้องคือS={1,−1}nn±1s∈Ss=(s1,s2,…,sn)±1
2nn!x1x2⋯xn=∑s∈Ss1s2⋯sn(s1x1+s2x2+⋯+snxn)n.(1)
อันที่จริงทฤษฎีบท Multinomial ระบุว่าสัมประสิทธิ์ของ monomial (ที่i jเป็นจำนวนเต็ม nonnegative รวมถึงn ) ในการขยายตัวของคำใด ๆ ทางด้านขวามือคือxi11xi22⋯xinnijn
(ni1,i2,…,in)si11si22⋯sinn.
ในผลรวมค่าสัมประสิทธิ์ที่เกี่ยวข้องกับx ฉัน1 1ปรากฏในคู่ที่หนึ่งของแต่ละคู่จะเกี่ยวข้องกับกรณีที่s 1 = 1มีค่าสัมประสิทธิ์สัดส่วนกับ s 1ครั้งs ฉัน1 1เท่ากับ1และอื่น ๆ ของ แต่ละคู่เกี่ยวข้องกับกรณีs 1 = - 1โดยมีค่าสัมประสิทธิ์เป็นสัดส่วน- 1ครั้ง( - 1 ) i 1เท่ากับ( - 1(1)xi11s1=1s1si111s1=−1−1(−1)i1 1 พวกเขายกเลิกเป็นผลรวมเมื่อใดก็ตามที่ฉัน1 + 1เป็นเลขคี่ อาร์กิวเมนต์เดียวกันนี้ใช้กับ i 2 , … , i n . ดังนั้นmonomials เท่านั้นที่เกิดขึ้นกับค่าสัมประสิทธิ์ภัณฑ์จะต้องมีอำนาจคี่ของทุก xฉัน monomial เพียงดังกล่าวเป็น x 1 x 2 ⋯ x n มันจะปรากฏขึ้นพร้อมค่าสัมประสิทธิ์ ( n(−1)i1+1i1+1i2,…,inxix1x2⋯xnในเงื่อนไขทั้งหมด2nของผลรวม ดังนั้นค่าสัมประสิทธิ์ของมันคือ2nn! ,QED(n1,1,…,1)=n!2n2nn!
เราจำเป็นต้องใช้เพียงครึ่งเดียวของแต่ละคู่ที่เกี่ยวข้องกับ : นั่นคือเราสามารถ จำกัด ด้านขวามือของ( 1 )กับเงื่อนไขด้วยs 1 = 1และลดสัมประสิทธิ์ทางซ้ายมือเป็น2 n - 1 n ! . นั่นให้โพลาไรเซชันเอกลักษณ์ทั้งสองที่ระบุอย่างแม่นยำในคำตอบนี้สำหรับเคสn = 2และn = 3 : 2 2 - 1 2 ! = 4และ2 3 - 1x1(1)s1=12n−1n!n=2n=322−12!=4 2423−13!=24
แน่นอน Polarization เอกลักษณ์สำหรับตัวแปรพีชคณิตทันทีหมายถึงมันสำหรับตัวแปรสุ่มขอให้แต่ละจะเป็นตัวแปรสุ่มXฉัน คาดหวังจากทั้งสองฝ่าย ผลลัพธ์จะเป็นไปตามเส้นตรงของความคาดหวังxiXi