ใครบางคนถามคำถามนี้กับฉันในการสัมภาษณ์งานและฉันตอบว่าการกระจายข้อต่อเป็นแบบเกาส์น ฉันคิดว่าฉันสามารถเขียนเกาส์ไบรอาริเอตด้วยวิธีและความแปรปรวนและความแปรปรวนร่วมได้ ฉันสงสัยว่าอาจมีกรณีที่น่าจะเป็นร่วมกันของ Gaussians สองไม่ Gaussian?
ใครบางคนถามคำถามนี้กับฉันในการสัมภาษณ์งานและฉันตอบว่าการกระจายข้อต่อเป็นแบบเกาส์น ฉันคิดว่าฉันสามารถเขียนเกาส์ไบรอาริเอตด้วยวิธีและความแปรปรวนและความแปรปรวนร่วมได้ ฉันสงสัยว่าอาจมีกรณีที่น่าจะเป็นร่วมกันของ Gaussians สองไม่ Gaussian?
คำตอบ:
การแจกแจงแบบปกติแบบ bivariate เป็นข้อยกเว้นไม่ใช่กฎ!
สิ่งสำคัญคือต้องตระหนักว่าการแจกแจงร่วม "เกือบทั้งหมด" ที่มีระยะขอบปกติไม่ใช่การกระจายตัวแบบปกติแบบสองตัวแปร นั่นคือมุมมองทั่วไปที่การแจกแจงร่วมกับระยะขอบปกติที่ไม่ใช่ค่า bivariate ปกติเป็นอย่างใด "พยาธิวิทยา" เป็นบิตเข้าใจผิด
แน่นอนว่าหลายตัวแปรปกติมีความสำคัญอย่างยิ่งเนื่องจากความเสถียรของมันภายใต้การแปลงเชิงเส้นและได้รับความสนใจจำนวนมากในการใช้งาน
ตัวอย่าง
การเริ่มต้นด้วยตัวอย่างมีประโยชน์ รูปด้านล่างประกอบด้วยแผ่นความร้อนของการแจกแจง bivariate หกรูปซึ่งทั้งหมดนั้นมีระยะขอบปกติมาตรฐาน ด้านซ้ายและกลางในแถวบนสุดเป็นบรรทัดฐานของ bivariate ส่วนที่เหลือไม่ได้ (ตามที่ควรจะเป็น) พวกเขากำลังอธิบายเพิ่มเติมด้านล่าง
กระดูกเปลือยของ copulas
คุณสมบัติของการพึ่งพาอาศัยกันมักจะมีการวิเคราะห์อย่างมีประสิทธิภาพโดยใช้copulas เชื่อม bivariateเป็นเพียงชื่อแฟนซีสำหรับการกระจายความน่าจะเป็นในหน่วยตารางกับเครื่องแบบมาร์จิน
สมมติว่าเป็น copula แบบ bivariate จากนั้นเราจะรู้ทันทีว่าC ( u , v ) ≥ 0 , C ( u , 1 ) = uและC ( 1 , v ) = v , ตัวอย่างเช่น
เราสามารถสร้างตัวแปรสุ่มแบบ bivariate บนระนาบแบบยุคลิดด้วยระยะขอบที่กำหนดไว้ล่วงหน้าโดยการแปลงรูปแบบของบิวริเอตแบบง่าย ๆ ขอให้และF 2จะกำหนดแจกแจงร่อแร่สำหรับคู่ของตัวแปรสุ่ม( X , Y ) จากนั้นถ้าC ( u , v )เป็น copula bivariate, F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) )
อย่างต่อเนื่องและ , ทฤษฎีบท Sklar ของอ้างสนทนาหมายความเอกลักษณ์ นั่นคือจากการแจกแจงไบวาริเอทมีมาร์ต่อเนื่อง , , copula ที่สอดคล้องกันนั้นมีลักษณะเฉพาะ (บนพื้นที่พิสัยที่เหมาะสม)
ค่าปกติของไบวาเรียเป็นพิเศษ
ทฤษฎีบทของ Sklar บอกเรา (โดยหลักแล้ว) ว่ามีเพียงโคคูล่าเพียงตัวเดียวที่สร้างการกระจายตัวแบบไบวาเรียปกติ นี่คือชื่อ aptly ตัวเกาส์เกาส์ซึ่งมีความหนาแน่นใน ที่ตัวเศษคือการแจกแจงปกติแบบ bivariate ที่มีสหสัมพันธ์ประเมินที่และ(V)
แต่มีจำนวนมากของ copulas อื่น ๆ และทั้งหมดของพวกเขาจะให้การกระจายสองตัวแปรที่มีมาร์จินปกติซึ่งเป็นไม่ bivariate ปกติโดยใช้การเปลี่ยนแปลงที่อธิบายไว้ในส่วนก่อนหน้านี้
รายละเอียดบางอย่างเกี่ยวกับตัวอย่าง
โปรดทราบว่าถ้าเป็น am copula โดยพลการที่มีความหนาแน่น , ความหนาแน่นของ bivariate ที่สอดคล้องกับระยะขอบปกติมาตรฐานภายใต้การแปลงคือ
โปรดทราบว่าด้วยการใช้เกาส์เกาส์ในสมการข้างต้นเราจะได้ค่าความหนาแน่นปกติที่เท่ากัน แต่สำหรับทางเลือกอื่น ๆ ของเราจะไม่
ตัวอย่างในรูปถูกสร้างขึ้นดังนี้ (ข้ามแต่ละแถวทีละหนึ่งคอลัมน์):
library(copula)
kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE)))
# force normal margins
evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1)))
contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
มันเป็นความจริงที่แต่ละองค์ประกอบของเวกเตอร์ปกติหลายตัวแปรนั้นมีการกระจายตัวตามปกติและคุณสามารถอนุมานค่าเฉลี่ยและความแปรปรวนได้ อย่างไรก็ตามมันไม่เป็นความจริงที่ว่าตัวแปรสุ่มของ Guassian ใด ๆ จะถูกกระจายกันตามปกติ นี่คือตัวอย่าง:
แก้ไข: ในการตอบสนองต่อฉันทามติว่าตัวแปรสุ่มที่เป็นมวลจุดสามารถคิดว่าเป็นตัวแปรกระจายตามปกติด้วยฉันกำลังเปลี่ยนตัวอย่างของฉัน
ปล่อยให้และให้โดยที่คือตัวแปรสุ่ม นั่นคือแต่ละคนมีความน่าจะเป็น1/2Y = X ⋅ ( 2 B - 1 )
ก่อนอื่นเราแสดงว่ามีการแจกแจงแบบปกติมาตรฐาน โดยกฎหมายของความน่าจะรวม ,
ต่อไป,
ที่เป็นมาตรฐาน CDF ในทำนองเดียวกัน
ดังนั้น,
ดังนั้น CDF ของเป็นจึง(0,1)
ตอนนี้เราแสดงให้เห็นว่าไม่ได้กระจายกันตามปกติ เมื่อ @ cardinal ชี้ให้เห็นว่าการจำแนกลักษณะหลายตัวแปรตามปกติคือการรวมกันเชิงเส้นขององค์ประกอบทั้งหมดจะกระจายตามปกติ ไม่มีคุณสมบัตินี้ตั้งแต่
ดังนั้นคือการผสมของตัวแปรสุ่มและมวลจุดที่ 0 ดังนั้นจึงไม่สามารถกระจายได้ตามปกติ
โพสต์ต่อไปนี้มีโครงร่างของการพิสูจน์เพียงเพื่อให้แนวคิดหลักและเริ่มต้นใช้งาน
ปล่อยให้เป็นสองตัวแปรสุ่มเกาส์เซียนอิสระและให้เป็น
แต่ละตัวแต่เนื่องจากทั้งคู่รวมกันเป็นเส้นตรงของ r.vs อิสระเดียวกันพวกเขาจึงต้องพึ่งพากัน
นิยาม คู่ของ r.vsจะกล่าวว่าเป็น bivariate กระจายตามปกติ IFF ก็สามารถเขียนเป็นเส้นตรงกันอิสระปกติ r.vsZ_2)
เล็มม่า ถ้าเป็นตัวแปรแบบเกาส์เบียสแล้วการรวมกันเชิงเส้นอื่น ๆ ของพวกมันจะเป็นตัวแปรสุ่มแบบปกติอีกครั้ง
พิสูจน์ ไม่สำคัญเลยข้ามเพื่อไม่ให้ใครขุ่นเคือง
คุณสมบัติ ถ้าไม่มีความสัมพันธ์กันแสดงว่าพวกเขาเป็นอิสระและในทางกลับกัน
การกระจายของ
สมมติว่าเป็น Gaussian r.vs เหมือนเดิม แต่สมมติว่าพวกมันมีความแปรปรวนในเชิงบวกและไม่มีค่าเฉลี่ยสำหรับความเรียบง่าย
หากเป็นพื้นที่ว่างที่ถูกขยายโดยให้และS}
และเป็นการรวมกันเชิงเส้นของดังนั้นก็เช่นกัน พวกเขาอยู่ด้วยกันเสียนไม่เกี่ยวข้อง (พิสูจน์) และเป็นอิสระ
การสลายตัว ถือกับ
จากนั้น
ตัวแปรสุ่มแบบเกาส์สองตัวแปรที่ไม่แปรนั้นเป็นแบบเกาส์ร่วมกันหากเงื่อนไขและก็เป็น Gaussian ด้วยเหมือนกันX | Y Y | X