ความแตกต่างระหว่างการแจกแจงแบบปกติแบบหลายตัวแปรมาตรฐานและ copula แบบเกาส์เซียน


17

ฉันสงสัยว่าความแตกต่างระหว่างการแจกแจงแบบปกติแบบหลายตัวแปรมาตรฐานและโคคูล่าแบบเกาส์คืออะไรเพราะเมื่อฉันดูฟังก์ชันความหนาแน่นพวกมันดูเหมือนกันกับฉัน

ปัญหาของฉันคือเหตุผลที่ว่าทำไม Copula Copula ถูกนำมาใช้หรือสิ่งที่เป็นประโยชน์ต่อ Copula Gaussian สร้างขึ้นหรือสิ่งที่เหนือกว่าของมันคือเมื่อ Copula Gaussian ไม่มีอะไรเลยนอกจากฟังก์ชั่นมาตรฐานหลายตัวแปรตัวเอง

แนวคิดที่อยู่เบื้องหลังการแปลงความน่าจะเป็นรวมในโคคูล่าคืออะไร? ฉันหมายความว่าเรารู้ว่า copula เป็นฟังก์ชันที่มีตัวแปรสม่ำเสมอ ทำไมต้องเป็นชุด? ทำไมไม่ใช้ข้อมูลจริงเช่นการแจกแจงปกติหลายตัวแปรและหาเมทริกซ์สหสัมพันธ์ (โดยปกติเราจะพล็อตสินทรัพย์สองรายการเพื่อพิจารณาความสัมพันธ์ของพวกเขา แต่เมื่อมันเป็นโคคูลาเราจะพล็อตเราซึ่งเป็นความน่าจะเป็นแทน)

คำถามอื่น ฉันยังสงสัยว่าเมทริกซ์สหสัมพันธ์จาก MVN อาจไม่ใช่แบบพารามิเตอร์หรือกึ่งพาราเมตริกเหมือนของโคคูล่า (สำหรับพารามิเตอร์โคคูลาสามารถเป็นเอกภาพของเคนดัลล์เป็นต้น)

ฉันจะขอบคุณมากสำหรับความช่วยเหลือของคุณตั้งแต่ฉันใหม่ในพื้นที่นี้ (แต่ฉันได้อ่านบทความมากมายและนี่เป็นสิ่งเดียวที่ฉันไม่เข้าใจ)


คุณเป็นอย่างไร "ดูที่ฟังก์ชั่นความหนาแน่น"? คุณอาจไม่ได้ใช้วิธีการที่ไวพอ ตัวอย่างเช่นความหนาแน่นไม่แน่นอนหลายตัวแปรเมื่อระยะขอบไม่ปกติ! ลองนี้ออกมาใช้เชื่อมเกาส์ที่มีต่อเนื่องกระจายเช่นเบต้า : ที่ควรจะมองเด็ดที่ไม่ปกติ! (1/2,1/2)
whuber

สมการ (6) คือ bivariate Gaussian copula CDF iopscience.iop.org/2041-8205/708/1/L9/fulltext/ … ในขณะที่สมการแรกของคำอธิบายคือ bivariate CDF มาตรฐานปกติroguewave.com/portals/0/products/ imsl-numerical-libraries / … และเมื่อเราเปรียบเทียบมันเข้าด้วยกันรูปแบบการทำงานจะคล้ายกันมาก พวกเขาเหมือนกันกับฉัน
26979

คุณพูดถูก: นั่นเป็นเหตุผลว่าทำไมคุณไม่ควรอ้างอิงอินเทอร์เน็ตแบบสุ่มโดยเฉพาะผู้ที่มีคำที่กำหนดไม่ดี ปรึกษา Nelson (หนึ่งในแหล่งข้อมูลสำหรับลิงก์แรกของคุณและสามารถอ่านได้อย่างชัดเจน)
whuber

1
ดังนั้นหากไม่พูดถึงอภิมหาดังกล่าวข้างต้นอะไรคือความแตกต่างในมุมมองของคุณ
26979

คำตอบ:


20

กฎทั่วไปข้อหนึ่งเกี่ยวกับเอกสารทางเทคนิค - โดยเฉพาะอย่างยิ่งที่พบในเว็บ - คือความน่าเชื่อถือของคำจำกัดความทางสถิติหรือทางคณิตศาสตร์ใด ๆ ชื่อหน้าในการอ้างอิงแรกที่นำเสนอ (ในความคิดเห็นคำถาม) คือ "จากการเงินสู่จักรวาล: Copula ของโครงสร้างขนาดใหญ่" ด้วยทั้ง "การเงิน" และ "จักรวาลวิทยา" ปรากฏเด่นชัดเรามั่นใจได้เลยว่านี่ไม่ใช่แหล่งข้อมูลที่ดีเกี่ยวกับ copulas!

ให้เราหันไปหาหนังสือเรียนที่เป็นมาตรฐานและเข้าถึงได้ง่ายของโรเจอร์เนลเซ่นเรื่องคำแนะนำเกี่ยวกับ copulas (Second Edition, 2006) สำหรับคำจำกัดความที่สำคัญ

... ทุกเชื่อมเป็นฟังก์ชั่นการจัดจำหน่ายร่วมกับอัตรากำไรขั้นต้นที่มีเครื่องแบบ [ช่วงปิดหน่วย ][0,1]]

[ที่หน้า 23 ด้านล่าง]

สำหรับข้อมูลเชิงลึกเกี่ยวกับ copulae ให้หันไปใช้ทฤษฎีบทแรกในหนังสือเล่มนี้ทฤษฎีบทของ Sklar :

ให้Hจะเป็นฟังก์ชั่นการจัดจำหน่ายร่วมกับอัตรากำไรขั้นต้นและG จากนั้นก็มีอยู่เชื่อมCเช่นว่าทุกx , y ที่ใน [ตัวเลขจริงขยาย] H ( x , Y ) = C ( F ( x ) , G ( Y ) )FGx,Y

H(x,Y)=(F(x),G(Y)).

[ระบุไว้ในหน้า 18 และ 21]

แม้ว่า Nelsen จะไม่เรียกมันว่าเป็นเช่นนั้นเขาก็ให้คำจำกัดความแบบเกาส์ในตัวอย่าง

... ถ้าหมายถึงมาตรฐาน (univariate) ฟังก์ชันการแจกแจงปกติและไม่มีρหมายถึงสองตัวแปรฟังก์ชันการแจกแจงแบบปกติมาตรฐาน (กับเพียร์สันผลิตภัณฑ์ขณะสัมประสิทธิ์สหสัมพันธ์ρ ) แล้ว ... C ( U , V ) = 1Φยังไม่มีข้อความρρ

C(u,v)=12π1ρ2Φ1(u)Φ1(v)exp[(s22ρst+t2)2(1ρ2)]dsdt

[ที่หน้า 23, 2.3.6 สมการ] จากสัญกรณ์มันเป็นสิ่งที่เกิดขึ้นทันทีว่านี้คือการแจกแจงร่วมสำหรับ ( u , v )เมื่อ( Φ - 1 ( u ) , Φ - 1 ( v ) )เป็น bivariate Normal ตอนนี้เราอาจหันหลังกลับและสร้างการกระจายตัวแบบไบวาเรียใหม่ที่มีการแจกแจงส่วนขอบ (ต่อเนื่อง) ที่ต้องการFและGซึ่งCนี้เป็นโคคูล่าเพียงแค่แทนที่การเกิดขึ้นของΦโดยFและC(u,v)(Φ1(u),Φ1(v))FGCΦF : ใช้เวลานี้โดยเฉพาะอย่างยิ่ง Cในลักษณะของ copulas ดังกล่าวข้างต้นGC

ใช่แล้วนี่ดูเหมือนสูตรสำหรับการแจกแจงปกติแบบไบวาริเอทอย่างน่าทึ่งเพราะมันเป็นตัวแปรปกติสำหรับตัวแปรที่แปลงแล้ว ) เนื่องจากการแปลงเหล่านี้จะไม่เป็นเชิงเส้นเมื่อใดก็ตามที่ Fและ Gยังไม่ได้ (univariate) CDFs ปกติด้วยตนเองการกระจายที่เกิดขึ้นจึงไม่ใช่ (ในกรณีเหล่านี้) bivariate ปกติ(Φ1(F(x)),Φ1(G(y)))FG


ตัวอย่าง

ให้เป็นฟังก์ชันการแจกแจงสำหรับตัวแปรBeta ( 4 , 2 ) XF(4,2)XG(2)YHFGxy

พล็อต

0x10y

การขาดความสมมาตรทำให้เห็นได้ชัดว่าไม่ใช่เรื่องปกติ (และไม่มีระยะขอบปกติ) แต่มันก็ยังมีรูปแบบเกาส์เซียนด้วยการก่อสร้าง FWIW มีสูตรและเป็นที่น่าเกลียดและเห็นได้ชัดว่าไม่ได้ทำให้เกิดตัวแปรปกติ:

132(20(1x)x3)(eyy)exp(w(x,y))

w(x,y)

erfc1(2(Q(2,0,y))223(2erfc1(2(Q(2,0,y)))erfc1(2(Ix(4,2)))2)2).

QIx


ขอบคุณสำหรับการแก้ไข @ Cardinal: ฉันอายเกี่ยวกับการสะกดชื่อของ Nelsen โดยเฉพาะอย่างยิ่งเมื่อฉันมองไปที่ด้านหน้าของหนังสือ! (ในการป้องกันของฉันฉันได้สังเกตเห็นครั้งแรกในบรรณานุกรมของเอกสารอ้างอิงของ OP ที่มันสะกดผิด: ที่จะต้องติดอยู่กับฉัน :-)
whuber

มันเป็นเรื่องเล็กน้อยฉันคิดว่าฉันเพิ่งจะไปแก้ไข การสะกดคำผิดปกติ (อย่างน้อยเป็นภาษาอังกฤษ!) โดยเฉพาะเมื่อเปรียบเทียบกับตัวแปรที่พบบ่อย :-)
สำคัญ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.