ความหมายของการแสดง simplex เป็นพื้นผิวรูปสามเหลี่ยมในการแจกแจง Dirichlet คืออะไร?


9

ฉันกำลังอ่านจากหนังสือที่แนะนำการแจกแจง Dirchilet แล้วนำเสนอตัวเลขเกี่ยวกับมัน แต่ฉันไม่สามารถเข้าใจตัวเลขเหล่านั้นได้ ฉันแนบรูปที่นี่ที่ด้านล่าง สิ่งที่ฉันไม่เข้าใจคือความหมายของสามเหลี่ยม

โดยปกติเมื่อเราต้องการพล็อตฟังก์ชั่นของตัวแปร 2 ตัวคุณใช้ค่าของ var1 และ va2 จากนั้นพล็อตค่าของฟังก์ชั่นค่าของตัวแปรสองตัวนั้น ... ซึ่งให้การสร้างภาพข้อมูลในมิติสามมิติ แต่ที่นี่มี 3 มิติและอีกหนึ่งค่าสำหรับค่าฟังก์ชั่นดังนั้นมันจึงสร้างภาพในพื้นที่ 4D ฉันไม่เข้าใจตัวเลขเหล่านั้น!

ฉันหวังว่าบางคนสามารถชี้แจงได้โปรด!

แก้ไข: นี่คือสิ่งที่ฉันไม่เข้าใจจากรูปที่ 2.14 ก ดังนั้นเราได้วาดจาก K = 3 dirichlet ตัวอย่างทีต้า (ซึ่งโดยทั่วไปคือเวกเตอร์) นั่นคือ: theta = [theta1, theta2, theta3] สามเหลี่ยมแปลง [theta1, theta2, theta3] ระยะทางจากจุดเริ่มต้นไปยังแต่ละ theta_i คือค่าของ theta_i จากนั้นสำหรับ theta_i แต่ละอันให้ใส่จุดยอดและเชื่อมต่อจุดยอดทั้งสามและทำรูปสามเหลี่ยม ฉันรู้ว่าถ้าฉันเสียบ [theta1, theta2, theta3] ลงใน dir (theta | a) ฉันจะได้หมายเลขหนึ่งซึ่งเป็นความน่าจะเป็นร่วมของเวกเตอร์ theta ฉันยังเข้าใจด้วยว่าความน่าจะเป็นสำหรับตัวแปรสุ่มต่อเนื่องเป็นการวัดพื้นที่ แต่ที่นี่เรามีสามมิติดังนั้นความน่าจะเป็นที่จะมีร่วมกันคือการวัดปริมาตรของพื้นที่จากระนาบสีชมพูและใต้ ... นั่นคือปิรามิด ตอนนี้ฉันไม่เข้าใจว่าบทบาทของสามเหลี่ยมที่นี่คืออะไร

ป้อนคำอธิบายรูปภาพที่นี่


2
ฉันขอแนะนำให้คุณเริ่มต้นจากการกระจายเบต้าและทำงานจากที่นั่น Dirichlet สำหรับ 3 คือ "just" ส่วนขยายแบบลอจิคัลของเบต้าซึ่งก็คือ Dirichlet สำหรับ 2
Andris Birkmanis

ตรวจสอบหัวข้อนี้สำหรับตัวอย่าง: stats.stackexchange.com/questions/244917/…
ทิม

มันจะมีประโยชน์ถ้าคิดว่าการแจกแจงแบบเบต้าจะแสดงในแบบ 2 มิติ (แกน x ซึ่งเป็นตัวแทนของผลลัพธ์แบบไบนารี {0,1} และแกน y แทนความน่าจะเป็น) ดังนั้นผลลัพธ์แบบไตรภาคต้องการมิติพิเศษใช่ไหม?
George

คำตอบ:


4

ฉันไม่เข้าใจว่าบทบาทของสามเหลี่ยมตรงนี้คืออะไร มันพยายามสื่อสารอะไรหรือมองเห็นภาพ?

คะแนนทั้งหมดในรูปสามเหลี่ยมต้องเป็นไปตามข้อ จำกัด สองประการ: ระหว่างศูนย์ถึงหนึ่งในแต่ละส่วนข้อมูล ( ) และผลรวมทั้งหมดถึงหนึ่ง ( )0θ1θ0+θ1+θ2=1

ในที่สุดฉันก็เข้าใจในสิ่งต่อไปนี้:

รูป

ดังนั้น (a) แสดงช่องว่าง 3 มิติด้วยเป็นพิกัด มันมีช่วงระหว่าง 0 ถึง 1 เท่านั้นθ1,2,3

ใน (b) สามเหลี่ยมแสดงขึ้นนี่คือซิมเพล็กซ์ของเรา

(c) แสดงตัวอย่างสองจุดที่ "วาง" บนเริมซึ่งเป็นไปตามเกณฑ์ที่สอง (รวมได้สูงสุดหนึ่ง)

(d) แสดงตัวอย่างอีกจุดบนเริมข้อ จำกัด เดียวกันถือ

ใน (e) ฉันพยายามแสดงการฉายภาพของ simplex ไปยังรูปสามเหลี่ยมสองมิติพร้อมจุดตัวอย่างทั้งหมดที่แสดงก่อนหน้านี้

หวังว่ามันจะสมเหตุสมผลมากกว่านี้ :)


2
รูปภาพสวย ๆ เป็นของคุณหรือเปล่า ถ้าไม่คุณช่วยกรุณาอ้างอิงและเป็นแหล่งข้อมูลได้หรือไม่
ทิม

1
ขอบคุณ มันเหมืองแร่ (วาดโดยใช้ Inkscape) ผมสามารถให้ SVG ถ้าจำเป็น ...
จอห์นโด

2

กราฟ 2.14 (a) แสดงระนาบที่ทำขึ้นโดยจุดยอดสามจุดบนแต่ละแกน ระยะทางของจุดสุดยอดจากจุดกำเนิดคือซึ่งสอดคล้องกับหนึ่งในคลาสพื้นที่ที่ล้อมรอบด้วยระนาบสีชมพูและระนาบของแกนคือความน่าจะเป็น (เวกเตอร์)θik=3θ. ทีนี้สมมติว่าคุณเอียงเครื่องบินลำนั้นเพื่อให้คุณมีปิรามิดที่มีระนาบสีชมพูใบหน้าที่อยู่ใกล้กับเครื่องอ่านวางไว้บนหน้ากระดาษเรียบที่สุด จากนั้นระงับส่วนที่สาม "โผล่ออกมา" ของหน้ากระดาษและเปลี่ยนสีสามเหลี่ยมเพื่อให้บริเวณที่มีความหนาแน่นสูงขึ้นโดยมีระยะทางที่ยาวจากฐานสู่พื้นผิวเป็นสีแดงมากขึ้น นั่นคือกราฟที่แสดง 2.14 (b) และ 2.14 (c) ยิ่งสีแดงเข้มขึ้นใกล้กับจุดสุดยอดมากเท่าไรก็ยิ่งมีโอกาสเกิดความสัมพันธ์กับจุดสุดยอดมากขึ้นเท่านั้น ในทำนองเดียวกันหากพื้นที่สีแดงไม่ใกล้กับจุดสุดยอดมากเป็นไปได้ยากที่เหตุการณ์จะมีความเป็นไปได้สูงที่จะเป็นสมาชิกในชั้นเรียนใด ๆ

แม้ว่าปิรามิดนี้จะทำให้รู้สึกได้ว่าเป็นการกระจายตัวของดีริชเลต์เพียงครั้งเดียว การวาดอีกครั้งจากการกระจายตัวแบบเดียวกันอาจให้พีระมิดที่แตกต่างกันซึ่งมีความยาวแตกต่างกันไปยังแต่ละจุดยอด ความแตกต่างที่สำคัญระหว่าง (a) และ (b) / (c) คือ (a) แสดงความน่าจะเป็นแบบกราฟิกของเวกเตอร์หนึ่งครั้ง กราฟ (b) และ (c) แสดงความหนาแน่นของความน่าจะเป็นสำหรับค่าใน simplex นั่นคือพวกเขากำลังพยายามที่จะนำเสนอฟังก์ชันความหนาแน่นของความน่าจะเป็นสำหรับค่าทั้งหมดθθθk=3θในการสนับสนุน วิธีคิดอย่างหนึ่งเกี่ยวกับ (b) และ (c) เป็นจุดที่มีสีแดงเพิ่มเติมตามความสูงเฉลี่ยระหว่างระนาบสีชมพูแบนและพื้นผิวของพีระมิดโดยเฉลี่ยอยู่ที่alpha)θDir(α)


บางจุดยังไม่ชัดเจน อาจจะเป็นเพราะภาษาอังกฤษของฉันอ่อนแอ ภูมิภาคที่ล้อมรอบด้วยระนาบสีชมพูและระนาบของแกนคือความหนาแน่น นั่นคือพื้นที่ว่างของพีระมิดใต้ระนาบสีชมพูใช่ไหม นอกจากนี้ "ความหนาแน่น"? คุณหมายถึงอะไร เช่นเดียวกับที่ฉันเข้าใจคือ dir (x1, x2, x3) เป็นหนึ่งค่าความหนาแน่นมาที่นี่ในกราฟได้อย่างไร
Jack Twain

ใช่ระหว่างระนาบสีชมพูกับระนาบที่เกิดจากเส้นสีดำใน 2.14 (a) คือพื้นที่ของปิรามิดที่ฉันพยายามจะอธิบาย ขอโทษสำหรับความสับสน!
Sycorax พูดว่า Reinstate Monica

ฉันจะแก้ไขโพสต์ของฉันเพื่ออธิบายเพิ่มเติมว่ายังไม่ชัดเจน
แจ็คทเวน

สิ่งที่เป็นพื้นที่สีชมพูคือการสนับสนุนที่อธิบายไว้ในหนังสือ ตั้งแต่ theta_k <= 1 และผลรวม (theta_k) = 1 เมื่อคุณเห็นภาพนั้น user777 นั้นถูกต้องสมบูรณ์
เกา

@ user777 ฉันเพิ่งแก้ไขโพสต์
Jack Twain
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.