สัญชาตญาณกราฟิกของสถิติในนานา


12

ในโพสต์นี้คุณสามารถอ่านคำสั่ง:

แบบจำลองมักจะถูกแทนที่ด้วยจุดบนมิติที่ จำกัดθ

ในเรขาคณิตเชิงอนุพันธ์และสถิติโดย Michael K Murray และ John W Riceแนวคิดเหล่านี้อธิบายได้ในร้อยแก้วที่อ่านได้แม้จะไม่สนใจนิพจน์ทางคณิตศาสตร์ น่าเสียดายที่มีภาพประกอบไม่มาก กันไปสำหรับโพสต์นี้ใน MathOverflow

ฉันต้องการขอความช่วยเหลือด้วยการนำเสนอด้วยภาพเพื่อใช้เป็นแผนที่หรือแรงจูงใจในการทำความเข้าใจหัวข้อที่เป็นทางการมากขึ้น

อะไรคือจุดที่หลากหลาย อ้างจากการค้นหาออนไลน์นี้ดูเหมือนจะบ่งบอกว่ามันอาจเป็นจุดข้อมูลหรือพารามิเตอร์การกระจาย:

สถิติเกี่ยวกับแมนิโฟลด์และเรขาคณิตข้อมูลเป็นสองวิธีที่แตกต่างกันซึ่งเรขาคณิตเชิงอนุพันธ์ตรงกับสถิติ ในขณะที่ในสถิติเกี่ยวกับแมนิโฟลด์มันเป็นข้อมูลที่วางอยู่บนท่อร่วมในเรขาคณิตข้อมูลข้อมูลอยู่ในแต่พารามิเตอร์ของฟังก์ชันความหนาแน่นของความน่าจะเป็นแบบพารามิเตอร์ที่น่าสนใจจะได้รับการปฏิบัติเหมือนนานา manifolds ดังกล่าวเรียกว่า manifolds ทางสถิติRn


ฉันวาดไดอะแกรมนี้โดยได้แรงบันดาลใจจากคำอธิบายของพื้นที่แทนเจนต์ที่นี่ :

ป้อนคำอธิบายรูปภาพที่นี่

[ แก้ไขเพื่อแสดงความคิดเห็นด้านล่างเกี่ยวกับ :C ] บนนานาพื้นที่แทนเจนต์คือเซตของอนุพันธ์ที่เป็นไปได้ทั้งหมด ("ความเร็ว") ที่จุดเกี่ยวข้องกับ ทุกโค้งที่เป็นไปได้บนท่อร่วมไอวิ่งผ่าน นี่จะเห็นได้ว่าเป็นชุดของแผนที่จากทุกโค้งผ่านคือกำหนดเป็นองค์ประกอบ , ด้วยแสดงถึงเส้นโค้ง (ฟังก์ชั่นจากเส้นจริงถึงพื้นผิวของท่อร่วมพี M (ψ: R M )P P, C (T) R , ( ψ ) ' (T)ψ M P,F,Fพี(M)pM(ψ:RM)p.p,C(t)R,(fψ)(t)ψM) วิ่งผ่านจุดและแสดงเป็นสีแดงบนแผนภาพด้านบน และหมายถึงฟังก์ชั่นทดสอบ "การ iso- " เส้นชั้นความสูงสีขาวแมปไปยังจุดเดียวกันบนเส้นจริงและล้อมรอบจุดPp,f,fp

ความเท่าเทียมกัน (หรือหนึ่งในสิ่งที่เทียบเท่ากับสถิติ) ถูกกล่าวถึงที่นี่และจะเกี่ยวข้องกับคำพูดต่อไปนี้:

หากพื้นที่พารามิเตอร์สำหรับตระกูลเอ็กซ์โพเนนเชียลมีชุดมิติเปิดแบบดังนั้นจะเรียกว่าอันดับเต็มs

ตระกูลเลขชี้กำลังที่ไม่ได้อยู่ในอันดับเต็มโดยทั่วไปเรียกว่าตระกูลเอ็กซ์โพเนนเชียลแบบโค้งเนื่องจากพื้นที่โดยทั่วไปของพารามิเตอร์คือส่วนโค้งในของมิติที่น้อยกว่า sRss.

เรื่องนี้ดูเหมือนจะทำให้การตีความของพล็อตดังนี้: พารามิเตอร์การกระจายตัว (ในกรณีของครอบครัวของการแจกแจงชี้แจง) อยู่บนท่อร่วมไอดี จุดข้อมูลในจะแมปไปยังบรรทัดบนท่อร่วมผ่านฟังก์ชันในกรณีของปัญหาการหาค่าเหมาะที่สุดแบบไม่เชิงเส้น นี่จะเป็นการคำนวณความเร็วของฟิสิกส์ในแบบคู่ขนาน: มองหาอนุพันธ์ของฟังก์ชันตามแนวลาดของ "iso-f" เส้น (อนุพันธ์ทิศทางในสีส้ม):ฟังก์ชั่นจะเล่นบทบาทของการปรับการเลือกพารามิเตอร์การกระจายตัวเป็นเส้นโค้ง ψ : RM( ψ ) ' ( T ) f : MR ψ fRψ:RMf(fψ)(t).f:MRψเดินทางไปตามเส้นชั้นความสูงของบนท่อร่วมไอดีf


พื้นหลังเพิ่มสิ่งที่:

จากหมายเหตุฉันเชื่อว่าแนวคิดเหล่านี้ไม่ได้เกี่ยวข้องกับการลดมิติข้อมูลที่ไม่ใช่เชิงเส้นใน ML ทันที พวกมันดูเหมือนเรขาคณิตข้อมูลมากขึ้น นี่คือคำพูด:

ที่สำคัญสถิติของแมนิโฟลด์นั้นแตกต่างจากการเรียนรู้ที่หลากหลาย หลังเป็นสาขาหนึ่งของการเรียนรู้เครื่องที่มีเป้าหมายคือการเรียนรู้นานาแฝงจากข้อมูล -valued โดยปกติมิติของใฝหามากมายแฝงน้อยกว่าnท่อร่วมแฝงอาจเป็นแบบเชิงเส้นหรือไม่เชิงเส้นขึ้นอยู่กับวิธีการเฉพาะที่ใช้ nRnn


ข้อมูลต่อไปนี้จากสถิติเกี่ยวกับ Manifolds ที่มีแอปพลิเคชันไปจนถึงการสร้างแบบจำลองรูปร่างโดยOren Freifeld :

ป้อนคำอธิบายรูปภาพที่นี่

ในขณะที่มักจะไม่เชิงเส้นเราสามารถเชื่อมโยงพื้นที่สัมผัสแสดงโดยเพื่อทุกจุดM เป็นพื้นที่เวกเตอร์ที่มีมิติเป็นเช่นเดียวกับที่ของMต้นกำเนิดของที่ หน้าหากถูกฝังในพื้นที่ Euclidean เราอาจคิดว่า เป็น subspace เลียนแบบเช่นนั้น: 1) มันแตะที่ ; 2) อย่างน้อยในพื้นที่อยู่ข้างด้านใดด้านหนึ่งอย่างสมบูรณ์ องค์ประกอบของ TpM เรียกว่าเวกเตอร์แทนเจนต์ทีพีเอ็มพีM T พีเอ็มเอ็มทีพีเอ็มพีเอ็มทีพีเอ็มเอ็มพีเอ็มMTpMpMTpMMTpMpMTpMMpM

[... ] บนแมนิโฟลด์แบบจำลองทางสถิติมักแสดงในพื้นที่สัมผัส

[ ... ]

[เราพิจารณาสองชุด] ชุดข้อมูลประกอบด้วยคะแนนใน :M

DL={p1,,pNL}M ;

DS={q1,,qNS}M

Letและแทนทั้งสองอาจจะเป็นที่รู้จักในจุดMสันนิษฐานว่าชุดข้อมูลสองชุดเป็นไปตามกฎทางสถิติต่อไปนี้:µLµSM

{logμL(p1),,logμL(pNL)}TμLM,logμL(pi)i.i.dN(0,ΣL) {logμS(q1),,logμS(qNS)}TμSM,logμS(qi)i.i.dN(0,ΣS)

[ ... ]

ในคำอื่น ๆ เมื่อจะแสดง (เป็นพาหะสัมผัส) ในพื้นที่สัมผัส (เพื่อ ) ที่ก็สามารถมองเห็นเป็นชุดของตัวอย่าง IID จากศูนย์เฉลี่ยเกาส์ที่มีความแปรปรวน\เช่นเดียวกันเมื่อจะแสดงในพื้นที่สัมผัสที่มันสามารถมองเห็นเป็นชุดของตัวอย่าง IID จากศูนย์เฉลี่ยเกาส์ที่มีความแปรปรวน\นี่เป็นกรณีของยุคลิดDLMμLΣLDSμSΣS

ในการอ้างอิงเดียวกันฉันพบตัวอย่างออนไลน์ (และในทางปฏิบัติเท่านั้น) ที่ใกล้เคียงที่สุดของแนวคิดกราฟิกนี้ที่ฉันถามเกี่ยวกับ:

ป้อนคำอธิบายรูปภาพที่นี่

นี่จะเป็นการบ่งบอกว่าข้อมูลอยู่บนพื้นผิวของท่อร่วมแสดงเป็นเวกเตอร์แทนเจนต์หรือไม่และพารามิเตอร์จะถูกแมปบนระนาบคาร์ทีเซียนหรือไม่?


1
คุณพยายามทำอะไรที่นี่ วาดนานา? ส่วนใหญ่วาดน่าเบื่อเกินไป ตัวอย่างเช่นลองใช้การแจกแจงแบบเกาส์
Aksakal

ฉันมักจะคิดว่าช่องว่างพารามิเตอร์เป็นช่องว่างเวกเตอร์เช่น n ถ้าฉันจะคิดว่าตัวแปร "แมนิโฟล" สิ่งแรกที่มาถึงใจจะเป็น "ระบบ จำกัด" เช่น 0 มิฉะนั้นทำไมพื้นที่ไม่ "สมบูรณ์" (การกำหนดชุดย่อยที่เป็น "manifold" คืออะไร)θRnf(θ)=0
GeoMatt22

2
หวังว่า @whuber จะเข้ามาและอธิบายรายละเอียดเกี่ยวกับความคิดเห็นของเขาในการแชท
gung - Reinstate Monica

1
คำตอบสั้น ๆ สำหรับคำถามที่คุณแก้ไขคือ "ไม่" พื้นที่แทนเจนต์จะอธิบายความเร็วของเส้นทางที่ราบเรียบทั้งหมดในนานา บทบาทหลักของมันในด้านสถิติคือการเพิ่มความเป็นไปได้สูงสุดซึ่งนานาอธิบายถึงตระกูลที่มีการกำหนดค่าอย่างละเอียด ใน "การเรียนรู้ของแมนิโฟลด์" การใช้แมนิโฟลด์นั้นใช้เป็นการประมาณค่าท้องถิ่นกับข้อมูลซึ่งเป็นเวอร์ชัน "โค้งของพื้นที่คอลัมน์" ในการถดถอยเชิงเส้น ที่นั่นพื้นที่แทนเจนต์ถูกฝังอยู่ภายในพื้นที่ยูคลิดโดยรอบ ในพื้นที่จะอธิบาย "ทิศทาง" ของข้อมูลและชุดข้อมูลปกติให้คำแนะนำ "ข้อผิดพลาด"
whuber

1
ใช่: พื้นที่โคแทนเจนต์ที่สามารถกำหนดเป็น derivations ของเชื้อโรคของฟังก์ชั่นรอบหน้าพื้นที่สัมผัสกันที่ (ดังนั้น!) เป็นเพียงสองของมัน และซื้อโครงสร้าง - นั่นคือยอมรับความคิดของสองช่องว่างสัมผัสและเป็น "ใกล้" - โดยวิธีการของการประสานงานชาร์ตบนมซึ่งจะช่วยลดความคมชัด (และปัญหาของการสร้างภาพ) เพื่อที่ของการกำหนดพื้นที่สัมผัส n นี้เป็นชุดของทุกเวกเตอร์ที่มีต้นกำเนิดที่xSpivak ในแคลคูลัสกับท่อร่วมไอดีTpMpppTMTMTpMTqMMTxRnx, ให้นิยามที่ชัดเจนและเป็นพื้นฐานของการจัดเรียงนี้
whuber

คำตอบ:


3

ตระกูลของการแจกแจงความน่าจะเป็นสามารถวิเคราะห์ได้ว่าเป็นจุดบนท่อร่วมที่มีพิกัดภายในที่สอดคล้องกับพารามิเตอร์ของการแจกแจง ความคิดคือการหลีกเลี่ยงการเป็นตัวแทนด้วยการวัดที่ไม่ถูกต้อง: Univariate Gaussiansสามารถลงจุดเป็นจุดใน Euclidean ที่อยู่ทางด้านขวาของพล็อตด้านล่าง ด้วยค่าเฉลี่ยใน -axis และ SD ในแกน (ครึ่งบวกในกรณีของการวางแผนความแปรปรวน):(Θ)N(μ,σ2),R2xy

ป้อนคำอธิบายรูปภาพที่นี่

อย่างไรก็ตามเมทริกซ์เอกลักษณ์ (ระยะทางแบบยุคลิด) จะไม่สามารถวัดระดับความคล้ายคลึงกันระหว่างบุคคลของ: บนเส้นโค้งปกติทางด้านซ้ายของพล็อตด้านบนให้ช่วงเวลาในโดเมน พื้นที่ที่ไม่ทับซ้อนกัน (เป็นสีน้ำเงินเข้ม) มีขนาดใหญ่กว่าสำหรับเส้นโค้งแบบเกาส์เซียนที่มีความแปรปรวนต่ำกว่าแม้ว่าค่าเฉลี่ยจะคงที่ ในความเป็นจริงตัวชี้วัดเท่านั้นรีมันว่า“ทำให้รู้สึก” สำหรับแมนิโฟลสถิติเป็นข้อมูลตัวชี้วัดฟิชเชอร์pdf

ในระยะห่างของข้อมูลฟิชเชอร์: การอ่านเชิงเรขาคณิต Costa SI, Santos SA และ Strapasson JE ใช้ประโยชน์จากความคล้ายคลึงกันระหว่างเมทริกซ์ข้อมูลฟิชเชอร์ของการแจกแจงแบบเกาส์และตัวชี้วัดในโมเดลดิสก์ Beltrami-Pointcaréเพื่อให้ได้สูตรปิด

กรวย "ทิศเหนือ" ของไฮเปอร์โบรด์กลายเป็น manifold ที่ไม่ใช่แบบยุคลิดซึ่งแต่ละจุดสอดคล้องกับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน (พื้นที่พารามิเตอร์) และระยะทางที่สั้นที่สุดระหว่างเช่นและในแผนภาพด้านล่างเป็นเส้นโค้งทางธรณีวิทยาฉาย (แผนที่แผนภูมิ) ลงบนระนาบเส้นศูนย์สูตรเป็นเส้นตรง hyperparabolic และเปิดใช้งานการวัดระยะทางระหว่างผ่านเมตริกซ์เมตริก - ตัวชี้วัดข้อมูลฟิชเชอร์ :x2+y2x2=1pdfs,PQ,pdfsgμν(Θ)eμeν

D(P(x;θ1),Q(x;θ2))=minθ(t)|θ(0)=θ1,θ(1)=θ201(dθdt)I(θ)dθdtdt

ด้วย

I(θ)=1σ2[1002]

ป้อนคำอธิบายรูปภาพที่นี่

แตกต่าง Kullback-Leiblerเกี่ยวข้องอย่างใกล้ชิดแม้จะขาดรูปทรงเรขาคณิตและตัวชี้วัดที่เกี่ยวข้อง

และเป็นที่น่าสนใจที่จะทราบว่าเมทริกซ์ข้อมูลฟิชเชอร์สามารถตีความได้ว่าเป็น Hessian ของเอนโทรปีของแชนนอน :

gij(θ)=E[2logp(x;θ)θiθj]=2H(p)θiθj

กับ

H(p)=p(x;θ)logp(x;θ)dx.

ตัวอย่างนี้จะคล้ายกันในแนวคิดในการร่วมกันมากขึ้นแผนที่โลก stereographic

ML การเรียนรู้ที่ฝังหลายมิติหรือการเรียนรู้ที่หลากหลายไม่ได้กล่าวถึงที่นี่


1

มีมากกว่าหนึ่งวิธีในการเชื่อมโยงความน่าจะเป็นกับเรขาคณิต ฉันแน่ใจว่าคุณเคยได้ยินเรื่องการกระจายวงรี (เช่น Gaussian) คำนี้แสดงถึงการเชื่อมโยงทางเรขาคณิตและชัดเจนเมื่อคุณวาดเมทริกซ์ความแปรปรวนร่วม ด้วย manifolds เพียงแค่วางค่าพารามิเตอร์ที่เป็นไปได้ทั้งหมดในระบบพิกัด ยกตัวอย่างเช่น Gaussian Manifold จะอยู่ในสองมิติ: 2 คุณสามารถมีค่าใด ๆแต่ความแปรปรวนในเชิงบวก 0 ดังนั้นนานาเสียนจะเป็นครึ่งหนึ่งของทั้งหมดพื้นที่ ไม่น่าสนใจμ,σ2μRσ2>0R2


ฉันคิดว่าฉันคิดว่า "ท่อร่วมไอดี" ควรจะมีขนาดต่ำกว่าพื้นที่ฝังตัวของมันหรือไม่? ดังนั้นhalfspaceจะไม่นับ?
GeoMatt22

ด้วยเสียนมันไม่ได้มีความหลากหลาย คุณจำเป็นต้องมีข้อ จำกัด ดังนั้นมันจะกลายเป็นชนิดของเครื่องบินหรือสายบาง
Aksakal

ฉันพยายามที่จะเข้าใจความหมายของคำตอบของคุณ ... คุณหมายถึง " ลิงค์เรขาคณิต"? นอกจากนี้ฉันเพิ่งพบการโพสต์ที่เกี่ยวข้องเกี่ยวกับเรื่องนี้ MathOverflow
Antoni Parellada

3
มันน่าสนใจยิ่งขึ้นด้วยการวัดที่เหมาะสม ... เช่น Fisher-Rao และจากนั้นกลายเป็น Poincare ซึ่งเกินความจริงครึ่งทางen.wikipedia.org/wiki/Poincar%C3%A9_half-plane_model
mic

2
สำหรับทุกคน: (1) แมนิโฟลด์ที่อธิบายตระกูลพาราเมทริกคือแมนิโฟลด์ภายใน : ไม่จำเป็นต้องฝังในพื้นที่เวคเตอร์ใด ๆ (2) พวกเขาเป็นมากกว่าความหลากหลายที่แตกต่างกัน: ข้อมูลการประมงทำให้พวกเขามีตัวชี้วัด Riemannian - ระยะทางในท้องถิ่น - ที่ช่วยให้พวกเขาสามารถศึกษาเรขาคณิตได้ นี่ทำให้ "ครึ่งหนึ่งของทั้งหมดช่องว่าง" เป็นพื้นผิวโค้ง R2
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.