ทำไมนักสถิติจึงกำหนดเมทริกซ์แบบสุ่ม?


18

ฉันเรียนคณิตศาสตร์เมื่อสิบปีที่แล้วดังนั้นฉันจึงมีภูมิหลังทางคณิตศาสตร์และสถิติ แต่คำถามนี้คือฆ่าฉัน

คำถามนี้ยังคงเป็นปรัชญาเล็กน้อยสำหรับฉัน ทำไมนักสถิติจึงพัฒนาเทคนิคทุกประเภทเพื่อทำงานกับเมทริกซ์แบบสุ่ม? ฉันหมายถึงเวกเตอร์สุ่มไม่แก้ปัญหาเหรอ? ถ้าไม่ใช่คอลัมน์เฉลี่ยที่แตกต่างกันของเมทริกซ์แบบสุ่มคืออะไร Anderson (2003, Wiley) พิจารณาเวกเตอร์สุ่มเป็นกรณีพิเศษของเมทริกซ์แบบสุ่มที่มีเพียงคอลัมน์เดียว

ฉันไม่เห็นจุดที่มีเมทริกซ์แบบสุ่ม (และฉันแน่ใจว่าเป็นเพราะฉันไม่รู้) แต่ทนกับฉัน ลองนึกภาพฉันมีโมเดลที่มีตัวแปรสุ่ม 20 ตัว ถ้าฉันต้องการคำนวณฟังก์ชั่นความน่าจะเป็นร่วมทำไมฉันถึงนึกภาพมันเป็นเมทริกซ์แทนที่จะเป็นเวกเตอร์

ฉันพลาดอะไรไป

PS: ฉันขอโทษสำหรับคำถามที่ติดแท็กไม่ดี แต่ยังไม่มีแท็กสำหรับการสุ่มเมทริกซ์และฉันยังไม่สามารถสร้างได้!

แก้ไข: เปลี่ยนเมทริกซ์เป็นเมทริกซ์ในชื่อเรื่อง


1
ฉันคิดว่าคุณมีความคิดที่ดีเกี่ยวกับมันเป็นเวกเตอร์แบบสุ่มที่ได้รับการปรับปรุงใหม่เพื่อให้เป็นเมทริกซ์
Matthew Gunn

2
อาจเป็นไปได้ที่เกี่ยวข้อง: en.wikipedia.org/wiki/Random_projection
dsaxton

9
คุณอาจถามว่าทำไมเมทริกซ์ถึงมีความสนใจ มันเป็นธรรมชาติที่สมบูรณ์แบบที่จะมองว่าเป็นเมทริกซ์สุ่มใด ๆ ที่ใช้เพื่อแสดงปรากฏการณ์ที่สังเกตหรือวัดในโลกแห่งความจริง สิ่งนี้ส่งผลให้มีประเภทและแบบจำลองที่เป็นไปได้สำหรับเมทริกซ์แบบสุ่มตั้งแต่เมทริกซ์แบบ adjacency ของกราฟแบบสุ่มไปจนถึงเมทริกซ์ความแปรปรวนร่วมตัวอย่างและอื่น ๆ
whuber

2
@ Aksakal ฉันคิดว่าประเด็นของ OP คือเมื่อไรที่จะมีประโยชน์ในการวิเคราะห์บางสิ่งในรูปแบบเมทริกซ์แบบสุ่ม เช่นในการจัดหมวดหมู่ภาพคุณมักจะเปลี่ยนเมทริกซ์ภาพเป็นเวกเตอร์ .. ไม่มีการวิเคราะห์เมทริกซ์ ดังนั้นความเห็นของ whuber คือคำตอบที่ดีที่สุด: เช่นเมทริกซ์ความแปรปรวนร่วมจะต้องเป็นกึ่งบวกแน่นอน - ถ้าคุณต้องการที่จะจำลองเมทริกซ์ความแปรปรวนร่วมแบบสุ่มมันง่ายกว่าที่จะทำงานกับสเปคเมทริกซ์มากกว่าเวกเตอร์
seanv507

2
เมทริกซ์แบบสุ่มเป็นเพียงกรณีพิเศษของเทนเซอร์แบบสุ่ม
Anony-Mousse - Reinstate Monica

คำตอบ:


23

มันขึ้นอยู่กับว่าคุณอยู่ในสาขาใด แต่หนึ่งในการผลักดันเริ่มต้นครั้งใหญ่ครั้งใหญ่สำหรับการศึกษาเมทริกซ์แบบสุ่มนั้นเกิดขึ้นจากวิชาฟิสิกส์ปรมาณูและได้รับการริเริ่มโดย Wigner คุณสามารถค้นหาสั้น ๆภาพรวมที่นี่ โดยเฉพาะมันคือค่าลักษณะเฉพาะ (ซึ่งเป็นระดับพลังงานในฟิสิกส์อะตอมมิก) ของเมทริกซ์แบบสุ่มที่สร้างความสนใจเป็นตันเนื่องจากความสัมพันธ์ระหว่างค่าลักษณะเฉพาะนั้นให้ข้อมูลเชิงลึกเกี่ยวกับสเปกตรัมการปล่อยของกระบวนการสลายนิวเคลียร์

เมื่อเร็ว ๆ นี้ได้มีการฟื้นตัวที่มีขนาดใหญ่ในด้านนี้กับการถือกำเนิดของเทรซี่-Widomกระจาย / s สำหรับค่าลักษณะเฉพาะที่ใหญ่ที่สุดของการฝึกอบรมแบบสุ่มพร้อมกับสวยงามการเชื่อมต่อไปยังเขตที่ดูเหมือนไม่เกี่ยวข้องเช่นทฤษฎีการปูกระเบื้อง , สถิติฟิสิกส์integrable ระบบ , ปรากฏการณ์ KPZ , combinatorics สุ่มและแม้แต่Riemann สมมุติฐาน คุณสามารถค้นหาตัวอย่างบางส่วนเพิ่มเติมที่นี่

สำหรับตัวอย่างจากพื้นดินมากขึ้นคำถามธรรมชาติที่ถามเกี่ยวกับเมทริกซ์ของเวกเตอร์แถวคือลักษณะของส่วนประกอบ PCA คุณสามารถรับการประมาณค่าฮิวริสติกสำหรับสิ่งนี้โดยสมมติว่าข้อมูลมาจากการกระจายตัวและจากนั้นดูค่าความแปรปรวนร่วมเมทริกซ์ความแปรปรวนร่วมซึ่งจะถูกทำนายจากการสุ่มแบบสากลเมทริกซ์โดยไม่คำนึงถึง (ภายในเหตุผล) ค่าลักษณะเฉพาะจะเข้าใกล้ชุดของคลาสที่รู้จักเสมอ คุณสามารถคิดว่านี่เป็น CLT ชนิดหนึ่งสำหรับเมทริกซ์แบบสุ่ม ดูกระดาษนี้สำหรับตัวอย่าง


ขอบคุณสำหรับคำตอบ. ฉันสงสัยว่ามันอาจเชื่อมโยงกับเทคนิคทางคณิตศาสตร์บางอย่าง ตอนนี้มันเข้ากันได้ดีทุกอย่างแล้วฟิสิกส์มักจะเป็นวิชาคณิตศาสตร์เสมอ
Eduardo

กระดาษของ Wigner อยู่ในช่วงกลางปี ​​1950 กระดาษของ Wishart อยู่ในช่วงปลายปี 1920 ดังนั้นจึงเป็นการยากที่จะอ้างว่า Wigner ให้แรงผลักดันครั้งใหญ่ครั้งแรกในความคิดของฉัน
Aksakal

13

ดูเหมือนว่าคุณจะสบายใจกับการใช้งานของเวกเตอร์แบบสุ่ม ตัวอย่างเช่นฉันจัดการกับเวกเตอร์สุ่มชนิดนี้ทุกวันอัตราดอกเบี้ยของอายุที่แตกต่างกัน Federal Reserve Bank มีซีรี่ส์ H15ดูตั๋วเงินคลัง 4 สัปดาห์ 3 เดือน 6 ​​เดือนและ 1 ปี คุณสามารถคิดถึงอัตรา 4 เหล่านี้เป็นเวกเตอร์ที่มี 4 องค์ประกอบ มันก็สุ่มแบบสุ่มด้วยดูที่คุณค่าทางประวัติศาสตร์ของเนื้อเรื่องด้านล่าง

ป้อนคำอธิบายรูปภาพที่นี่

เช่นเดียวกับตัวเลขสุ่มใด ๆ ที่เราอาจถามตัวเองความแปรปรวนระหว่างพวกเขาคืออะไร? ตอนนี้คุณได้เมทริกซ์ความแปรปรวนร่วม 4x4 หากคุณประเมินจากข้อมูลรายวันหนึ่งเดือนคุณจะได้รับเมทริกซ์ความแปรปรวนร่วมที่แตกต่างกัน 12 ครั้งในแต่ละปี เมทริกซ์ความแปรปรวนร่วมตัวอย่างของซีรีย์สุ่มนั้นเป็นวัตถุสุ่มดูที่กระดาษของ Wishart "การกระจายช่วงเวลาผลิตภัณฑ์ทั่วไปในตัวอย่างจากประชากรที่หลากหลายหลายรูปแบบ" ที่นี่ มีการแจกแจงเรียกหลังจากเขา

นี่เป็นวิธีหนึ่งในการไปหาเมทริกซ์แบบสุ่ม ไม่น่าแปลกใจที่ทฤษฎีเมทริกซ์แบบสุ่ม (RMT) ถูกนำมาใช้ในด้านการเงินอย่างที่คุณเห็นในตอนนี้


1
คุณพูดถึงการประมาณใน "ข้อมูลหนึ่งเดือน" คุณหมายถึง "ข้อมูลรายวันมูลค่าหนึ่งเดือน" หรือไม่?
จอห์น

1
@John ในตัวอย่างนี้ใช่ทุกวัน อย่างไรก็ตามบางซีรีย์ถูกวัดในวันเช่นราคาตราสารทุน หากคุณมีพอร์ทการลงทุนคุณจะได้รับเมทริกซ์ความแปรปรวนร่วมระหว่างวันที่ความถี่สูงมาก
Aksakal

3
+1 การถอดความที่นี่ แต่ฉันคิดว่าวิธีหนึ่งที่จะกระตุ้นเมทริกซ์แบบสุ่มคือในกรณีนี้เรามักจะสนใจในความสัมพันธ์ระหว่างเวกเตอร์แบบสุ่ม (ไม่ใช่ภายใน) สิ่งนี้กระตุ้นให้เกิดความคิดเกี่ยวกับเมทริกซ์แทนเวกเตอร์
หน้าผา AB

@Aksakal ข้อมูลที่คุณพูดถึงมีความถี่เป็นรายเดือนเช่นเดียวกับรายวัน ฉันพบว่ามันสับสนก่อนที่คุณจะแก้ไขโพสต์เพราะมันไม่สมเหตุสมผลที่จะประเมินเมทริกซ์ความแปรปรวนร่วมโดยใช้ข้อมูลเดือนหนึ่งเดือน
จอห์น

@ จอห์นคุณสามารถประเมินเมทริกซ์ความแปรปรวนร่วมกับข้อมูลรายเดือนหรือรายสัปดาห์ซ้อนทับหรือไม่ทับซ้อน ฯลฯ ไม่มีวิธีที่ถูกต้องในการทำเช่นนี้
Aksakal

8

ในการฝึกอบรมเชิงฟิสิกส์เชิงทฤษฎีมีบทบาทสำคัญในการทำความเข้าใจคุณสมบัติสากลของสเปกตรัมพลังงานของระบบที่มีสมมาตรเฉพาะ

ภูมิหลังทางฟิสิกส์เชิงทฤษฎีของฉันอาจทำให้ฉันมีมุมมองที่ลำเอียงเล็กน้อยที่นี่ แต่ฉันยังอยากจะแนะนำว่าความนิยมของทฤษฎีเมทริกซ์แบบสุ่ม (RMT) มาจากการประยุกต์ใช้ที่ประสบความสำเร็จในวิชาฟิสิกส์

โดยไม่ต้องลงรายละเอียดมากเกินไปตัวอย่างเช่นพลังงานสเป็คตรัมในกลศาสตร์ควอนตัมสามารถรับได้โดยการคำนวณค่าลักษณะเฉพาะของระบบมิลโตเนียน - ซึ่งสามารถแสดงเป็นเมทริกซ์ฤาษี บ่อยครั้งที่นักฟิสิกส์ไม่สนใจระบบใดเป็นพิเศษ แต่ต้องการรู้ว่าคุณสมบัติทั่วไปของระบบควอนตัมที่มีคุณสมบัติที่วุ่นวายซึ่งนำค่าของเมทริกซ์แฮมิลตันเฮอร์มิเนียนเพื่อเติมเมทริกซ์ - อวกาศตามหลักการของพลังงานหรือพารามิเตอร์อื่น ๆ เช่นเงื่อนไขขอบเขต) สิ่งนี้เป็นแรงกระตุ้นให้รักษาคลาสของระบบกายภาพเป็นเมทริกซ์แบบสุ่มและดูคุณสมบัติโดยเฉลี่ยของระบบเหล่านี้ ฉันขอแนะนำวรรณคดีเกี่ยวกับการคาดเดา Bohigas-Gianonni-Schmidt หากคุณต้องการดำดิ่งลึกลงไปในนี้

กล่าวโดยย่อหนึ่งสามารถแสดงให้เห็นว่าระดับพลังงานของระบบที่มีการย้อนเวลาสมมาตรมีพฤติกรรมที่แตกต่างจากระดับพลังงานของระบบที่ไม่มีเวลาย้อนกลับสมมาตร (ซึ่งเกิดขึ้นเช่นถ้าคุณเพิ่มสนามแม่เหล็ก) อันที่จริงแล้วการคำนวณค่อนข้างสั้นโดยใช้เมทริกซ์สุ่มเกาส์เซียนสามารถแสดงให้เห็นว่าระดับพลังงานมีแนวโน้มที่จะใกล้เคียงกันในทั้งสองระบบ

ผลลัพธ์เหล่านี้สามารถขยายและช่วยให้เข้าใจถึงสมมาตรอื่น ๆ ซึ่งมีผลกระทบสำคัญในสาขาต่าง ๆ เช่นฟิสิกส์ของอนุภาคหรือทฤษฎีของการขนส่ง mesoscopic และต่อมาแม้ในตลาดการเงิน


1
นี่คือเหตุผลที่ฉันออกจากฟิสิกส์ :) "สมองเสียหาย"
Aksakal

นักสถิติอย่าง Wishart ที่ซึ่งก่อนหน้านักฟิสิกส์ปรมาณู
kjetil b halvorsen

5

แผนที่เชิงเส้นคือแผนที่ระหว่างปริภูมิเวกเตอร์ สมมติว่าคุณมีแผนที่เชิงเส้นและได้เลือกเบสสำหรับโดเมนและพื้นที่เว้นวรรค จากนั้นคุณสามารถเขียนเมทริกซ์ที่เข้ารหัสแผนที่เชิงเส้น หากคุณต้องการพิจารณาแผนที่เชิงเส้นแบบสุ่มระหว่างสองช่องว่างคุณควรพิจารณาทฤษฎีของเมทริกซ์แบบสุ่ม การฉายแบบสุ่มเป็นตัวอย่างที่ง่ายของสิ่งนั้น

นอกจากนี้ยังมีวัตถุที่มีค่าเมทริกซ์ / เทนเซอร์ในฟิสิกส์ เน้นเมตริกซ์หนืดดังกล่าวเป็นหนึ่ง (ในสวนสัตว์จริง) ในวัสดุ viscoelastic ที่เป็นเนื้อเดียวกันเกือบจะเป็นประโยชน์ในการสร้างแบบจำลองของสายพันธุ์ (elastic, viscous, et al.) และด้วยเหตุนี้ความเค้นจะถูกกำหนดเป็นแบบเทนเซอร์แบบสุ่มที่มีความแปรปรวนเล็กน้อย แม้ว่าจะมีความรู้สึก "แผนที่เชิงเส้น" สำหรับความเครียด / ความเครียดนี้มันมีความซื่อสัตย์มากกว่าที่จะอธิบายแอพพลิเคชั่นของเมทริกซ์แบบสุ่มว่าเป็นการสุ่มบางสิ่งที่เป็นเมทริกซ์อยู่แล้ว


4

การตรวจจับแรงกดเป็นแอปพลิเคชั่นในการประมวลผลภาพอาศัยการฝึกอบรมแบบสุ่มเป็นการวัดแบบรวมของสัญญาณ 2D คุณสมบัติเฉพาะของเมทริกซ์เหล่านี้คือการเชื่อมโยงกันถูกกำหนดไว้สำหรับเมทริกซ์เหล่านี้และมีบทบาทในทางทฤษฎี

ลดความซับซ้อนลงอย่างสิ้นเชิงปรากฎว่าการลดบรรทัดฐาน L1 ของผลิตภัณฑ์บางตัวของเมทริกซ์เกาส์เซียนและสัญญาณอินพุตแบบเบาบางช่วยให้คุณสามารถกู้คืนข้อมูลได้มากกว่าที่คุณคาดหวัง

งานวิจัยที่น่าสนใจที่สุดในช่วงนี้ที่ฉันรู้จักคืองานของมหาวิทยาลัยไรซ์: http://dsp.rice.edu/research/compressive-sensing/random-matrices

ทฤษฎีของผลิตภัณฑ์เมทริกซ์เป็น "การวัดสัญญาณ" อย่างน้อยก็ย้อนกลับไปถึง WW2 ในฐานะที่เป็นอดีตศาสตราจารย์ของฉันเล่าให้ฉันฟังทีละรายการทดสอบกองทัพทุกคนเพื่อพูดซิฟิลิสเป็นค่าใช้จ่ายต้องห้าม การผสมตัวอย่างเหล่านี้เข้าด้วยกันอย่างเป็นระบบ (โดยการผสมบางส่วนของตัวอย่างเลือดแต่ละชิ้นเข้าด้วยกันและทำการทดสอบ) จะช่วยลดจำนวนครั้งที่ต้องทำการทดสอบ นี่อาจเป็นแบบจำลองเป็นเวกเตอร์ไบนารีแบบสุ่มคูณด้วยเมทริกซ์กระจัดกระจาย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.