เอกสารสำคัญเกี่ยวกับการย่อยสลายเมทริกซ์


18

ฉันเพิ่งอ่านหนังสือของ Skillicorn เกี่ยวกับการย่อยสลายเมทริกซ์และผิดหวังเล็กน้อยเนื่องจากเป็นเป้าหมายสำหรับผู้ชมระดับปริญญาตรี ฉันต้องการรวบรวม (สำหรับตัวฉันเองและคนอื่น ๆ ) โดยสังเขปสั้น ๆ เกี่ยวกับเอกสารสำคัญ (การสำรวจ แต่ยังรวมถึงเอกสารที่ก้าวหน้า) เกี่ยวกับการย่อยสลายเมทริกซ์ สิ่งที่ฉันมีอยู่ในใจเป็นหลักคือบางสิ่งบางอย่างใน SVD / PCA (และตัวแปรที่แข็งแกร่ง / กระจัดกระจาย) และ NNMF เนื่องจากมีการใช้งานมากที่สุด คุณมีคำแนะนำ / ข้อเสนอแนะหรือไม่? ฉันถือของฉันไม่อคติคำตอบ ฉันขอให้ จำกัด คำตอบให้กับกระดาษ 2-3 ข้อ

PS: ผมหมายถึงทั้งสอง decompositions เป็นที่ใช้มากที่สุดในการวิเคราะห์ข้อมูล แน่นอนว่า QR, Cholesky, LU และ polar มีความสำคัญมากในการวิเคราะห์เชิงตัวเลข นั่นไม่ใช่จุดเน้นของคำถามของฉัน

คำตอบ:


16

คุณจะรู้ได้อย่างไรว่า SVD และ NMF นั้นเป็นเมทริกซ์ที่ใช้กันมากที่สุดแทนที่จะเป็น LU, Cholesky และ QR 'การพัฒนา' ที่ชื่นชอบส่วนตัวของฉันจะต้องเป็นอัลกอริทึม QR เปิดเผยอันดับรับประกัน

  • ชานโทนี่เอฟ "อันดับเปิดเผยข้อมูล QR" พีชคณิตเชิงเส้นและแอปพลิเคชั่นเล่ม 88-89, เมษายน 2530, หน้า 67-82 DOI: 10.1016 / 0024-3795 (87) 90103-0

... การพัฒนาความคิดก่อนหน้าของ QR ด้วยการหมุนคอลัมน์:

  • Businger, Peter; Golub, Gene H. (1965) โซลูชั่นกำลังสองน้อยเชิงเส้นโดยการแปลงเจ้าของ Numerische Mathematikเล่มที่ 7, หมายเลข 3, 269-276, DOI: 10.1007 / BF01436084

A ( ?) ตำราคลาสสิก:

  • Golub, ยีน H.; สินเชื่อแวน, ชาร์ลส์เอฟ (1996) เมทริกซ์คำนวณ (3rd ed.), Johns Hopkins, ไอ978-0-8018-5414-9

(ฉันรู้ว่าคุณไม่ได้ขอหนังสือเรียน แต่ฉันไม่สามารถต้านทานได้)

แก้ไข: googling อีกเล็กน้อยพบกระดาษที่มีบทคัดย่อแสดงให้เห็นว่าเราอาจจะเป็นเรื่องเล็กน้อยที่ข้าม porpoises ข้อความด้านบนของฉันมาจากมุมมอง 'พีชคณิตเชิงเส้นเชิงตัวเลข' (NLA) คุณอาจกังวลมากกว่านี้กับมุมมอง 'สถิติที่ใช้ / psychometrics' (AS / P) คุณช่วยอธิบายได้ไหม?


2
ฉันจะบอกว่า "ตำราเรียน" ตัวเองด้วยMatrix Algorithmsของ Stewart ( ทั้งสอง ส่วน ) ในไม่ช้า ฉันจะให้รายการเอกสารบุกเบิกด้วยตัวเอง แต่ OP ควรอธิบายหากเขาต้องการมุมมองตัวเลขหรือมุมมองสถิติ (ฉันสามารถช่วยกับอดีต แต่ไม่มากหลัง)
JM ไม่ใช่นักสถิติ

1
+1 สำหรับ Golub และ Van Loan และใช่บทความที่ชัดเจนมีความเหมาะสม
shabbychef

2
ฉันแก้ไขคำถามของฉันเพื่อชี้แจงว่าฉันมุ่งเน้นที่ส่วนของสถิติ ฉันเห็นด้วยกับทุกคนว่า Golub และ Van Loan เป็นข้อมูลอ้างอิงมาตรฐานสำหรับการสลายตัวของเมทริกซ์ แต่มันตัดหัวข้อของการย่อยสลายขนาดใหญ่มากผ่านการฉายแบบสุ่ม กระดาษสำรวจที่ฉันจะใส่ในรายการของฉันคือ "โครงสร้างการค้นหาด้วยการสุ่ม: อัลกอริธึม Stochastic สำหรับการสร้างการย่อยสลายเมทริกซ์โดยประมาณ" โดย Halko et al
Gappy

4

สำหรับ NNMF นั้น Lee และ Seung อธิบายถึงอัลกอริธึมซ้ำ ๆ ซึ่งง่ายมากในการนำไปใช้ ที่จริงแล้วพวกมันให้อัลกอริธึมที่คล้ายกันสองอันอันหนึ่งสำหรับการลดบรรทัดฐาน Frobenius ของสิ่งตกค้างอีกอันหนึ่งเพื่อลด Kullback-Leibler Divergence ของการประมาณและเมทริกซ์ดั้งเดิม


3

บางทีคุณอาจพบว่าน่าสนใจ

  1. [เรียนรู้ด้วยเมทริกซ์ Factorizations]วิทยานิพนธ์ระดับปริญญาเอกโดย Nathan Srebro
  2. [การตรวจสอบวิธีการแยกตัวประกอบเมทริกซ์ที่หลากหลายสำหรับระบบผู้แนะนำขนาดใหญ่] , GáborTakács et.al. และเกือบเทคนิคเดียวกันอธิบายไว้ที่นี่

ลิงก์สองลิงค์สุดท้ายแสดงว่ามีการใช้เมทริกซ์แบบกระจายข้อเท็จจริงในการกรองแบบร่วมมือกันได้อย่างไร อย่างไรก็ตามฉันเชื่อว่าอัลกอริธึมการแยกตัวประกอบแบบ SGD จะมีประโยชน์ในที่อื่น (อย่างน้อยพวกมันก็ง่ายในการเขียนโค้ด)


2

Witten, Tibshirani - การสลายตัวของเมทริกซ์ถูกลงโทษ

http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf

http://cran.r-project.org/web/packages/PMA/index.html

Martinsson, Rokhlin, Szlam, Tygert - SVD แบบสุ่ม

http://cims.nyu.edu/~tygert/software.html

http://cims.nyu.edu/~tygert/blanczos.pdf


5
ขอบคุณ ฉันรู้ว่าเอกสารทั้งสอง ฉันไม่ใช่แฟนตัวยงของ Witten [ไม่ใช่ Whitten] และคนอื่น ๆ เนื่องจากฉันคิดว่ามีเอกสารสำคัญมากกว่าเกี่ยวกับการย่อยสลายแบบเบาบาง ใน SVD แบบสุ่มฉันชอบบทความทบทวน "โครงสร้างการค้นหาที่มีการสุ่ม: อัลกอริธึม Stochastic สำหรับการสร้างการย่อยสลายเมทริกซ์โดยประมาณ" ( arxiv.org/abs/0909.4061 ) ยังได้รับอนุญาตจาก Martinsson
Gappy

ฉันเห็นด้วย. ฉันแค่เอาเอกสาร 2 เล่มที่ไม่มีใครพูดถึง
pslice

2

ที่ปีนี้NIPSมีกระดาษสั้น ๆ เกี่ยวกับการกระจายขนาดใหญ่มาก SVD ที่ทำงานในบัตรเดียวมากกว่าเมทริกซ์การป้อนข้อมูลสตรีมมิ่ง

การใช้งานที่มุ่งเน้นมากขึ้นกระดาษ แต่ใส่สิ่งในมุมมองกับเวลานาฬิกาแขวนจริงและ ตารางใกล้จุดเริ่มต้นเป็นการสำรวจที่ดีเช่นกัน


NIPS หมายถึงอะไร
onestop

เพิ่ม @onestop ลิงก์แล้ว NIPS = ระบบประมวลผลข้อมูลประสาท มันเป็นชุมชน (ไม่ใช่ระบบ :)) แต่ pisk กำลังพูดเกี่ยวกับการประชุม NIPS 2010
robin girard
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.