การวิเคราะห์องค์ประกอบหลักและการปรับสเกลหลายมิติแตกต่างกันอย่างไร


133

PCA และ MDS แบบคลาสสิคแตกต่างกันอย่างไร วิธีการเกี่ยวกับ MDS เมื่อเทียบกับที่ไม่ใช่ MDS? มีเวลาที่คุณจะชอบอีกอันไหม? การตีความต่างกันอย่างไร

คำตอบ:


95

การวัด MDS แบบคลาสสิคของTorgersonนั้นกระทำโดยการเปลี่ยนระยะทางเป็นความคล้ายคลึงและทำการ PCA (eigen-decomposition หรือเอกพจน์ - ค่า - การสลายตัว) บนเหล่านั้น [ชื่ออื่นของขั้นตอนนี้ ( distances between objects -> similarities between them -> PCAโดยที่การโหลดเป็นพิกัดที่ต้องการ) คือการวิเคราะห์พิกัดหลักหรือPCoA ] ดังนั้น PCA อาจถูกเรียกว่าอัลกอริธึมของ MDS ที่ง่ายที่สุด

Non-metric MDS ขึ้นอยู่กับขั้นตอนวิธี ALSCAL หรือ PROXSCAL แบบวนซ้ำ (หรืออัลกอริทึมที่คล้ายกัน) ซึ่งเป็นเทคนิคการทำแผนที่ที่หลากหลายกว่า PCA และสามารถนำไปใช้กับ MDS ของเมตริกได้เช่นกัน ในขณะที่ PCA ยังคง เมตรมิติที่สำคัญสำหรับคุณ ALSCAL / PROXSCAL เหมาะกับการกำหนดค่าเมตรขนาด (คุณก่อนกำหนดเมตร ) และผลิตซ้ำความแตกต่างบนแผนที่ขึ้นโดยตรงและถูกต้องกว่า PCA มักจะสามารถ (ดูส่วนภาพประกอบด้านล่าง)

ดังนั้น MDS และ PCA อาจไม่อยู่ในระดับเดียวกันที่จะเข้าแถวหรือตรงกันข้ามกัน PCA เป็นเพียงวิธีการในขณะที่ MDS เป็นระดับของการวิเคราะห์ ขณะทำแผนที่ PCA เป็นกรณีเฉพาะของ MDS ในอีกทางหนึ่ง PCA เป็นกรณีเฉพาะของการวิเคราะห์ปัจจัยซึ่งเป็นการลดข้อมูลเป็นมากกว่าการทำแผนที่ในขณะที่ MDS เป็นเพียงการทำแผนที่

สำหรับคำถามของคุณเกี่ยวกับตัวชี้วัด MDS เทียบกับตัวชี้วัดที่ไม่ใช่ตัวชี้วัดมีความคิดเห็นเพียงเล็กน้อยเพราะคำตอบนั้นตรงไปตรงมา ถ้าฉันเชื่อว่าความแตกต่างของอินพุตของฉันนั้นใกล้เคียงกับระยะทางแบบยุคลิดที่การแปลงเชิงเส้นจะเพียงพอต่อการแมปพวกมันในพื้นที่มิติ m ฉันจะชอบ MDS ตัวชี้วัด หากฉันไม่เชื่อการแปลงแบบโมโนโทนิกก็จำเป็นต้องใช้ MDS ที่ไม่ใช่ตัวชี้วัด


หมายเหตุเกี่ยวกับคำศัพท์สำหรับผู้อ่าน ภาคเรียนคลาสสิก (al) MDS (CMDS) สามารถมีความหมายที่แตกต่างกันสองแบบในวรรณกรรมอันกว้างขวางบน MDS ดังนั้นจึงเป็นสิ่งที่คลุมเครือและควรหลีกเลี่ยง คำจำกัดความหนึ่งคือ CMDS เป็นคำพ้องความหมายของ MDS ของ Torgerson อีกคำจำกัดความคือ CMDS คือ MDS ใด ๆ (โดยอัลกอริธึมใด ๆ การวิเคราะห์เมทริกหรืออเมทริก) ด้วยอินพุตเมทริกซ์เดียว (สำหรับแบบจำลองที่มีอยู่วิเคราะห์เมทริกซ์จำนวนมากในคราวเดียว - โมเดล "INDSCAL" และโมเดลจำลอง


ภาพประกอบคำตอบ cloud of points (ellipse) บางจุดถูกแมปบน mds-map แบบหนึ่งมิติ จุดคู่นั้นจะแสดงเป็นจุดสีแดง

ป้อนคำอธิบายรูปภาพที่นี่

DoDm22D o - D m 1Do2Dm21DoDm1

MDS ที่ใช้ PCA (Torgerson's หรือ PCoA) ไม่ตรง มันช่วยลดระยะห่างกำลังสองระหว่างวัตถุในอวกาศดั้งเดิมและรูปภาพของพวกมันบนแผนที่ นี่ไม่ใช่งาน MDS ของแท้ มันสำเร็จเป็น MDS เพียงเท่าที่แกนหลักจูเนียร์ทิ้งจะอ่อนแอ หากอธิบายความแปรปรวนได้มากกว่าในอดีตสามารถสะท้อนระยะทางคู่ในคลาวด์อย่างมีนัยสำคัญโดยเฉพาะอย่างยิ่งสำหรับจุดที่อยู่ห่างกันไปตามวงรี ซ้ำ MDS จะชนะเสมอและโดยเฉพาะอย่างยิ่งเมื่อต้องการแผนที่ในมิติต่ำมาก การทำซ้ำ MDS จะประสบความสำเร็จมากขึ้นเมื่อรูปวงรีเมฆบาง แต่จะเติม mds-task ให้ดีกว่า PCoA โดยคุณสมบัติของเมทริกซ์การคูณสองครั้ง (อธิบายไว้ที่นี่P 2D o 2 2 - D m 2 2P1P2) ปรากฏว่า PCoA ย่อขนาดเล็กสุดซึ่งแตกต่างจากการย่อเล็กสุดใด ๆ ข้างต้นDo22Dm22

อีกครั้ง PCA แสดงคะแนนของคลาวด์ในพื้นที่ย่อยประหยัดทั้งองค์กรที่ได้เปรียบมากที่สุด มันไม่ได้โครงการระยะทางจากจำนวนสถานที่ญาติของจุดบนสเปซประหยัดมากที่สุดในที่เคารพเป็นซ้ำ MDS ไม่ได้ อย่างไรก็ตามในอดีต PCoA / PCA ถือเป็นวิธีการหนึ่งในการวัด MDS


3
(+1) ฉันชอบคำตอบทั้งคู่ซึ่งอันนี้อาจมากกว่า
Dmitrij Celov

ลิงค์ของ PDF ที่เกี่ยวข้องกับ PCoA มันสามารถพบได้บนเก็บถาวรของเว็บ: web.archive.org/web/20160315120635/http://forrest.psych.unc.edu/ …
ปิแอร์

49

เอ่อ ... ค่อนข้างแตกต่าง ใน PCA คุณจะได้รับข้อมูลต่อเนื่องหลายตัวแปร (เวกเตอร์หลายตัวแปรสำหรับแต่ละเรื่อง) และคุณพยายามคิดว่าคุณไม่ต้องการมิติหลายมิติในการทำให้เป็นแนวคิด ใน (ตัวชี้วัด) MDS คุณจะได้รับเมทริกซ์ของระยะทางระหว่างวัตถุและคุณพยายามที่จะหาตำแหน่งของวัตถุเหล่านี้ในอวกาศ (และคุณต้องการพื้นที่ 1D, 2D, 3D และอื่น ๆ ) ใน MDS ที่ไม่ใช่ตัวชี้วัดคุณรู้เพียงว่าวัตถุ 1 และ 2 นั้นอยู่ไกลกว่าวัตถุ 2 และ 3 ดังนั้นคุณจึงลองหาจำนวนนั้นเพื่อหามิติและตำแหน่ง

ด้วยจินตนาการที่เด่นชัดคุณสามารถพูดได้ว่าเป้าหมายทั่วไปของ PCA และ MDS คือการมองเห็นวัตถุในแบบ 2D หรือ 3D แต่เนื่องจากอินพุตแตกต่างกันวิธีการเหล่านี้จะไม่ถูกกล่าวถึงแม้จะเกี่ยวข้องกันในตำราเรียนหลายตัวแปรก็ตาม ฉันเดาว่าคุณสามารถแปลงข้อมูลที่ใช้งานได้สำหรับ PCA เป็นข้อมูลที่ใช้งานได้สำหรับ MDS (เช่นโดยการคำนวณระยะทาง Mahalanobis ระหว่างวัตถุโดยใช้เมทริกซ์ความแปรปรวนร่วมตัวอย่าง) แต่นั่นจะทำให้สูญเสียข้อมูลทันที: MDS ถูกกำหนดขึ้นเท่านั้น ไปยังตำแหน่งและการหมุนและสองหลังสามารถทำได้อย่างไม่เป็นทางการมากขึ้นด้วย PCA

ถ้าฉันจะแสดงผลลัพธ์ของ MDS ที่ไม่ใช่เมตริกอย่างคร่าวๆและต้องการให้พวกเขารู้คร่าวๆว่ามันทำอะไรโดยไม่ต้องลงรายละเอียดฉันสามารถพูดได้ว่า:

ด้วยมาตรการของความคล้ายคลึงกันหรือความแตกต่างที่เรามีเราพยายามทำแผนที่วัตถุ / วัตถุของเราในลักษณะที่ 'เมือง' ที่พวกเขาประกอบขึ้นมีระยะทางระหว่างพวกเขาที่ใกล้เคียงกับความคล้ายคลึงกันมากที่สุดเท่าที่เราจะทำได้ แต่เราสามารถแมปพวกมันได้อย่างสมบูรณ์ในพื้นที่มิติดังนั้นฉันจึงแสดงสองมิติข้อมูลมากที่สุดที่นี่ - เหมือนอย่างที่คุณจะทำใน PCA ถ้าคุณแสดงภาพที่มีองค์ประกอบหลักสองตัวn


18
PCA ไม่ได้ใช้กับเมทริกซ์สหสัมพันธ์เท่ากับ MDS ที่มีระยะทางแบบยุคลิดที่คำนวณโดยตัวแปรมาตรฐานหรือไม่?
chl

ดังนั้นถ้าฉันจะแสดงผลลัพธ์ของ MDS ที่ไม่ใช่ตัวชี้วัดสั้น ๆ และต้องการให้พวกเขารู้คร่าวๆเกี่ยวกับสิ่งที่มันทำโดยไม่ต้องลงรายละเอียดฉันสามารถพูดว่า "สิ่งนี้คล้ายกับ PCA" โดยไม่ทำให้เข้าใจผิดหรือไม่?
Freya Harrison

6
ฉันจะบอกว่า "ด้วยมาตรการของความคล้ายคลึงกันหรือความแตกต่างที่เรามีเราพยายามทำแผนที่วัตถุ / วิชาของเราในแบบที่ 'เมือง' ที่พวกเขาประกอบขึ้นมีระยะทางระหว่างพวกเขาที่ใกล้เคียงกับมาตรการความคล้ายคลึงกันเหล่านี้ เราสามารถสร้างมันได้เราทำได้เพียงแมปมันอย่างสมบูรณ์แบบในพื้นที่ -dimensional ดังนั้นฉันจึงแสดงมิติข้อมูลมากที่สุดที่นี่ - เหมือนกับว่าคุณจะทำอะไรใน PCA ถ้าคุณแสดงภาพด้วยองค์ประกอบหลักสองตัว " n
StasK

+1 ยอดเยี่ยมสำหรับฉันความคิดเห็นนี้ผูกคำตอบของคุณไว้อย่างดี ขอบคุณ
Freya Harrison

47

MDS สองประเภท

งานการวัดมาตราส่วนหลายมิติ (MDS) สามารถสรุปได้ดังนี้: ให้เมทริกซ์ ของระยะทางระหว่างคู่ระหว่างคะแนนหาจุดต่ำ - มิติฝังจุดข้อมูลในเช่นนั้น ยูคลิดระยะทางระหว่างพวกเขาประมาณระยะทางที่กำหนด:D n R kxฉัน - xเจD ฉันเจn×nDnRk

xixjDij.

ถ้า "เข้าใจ" ที่นี่เป็นที่เข้าใจกันโดยทั่วไปในความผิดพลาดของการสร้างใหม่นั่นคือถ้าเป้าหมายคือการลดฟังก์ชั่นต้นทุนที่เรียกว่า "ความเครียด":จากนั้นโซลูชันจะไม่เทียบเท่ากับ PCA โซลูชันไม่ได้รับจากสูตรปิดใด ๆ และต้องคำนวณโดยอัลกอริทึมการทำซ้ำโดยเฉพาะ

StressDxixj2,

"Classical MDS" หรือที่รู้จักในชื่อ "Torgerson MDS" แทนที่ฟังก์ชันต้นทุนนี้โดยที่เกี่ยวข้องแต่ไม่เทียบเท่าหนึ่งเรียกว่า "สายพันธุ์":ซึ่งพยายามลดข้อผิดพลาดในการสร้างใหม่ของผลิตภัณฑ์สเกลาร์กึ่งกลางแทนระยะทาง ปรากฎว่าสามารถคำนวณได้จาก (ถ้าเป็นระยะทางแบบยุคลิด) และการลดข้อผิดพลาดในการสร้างใหม่นั้นเป็นสิ่งที่ PCA ทำดังที่แสดงไว้ในส่วนถัดไปK C D D K

StrainKcxi,xj2,
KcDDKc

Classical (Torgerson) MDS ในระยะทางแบบยุคลิดเทียบเท่ากับ PCA

ปล่อยให้ข้อมูลถูกรวบรวมในเมทริกซ์ของขนาดด้วยการสังเกตในแถวและคุณสมบัติในคอลัมน์ ให้เป็นเมทริกซ์กึ่งกลางที่มีค่าลบคอลัมน์ n × k X cXn×kXc

จากนั้น PCA จะทำการแยกย่อยค่าโดยมีคอลัมน์เป็นส่วนประกอบหลัก วิธีทั่วไปในการรับพวกมันคือ eigendecomposition ของเมทริกซ์ความแปรปรวนร่วมแต่วิธีที่เป็นไปได้อีกอย่างหนึ่งคือทำการ eigendecomposition ของ แกรมเมทริกซ์ : องค์ประกอบหลักคือสแควร์รูท ของค่าลักษณะเฉพาะXc=USVUS1nXcXcKc=XcXc=US2U

มันง่ายที่จะเห็นว่าโดยที่คือเมทริกซ์ของคน จากนี้เราจะได้รับที่เป็นเมทริกซ์แกรมของข้อมูลที่ไม่ได้ใส่ไว้ สิ่งนี้มีประโยชน์: ถ้าเรามีเมทริกซ์ Gram ของข้อมูลที่ไม่ได้ใส่เข้าไปเราสามารถจัดให้อยู่ตรงกลางได้โดยไม่ต้องกลับไปที่เอง การดำเนินการนี้บางครั้งเรียกว่าXc=(I1n1n)X1nn×n

Kc=(I1nn)K(I1nn)=K1nnKK1nn+1nnK1nn,
K=XXXการทำให้อยู่กึ่งกลาง : สังเกตว่าจำนวนการลบหมายถึงแถวและคอลัมน์หมายถึงจาก (และการเพิ่มค่าเฉลี่ยส่วนกลางที่ได้รับการลบสองครั้ง) ดังนั้นทั้งแถวและคอลัมน์หมายความว่า เท่ากับศูนย์KKc

ทีนี้ลองพิจารณา matrixของระยะทางแบบยุคลิดคู่กับ. เมทริกซ์นี้สามารถแปลงเป็นเพื่อใช้ PCA ได้หรือไม่? ปรากฎว่าคำตอบคือใช่n×nDDij=xixjKc

อันที่จริงตามกฎของโคไซน์เราเห็นว่า Soแตกต่างจากโดยค่าคงที่ของแถวและคอลัมน์เท่านั้น (ที่นี่หมายถึงองค์ประกอบที่มีความฉลาด! หมายความว่าถ้าเรารวมศูนย์ไว้สองครั้งเราจะได้ :

Dij2=xixj2=xix¯2+xjx¯22xix¯,xjx¯=xix¯2+xjx¯22[Kc]ij.
D2/2KcD2Kc
Kc=(I1nn)D22(I1nn).

ซึ่งหมายความว่าเริ่มต้นจากเมทริกซ์ของระยะทางแบบยุคลิดแบบคู่เราสามารถทำการ PCA และรับส่วนประกอบหลักได้ นี่คือสิ่งที่ MDS คลาสสิก (Torgerson) ทำ:ดังนั้นผลลัพธ์จึงเทียบเท่ากับ PCADDKcUS

แน่นอนว่าหากเลือกการวัดระยะทางอื่นแทนจากนั้น MDS แบบคลาสสิคจะส่งผลให้เกิดสิ่งอื่นxixj

การอ้างอิง: องค์ประกอบของการเรียนรู้เชิงสถิติ , ส่วนที่ 18.5.2


ผมต้องยอมรับว่าผมยังไม่ได้คิดว่าผ่านทางนี้ แต่นี่เป็น "เหอะตรวจสอบ" ฉันสงสัยเกี่ยวกับ: จากมิติของการฝึกอบรมที่ไม่ควรเมทริกซ์แกรมของคุณจะเป็นซึ่งเป็น ? XXTn×n
cbeleites

ขอบคุณ @cbeleites แน่นอนคุณพูดถูก - นั่นเป็นแค่ตัวพิมพ์ผิด จะแก้ไขทันที แจ้งให้เราทราบหากคุณเห็นข้อผิดพลาดอื่น ๆ (หรือสามารถแก้ไขได้โดยตรง)
อะมีบา

1
+1 และขอบคุณสำหรับการแสดงโดยคณิตศาสตร์สิ่งที่ระบุไว้ในวรรคหนึ่งคำตอบของฉัน
ttnphns

2
+1 ฉันหวังว่านี่เป็นคำตอบที่ได้รับการยอมรับ / สูงสุด ฉันคิดว่ามันสมควรที่จะเป็น
Zhubarb

35

PCA ให้ผลลัพธ์ที่แน่นอนเช่นเดียวกับ MDS แบบคลาสสิกหากใช้ระยะทางแบบยุคลิด

ฉันอ้างถึง Cox & Cox (2001), หน้า 43-44:

มีความเป็นคู่ระหว่างการวิเคราะห์องค์ประกอบหลักและ PCO [การวิเคราะห์พิกัดหลักหรือ MDS แบบคลาสสิก] ซึ่งความแตกต่างได้รับจากระยะทางแบบยุคลิด

ส่วนใน Cox & Cox อธิบายได้อย่างชัดเจน:

  • ลองนึกภาพคุณมี = คุณลักษณะของผลิตภัณฑ์โดยขนาดหมายถึงกึ่งกลางXnp
  • PCA จะบรรลุโดยการหา eigenvectors ของเมทริกซ์ความแปรปรวนร่วม ~ (หารด้วย n-1) - โทร eigenvectorsและค่าลักษณะเฉพาะ\XXξμ
  • MDS จะบรรลุโดยแปลงแรกลงในเมทริกซ์ระยะทางที่นี่ระยะทางยุคลิดคือแล้วหา eigenvectors - การเรียก eigenvectorsและค่าลักษณะเฉพาะ\XXXvλ
  • p 43: "เป็นที่ทราบกันดีว่าค่าลักษณะเฉพาะของนั้นเหมือนกับค่าของพร้อมกับค่าลักษณะพิเศษที่เป็นศูนย์ np พิเศษ" ดังนั้นสำหรับ , =XXXXi<pμiλi
  • กลับไปที่คำจำกัดความของค่าลักษณะเฉพาะพิจารณาค่าลักษณะเฉพาะ ของithXXvi=λivi
  • ก่อนหน้ากับเราได้รับviX(XX)Xvi=λiXvi
  • เรายังมี\ ตั้งแต่เราได้รับที่สำหรับ<pλ ฉัน = μ ฉันξ ฉัน = X v ฉันXXξi=μiξiλi=μiξi=Xvii<p

2
ฉันเขียนโค้ดใน R และใช้ cmdscale เป็นการนำ MDS แบบคลาสสิคและ prcomp มาใช้กับ PCA - อย่างไรก็ตามผลลัพธ์ไม่เหมือนกัน ... มีประเด็นอะไรบ้างที่ฉันหายไป?
user4581

3
same results as classical MDS. โดย "Classical MDS" คุณจะต้องมีความหมาย MDS ของ Torgerson ที่นี่ จากนั้นคำสั่งนั้นเป็นจริงสำหรับ MDS ของ Torgerson คือ PCA (เริ่มจากเมทริกซ์ระยะทางเท่านั้น) หากนิยาม "Classical MDS" แตกต่างกัน (ดูคำตอบของฉัน) ข้อความนั้นไม่เป็นความจริง
ttnphns

7
เดี๋ยวก่อน XX 'ให้ระยะยูคลิดอย่างไร XX 'เป็นผลิตภัณฑ์ภายใน - ถ้าเมทริกซ์ได้มาตรฐานแล้วมันจะให้ความเหมือนโคไซน์ ระยะทางแบบยุคลิดต้องใช้การลบและรากที่สอง
ShainaR

@ user1705135 ฉันสับสนโดยประเด็นของคุณ 5. มันควรจะเป็นหรือไม่? XXvi=λivi
Michael

4

การเปรียบเทียบ: "Metric MDS ให้ผลลัพธ์เหมือนกันเป็น PCA" - ขั้นตอน - เมื่อเราดูวิธีการใช้ SVD เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด แต่เกณฑ์มิติสูงที่อนุรักษ์ไว้นั้นแตกต่างกัน PCA ใช้เมทริกซ์ความแปรปรวนแบบกึ่งกลางในขณะที่ MDS ใช้เมทริกซ์แกรมที่ได้จากเมทริกซ์ระยะทางสองจุดกึ่งกลาง

จะทำให้เกิดความแตกต่างทางคณิตศาสตร์: PCA สามารถดูได้ว่าการเพิ่มเหนือภายใต้ข้อ จำกัด ที่คือ orthogonal ดังนั้นจึงให้แกน / ส่วนประกอบหลัก ในหลายมิติปรับเมทริกซ์กรัม (เมทริกซ์ PSD ที่สามารถแสดงเป็น ) จะถูกคำนวณจากระยะทางยุคลิดระหว่างแถวในและต่อไปนี้จะลดลงกว่าYลด:{2}XXZTZXY| | G-YTY| | 2 Tr(XT(I1neeT)X)XXZTZXY||GYTY||F2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.