MDS มีบทบาทอย่างไรในสถิติสมัยใหม่


18

ฉันเพิ่งเจอการปรับสเกลหลายมิติ ฉันพยายามทำความเข้าใจเครื่องมือนี้ให้ดีขึ้นและบทบาทของมันในสถิติสมัยใหม่ ดังนั้นนี่คือคำถามที่แนะนำเล็กน้อย:

  • คำถามใดตอบ
  • นักวิจัยคนไหนที่สนใจจะใช้มัน?
  • มีเทคนิคทางสถิติอื่น ๆ ที่ทำหน้าที่คล้ายกันหรือไม่?
  • ทฤษฎีอะไรที่พัฒนาไปรอบ ๆ มัน?
  • "MDS" เกี่ยวข้องกับ "SSA" อย่างไร

ฉันขออภัยล่วงหน้าสำหรับการถามคำถามแบบผสม / ไม่มีการจัดระเบียบ แต่เป็นลักษณะของเวทีปัจจุบันของฉันในสาขานี้


7
ภาพประกอบที่อื่น ๆ ใน SE อยู่สองคนแรกรายการกระสุน: gis.stackexchange.com/a/20428 ; gis.stackexchange.com/a/15567
whuber

คำตอบ:


24

ในกรณีที่คุณจะยอมรับคำตอบที่กระชับ ...

คำถามอะไรตอบ การทำแผนที่ภาพของความแตกต่างของจำนวนคู่ในพื้นที่แบบยุคลิด (ส่วนใหญ่) ที่มีมิติต่ำ

นักวิจัยคนไหนที่สนใจจะใช้มัน? ทุกคนที่มีจุดมุ่งหมายในการแสดงกลุ่มของจุดหรือรับข้อมูลเชิงลึกเกี่ยวกับมิติที่ซ่อนเร้นที่เป็นไปได้ซึ่งเป็นจุดที่แตกต่าง หรือผู้ที่ต้องการเปลี่ยนเมทริกซ์ความใกล้ชิดเป็นข้อมูลตัวแปรจุด X

มีเทคนิคทางสถิติอื่น ๆ ที่ทำหน้าที่คล้ายกันหรือไม่? PCA (เชิงเส้นไม่เชิงเส้น) การวิเคราะห์สารบรรณการแฉหลายมิติ (รุ่น MDS สำหรับเมทริกซ์สี่เหลี่ยม) พวกเขามีความสัมพันธ์ในรูปแบบต่าง ๆ กับ MDS แต่ไม่ค่อยถูกมองว่าเป็นสิ่งทดแทน (เชิงเส้น PCA และ CA มีความเกี่ยวข้องกับการเชิงเส้นพีชคณิตเนื้อที่ลดการดำเนินงานในการฝึกอบรมและตารางสี่เหลี่ยมตามลำดับ. MDS และ MDU จะคล้ายกันซ้ำแล้วซ้ำอีกไม่เชิงเส้นทั่วไปเนื้อที่กระชับขั้นตอนวิธีการในการฝึกอบรมและตารางสี่เหลี่ยมตามลำดับ.)

ทฤษฎีอะไรที่พัฒนาไปรอบ ๆ มัน? เมทริกซ์ของความแตกต่างที่สังเกตจะกลายเป็นความแตกต่างTในลักษณะเช่นเพื่อลดข้อผิดพลาดEของการทำแผนที่ความแตกต่างโดยใช้วิธีการระยะทางแบบยุคลิดDในเมตรพื้นที่มิติ: S T = D + E การแปลงสามารถร้องขอแบบเส้นตรง (เมตริก MDS) หรือโมโนโทน (ไม่ใช่แบบเมตริกเมตริก) Eอาจเป็นข้อผิดพลาดที่แน่นอนหรือข้อผิดพลาดกำลังสองหรือฟังก์ชั่นความเครียดอื่น ๆ คุณสามารถขอรับแผนที่สำหรับเมทริกซ์เดี่ยวSSTEDmST=mD+EES(MDS แบบคลาสสิกหรือแบบง่าย) หรือแผนที่สำหรับเมทริกซ์หลายตัวพร้อมกันด้วยแผนที่น้ำหนักเพิ่มเติม (ความแตกต่างส่วนบุคคลหรือ MDS แบบถ่วงน้ำหนัก) มีรูปแบบอื่น ๆ เช่น MDS ซ้ำและ MDS ทั่วไป ดังนั้น MDS จึงเป็นเทคนิคที่หลากหลาย

"MDS" เกี่ยวข้องกับ "SSA" อย่างไร แนวคิดเกี่ยวกับเรื่องนี้สามารถพบได้ในหน้า Wikipedia ของ MDS

อัปเดตสำหรับจุดสุดท้าย เทคโน้ตนี้จาก SPSS ทิ้งความประทับใจว่า SSA เป็นกรณีของการแฉหลายมิติ (ขั้นตอน PREFSCAL ใน SPSS) หลังอย่างที่ฉันได้กล่าวไว้ข้างต้นคือ MDS algo ที่ใช้กับเมทริกซ์สี่เหลี่ยม (แทนที่จะเป็นสี่เหลี่ยมสมมาตร)


3
(+1) บทสรุปที่ดี! Forrest Young (อ้างถึงโดย @whuber ในความคิดเห็นของเขา) Yoshio TakaneและJan de Leeuwมีเอกสารที่ดีมากเกี่ยวกับ MDS
chl

@chl ขอบคุณ: บทความที่มีประโยชน์ในหน้าของ Takane ในเยอะแยะ
ttnphns

6

@ttnphns ให้ภาพรวมที่ดี ฉันแค่ต้องการเพิ่มสิ่งเล็ก ๆ สองสามอย่าง Greenacreทำงานเกี่ยวกับการวิเคราะห์สารบรรณได้ดีและมีความเกี่ยวข้องกับเทคนิคทางสถิติอื่น ๆ (เช่น MDS แต่ยังรวมถึง PCA และอื่น ๆ ) คุณอาจต้องการดูเนื้อหาของเขา (ตัวอย่างเช่นงานนำเสนอนี้อาจเป็น ที่เป็นประโยชน์) นอกจากนี้ MDS มักจะใช้ในการทำพล็อต (แม้ว่ามันจะเป็นไปได้เพียงดึงข้อมูลตัวเลขบางอย่าง) และเขาได้เขียนหนังสือพล็อตประเภทนี้โดยทั่วไปและวางไว้บนเว็บได้ฟรีที่นี่(แม้ว่าจะมีเพียงหนึ่งบทเท่านั้นที่เป็นเรื่องเกี่ยวกับแปลง MDS ต่อ se) สุดท้ายในแง่ของการใช้งานทั่วไปมันถูกใช้บ่อยมากในการวิจัยตลาดและการวางตำแหน่งผลิตภัณฑ์ซึ่งนักวิจัยใช้มันในเชิงพรรณนาเพื่อทำความเข้าใจว่าผู้บริโภคคิดอย่างไรเกี่ยวกับความคล้ายคลึงกันระหว่างผลิตภัณฑ์คู่แข่งที่แตกต่างกัน คุณไม่ต้องการให้ผลิตภัณฑ์ของคุณแตกต่างจากส่วนที่เหลือ


1
(+1) การทำความเข้าใจ Biplotsโดย Gower และ coll ยังเป็นหนังสือที่ยอดเยี่ยม (มันมาพร้อมกับแพคเกจไบนารีR , windows-only), ประมาณ 50 pp. สำหรับ MDS และ biplots ที่ไม่ใช่เชิงเส้น
chl

2
@chl ขอบคุณสำหรับเคล็ดลับหนังสือเล่มนั้นดูน่าสนใจ
gung - Reinstate Monica

1

จุดแข็งอีกประการหนึ่งคือคุณสามารถใช้ MDS เพื่อวิเคราะห์ข้อมูลที่คุณไม่ทราบถึงตัวแปรหรือมิติที่สำคัญ ขั้นตอนมาตรฐานสำหรับสิ่งนี้คือ: 1) ให้ผู้เข้าร่วมจัดอันดับเรียงลำดับหรือระบุความคล้ายคลึงกันระหว่างวัตถุโดยตรง 2) แปลงการตอบสนองให้เป็นเมทริกซ์ที่ต่างกัน 3) ใช้ MDS และหาโมเดล 2 หรือ 3D; 4) พัฒนาสมมติฐานเกี่ยวกับมิติโครงสร้างของแผนที่

ความเห็นส่วนตัวของฉันคือมีเครื่องมือลดขนาดอื่น ๆ ที่มักจะเหมาะสมกว่าสำหรับเป้าหมายนั้น แต่สิ่งที่ MDS ให้ไว้คือโอกาสในการพัฒนาทฤษฎีเกี่ยวกับมิติที่ใช้ในการจัดระเบียบการตัดสิน สิ่งสำคัญคือต้องคำนึงถึงระดับของความเครียด (การบิดเบือนที่เกิดจากการลดมิติ) และนำมารวมเข้ากับความคิดของคุณ

ฉันคิดว่าหนึ่งในหนังสือที่ดีที่สุดใน MDS คือ "Applied Multidimensional Scaling" โดย Borg, Groenen และ Mair (2013)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.