(เพราะอะไร) SOM สไตล์โคโนนันหลุดพ้นไปจากความโปรดปรานไหม?


33

เท่าที่ฉันสามารถบอกได้ SOM สไตล์โคโนนนั้นมีจุดสูงสุดในช่วงประมาณปี 2005 และไม่เคยได้รับความนิยมเท่านี้มาก่อน ฉันไม่พบกระดาษใด ๆ ที่ระบุว่า SOM ได้รับการแบ่งย่อยด้วยวิธีอื่นหรือได้รับการพิสูจน์แล้วว่าเทียบเท่ากับสิ่งอื่น (ในระดับที่สูงกว่าอย่างใด) แต่ดูเหมือนว่า tSNE และวิธีการอื่นจะได้รับหมึกเพิ่มมากขึ้นทุกวันตัวอย่างเช่นใน Wikipedia หรือใน SciKit Learn และ SOM ถูกกล่าวถึงมากขึ้นเป็นวิธีการทางประวัติศาสตร์

(ที่จริงแล้วบทความ Wikipedia ดูเหมือนจะระบุว่า SOM ยังคงมีข้อได้เปรียบเหนือคู่แข่งอยู่บ้าง แต่ก็เป็นรายการสั้นที่สุดในรายการแก้ไข: ตามคำขอของ gung ซึ่งเป็นหนึ่งในบทความที่ฉันคิดว่าเป็น: การลดขนาดแบบไม่เชิงเส้นโปรดทราบว่า SOM เขียนเกี่ยวกับเรื่องนี้น้อยกว่าวิธีอื่น ๆ ฉันไม่สามารถหาบทความที่กล่าวถึงข้อได้เปรียบที่ SOM ดูเหมือนว่าจะรักษาวิธีอื่น ๆ ได้ส่วนใหญ่)

ข้อมูลเชิงลึกใด ๆ มีคนถามว่าทำไมไม่ใช้ SOM และได้รับการอ้างอิงเมื่อนานมาแล้วและฉันได้พบการดำเนินการจากการประชุม SOM แต่สงสัยว่าการเพิ่มขึ้นของ SVM หรือ tSNE และ al เพียงแค่ SOM ถูกบดบังในการเรียนรู้ของเครื่องป๊อป

แก้ไข 2: โดยบังเอิญบริสุทธิ์ฉันเพิ่งอ่านการสำรวจปี 2008 เกี่ยวกับการลดขนาดแบบไม่เชิงเส้นในเย็นวันนี้และสำหรับตัวอย่างที่กล่าวถึงเท่านั้น: Isomap (2000), การฝังเชิงเส้นในท้องถิ่น (LLE) (2000), Hessian LLE (2003), Laplacian eigenmaps (2003) และการฝัง semidefinite (SDE) (2004)


3
คุณสามารถลิงค์ไปยังแหล่งข้อมูลใด ๆ ที่คุณอ้างถึงได้หรือไม่? (เช่นบทความ Wikipedia ที่ "น่าจะบ่งบอกว่า ... "?)
gung - Reinstate Monica

11
ดูเหมือนว่าพวกเขาจะไม่ได้รับความนิยมเท่าที่ฉันไม่รู้ว่า SOM หมายถึงอะไร
Matthew Drury

5
เห็นได้ชัดว่าแผนที่การจัดระเบียบตนเอง
Christoph Hanck

SOM เป็นเพียงตัวแปรหนึ่งของการปรับสเกลหลายมิติ (MDS) ซึ่งเก่ากว่ามาก
kjetil b halvorsen

@kjetilbhalvorsen: คุณมีข้อมูลอ้างอิงเกี่ยวกับ SOM และ MDS หรือไม่ ตามที่ฉันเข้าใจ MDS เป็นสากลในธรรมชาติ (เกี่ยวข้องกับ PCA) ในขณะที่ SOM เป็นท้องถิ่นในธรรมชาติ หรือบางทีฉันก็เข้าใจผิด
เวย์น

คำตอบ:


18

ฉันคิดว่าคุณกำลังจะทำอะไรบางอย่างโดยการสังเกตอิทธิพลของสิ่งที่เครื่องเรียนรู้ในปัจจุบันเป็นอัลกอริทึม 'ดีที่สุด' สำหรับการลดขนาด ในขณะที่ t-SNE แสดงให้เห็นถึงประสิทธิภาพในการแข่งขันเช่นMerck Viz Challengeแต่โดยส่วนตัวฉันประสบความสำเร็จในการนำ SOM มาใช้สำหรับทั้งการดึงคุณสมบัติและการจำแนกไบนารี ในขณะที่มีบางคนที่ยกเลิก SOM โดยไม่มีเหตุผลนอกเหนือจากอายุของอัลกอริทึม (ตรวจสอบการสนทนานี้ยังมีบทความอีกจำนวนหนึ่งที่ตีพิมพ์ภายในไม่กี่ปีที่ผ่านมาซึ่งนำ SOM มาใช้และได้รับผลบวก (ดูMortazavi et al., 2013 ; Frenkel et al., 2013ตัวอย่าง) การค้นหาของ Google Scholar จะเปิดเผยว่า SOM ยังคงใช้อยู่ภายในโดเมนแอปพลิเคชันจำนวนมาก ตามกฎทั่วไปอย่างไรก็ตามอัลกอริธึมที่ดีที่สุดสำหรับงานนั้น ๆ คือ - อัลกอริธึมที่ดีที่สุดสำหรับงานเฉพาะ ในกรณีที่ป่าสุ่มอาจทำงานได้ดีสำหรับงานจำแนกประเภทไบนารีโดยเฉพาะมันอาจทำงานได้อย่างน่ากลัว เช่นเดียวกับงานการจัดกลุ่มการถดถอยและการเพิ่มประสิทธิภาพ ปรากฏการณ์นี้เชื่อมโยงกับทฤษฎีบทอาหารกลางวันฟรีแต่นั่นเป็นหัวข้อสำหรับการสนทนาอื่น โดยรวมถ้า SOM ทำงานได้ดีที่สุดสำหรับคุณในงานเฉพาะนั่นคืออัลกอริทึมที่คุณควรใช้สำหรับงานนั้นไม่ว่าอะไรจะได้รับความนิยม


5

ฉันได้ทำการวิจัยเกี่ยวกับการเปรียบเทียบ SOM กับ t-SNE และอื่น ๆ อีกมากมายและยังเสนอการปรับปรุง SOM ที่นำไปสู่อีกระดับของประสิทธิภาพ โปรดตรวจสอบที่นี่และแจ้งให้เราทราบความคิดเห็นของคุณ ชอบที่จะได้รับความคิดเกี่ยวกับสิ่งที่ผู้คนคิดเกี่ยวกับมันและถ้ามันมีค่าการเผยแพร่ในหลามสำหรับคนที่จะใช้

ลิงก์ IEEE ไปยังกระดาษ: http://ieeexplore.ieee.org/document/6178802/

การใช้ Matlab https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase

ขอบคุณสำหรับความคิดเห็นของคุณ


4
ยินดีต้อนรับสู่ Cross Validated! มันจะช่วยให้สรุปสั้น ๆ เกี่ยวกับสิ่งที่คุณค้นพบและการปรับปรุงที่คุณทำและอาจช่วยตอบคำถามได้โดยตรงอีกด้วย
Scortchi - Reinstate Monica

1

ทัศนะส่วนตัวของฉันคือ SOMs เป็นที่รู้จักน้อยกว่าและรับรู้ว่าเป็น 'เซ็กซี่' น้อยกว่าวิธีการอื่น ๆ แต่ก็ยังมีความเกี่ยวข้องสูงสำหรับปัญหาบางประเภท อาจเป็นกรณีที่พวกเขาจะมีส่วนร่วมสำคัญในการทำหากพวกเขาใช้กันอย่างแพร่หลาย พวกมันมีค่ามากในช่วงแรก ๆ ของวิทยาศาสตร์ข้อมูลเชิงสำรวจเพื่อทำความเข้าใจกับ 'ภูมิทัศน์' หรือ 'โทโพโลยี' ของข้อมูลหลายตัวแปร

การพัฒนาห้องสมุดเช่นSomocluและการวิจัยเช่นนั้นโดยGuénaël Cabanes (ท่ามกลางคนอื่น ๆ ) แสดงให้เห็นว่า SOMs ยังคงมีความเกี่ยวข้อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.