นานาคืออะไร?


28

ในเทคนิคการลดขนาดเช่นการวิเคราะห์องค์ประกอบหลัก LDA ฯลฯ มักใช้คำที่หลากหลาย นานาในระยะที่ไม่ใช่ด้านเทคนิคคืออะไร? หากจุดเป็นของทรงกลมที่มีมิติที่ฉันต้องการลดและหากมีจุดรบกวนและและไม่เกี่ยวข้องกันแล้วจุดที่แท้จริงจะถูกแยกออกจากกันเนื่องจากเสียงรบกวน ดังนั้นจึงจำเป็นต้องมีการกรองสัญญาณรบกวน ดังนั้นการลดมิติจะได้รับการดำเนินการเกี่ยวกับ y ที่ ดังนั้นและเป็นของแมนิโฟลด์ที่ต่างกันหรือไม่?y x z = x + y x yxyxyxz=x+yxy

ฉันกำลังทำงานกับข้อมูลจุดเมฆที่มักใช้ในการมองเห็นหุ่นยนต์ เมฆจุดนั้นเสียงดังเนื่องจากเสียงรบกวนในการได้มาและฉันต้องลดเสียงก่อนที่จะลดขนาด มิฉะนั้นฉันจะได้รับการลดขนาดที่ไม่ถูกต้อง ดังนั้นนานาคืออะไรที่นี่และเสียงรบกวนเป็นส่วนหนึ่งของ manifold เดียวกันกับที่เป็นเจ้าของ?x


4
มันเป็นไปไม่ได้จริงๆที่จะใช้คำอย่างถูกต้องโดยไม่ต้องแม่นยำทางคณิตศาสตร์
Chill2Macht

คำตอบ:


45

ในแง่เทคนิคที่ไม่ใช่นานาเป็นโครงสร้างทางเรขาคณิตอย่างต่อเนื่องที่มีมิติที่ จำกัด : เส้น, เส้นโค้ง, เครื่องบิน, พื้นผิว, ทรงกลม, ลูก, ทรงกระบอก, ทรงกระบอก, พรู, "หยด" ... บางสิ่งเช่นนี้ : ป้อนคำอธิบายรูปภาพที่นี่

มันเป็นคำทั่วไปที่ใช้โดยนักคณิตศาสตร์จะพูดว่า "โค้ง" (มิติ 1) หรือ "ผิว" (2 มิติ) หรือวัตถุ 3D (3 มิติ) ... สำหรับการใด ๆ ที่เป็นไปได้แน่นอนมิติnท่อร่วมมิติหนึ่งมิติเป็นเพียงเส้นโค้ง (เส้นวงกลม ... ) ท่อสองมิตินั้นเป็นเพียงพื้นผิว (ระนาบทรงกลมพรูทรงกระบอก ... ) แมนิโฟลด์สามมิติคือ "วัตถุเต็มรูปแบบ" (บอลเต็มลูกบาศก์พื้นที่ 3D รอบตัวเรา ... )n

manifold มักจะอธิบายโดยสมการ: ชุดของจุดเช่นเป็น manifold มิติเดียว (วงกลม)x 2 + y 2 = 1(x,y)x2+y2=1

นานามีมิติเดียวกันทุกที่ ตัวอย่างเช่นหากคุณต่อท้ายบรรทัด (ส่วนข้อมูล 1) ไปยังทรงกลม (ส่วนข้อมูล 2) ดังนั้นโครงสร้างทางเรขาคณิตที่ได้จะไม่ได้เกิดขึ้นมากมาย

ซึ่งแตกต่างจากความคิดที่กว้างขึ้นของพื้นที่ตัวชี้วัดหรือพื้นที่ทอพอโลยียังตั้งใจที่จะอธิบายถึงสัญชาตญาณตามธรรมชาติของเราอย่างต่อเนื่องเป็นชุดของจุดนานามีวัตถุประสงค์เพื่อเป็นสิ่งที่ง่ายในท้องถิ่น: เช่นพื้นที่มิติเวกเตอร์ จำกัด : n กฎนี้ออกจากช่องว่างนามธรรม (เช่นช่องว่างมิติที่ไม่มีที่สิ้นสุด) ที่มักจะล้มเหลวในการมีความหมายที่เป็นรูปธรรมทางเรขาคณิตRn

ซึ่งแตกต่างจากพื้นที่เวกเตอร์ manifolds สามารถมีรูปร่างต่าง ๆ manifolds บางคนสามารถมองเห็นได้อย่างง่ายดาย (ทรงกลมลูก ... ) บางคนเป็นเรื่องยากที่จะเห็นภาพเช่นขวด Kleinหรือprojective เครื่องบินจริง

ในสถิติการเรียนรู้ของเครื่องหรือคณิตศาสตร์ประยุกต์โดยทั่วไปคำว่า "manifold" มักจะถูกใช้เพื่อพูดว่า "เหมือน subspace เชิงเส้น" แต่อาจโค้ง ทุกครั้งที่คุณเขียนสมการเชิงเส้นเช่น:คุณจะได้สเปซย่อยเชิงเส้น (เลียนแบบ) (นี่คือระนาบ) โดยปกติเมื่อสมการไม่เชิงเส้นเช่นนี่คือนานา (นี่คือทรงกลมที่ยืดออก)x 2 + 2 y 2 + 3 z 2 = 73x+2y4z=1x2+2y2+3z2=7

ตัวอย่างเช่น " สมมติฐานของแมนิโฟลด์ " ของ ML พูดว่า "ข้อมูลมิติสูงเป็นจุดในมิติต่ำมากที่มีการเพิ่มเสียงรบกวนมิติสูง" คุณสามารถจินตนาการถึงจุดต่าง ๆ ของวงกลม 1D พร้อมกับเพิ่มสัญญาณรบกวน 2 มิติ ในขณะที่จุดจะไม่ตรงกับวงกลมที่พวกเขาตอบสนองทางสถิติสมการ 1 วงกลมเป็นรากฐานที่หลากหลาย: x2+y2=1https://i.stack.imgur.com/iEm2m.png


4
@RiaGeorge ในภาพมันเป็นพื้นผิวที่มีความหลากหลาย มันต่อเนื่องเพราะคุณสามารถเคลื่อนที่ไปรอบ ๆ ได้อย่างอิสระโดยไม่มีการหยุดชะงักและไม่ต้องกระโดดจากพื้นผิวเพื่อให้ได้ระหว่างสองสถาน รูที่คุณพาดพิงถึงมีความสำคัญในการอธิบายวิธีที่คุณสามารถวนรอบพื้นผิวระหว่างจุดสองจุดด้วยวิธีที่ง่ายที่สุดและการนับพวกเขาเป็นเทคนิคสำคัญในการศึกษา manifolds
Matthew Drury

4
การอธิบายว่าโทโพโลยีนั้นเป็นคำถามที่กว้างเกินไปสำหรับไซต์นี้หรือไม่ ฉันจะค้นหาการแลกเปลี่ยนสแต็กทางคณิตศาสตร์เพื่อหาข้อมูลเกี่ยวกับสิ่งนั้น Manifold และ topology ไม่ใช่คำพ้องความหมาย: manifolds เป็นวัตถุทางคณิตศาสตร์ที่ศึกษาด้วยเทคนิคของ topology, topology เป็นหัวข้อย่อยของคณิตศาสตร์
Matthew Drury

1
คำตอบคิดถึงประเด็นพื้นฐานทั้งหมดที่สร้างความหลากหลายฉันไม่เข้าใจว่ามันมี upvotes มากมาย โทโพโลยีแผนภูมิและเรียบเนียนไม่ได้กล่าวถึงแม้คำตอบและโดยทั่วไปจะช่วยให้การแสดงผลที่นานาเป็นพื้นผิวที่มันเป็นไม่ได้
เริ่ม

2
จุดทางเทคนิคชุดโซลูชันของระบบสมการไม่จำเป็นต้องมีความหลากหลาย มันมีความหลากหลายดังนั้นส่วนใหญ่จึงเป็นท่อร่วมไอดี แต่มันสามารถมีจุดตัดของตัวเองได้ซึ่งทรัพย์สินต่าง ๆ จะล้มเหลว
Matt Samuel

1
คำนิยามต่าง ๆ นานาของคุณมีความต้องการที่จะเป็นมิติ จำกัด แต่คุณรวมตัวอย่างที่ไม่เป็นไปตามข้อกำหนดดังกล่าว - เช่นเส้นระนาบเส้นโค้งและพื้นผิว คุณช่วยอธิบายความหมายของสิ่งที่คุณต้องการได้ไหม
Mowzer

13

A (ทอพอโลยี) คือช่องว่างซึ่งก็คือ:M

Rnn

nci:MRc:MRn

RNNn

โปรดทราบว่าเพื่อให้ "โครงสร้าง" มีความแม่นยำที่นี่เราจำเป็นต้องเข้าใจแนวคิดพื้นฐานของโทโพโลยี ( def. ) ซึ่งทำให้สามารถสร้างแนวคิดที่ชัดเจนเกี่ยวกับพฤติกรรม"ท้องถิ่น"และ"ภายใน"ข้างต้น เมื่อฉันพูดว่า "เทียบเท่า" ฉันหมายถึงโครงสร้างทอพอโลยีเทียบเท่ากัน ( homeomorphic ) และเมื่อฉันพูดว่า "โครงสร้างที่สงวนไว้" ฉันหมายถึงสิ่งเดียวกัน (สร้างโครงสร้างทอพอโลยีที่เทียบเท่า)

โปรดทราบด้วยว่าในการที่จะทำแคลคูลัสบน manifoldsเราต้องการเงื่อนไขเพิ่มเติมซึ่งไม่เป็นไปตามเงื่อนไขสองประการข้างต้นซึ่งโดยทั่วไปบอกว่าบางอย่างเช่น นี่คือท่อร่วมที่ใช้บ่อยที่สุดในการปฏิบัติ ซึ่งแตกต่างจากแมนิโฟลทอพอโลยีทั่วไปนอกเหนือไปจากแคลคูลัสพวกเขายังช่วยให้triangulationsซึ่งเป็นสิ่งที่สำคัญมากในการใช้งานเช่นเดียวกับคุณที่เกี่ยวข้องกับข้อมูลจุดเมฆ

โปรดทราบว่าไม่ใช่ทุกคนที่ใช้คำจำกัดความเดียวกันสำหรับนานา (ทอพอโลยี) ผู้แต่งหลายคนจะนิยามว่าเป็นเงื่อนไขที่น่าพึงใจเท่านั้น (1) ด้านบนและไม่จำเป็นต้องเป็น (2) ด้วยเช่นกัน อย่างไรก็ตามคำจำกัดความที่สอดคล้องกับทั้ง (1) และ (2) นั้นมีพฤติกรรมที่ดีกว่ามากดังนั้นจึงมีประโยชน์มากสำหรับผู้ปฏิบัติงาน หนึ่งอาจคาดหวังโดยสังหรณ์ว่า (1) หมายถึง (2) แต่จริง ๆ แล้วไม่ได้

Rn


ขอบคุณสำหรับคำตอบของคุณ: คุณช่วยอธิบายได้ไหมว่าทอพอโลยีในเทอมนั้นเป็นอย่างไร? คำว่าทอพอโลยีและหลากหลายใช้แทนกันได้หรือไม่? ส่วนข้อมูลต้องเป็นตัวเลขจำนวนเต็มหรือไม่ จำนวนจริงคืออะไรจากนั้นฉันคิดว่าโครงสร้างเรียกว่าแฟร็กทัลหากโครงสร้างทั้งหมดประกอบด้วยแต่ละส่วนย่อยคือการทำซ้ำตัวเอง
Ria George

1
n1ยังไม่มีข้อความ

@RiaGeorge สัจพจน์สำหรับ "โทโพโลยี" สามารถพบได้ในหน้า Wikipedia: en.wikipedia.org/wiki/General_topology#A_topology_on_a_set - โปรดทราบด้วยว่าลิงก์ที่ฉันให้คุณมีความหมาย (เทียบเท่า) ของคำว่า "ทอพอโลยี" ของละแวกใกล้เคียงชี้ไปที่สิ่งที่เกี่ยวข้อง แต่ไม่เหมือนกันฉันได้แก้ไขคำตอบของฉันเพื่อสะท้อนสิ่งนี้: en.wikipedia.org/wiki/…โปรดทราบว่าคำจำกัดความในแง่ของละแวกใกล้เคียงนั้นยากที่จะเข้าใจมากขึ้น (ฉันจินตนาการว่าฉันเข้าใจ ดี แต่ฉันก็ไม่ต้องกังวลเหมือนกันเพราะฉันขี้เกียจ
Chill2Macht

ดังนั้นความเห็นส่วนตัวของฉันที่คุณไม่จำเป็นต้องรู้คำนิยามของโทโพโลยี - แค่รู้ว่าคำจำกัดความที่เรียบง่ายนั้นให้พลังทั้งหมดของคำนิยามของเพื่อนบ้านในแง่ของการอธิบายพฤติกรรมในท้องถิ่นอย่างจริงจังเนื่องจากเป็น เทียบเท่า) อย่างไรก็ตามถ้าคุณสนใจเศษส่วนบางทีคุณอาจพบว่าหน้า Wikipedia เหล่านี้น่าสนใจ - ฉันไม่สามารถช่วยคุณได้มากกว่านั้นเพราะฉันไม่คุ้นเคยกับทฤษฎีอย่างลึกซึ้งและไม่รู้จักหรือเข้าใจมากที่สุด คำจำกัดความ - ฉันเคยได้ยินเพียงบางส่วนของ
Chill2Macht

1
นี่เป็นคำตอบเดียวที่ให้ความสนใจกับแนวคิดทางคณิตศาสตร์ที่ทันสมัยในการรวบรวมวัตถุระดับโลกจากข้อมูลในเครื่อง น่าเสียดายที่มันไม่ได้ทำให้ระดับความเรียบง่ายและความชัดเจนที่ต้องการสำหรับบัญชี "ที่ไม่ใช่ด้านเทคนิค"
whuber

9

ในบริบทนี้คำที่หลากหลายมีความถูกต้อง แต่เป็นฟาลาลูนสูง ในทางเทคนิค manifold คือช่องว่างใด ๆ (ชุดของจุดที่มีทอพอโลยี) ที่ราบรื่นและต่อเนื่องเพียงพอ (ในทางที่สามารถทำได้ด้วยความพยายามบางอย่าง

ลองนึกภาพช่องว่างของค่าที่เป็นไปได้ทั้งหมดของปัจจัยดั้งเดิมของคุณ หลังจากเทคนิคการลดมิติไม่สามารถทำได้ทุกจุดในพื้นที่นั้น แต่จะมีเพียงแต้มบนพื้นที่ย่อยที่ฝังอยู่ภายในในพื้นที่นั้นเท่านั้น พื้นที่ย่อยที่ฝังตัวนั้นเกิดขึ้นเพื่อให้เป็นไปตามข้อกำหนดทางคณิตศาสตร์ของท่อร่วมไอดี สำหรับเทคนิคการลดมิติเชิงเส้นอย่าง PCA นั้น sub-space นั้นเป็นเพียง sub-space เชิงเส้น (เช่น hyper-plane) ซึ่งเป็นท่อร่วมที่ค่อนข้างน่ารำคาญ แต่สำหรับเทคนิคการลดมิติที่ไม่เป็นเชิงเส้นพื้นที่ย่อยนั้นอาจมีความซับซ้อนมากกว่า (เช่นพื้นผิวโค้งมากเกินไป) สำหรับวัตถุประสงค์ในการวิเคราะห์ข้อมูลการทำความเข้าใจว่าสิ่งเหล่านี้เป็นพื้นที่ย่อยมีความสำคัญมากกว่าการอนุมานใด ๆ ที่คุณจะได้รับจากการรู้ว่าพวกเขาเติมเต็มคำจำกัดความของนานา


3
"Highfalutin" ... เรียนรู้คำศัพท์ใหม่วันนี้!
Mehrdad

5
ศาสตร์นานาเป็นพื้นที่ทอพอโลยีต่อเนื่องในท้องถิ่น ฉันชอบความคิดในการพยายามอธิบายสิ่งต่าง ๆ ในภาษาธรรมดา แต่ลักษณะนี้ไม่ได้ผล ก่อนอื่นความต่อเนื่องมักเป็นคุณสมบัติของท้องถิ่นดังนั้นฉันไม่แน่ใจว่าสิ่งที่คุณหมายถึงอย่างต่อเนื่องในพื้นที่ นอกจากนี้คำจำกัดความของคุณล้มเหลวในการแยกแยะสิ่งต่าง ๆ มากมายที่ไม่ได้มีอยู่มากมายเช่นเส้นจำนวนตรรกยะหรือการรวมกันของสองเส้นตัดกันในระนาบแบบยุคลิด
Ben Crowell

4
ฉันเห็นด้วยกับเบ็นในทางเทคนิคแล้วมันคือ "ยุคลิดแบบโลคอล" ฉันไม่แน่ใจว่ามีวิธีที่ดีในการต้มให้เป็นภาษาอังกฤษธรรมดา ๆ
Matthew Drury

1
ฉันต้องเห็นด้วยอย่างยิ่งกับความคิดเห็นสองข้อข้างต้น อันที่จริงคำตอบที่ฉันเขียนไว้ด้านล่างนั้นเดิมทีมีไว้เพื่อแสดงความคิดเห็นที่ชัดเจนต่อคำตอบนี้ซึ่งยาวเกินไป ไม่มีแนวคิดที่ชัดเจนเกี่ยวกับพื้นที่ทอพอโลยี "ต่อเนื่อง" (ดูที่นี่: math.stackexchange.com/questions/1822769/… ) การกำหนด manifolds ในแง่ของแนวคิดที่ไม่มีอยู่จริงคือในความคิดของฉันในระยะยาวมีแนวโน้มที่จะสับสนมากกว่าชัดเจน อย่างน้อยที่สุดฉันขอแนะนำให้แทนที่คำว่า "ทางคณิตศาสตร์" ในประโยคแรกด้วยอย่างอื่น
Chill2Macht

ฉันจะใช้ความคิดเห็นนี้เป็นโอกาสที่จะถามคำถามเล็ก ๆ น้อย ๆ ... ฉัน (คิดว่า) ฉันมีความคิดที่หลากหลาย แต่ทำไม "ภายใน" จึงจำเป็น? ไม่ใช่พื้นที่ "ในพื้นที่" ต่อเนื่อง ... ต่อเนื่องโดยรวมหรือไม่
Paul92
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.