การใช้โครงข่ายประสาทเทียมเพื่อจดจำรูปแบบในเมทริกซ์


10

ฉันพยายามที่จะพัฒนาโครงข่ายประสาทเทียมซึ่งสามารถระบุคุณสมบัติการออกแบบในแบบจำลอง CAD (เช่นสล็อต, หัวหน้า, หลุม, กระเป๋า, ขั้นตอน)

ข้อมูลอินพุตที่ฉันต้องการใช้สำหรับเครือข่ายคือเมทริกซ์ anxn (โดยที่ n คือจำนวนใบหน้าในโมเดล CAD) '1' ในสามเหลี่ยมด้านขวาบนของเมทริกซ์แสดงถึงความสัมพันธ์ที่นูนระหว่างสองใบหน้าและ '1' ในสามเหลี่ยมล่างซ้ายแสดงถึงความสัมพันธ์แบบเว้า ศูนย์ทั้งสองตำแหน่งหมายความว่าใบหน้าไม่ได้อยู่ติดกัน ภาพด้านล่างเป็นตัวอย่างของเมทริกซ์ดังกล่าว ป้อนคำอธิบายรูปภาพที่นี่

ให้บอกว่าฉันตั้งค่าขนาดรุ่นสูงสุดไว้ที่ 20 ใบหน้าและใช้การเติมเต็มสำหรับสิ่งที่เล็กกว่านั้นเพื่อให้อินพุตกับเครือข่ายมีขนาดคงที่

ฉันต้องการที่จะรับรู้ถึง 5 คุณสมบัติการออกแบบที่แตกต่างกันและดังนั้นจึงมี 5 เซลล์ประสาทเอาท์พุท - [สล็อต, กระเป๋า, หลุม, เจ้านาย, ขั้นตอน]

ฉันจะพูดถูกไหมว่านี่เป็นปัญหาของ 'การจดจำรูปแบบ' ตัวอย่างเช่นถ้าฉันจัดหาเครือข่ายด้วยรูปแบบการฝึกอบรมจำนวนมาก - พร้อมกับฉลากที่อธิบายถึงคุณลักษณะการออกแบบที่มีอยู่ในโมเดลเครือข่ายจะเรียนรู้ที่จะจดจำรูปแบบ adjacency เฉพาะที่แสดงในเมทริกซ์ซึ่งเกี่ยวข้องกับคุณสมบัติการออกแบบบางอย่างหรือไม่

ฉันเป็นผู้เริ่มต้นที่สมบูรณ์ในการเรียนรู้ของเครื่องและฉันพยายามที่จะเข้าใจว่าวิธีการนี้จะใช้งานได้หรือไม่ - หากต้องการข้อมูลเพิ่มเติมใด ๆ เพื่อทำความเข้าใจปัญหาแสดงความคิดเห็น ข้อมูลหรือความช่วยเหลือใด ๆ จะได้รับการชื่นชมขอบคุณ


1
มันดูน่าสนใจจริงๆ แต่คุณพูดถึงสามเหลี่ยมอะไร คุณสามารถวาดเพื่อความชัดเจนได้หรือไม่?
FelicityC

คำตอบ:


1

ฉันจะพูดถูกไหมว่านี่เป็นปัญหาของ 'การจดจำรูปแบบ'

ใช่แล้ว ในทางปฏิบัติ: ไม่

ฉันคิดว่าคุณอาจตีความคำว่า "การจดจำรูปแบบ" ที่แท้จริงเกินไป แม้ว่าวิกิพีเดียจะกำหนดการจดจำรูปแบบเป็น "สาขาการเรียนรู้ของเครื่องที่มุ่งเน้นไปที่การจดจำรูปแบบและความสม่ำเสมอของข้อมูล" มันไม่ได้เกี่ยวกับการแก้ปัญหาที่สามารถ "ง่าย" โดยการใช้เหตุผลเชิงตรรกะ

เช่นคุณพูดอย่างนั้น

'1' ที่มุมบนขวาของเมทริกซ์แสดงถึงความสัมพันธ์ที่นูนระหว่างสองใบหน้ากับ '1' ในสามเหลี่ยมซ้ายล่างแสดงถึงความสัมพันธ์แบบเว้า

นี่คือความจริงเสมอ ในสถานการณ์การเรียนรู้ของเครื่องทั่วไปคุณจะไม่เคยมีความรู้มาก่อน (ปกติ) อย่างน้อยก็ไม่ควรที่จะ "แก้ปัญหาด้วยมือ" ได้

การจดจำรูปแบบเป็นวิธีการทางสถิติในการแก้ปัญหาเมื่อพวกเขาซับซ้อนเกินกว่าที่จะวิเคราะห์ด้วยเหตุผลเชิงตรรกะแบบดั้งเดิมและแบบจำลองการถดถอยที่ง่ายขึ้น วิกิพีเดียยังระบุ (ด้วยแหล่งที่มา) ว่าการจดจำรูปแบบ "ในบางกรณีถือว่าใกล้เคียงกับการเรียนรู้ของเครื่อง"

ดังที่กล่าวไว้: คุณสามารถใช้การจดจำรูปแบบกับปัญหานี้ อย่างไรก็ตามดูเหมือนว่าจะเกินราคาในกรณีนี้ ปัญหาของคุณเท่าที่ฉันเข้าใจมีโซลูชัน "วิเคราะห์" ที่เกิดขึ้นจริง นั่นคือคุณสามารถรับผลลัพธ์ที่ถูกต้อง 100% ตลอดเวลาตามตรรกะ กลไกการเรียนรู้ด้วยกลไกสามารถทำได้ในทางทฤษฎีและในกรณีนี้และสาขา ML นี้เรียกว่า Meta Modeling [1]

ตัวอย่างเช่นถ้าฉันจัดหาเครือข่ายด้วยรูปแบบการฝึกอบรมจำนวนมาก - พร้อมกับฉลากที่อธิบายถึงคุณลักษณะการออกแบบที่มีอยู่ในโมเดลเครือข่ายจะเรียนรู้ที่จะจดจำรูปแบบ adjacency เฉพาะที่แสดงในเมทริกซ์ซึ่งเกี่ยวข้องกับคุณสมบัติการออกแบบบางอย่างหรือไม่

ในคำ: อาจเป็นไปได้ วิธีที่ดีที่สุดที่จะไป? อาจจะไม่. ทำไมไม่ถาม

มีความเป็นไปได้ที่โมเดลของคุณจะไม่ได้เรียนรู้สิ่งที่คุณต้องการอย่างแน่นอน นอกจากนี้คุณยังมีความท้าทายมากมายเช่นการ overfittingที่คุณจำเป็นต้องกังวลเกี่ยวกับตัวเอง มันเป็นวิธีการทางสถิติตามที่ฉันพูด แม้ว่ามันจะจัดประเภทข้อมูลการทดสอบทั้งหมดของคุณว่าถูกต้อง 100% แต่ก็ไม่มีทาง (เว้นแต่คุณจะตรวจสอบคณิตศาสตร์ที่ยากที่จะดื้อได้) ให้มั่นใจได้ 100% ว่าจะจำแนกอย่างถูกต้องเสมอ ฉันสงสัยเพิ่มเติมว่าคุณมีแนวโน้มที่จะใช้เวลามากขึ้นในการทำงานกับแบบจำลองของคุณแล้วเวลาที่ใช้ในการอนุมานตรรกะ

ฉันไม่เห็นด้วยกับ @Bitzel: ฉันจะไม่ทำซีเอ็นเอ็น (เครือข่ายประสาทเทียม) ในเรื่องนี้ ซีเอ็นเอ็นถูกใช้เมื่อคุณต้องการดูส่วนเฉพาะของเมทริกซ์และความสัมพันธ์และความเชื่อมโยงระหว่างพิกเซลนั้นมีความสำคัญเช่นในรูปภาพ เนื่องจากคุณมีเพียง 1 และ 0 ฉันสงสัยอย่างยิ่งว่าซีเอ็นเอ็นจะล้นมืออย่างมาก และด้วย sparsity ทั้งหมด (ศูนย์จำนวนมาก) คุณจะพบกับศูนย์จำนวนมากในการโน้มน้าวใจ

ฉันขอแนะนำเครือข่ายประสาทวานิลลาธรรมดา (ส่งต่อ) ซึ่งแม้จะมีความเบาบางฉันคิดว่าจะสามารถจัดประเภทนี้ได้อย่างง่ายดาย


1
คำตอบอย่างละเอียดมาก เวอร์ชันสั้น ๆ หนึ่งสำหรับคำถามที่มีวิธีการวิเคราะห์ ML มักไม่ใช่วิธีที่เหมาะสม
Amrinder Arora

0

เท่าที่ฉันเข้าใจใช่ปัญหาของคุณเกี่ยวข้องกับการจดจำรูปแบบ เนื่องจากวิธีการคือการจำแนกอินพุตที่มีป้ายกำกับที่คุณเคยจัดเตรียมไว้สำหรับตาข่ายประสาทฉันจึงคิดว่าเครือข่ายประสาทเทียมสามารถทำงานให้คุณได้


0

ปัญหา

ข้อมูลการฝึกอบรมสำหรับระบบที่เสนอมีดังนี้

  • เมทริกบูลีนเป็นตัวแทนของพื้นผิวของการออกแบบทางเรขาคณิตที่เป็นของแข็ง
  • ยังแสดงในเมทริกซ์คือความแตกต่างระหว่างมุมภายในและภายนอกของขอบ
  • ป้ายกำกับ (อธิบายด้านล่าง)

นูนและเว้าไม่ใช่คำที่ถูกต้องในการอธิบายความไม่ต่อเนื่องของการไล่ระดับสีพื้นผิว ขอบภายในเช่นทำจากดอกเอ็นมิลไม่ใช่ผิวจริงของเว้า ความไม่ต่อเนื่องของการไล่ระดับพื้นผิวจากมุมมองของแบบจำลองของแข็งในอุดมคติมีรัศมีเป็นศูนย์ ขอบด้านนอกไม่ได้เป็นส่วนนูนของพื้นผิวด้วยเหตุผลเดียวกัน

ผลลัพธ์ที่ตั้งใจไว้ของระบบที่ผ่านการฝึกอบรมที่นำเสนอคืออาร์เรย์บูลีนที่แสดงถึงคุณสมบัติการออกแบบทางเรขาคณิตที่เป็นของแข็ง

  • สล็อตหนึ่งช่องขึ้นไป
  • เจ้านายหนึ่งคนขึ้นไป
  • หนึ่งหลุมขึ้นไป
  • กระเป๋าหนึ่งใบหรือมากกว่า
  • หนึ่งขั้นตอนขึ้นไป

อาร์เรย์ของค่าบูลีนนี้ยังใช้เป็นป้ายกำกับสำหรับการฝึกอบรม

Caveats ที่เป็นไปได้ในแนวทาง

มีการทำแผนที่ความไม่ลงรอยกันในวิธีนี้ พวกเขาตกคร่าว ๆ เป็นหนึ่งในสี่ประเภท

  • ความกำกวมที่สร้างขึ้นโดยการทำแผนที่โทโพโลยีในแบบจำลอง CAD ไปยังเมทริกซ์ - รูปทรงเรขาคณิตที่เป็นของแข็งซึ่งไม่มีการจับภาพหลักในการเข้ารหัสเมทริกซ์
  • แบบจำลอง CAD ที่ไม่มีเมทริกซ์อยู่ - กรณีที่ขอบเปลี่ยนจากมุมด้านในถึงด้านนอกหรือเกิดจากความโค้ง
  • ความกำกวมในการระบุคุณลักษณะจากเมทริกซ์ - ซ้อนทับระหว่างคุณลักษณะที่สามารถระบุรูปแบบในเมทริกซ์
  • เมทริกซ์อธิบายคุณลักษณะที่ไม่ได้อยู่ในห้าข้อนี้อาจกลายเป็นปัญหาการสูญหายของข้อมูลในการพัฒนา

นี่เป็นเพียงตัวอย่างเล็ก ๆ น้อย ๆ ของปัญหาทอพอโลยีที่อาจพบได้บ่อยในโดเมนการออกแบบเชิงกลบางอย่างและทำให้การทำแผนที่ข้อมูลยุ่งเหยิง

  • รูมีเมทริกซ์เดียวกับเฟรมกล่องที่มีรัศมีภายใน
  • รัศมีภายนอกอาจนำไปสู่การขยายใหญ่เกินไปในเมทริกซ์
  • รูที่ตัดกับขอบอาจแยกไม่ออกจากทอพอโลยีอื่นในรูปแบบเมทริกซ์
  • สองจุดขึ้นไปที่ตัดผ่านรูอาจทำให้เกิดความกำกวม
  • ครีบและซี่โครงที่รองรับผู้บังคับบัญชารอบที่มีรูตรงกลางอาจแยกไม่ออก
  • ลูกบอลและพรูมีเมทริกซ์เดียวกัน
  • ดิสก์และแถบที่มีกากบาทเป็นรูปหกเหลี่ยมที่มีการบิด 180 องศามีเมทริกซ์เดียวกัน

คำเตือนที่เป็นไปได้เหล่านี้อาจเป็นหรือไม่เป็นกังวลสำหรับโครงการที่กำหนดไว้ในคำถาม

การตั้งค่าขนาดใบหน้าให้สมดุลกับความน่าเชื่อถือ แต่ จำกัด การใช้งาน อาจมีวิธีการที่ใช้ประโยชน์จากหนึ่งในสายพันธุ์ของ RNNs ซึ่งอาจอนุญาตให้มีการครอบคลุมขนาดแบบจำลองโดยพลการโดยไม่ลดประสิทธิภาพลงสำหรับรูปทรงเรขาคณิตที่เรียบง่าย วิธีการดังกล่าวอาจเกี่ยวข้องกับการกระจายเมทริกซ์ออกมาเป็นลำดับสำหรับแต่ละตัวอย่างโดยใช้กลยุทธ์การทำให้เป็นมาตรฐานปกติสำหรับแต่ละเมทริกซ์ การแพ็ดดิ้งอาจมีประสิทธิภาพหากไม่มีข้อ จำกัด ด้านประสิทธิภาพการฝึกอบรมและมีจำนวนใบหน้าสูงสุดในทางปฏิบัติ

พิจารณาการนับและความแน่นอนเป็นผลลัพธ์

[0.0,1.0]

ความเป็นไปได้ของการใช้เอาต์พุตจำนวนเต็มที่ไม่เป็นลบในฐานะตัวแทนไบนารีที่ไม่ได้ลงนามที่สร้างโดยการรวมเซลล์เอาต์พุตไบนารีจำนวนมากแทนที่จะเป็นบูลีนเดี่ยวต่อคุณลักษณะควรพิจารณาอย่างน้อยเช่นกัน ดาวน์สตรีมความสามารถในการนับคุณสมบัติอาจมีความสำคัญ

สิ่งนี้นำไปสู่การเปลี่ยนลำดับที่เป็นจริงห้าประการเพื่อพิจารณาซึ่งสามารถสร้างขึ้นโดยเครือข่ายที่ผ่านการฝึกอบรมสำหรับคุณลักษณะแต่ละอย่างของแบบจำลองเรขาคณิตแข็งแต่ละแบบ

  • บูลีนแสดงว่ามีอยู่จริง
  • จำนวนเต็มที่ไม่ใช่เชิงลบที่ระบุการนับอินสแตนซ์
  • บูลีนและความแน่นอนที่แท้จริงของหนึ่งหรือมากกว่าหนึ่งอินสแตนซ์
  • จำนวนเต็มที่ไม่เป็นลบแสดงจำนวนอินสแตนซ์ที่เป็นไปได้มากที่สุดและความแน่นอนที่แท้จริงของอินสแตนซ์อย่างน้อยหนึ่งรายการ
  • ค่าเฉลี่ยจริงและส่วนเบี่ยงเบนมาตรฐาน

การจดจำรูปแบบหรืออะไร

ในวัฒนธรรมปัจจุบันการใช้เครือข่ายเทียมกับปัญหานี้ไม่ได้อธิบายตามปกติว่าเป็นการจดจำรูปแบบในแง่ของการมองเห็นด้วยคอมพิวเตอร์หรือการประมวลผลเสียง มันเป็นความคิดของการเรียนรู้การทำแผนที่การทำงานที่ซับซ้อนผ่านการบรรจบกันในทิศทางที่หยาบของการทำแผนที่ความคิดกำหนดความใกล้ชิดความถูกต้องและความน่าเชื่อถือ พารามิเตอร์ของฟังก์ชั่นอินพุตที่กำหนด Xถูกขับเคลื่อนไปยังป้ายกำกับที่เกี่ยวข้อง Y ระหว่างการฝึก

(X)Y

หากคลาสแนวคิดถูกประมาณฟังก์ชั่นการใช้งานโดยเครือข่ายแสดงอย่างเพียงพอในตัวอย่างที่ใช้สำหรับการฝึกอบรมและตัวอย่างของตัวอย่างการฝึกอบรมถูกวาดในลักษณะเดียวกับที่โปรแกรมเป้าหมายจะวาดในภายหลังการประมาณนั้นน่าจะเพียงพอ

ในโลกของทฤษฎีข้อมูลมีความแตกต่างระหว่างการจดจำรูปแบบและการประมาณฟังก์ชั่นการเบลอของภาพที่ควรจะเป็นในระดับที่สูงกว่านามธรรมแนวคิด AI

ความเป็นไปได้

เครือข่ายจะเรียนรู้การแมปเมทริกซ์กับ [อาร์เรย์ของ] บูลีน [ตัวบ่งชี้] ของคุณสมบัติการออกแบบหรือไม่

หากคำเตือนที่ระบุไว้ข้างต้นเป็นที่ยอมรับของผู้มีส่วนได้ส่วนเสียของโครงการตัวอย่างจะมีการระบุไว้อย่างดีและมีจำนวนเพียงพอและการทำให้ข้อมูลเป็นปกติ, ฟังก์ชั่นการสูญเสีย, พารามิเตอร์ไฮเปอร์และการจัดเลเยอร์ การฝึกอบรมและระบบระบุคุณสมบัติอัตโนมัติที่เหมาะสม อีกครั้งความสามารถในการใช้งานของบานพับรูปทรงของแข็งใหม่ที่ดึงมาจากคลาสแนวคิดเหมือนกับตัวอย่างการฝึกอบรม ความน่าเชื่อถือของระบบขึ้นอยู่กับการฝึกอบรมที่เป็นตัวแทนของกรณีใช้งานในภายหลัง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.