เครือข่ายประสาทลึก - เพียงเพื่อการจำแนกภาพ?


14

ตัวอย่างทั้งหมดที่ฉันพบโดยใช้ความเชื่ออย่างลึกล้ำหรือโครงข่ายประสาทเทียมใช้สำหรับการจำแนกภาพการตรวจจับแชทและการรู้จำเสียง

โครงข่ายใยประสาทเทียมแบบลึกยังมีประโยชน์สำหรับงานการปรับเปลี่ยนแบบดั้งเดิมซึ่งคุณสมบัติไม่ได้มีโครงสร้าง (เช่นไม่จัดเรียงตามลำดับหรือตาราง) ถ้าใช่คุณยกตัวอย่างได้ไหม


3
ประโยคแรกของคุณทำให้เกิดเครือข่ายประสาทเทียม ดูเหมือนว่าคุณกำลังสับสนกับเครือข่ายความเชื่อลึก ๆ พวกเขาไม่เหมือนกันแม้ว่าทั้งคู่จะเป็นรูปแบบของโครงข่ายประสาท
MSalters

1
ฉันจะเห็นด้วยกับ @msalters แต่จะบอกว่าเครือข่ายความเชื่อที่ลึกซึ้งเป็นเครือข่ายที่ลึกอย่างแท้จริงและประสบความสำเร็จอย่าง จำกัด ในขณะที่อวนที่มีความเชื่อในเครือข่ายเป็นเหมือนตัวกรองภาพไฮบริดที่ปรับตัวได้
seanv507

คุณหมายถึงอะไรโดย "การสังเกต" เป็น "ไม่มีโครงสร้าง (ไม่ได้จัดเรียงตามลำดับหรือตาราง)" คุณอ้างถึงรูปภาพที่มี "โครงสร้าง" ในแง่ที่ว่าพิกเซลแต่ละพิกเซลถูกจัดเรียงบนตารางหรือไม่? แต่แล้วคุณสมบัติที่เป็น "โครงสร้าง" ไม่ใช่ "การสังเกต" (ภาพเหล่านั้นจะเป็นภาพบุคคล)
อะมีบาพูดว่า Reinstate Monica

ฉันจะบอกว่าเครือข่าย Convolution ทั้งหมดนั้นอยู่ในระดับลึกไม่ใช่ทุกเครือข่ายที่ลึกจะเป็นพันธมิตรและในทำนองเดียวกันทุกเครือข่ายที่มีความเชื่อลึกนั้นจะลึก แน่นอนคุณสามารถมีเครือข่ายที่ลึกที่ไม่ลึกและไม่สับสนพวกเขาก็มีแนวโน้มที่จะฝึกอบรมยาก แน่นอนว่ามีขอบเขตสำหรับการถกเถียงกันอย่างไม่มีจุดหมายเกี่ยวกับคำศัพท์
Lyndon White

คุณไม่สามารถใช้เครือข่าย convolutional กับข้อมูลที่ไม่มีโครงสร้าง (ไม่ใช่ในลำดับ / ตาราง ฯลฯ ) โดยทั่วไปมันไม่สมเหตุสมผล เครือข่าย convolutional นั้นมีความสัมพันธ์อย่างใกล้ชิดกับการแปลงฟูริเยร์ของอินพุตของคุณเช่นสำหรับลำดับการแปลงจากโดเมนเวลาเป็นโดเมนความถี่
Lyndon White

คำตอบ:


8

ลักษณะของภาพที่ทำให้สามารถจำแนกได้ด้วยเครือข่ายประสาทลึกนั้นมีคุณสมบัติมากมาย (อาจเป็นล้านถ้าไม่ใช่ล้านพิกเซลที่มี RGB, ความเข้ม ฯลฯ ) และหากคุณมีป้ายกำกับที่ถูกต้องมันไม่ใช่ข้อมูลที่มีเสียงดัง กล้องทุกวันนี้ดีมากและไม่ได้ทำการวัดอะไรผิด ๆ ต้องขอบคุณอินเทอร์เน็ตเรามีภาพที่มีป้ายกำกับอย่างถูกต้องจำนวนมาก เครือข่ายที่ลึกสามารถแสดงฟังก์ชั่นที่ซับซ้อนตามอำเภอใจซึ่งเป็นปัญหากับข้อมูลที่มีเสียงดังเพราะคุณสามารถรบกวนเสียงได้อย่างง่ายดายดังนั้นทำไมวิธีการเรียนรู้หลายวิธีจึงมีแนวโน้มที่จะลงโทษแบบจำลองที่ซับซ้อน ในกรณีของการรู้จำภาพอย่างไรก็ตามฟังก์ชั่นที่แท้จริงดูเหมือนจะซับซ้อนจริง ๆ เราไม่รู้ว่ารูปแบบการใช้งานเป็นอย่างไรและเราไม่รู้ด้วยซ้ำว่าคุณสมบัติที่เกี่ยวข้องนั้นมีอยู่ในหลายกรณี

นี่ไม่ได้หมายความว่าคุณไม่สามารถใช้เครือข่ายที่ลึกซึ้งเพื่อเรียนรู้ฟังก์ชั่นที่ไม่มีส่วนเกี่ยวข้องกับภาพ คุณเพียงแค่ต้องระมัดระวังเกี่ยวกับข้อเสียซึ่งส่วนใหญ่มีแนวโน้มที่จะ overfitting มาก แต่ก็ยังมีค่าใช้จ่ายในการคำนวณสูงและอาจต้องใช้เวลานานในการฝึกอบรม ข้อเสียอีกอย่างคือคุณมีความสามารถในการตีความโมเดลน้อยมากหรือไม่มีเลยซึ่งไม่สำคัญสำหรับการจัดหมวดหมู่ภาพ เราแค่พยายามทำให้คอมพิวเตอร์รู้จักความแตกต่างระหว่างชิมแปนซีกับลิงอุรังอุตัง ความเข้าใจของมนุษย์ในสูตรไม่สำคัญ สำหรับโดเมนอื่น ๆ โดยเฉพาะอย่างยิ่งการวินิจฉัยทางการแพทย์การวิจัยเชิงนโยบาย ฯลฯ คุณต้องการหรืออาจต้องการความเข้าใจของมนุษย์


5

แน่นอนว่าคุณสามารถใช้โครงข่ายประสาทเทียมลึก ๆ สำหรับปัญหาต่าง ๆ นอกเหนือจากการจดจำรูปภาพหรือการรู้จำเสียง ปัญหาคือถ้าคุณต้องการมันจริงๆ

เครือข่ายประสาทลึกนั้นมีประสิทธิภาพมากกว่า MLP แบบง่าย ๆ แต่ก็ใช้ทรัพยากรมากกว่าและยากต่อการพัฒนา ดังนั้นจึงถูกใช้ในโดเมนที่ซับซ้อนจริงๆ คุณสามารถใช้มันเพื่อแก้ปัญหาที่ง่ายขึ้น แต่โดยทั่วไปแล้วโมเดลที่ง่ายกว่าจะได้ผลลัพธ์ที่ดีเช่นกัน

การใช้โครงข่ายประสาทเทียมลึก ๆ เพื่อแก้ปัญหาง่าย ๆ ก็เหมือนกับการฆ่าแมลงวันด้วยปืนยิงรถถังแน่นอนว่าคุณจะฆ่าพวกมัน แต่คุณไม่เจอวิธีที่ง่ายกว่านี้เหรอ?


2
นี่คือคำตอบที่ไม่ใช่ อะไรง่ายอะไรที่ยาก การทำนายตลาดหุ้น / การคาดการณ์จากตัวอย่างที่ จำกัด / ... มีปัญหาอะไรมากมายที่จะดีกับพวกเขาบ้าง?
seanv507

ฉันไม่ได้บอกว่าเครือข่ายประสาทลึกสามารถแก้ไขอะไรได้ สิ่งที่ฉันหมายถึงคือมันใช้ในโดเมนที่ซับซ้อนที่คุณมีรายการจำนวนมาก ฉันรู้ว่าพวกเขาไม่สามารถแก้ปัญหาทุกปัญหาได้ แต่มันไม่ใช่ประเด็นในคำถามนี้ ประเด็นคือการเน้นว่าพวกเขาสามารถนำไปใช้กับปัญหาอื่น ๆ นอกเหนือจากการจดจำภาพ / การพูด แต่พวกเขามีข้อเสียที่ควรพิจารณาในกรณีที่รูปแบบอื่น ๆ ที่สามารถนำมาใช้
davidivad

5

ฉันเห็นด้วยกับคำตอบของ davidivad แต่ฉันก็คิดว่าการประยุกต์ใช้โครงข่ายใยประสาทลึกกับภาพก็คือรูปภาพ (และที่สำคัญกว่านั้นคือรูปภาพที่มีป้ายกำกับ ) มีราคาไม่แพงนักในการรวบรวม ในโดเมนอื่น ๆ อาจมีราคาแพงมากในการรวบรวมข้อมูลในขนาดใหญ่โดยเฉพาะอย่างยิ่งภายในข้อ จำกัด ของอุตสาหกรรมทั่วไปหรือรัฐวิสาหกิจ การรวมปัญหานี้คือในหลาย ๆ แอปพลิเคชั่นปรากฏการณ์ที่น่าสนใจนั้นค่อนข้างหายากดังนั้นจะมีตัวอย่างที่มีค่าในการเรียนรู้ดังนั้นแม้ความพยายามในการเก็บรวบรวมข้อมูลขนาดใหญ่อาจทำให้สมาชิกบางกลุ่มมีจำนวนน้อย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.