ฟีเจอร์คอขวดคืออะไร?


11

ในบล็อกโพสต์การสร้างรูปแบบการจำแนกภาพที่ทรงพลังโดยใช้ข้อมูลน้อยมากมีการกล่าวถึงคุณสมบัติของคอขวด ฟีเจอร์คอขวดคืออะไร? พวกเขาเปลี่ยนแปลงด้วยสถาปัตยกรรมที่ใช้หรือไม่ พวกมันเป็นผลลัพธ์สุดท้ายของเลเยอร์ convolutional ก่อนเลเยอร์ที่เชื่อมต่อเต็มที่หรือไม่? ทำไมพวกเขาถึงเรียกเช่นนั้น?


[ดูสิ่งนี้ด้วย] ( ai.stackexchange.com/questions/4864/… )
Anurag Singh

คำตอบ:


9

ในบล็อกโพสต์การสร้างรูปแบบการจำแนกภาพที่ทรงพลังโดยใช้ข้อมูลน้อยมากมีการกล่าวถึงคุณสมบัติของคอขวด ฟีเจอร์คอขวดคืออะไร?

มันเขียนไว้อย่างชัดเจนในการเชื่อมโยงที่คุณให้กับ "คุณสมบัติคอขวด" จากรุ่น VGG16 นี้: การเปิดใช้งานที่ผ่านมาก่อนที่จะแผนที่ชั้นอย่างเต็มที่ที่เกี่ยวโยงกัน

พวกเขาเปลี่ยนแปลงด้วยสถาปัตยกรรมที่ใช้หรือไม่

แน่ใจ ผู้เขียนส่วนใหญ่มักใช้โมเดลที่ได้รับการฝึกฝนมาก่อน (ผ่านการฝึกอบรมกับข้อมูลขนาดใหญ่และตอนนี้ใช้เป็นตัวแยกคุณลักษณะเท่านั้น)

พวกมันเป็นผลลัพธ์สุดท้ายของเลเยอร์ convolutional ก่อนเลเยอร์ที่เชื่อมต่อเต็มที่หรือไม่?

ใช่.

ทำไมพวกเขาถึงเรียกเช่นนั้น?

เมื่อกำหนดขนาดอินพุตให้กับ VGG คุณลักษณะแผนที่ของมิติ HxW จะเล็กลงเป็นสองเท่าหลังจากการใช้งานพูลทุกครั้ง HxW มีขนาดเล็กที่สุดในชั้น convolutional ล่าสุด


6

ก่อนอื่นเราต้องพูดคุยเกี่ยวกับการเรียนรู้การถ่ายโอน ลองนึกภาพคุณฝึกเครือข่ายประสาทผ่านชุดข้อมูลของภาพเพื่อตรวจจับแมวคุณสามารถใช้ส่วนหนึ่งของการฝึกอบรมที่คุณทำเพื่อทำงานกับเครื่องตรวจจับอื่นได้ ที่เรียกว่าการเรียนรู้การถ่ายโอน

ในการถ่ายโอนการเรียนรู้คุณจะลบเลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์ล่าสุดออกจากโมเดลและเสียบเลเยอร์ของคุณที่นั่น เอาต์พุตโมเดล "ที่ถูกตัดทอน" จะเป็นคุณลักษณะที่จะเติม "โมเดล" ของคุณ สิ่งเหล่านี้คือคุณสมบัติของคอขวด

VGG16 เป็นแบบฝึกหัดเหนือแค็ตตาล็อก ImageNet ที่มีความแม่นยำดีมาก ในโพสต์ที่คุณแบ่งปันใช้โมเดลนั้นเป็นฐานในการตรวจจับแมวและสุนัขที่มีความแม่นยำสูงกว่า

คุณสมบัติคอขวดขึ้นอยู่กับรุ่น ในกรณีนี้เราใช้ VGG16 มีรุ่นอื่น ๆ ที่ผ่านการฝึกอบรมมาแล้วเช่น VGG19, ResNet-50

มันเหมือนกับว่าคุณกำลังตัดโมเดลและเพิ่มเลเยอร์ของคุณเอง ส่วนใหญ่เอาท์พุทเลเยอร์ในการตัดสินใจสิ่งที่คุณต้องการตรวจสอบผลลัพธ์สุดท้าย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.