อะไรคือความแตกต่างระหว่าง Inception v2 และ Inception v3?


18

บทความที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับการโน้มน้าวใจอธิบายถึง GoogleNet ซึ่งมีโมดูลการลงทะเบียนดั้งเดิม:

ป้อนคำอธิบายรูปภาพที่นี่

การเปลี่ยนเป็นการเริ่มต้น v2 คือพวกเขาแทนที่การ convolutions 5x5 โดยการ convolutions 3x3 ที่ต่อเนื่องกันสองครั้งและใช้การรวมกำไร:

ป้อนคำอธิบายรูปภาพที่นี่

อะไรคือความแตกต่างระหว่าง Inception v2 และ Inception v3?


มันเป็นเพียงการทำให้เป็นมาตรฐานหรือไม่? Inception v2 มีการทำแบ็ตช์มาตรฐานหรือไม่?
Martin Thoma

github.com/SKKSaikia/CNN-GoogLeNet ที่เก็บนี้เก็บ GoogLeNet ทุกรุ่นและความแตกต่าง ให้มันลอง.
Amartya Ranjan Saikia

คำตอบ:


22

ในNormalization Batch paper , Sergey และคณะ, 2015 สถาปัตยกรรมInception-v1 ที่นำเสนอซึ่งแตกต่างจากGoogleNetในบทความที่จะลึกลงไปด้วยความเชื่อมั่นและในขณะเดียวกันพวกเขาก็แนะนำ Batch Normalization to Inception (BN-Inception)

ความแตกต่างที่สำคัญกับเครือข่ายที่อธิบายไว้ใน (Szegedy et al., 2014) คือเลเยอร์ 5x5 จะถูกแทนที่ด้วยเลเยอร์ต่อเนื่อง 3x5 สองอันที่ 3x3 convolutions พร้อมตัวกรองสูงสุด 128 ตัว

และในกระดาษทบทวน Inception สถาปัตยกรรมสำหรับคอมพิวเตอร์วิสัยทัศน์ผู้เขียนเสนอจัดตั้งกองทุน-v2 และ Inception-v3

ในInception-v2พวกเขาแนะนำการแยกตัวประกอบ (แยกตัวประกอบการแปลงเป็นความเชื่อที่เล็กลง) และการเปลี่ยนแปลงเล็กน้อยใน Inception-v1

โปรดทราบว่าเราได้ทำการแปลงการสังสรรแบบดั้งเดิม 7x7 เป็น 3 3x3 convolutions

สำหรับInception-v3เป็นตัวแปรของ Inception-v2 ซึ่งเพิ่ม BN -iliary

BN ช่วยอ้างถึงรุ่นที่เลเยอร์เชื่อมต่ออย่างเต็มที่ของลักษณนามเสริมนั้นเป็นปกติยังไม่เพียง แต่ convolutions เรากำลังอ้างถึงโมเดล [Inception-v2 + BN ที่เสริม] เป็น Inception-v3


3

นอกจากสิ่งที่ daoliker พูดถึง

inception v2 ใช้ convolution ที่แบ่งแยกได้เป็นชั้นแรกของความลึก 64

อ้างจากกระดาษ

แบบจำลองของเราใช้การโน้มน้าวแบบแยกไม่ได้พร้อมตัวคูณความลึก 8 ในชั้นแรก สิ่งนี้จะช่วยลดค่าใช้จ่ายในการคำนวณในขณะที่เพิ่มการใช้หน่วยความจำในเวลาฝึกอบรม

ทำไมสิ่งนี้จึงสำคัญ เพราะมันถูกทิ้งใน v3 และ v4 และ resnet ก่อตั้ง แต่แนะนำใหม่และใช้อย่างมากในmobilenetภายหลัง


1

คำตอบสามารถพบได้ในไปลึกด้วยกระดาษ convolutions: https://arxiv.org/pdf/1512.00567v3.pdf

ตรวจสอบตารางที่ 3 Inception v2 เป็นสถาปัตยกรรมที่อธิบายไว้ในเอกสาร Going Convolutions Inception v3 เป็นสถาปัตยกรรมเดียวกัน (การเปลี่ยนแปลงเล็กน้อย) พร้อมอัลกอริธึมการฝึกอบรมที่แตกต่างกัน (RMSprop, การปรับให้เรียบของฉลาก, เพิ่มหัวเสริมด้วยบรรทัดฐานแบทช์เพื่อปรับปรุงการฝึกอบรม ฯลฯ )


1

ที่จริงแล้วคำตอบข้างต้นดูเหมือนจะผิด อันที่จริงมันเป็นเรื่องใหญ่กับการตั้งชื่อ อย่างไรก็ตามดูเหมือนว่าจะได้รับการแก้ไขในกระดาษที่แนะนำ Inception-v4 (ดู: "Inception-v4, Inception-ResNet และผลกระทบของการเชื่อมต่อที่เหลือในการเรียนรู้"):

Incon-architecture สถาปัตยกรรมแบบ Inception เชิงลึกได้ถูกนำมาใช้เป็น GoogLeNet ใน (Szegedy et al. 2015a) ที่นี่ชื่อ Inception-v1 ต่อมาสถาปัตยกรรม Inception นั้นได้รับการขัดเกลาในหลาย ๆ ด้านโดยเริ่มจากการทำให้เป็นมาตรฐานแบบชุด (Ioffe and Szegedy 2015) (Inception-v2) ต่อมาจากแนวคิดการแยกตัวประกอบเพิ่มเติมในการทำซ้ำครั้งที่สาม (Szegedy et al. 2015b) ซึ่งจะเรียกว่า Inception-v3 ในรายงานนี้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.