คุณถูกต้องว่าเลเยอร์เชิงเส้นหลายรายการสามารถเทียบเท่ากับเลเยอร์เชิงเส้นเดียวได้ ดังที่คำตอบอื่น ๆ ได้กล่าวไว้ฟังก์ชั่นการเปิดใช้งานแบบไม่เชิงเส้นอนุญาตการจำแนกแบบไม่เชิงเส้น การบอกว่าตัวจําแนกเป็นแบบไม่เชิงเส้นหมายความว่ามันมีขอบเขตการตัดสินใจแบบไม่เชิงเส้น ขอบเขตการตัดสินใจเป็นพื้นผิวที่แยกชั้นเรียน ตัวจําแนกจะคาดการณ์หนึ่งชั้นสำหรับทุกจุดในด้านหนึ่งของขอบเขตการตัดสินใจและอีกชั้นหนึ่งสำหรับทุกจุดในด้านอื่น ๆ
ลองพิจารณาสถานการณ์ทั่วไป: ทำการจำแนกเลขฐานสองกับเครือข่ายที่มีหน่วยซ้อนไม่เชิงเส้นหลายชั้นและหน่วยเอาท์พุทที่มีฟังก์ชั่นเปิดใช้งาน sigmoidal ให้เอาต์พุต,คือเวกเตอร์ของการเปิดใช้งานสำหรับเลเยอร์ที่ซ่อนอยู่ล่าสุด,คือเวกเตอร์ของน้ำหนักของพวกเขาไปยังยูนิตเอาต์พุต, และคืออคติของเอาต์พุตยูนิต ผลลัพธ์คือ:h w byhwb
y=σ(hw+b)
โดยที่เป็นฟังก์ชัน sigmoid โลจิสติกส์ เอาท์พุทถูกตีความว่าเป็นความน่าจะเป็นว่าชั้นเป็น1คลาสคาดการณ์คือ:1 cσ1c
c={01y≤0.5y>0.5
ลองพิจารณากฎการจัดหมวดหมู่เกี่ยวกับการเปิดใช้งานหน่วยที่ซ่อนอยู่ เราจะเห็นว่าการเปิดใช้งานหน่วยที่ซ่อนอยู่จะถูกฉายลงบนเส้นB กฎสำหรับการกำหนดคลาสเป็นฟังก์ชั่นของซึ่งสัมพันธ์กับการฉายภาพตามเส้น กฎการจัดหมวดหมู่จึงเทียบเท่ากับการพิจารณาว่าการประมาณการตามเส้นนั้นน้อยกว่าหรือมากกว่าขีด จำกัด บางส่วน (ในกรณีนี้ขีด จำกัด จะถูกกำหนดโดยค่าลบของอคติ) ซึ่งหมายความว่าขอบเขตการตัดสินใจเป็นไฮเปอร์เพลนที่เป็นฉากตั้งฉากกับเส้นและตัดกันเส้น ณ จุดที่สอดคล้องกับขีด จำกัด นั้นhW+by
ฉันกล่าวก่อนหน้านี้ว่าขอบเขตการตัดสินใจไม่เชิงเส้น แต่ไฮเปอร์เพลนเป็นคำจำกัดความของขอบเขตเชิงเส้น แต่เราได้พิจารณาขอบเขตเป็นหน้าที่ของหน่วยที่ซ่อนอยู่ก่อนหน้าเอาต์พุต การเปิดใช้งานหน่วยที่ซ่อนอยู่เป็นฟังก์ชันที่ไม่ใช่เชิงเส้นของอินพุตดั้งเดิมเนื่องจากเลเยอร์ที่ซ่อนไว้ก่อนหน้านี้และฟังก์ชั่นการเปิดใช้งานแบบไม่เชิงเส้น วิธีหนึ่งที่จะคิดเกี่ยวกับเครือข่ายก็คือมันจะทำการแมปข้อมูลแบบไม่เชิงเส้นในพื้นที่ของคุณลักษณะ พิกัดในพื้นที่นี้ได้รับจากการเปิดใช้งานของหน่วยที่ซ่อนอยู่ล่าสุด เครือข่ายทำการจำแนกเชิงเส้นในพื้นที่นี้ (การถดถอยโลจิสติกส์ในกรณีนี้) นอกจากนี้เรายังสามารถคิดถึงขอบเขตการตัดสินใจในฐานะหน้าที่ของอินพุตต้นฉบับ ฟังก์ชั่นนี้จะเป็นแบบไม่เชิงเส้นเนื่องจากการแมปแบบไม่เชิงเส้นจากอินพุตไปยังการเปิดใช้งานหน่วยที่ซ่อนอยู่
โพสต์บล็อกนี้แสดงให้เห็นถึงตัวเลขและภาพเคลื่อนไหวที่ดีของกระบวนการนี้