เราจะอธิบายความแตกต่างระหว่างการถดถอยโลจิสติกและเครือข่ายประสาทเทียมให้กับผู้ชมที่ไม่มีพื้นฐานด้านสถิติได้อย่างไร
เราจะอธิบายความแตกต่างระหว่างการถดถอยโลจิสติกและเครือข่ายประสาทเทียมให้กับผู้ชมที่ไม่มีพื้นฐานด้านสถิติได้อย่างไร
คำตอบ:
ฉันคิดว่าคุณกำลังนึกถึงสิ่งที่เคยเป็นและอาจจะยังถูกเรียกว่า 'หลายคนรับรู้' ในคำถามของคุณเกี่ยวกับเครือข่ายประสาท ถ้าเป็นเช่นนั้นฉันจะอธิบายเรื่องทั้งหมดในแง่ของความยืดหยุ่นเกี่ยวกับรูปแบบของขอบเขตการตัดสินใจในฐานะหน้าที่ของตัวแปรอธิบาย โดยเฉพาะอย่างยิ่งสำหรับผู้ชมนี้ฉันจะไม่พูดถึงฟังก์ชั่นลิงก์ / อัตราต่อรองของบันทึกเป็นต้นเพียง แต่คิดว่าความน่าจะเป็นของเหตุการณ์นั้นอยู่บนพื้นฐานของการสังเกตการณ์
นี่เป็นลำดับที่เป็นไปได้:
ข้อดีของวิธีนี้คือคุณไม่จำเป็นต้องเข้าไปดูรายละเอียดทางคณิตศาสตร์เพื่อให้ความคิดที่ถูกต้อง ในความเป็นจริงพวกเขาไม่จำเป็นต้องเข้าใจการถดถอยโลจิสติกส์หรือเครือข่ายประสาทเพื่อเข้าใจความเหมือนและความแตกต่าง
ข้อเสียของวิธีการคือการที่คุณต้องทำภาพจำนวนมากและต่อต้านสิ่งล่อใจที่จะวางลงในพีชคณิตเพื่ออธิบายสิ่งต่าง ๆ อย่างมาก
สำหรับการสรุปที่ง่ายกว่า:
การถดถอยโลจิสติกส์: รูปแบบที่ง่ายที่สุดของโครงข่ายประสาทเทียมซึ่งส่งผลให้เกิดขอบเขตการตัดสินใจที่เป็นเส้นตรง
Neural Networks: superset ที่รวมถึงการถดถอยโลจิสติกและตัวแยกประเภทอื่น ๆ ที่สามารถสร้างขอบเขตการตัดสินใจที่ซับซ้อนมากขึ้น
(หมายเหตุ: ฉันหมายถึงการถดถอยโลจิสติก "ธรรมดา" โดยไม่ได้รับความช่วยเหลือจากเมล็ดหนึ่ง)
(การอ้างอิง: หลักสูตร deeplearning.ai โดย Andrew Ng "การถดถอยโลจิสติกในฐานะเครือข่ายประสาท" และ "การจัดหมวดหมู่ข้อมูลภาพถ่ายด้วยเลเยอร์ที่ซ่อนอยู่หนึ่งชั้น")
ฉันจะใช้คำถามอย่างแท้จริง: คนที่ไม่มีพื้นฐานด้านสถิติ และฉันจะไม่พยายามให้ข้อมูลพื้นฐานทางสถิติแก่บุคคลนั้น ตัวอย่างเช่นสมมติว่าคุณต้องอธิบายความแตกต่างของ CEO ของ บริษัท หรืออะไรทำนองนั้น
ดังนั้น: การถดถอยโลจิสติกเป็นเครื่องมือสำหรับการสร้างแบบจำลองตัวแปรเด็ดขาดในแง่ของตัวแปรอื่น ๆ มันให้วิธีในการค้นหาว่าการเปลี่ยนแปลงในตัวแปร "อื่น ๆ " แต่ละตัวมีผลต่ออัตราต่อรองของผลลัพธ์ที่แตกต่างกันอย่างไรในตัวแปรแรก ผลลัพธ์ค่อนข้างง่ายต่อการตีความ
โครงข่ายประสาทเทียมเป็นวิธีการหนึ่งที่ให้คอมพิวเตอร์ลองเรียนรู้จากตัวอย่างในรูปแบบที่คล้ายกับวิธีที่มนุษย์เรียนรู้เกี่ยวกับสิ่งต่าง ๆ มันอาจส่งผลให้ตัวแบบที่เป็นตัวทำนายที่ดี แต่โดยปกติแล้วพวกมันจะทึบกว่าตัวแบบถดถอยโลจิสติกส์
ฉันได้รับการสอนว่าคุณสามารถนึกถึงเครือข่ายประสาท (ด้วยฟังก์ชั่นการเปิดใช้งานโลจิสติก) เป็นค่าเฉลี่ยของฟังก์ชั่น logit โดยมีน้ำหนักตัวประมาณ ด้วยการเลือกการบันทึกจำนวนมากคุณสามารถใส่แบบฟอร์มการทำงานใดก็ได้ มีสัญชาตญาณกราฟิกในโพสต์บล็อกความรู้สึกทางเศรษฐกิจ
คำตอบอื่น ๆ ที่ดี ฉันแค่เพิ่มรูปภาพที่แสดงว่าคุณสามารถนึกถึงการถดถอยโลจิสติกและการถดถอยโลจิสติกหลายระดับ
จากSebastian Raschka, Michigan State University บน KDnuggets :
ภาพประกอบเพิ่มเติมอีกเล็กน้อยสำหรับการถดถอยโลจิสติกหลายระดับ:
ภาพประกอบที่คล้ายกันที่นำมาจากhttp://www.deeplearningbook.org/บทที่ 1:
และอีกหนึ่งบทเรียนจากTensorFlow :
เช่นในCaffeคุณจะดำเนินการถดถอยโลจิสติดังต่อไปนี้ :
ฉันจะใช้ตัวอย่างของปัญหาที่ซับซ้อน แต่เป็นรูปธรรมที่ผู้ชมเข้าใจ ใช้โหนดที่ซ่อนอยู่ซึ่งการตีความไม่ได้รับการฝึกอบรม แต่มีความหมายเฉพาะ
อินพุตไบนารีระบุว่ามีชิ้นส่วนของแต่ละประเภทในแต่ละตารางหรือไม่
การถดถอยเชิงเส้นเป็นตัวกำหนดว่าอัศวินม้าขาวบน h4 นั้นดีแค่ไหน อาจไม่ชัดเจนว่าเป็นสิ่งที่ดี แต่ถ้าอยู่ใน h4 จะไม่ถูกบันทึกซึ่งอาจเทียบกับข้อพิจารณาอื่น ๆ การถดถอยเชิงเส้นอาจกู้คืนค่าหยาบของชิ้นและมันจะดีกว่าที่จะมีชิ้นส่วนของคุณไปที่ศูนย์กลางของกระดานและบนฝั่งของฝ่ายตรงข้ามของกระดาน การถดถอยเชิงเส้นไม่สามารถให้คุณค่ากับการรวมกันเช่นว่าราชินีของคุณใน b2 นั้นมีค่ามากกว่าถ้ากษัตริย์ผู้ต่อต้านอยู่บน a1
โครงข่ายประสาทเทียมอาจมีโหนดที่ซ่อนอยู่สำหรับแนวคิดเช่น "ความได้เปรียบเชิงวัตถุ" "ความปลอดภัยของราชาดำ" "การควบคุมของศูนย์กลาง" "ทั้งสอง rooks บน d-file," "Queen rook pawn" หรือ "bishop การเคลื่อนไหว." บางส่วนของสิ่งเหล่านี้สามารถประมาณได้จากอินพุตของบอร์ดเท่านั้นในขณะที่บางอันอาจต้องอยู่ในเลเยอร์ที่สองหรือหลังจากนั้น โครงข่ายประสาทเทียมสามารถใช้สิ่งเหล่านี้เป็นข้อมูลป้อนเข้าไปในการประเมินขั้นสุดท้ายของตำแหน่ง แนวคิดเหล่านี้ช่วยให้ผู้เชี่ยวชาญประเมินตำแหน่งดังนั้นเครือข่ายประสาทควรมีความสามารถในการประเมินที่แม่นยำกว่าการถดถอยเชิงเส้น อย่างไรก็ตามการสร้างโครงข่ายประสาทต้องใช้เวลามากกว่านี้เนื่องจากคุณต้องเลือกโครงสร้างของมันและมีพารามิเตอร์ในการฝึกอบรมอีกมากมาย