การวัดความสัมพันธ์ของโครงข่ายประสาทเทียมที่ได้รับการฝึกอบรม


9

ฉันกำลังฝึกอบรมโครงข่ายประสาทเทียม (backpropagation, feed-forward) พร้อมกับข้อมูลที่ไม่ได้กระจายทั่วไป นอกเหนือจากค่าเฉลี่ยความคลาดเคลื่อนกำลังสองวรรณคดีมักเสนอแนะว่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันสำหรับการประเมินคุณภาพของตาข่ายที่ผ่านการฝึกอบรม แต่สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันนั้นสมเหตุสมผลหรือไม่ถ้าข้อมูลการฝึกอบรมไม่ได้ถูกแจกจ่ายตามปกติ? มันจะไม่สมเหตุสมผลหรือไม่ที่จะใช้การวัดความสัมพันธ์ตามระดับเช่น Spearman rho?


คุณสามารถอธิบายรายละเอียดเกี่ยวกับวิธีการใช้งานหรืออ้างอิงได้หรือไม่?
bayerj

คำตอบ:


6

สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันเป็นการวัดความสัมพันธ์เชิงเส้น ขึ้นอยู่กับช่วงเวลาสำคัญที่สองเชิงประจักษ์มันได้รับอิทธิพลจากค่ามาก ดังนั้น:

  • หลักฐานของความไม่เชิงเส้นในการกระจายของค่าจริง - vs - ทำนายจะแนะนำให้ใช้ทางเลือกเช่นสัมประสิทธิ์สหสัมพันธ์ (Spearman) สัมประสิทธิ์;

    • ถ้าความสัมพันธ์ดูโดยเฉลี่ย (เหมือนในแถวบนของภาพประกอบ) ค่าสัมประสิทธิ์สหสัมพันธ์อันดับจะมีประสิทธิภาพ

    • มิฉะนั้นความสัมพันธ์คือ curvilinear (เช่นในตัวอย่างจากแถวล่างของภาพประกอบเช่นซ้ายสุดหรือกลางรูปตัวยู) และมีแนวโน้มว่าการวัดความสัมพันธ์ใด ๆ จะเป็นคำอธิบายที่ไม่เพียงพอ การใช้สัมประสิทธิ์สหสัมพันธ์อันดับจะไม่แก้ไขสิ่งนี้

  • การปรากฏตัวของข้อมูลที่อยู่ห่างไกลใน scatterplot บ่งชี้ว่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันอาจกำลังเกินกำลังของความสัมพันธ์เชิงเส้น มันอาจจะหรืออาจไม่ถูกต้อง; ใช้ด้วยความระมัดระวัง ค่าสัมประสิทธิ์สหสัมพันธ์อันดับอาจจะดีกว่าหรือไม่ดีขึ้นอยู่กับความน่าเชื่อถือของค่าที่อยู่ห่างไกล

ตัวอย่างของการกระจายและเพียร์สันสหสัมพันธ์

(ภาพที่คัดลอกมาจากบทความ Wikipedia เกี่ยวกับสัมประสิทธิ์สหสัมพันธ์ของ Pearson )


คุณสามารถให้แหล่งข้อมูลสำหรับแถลงการณ์ของคุณเกี่ยวกับการใช้อันดับสหสัมพันธ์เพื่อวัดประสิทธิภาพการถดถอยได้หรือไม่?
Simon Kuang
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.