อะไรคือความแตกต่างระหว่างฟังก์ชั่นการสูญเสียและฟังก์ชั่นการตัดสินใจ?


23

ฉันเห็นว่าทั้งสองฟังก์ชั่นเป็นส่วนหนึ่งของวิธีการขุดข้อมูลเช่นตัวเร่งการเลื่อนสีไล่ระดับสี ฉันเห็นว่ามันเป็นวัตถุแยกกันเช่นกัน

ความสัมพันธ์ระหว่างทั้งสองเป็นอย่างไร

คำตอบ:


45

ฟังก์ชั่นการตัดสินใจเป็นฟังก์ชั่นซึ่งจะมีชุดข้อมูลเป็น input และให้การตัดสินใจเป็นเอาท์พุท การตัดสินใจขึ้นอยู่กับปัญหาที่เกิดขึ้น ตัวอย่างรวมถึง:

  • ปัญหาการประมาณค่า: "การตัดสินใจ" คือค่าประมาณ
  • ปัญหาการทดสอบสมมติฐาน:การตัดสินใจคือปฏิเสธหรือไม่ปฏิเสธสมมติฐานว่าง
  • ปัญหาการจำแนก:การตัดสินใจคือการจำแนกการสังเกตใหม่ (หรือการสังเกต) เป็นหมวดหมู่
  • ปัญหาการเลือกรูปแบบ:การตัดสินใจคือการเลือกหนึ่งในรูปแบบของผู้สมัคร

โดยทั่วไปจะมีฟังก์ชั่นการตัดสินใจจำนวนไม่ จำกัด สำหรับปัญหา หากเรามีความสนใจในการประเมินความสูงของชายชาวสวีเดนจากการสังเกตสิบครั้งเราสามารถใช้ฟังก์ชันการตัดสินใจใด ๆ ต่อไปนี้d ( x ) :x=(x1,x2,,x10)d(x)

  • ค่าเฉลี่ยตัวอย่าง: ฉันd(x)=110i=110xi
  • ค่ามัธยฐานของตัวอย่าง: d(x)=median(x)
  • ค่าเฉลี่ยเรขาคณิตของตัวอย่าง: d(x)=x1x1010
  • ฟังก์ชั่นที่เสมอกลับ 1: โดยไม่คำนึงถึงความคุ้มค่าของx โง่ใช่ แต่มันก็เป็นฟังก์ชั่นการตัดสินใจที่ถูกต้องd(x)=1x

เราจะตัดสินใจได้อย่างไรว่าจะใช้ฟังก์ชันการตัดสินใจใด วิธีหนึ่งคือการใช้ฟังก์ชั่นการสูญเสียซึ่งอธิบายถึงการสูญเสีย (หรือค่าใช้จ่าย) ที่เกี่ยวข้องกับการตัดสินใจที่เป็นไปได้ทั้งหมด ฟังก์ชันการตัดสินใจที่แตกต่างกันมีแนวโน้มที่จะนำไปสู่ข้อผิดพลาดประเภทต่าง ๆ ฟังก์ชั่นการสูญเสียบอกเราว่าเราควรจะกังวลเกี่ยวกับข้อผิดพลาดประเภทใด ฟังก์ชั่นการตัดสินใจที่ดีที่สุดคือฟังก์ชั่นที่มีอัตราผลตอบแทนต่ำสุดขาดทุนที่คาดว่า สิ่งที่เกิดขึ้นจากการสูญเสียที่คาดหวังขึ้นอยู่กับการตั้งค่า (โดยเฉพาะอย่างยิ่งไม่ว่าเราจะพูดถึงสถิติที่ใช้บ่อยหรือแบบเบย์ )

สรุป:

  • ฟังก์ชั่นการตัดสินใจจะใช้ในการตัดสินใจตามข้อมูล
  • ฟังก์ชั่นการสูญเสียถูกใช้เพื่อกำหนดฟังก์ชั่นการตัดสินใจที่จะใช้

สำหรับฟังก์ชั่นการตัดสินใจแบบพารามิเตอร์ (เช่นการถดถอยโลจิสติกการตัดสินใจขีด จำกัด ) โดยทั่วไปคุณมีฟังก์ชั่นหนึ่งที่เป็นไปได้สำหรับการรวมพารามิเตอร์แต่ละตัวและฟังก์ชั่นการสูญเสียจะใช้เพื่อค้นหาสิ่งที่ดีที่สุด ตัวอย่างทั่วไป: หากคุณใช้การไล่ระดับสีแบบไล่ระดับเพื่อสำรวจพื้นที่พารามิเตอร์คุณจะได้รับการสูญเสียเมื่อเทียบกับพารามิเตอร์และสืบสู่การสูญเสียขั้นต่ำ (ในพื้นที่)
pixelou

7

ฟังก์ชั่นการสูญเสียคือสิ่งที่ถูกย่อให้เล็กสุดเพื่อให้ได้แบบซึ่งเหมาะสมที่สุดในบางแง่มุม ตัวแบบมีฟังก์ชั่นการตัดสินใจที่ใช้ในการทำนาย

ตัวอย่างเช่นในตัวแยกประเภท SVM:

  • L(w,ξ)=12w2+Ciξi
  • f(x)=wTx+b

ไม่ใช่ค่าเฉลี่ยเท่ากับระยะทางหรือฉันผสมบางอย่างที่นี่ ... ดังนั้นฟังก์ชันการตัดสินใจจึงเป็นส่วนหนึ่งของฟังก์ชั่นการสูญเสียที่ฉันใช้เพื่อ "เปรียบเทียบ" กับค่าจริงฉันพยายามแก้ไขแบบจำลองหรือไม่? และเป้าหมายคือการลด "ความแตกต่าง" นี้ให้น้อยที่สุด?
สวัสดี

@Hiatus บรรทัดฐานของไฮเปอร์เพลตที่แยก (ซึ่งจะได้รับการปรับให้เหมาะสมเมื่อฝึกอบรม SVM) ไม่ได้ถูกใช้ในฟังก์ชันการตัดสินใจ ใช้ไฮเปอร์เพลนของตัวเอง การลดบรรทัดฐานระหว่างการฝึกอบรมนั้นเป็นรูปแบบหนึ่งของการทำให้เป็นปกติ
Marc Claesen

มันจะเป็นการดีกว่าถ้าให้คำตอบทั่วไปที่ไม่ได้ผูกกับตัวจําแนกเฉพาะ
smci
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.