เหตุใดจึงต้องใช้มาตราส่วนของแพลต

17

เพื่อการปรับระดับความเชื่อมั่นความน่าจะเป็นในการเรียนรู้ภายใต้การดูแล (พูดกับแผนที่ความเชื่อมั่นจากนัก SVM หรือต้นไม้ตัดสินใจโดยใช้ข้อมูล oversampled) วิธีหนึ่งคือการใช้แพลตขูดหินปูน (เช่นได้รับการสอบเทียบความน่าจะเป็นจากการส่งเสริม )

โดยทั่วไปจะใช้การถดถอยโลจิสติกเพื่อทำแผนที่ถึง ]ตัวแปรตามคือป้ายจริงและตัวทำนายคือความมั่นใจจากแบบจำลองที่ไม่ผ่านการปรับเทียบ สิ่งที่ฉันไม่เข้าใจคือการใช้ตัวแปรเป้าหมายอื่นที่ไม่ใช่ 1 หรือ 0 วิธีการนี้เรียกร้องให้สร้าง "label" ใหม่: $[-\infty;\infty]$ $[0;1]$

เพื่อหลีกเลี่ยงการ overfitting ไปยังชุดรถไฟ sigmoid จะใช้โมเดลตัวอย่างนอก หากมีตัวอย่างบวกและตัวอย่างเชิงลบในชุดรถไฟสำหรับตัวอย่างการฝึกอบรมแต่ละการสอบเทียบแพลตใช้ค่าเป้าหมายและ (แทน 1 และ 0 ตามลำดับ) โดยที่ $N_+$ $N_-$ $y_+$ $y_-$
$y_{+} = \frac{N_{+} + 1}{N_{+} + 2}; y_{-} = \frac{1}{N_{-} + 2}$ $y_+=\frac{N_++1}{N_++2};\quad\quad y_-=\frac{1}{N_-+2}$

สิ่งที่ฉันไม่เข้าใจก็คือเป้าหมายใหม่นี้มีประโยชน์อย่างไร การถดถอยโลจิสติกไม่เพียงแค่จัดการกับตัวแปรตามเป็นป้ายกำกับไบนารี (ไม่ว่าจะได้รับฉลากใด)

UPDATE:

$1/0$ PROC GENMOD

data(ToothGrowth) 
attach(ToothGrowth) 

  # 1/0 coding 
dep          <- ifelse(supp == "VC", 1, 0) 
OneZeroModel <- glm(dep~len, family=binomial) 
OneZeroModel 
predict(OneZeroModel) 

  # Platt coding 
dep2           <- ifelse(supp == "VC", 31/32, 1/32) 
plattCodeModel <- glm(dep2~len, family=binomial) 
plattCodeModel 
predict(plattCodeModel) 

compare        <- cbind(predict(OneZeroModel), predict(plattCodeModel)) 

plot(predict(OneZeroModel), predict(plattCodeModel))

logistic cross-validation calibration

— B_Miner
แหล่งที่มา

13

ผมขอแนะนำให้ไปตรวจสอบที่หน้าวิกิพีเดียของการถดถอยโลจิสติก มันระบุว่าในกรณีของการถดถอยโลจิสติกตัวแปรขึ้นอยู่กับแผนที่แมปทำนายความน่าจะเป็นของการเกิดขึ้นของตัวแปรตาม ความน่าจะเป็นที่ใช้ในการฝึกอบรมเป็น 1 (ถ้า y เป็นค่าบวกในชุดการฝึกอบรม) หรือ 0 (ถ้า y เป็นค่าลบ)

$p_i=\frac{1}{(1+exp(A*f_i+B))}$ $f_i$ $y_+$ $y_{-}$

— Steffen
แหล่งที่มา

ขอบคุณสำหรับคำตอบ! ฉันใช้ SAS เป็นครั้งแรกและไม่สามารถรับตัวแปรตอบกลับที่แตกต่างกันได้ ฉันพอดีกับสิ่งต่อไปนี้ใน R เป็นตัวอย่างและเห็นว่ามีการออกคำเตือนเกี่ยวกับการไม่เป็นตัวแปร reponse จำนวนเต็ม แต่ผลลัพธ์นั้นพอดีกับแบบจำลองอื่น

— B_Miner

data (ToothGrowth) แนบ (ToothGrowth) # 1/0 การเข้ารหัส dep <-ifelse (supp == "VC", 1,0) OneZeroModel <-glm (dep ~ len, ครอบครัว = binomial) OneZeroModel ทำนาย #Platt การเข้ารหัส dep2 <-ifelse (supp == "VC", 31/32, 1/32) plattCodeModel <-glm (dep2 ~ len, ครอบครัว = binomial) plattCodeModel ทำนาย (plattCodeModel) เปรียบเทียบ <-cbind (ทำนาย (OneZeroModel) plattCodeModel) พล็อต (ทำนาย (OneZeroModel), คาดการณ์ (plattCodeModel))

— B_Miner

@ user2040: 1. ใช่ ... มีคำถามหรือเป็นเพียงคำพูด :) 2. ทำไมคุณไม่เพิ่มรหัสในคำถาม ไม่มีการจัดรูปแบบที่น่ากลัว

— steffen

2

วิธีการในการหลีกเลี่ยงในช่วงที่เหมาะสมที่ฉันได้พบว่ามีประโยชน์อีกประการหนึ่งคือเพื่อให้พอดีกับรูปแบบการถดถอยโลจิสติก univariate ที่จะลาออกจากการตรวจสอบข้ามการส่งออกของ SVM ซึ่งสามารถประมาณได้อย่างมีประสิทธิภาพโดยใช้ช่วงที่ถูกผูกไว้

อย่างไรก็ตามหากคุณต้องการตัวจําแนกที่สร้างการประมาณความน่าจะเป็นของการเป็นสมาชิกคลาสคุณควรใช้การถดถอยลอจิคัลเคอร์เนลซึ่งจะทำให้ดีขึ้นได้โดยตรง ouput ของ SVM ได้รับการออกแบบมาสำหรับการจำแนกแบบไม่ต่อเนื่องและไม่จำเป็นต้องมีข้อมูลที่จำเป็นสำหรับการประมาณความน่าจะเป็นที่ถูกต้องจาก p = 0.5 contour

ลักษณนามของกระบวนการแบบเกาส์เป็นอีกตัวเลือกที่ดีถ้าคุณต้องการลักษณนามที่น่าจะเป็นเคอร์เนล

— Dikran Marsupial
แหล่งที่มา