การทดสอบสัมประสิทธิ์นัยสำคัญในการถดถอยโลจิสติก Lasso


10

[คำถามที่คล้ายกันถูกถามที่นี่โดยไม่มีคำตอบ]

ฉันมีโมเดลการถดถอยโลจิสติกที่มีการทำให้เป็นมาตรฐาน L1 (การถดถอยโลจิสติก Lasso) และฉันต้องการทดสอบค่าสัมประสิทธิ์ที่เหมาะสมสำหรับความสำคัญและรับค่า p ของพวกเขา ฉันรู้ว่าการทดสอบของ Wald (ตัวอย่าง) เป็นตัวเลือกในการทดสอบความสำคัญของสัมประสิทธิ์ส่วนบุคคลในการถดถอยแบบเต็มโดยไม่มีการทำให้เป็นมาตรฐาน แต่ด้วย Lasso ฉันคิดว่าปัญหาอื่น ๆ เกิดขึ้นซึ่งไม่อนุญาตให้ใช้สูตร Wald ตามปกติ ตัวอย่างเช่นการประมาณค่าความแปรปรวน neded สำหรับการทดสอบไม่เป็นไปตามการแสดงออกปกติ กระดาษ Lasso ดั้งเดิม

http://statweb.stanford.edu/~tibs/lasso/lasso.pdf

แนะนำให้ใช้ขั้นตอนการบูตบู๊ตเพื่อประเมินความแปรปรวนของสัมประสิทธิ์ซึ่งอาจต้องใช้ (อีกครั้งฉันคิดว่า) สำหรับการทดสอบ (ส่วน 2.5 วรรคสุดท้ายของหน้า 272 และจุดเริ่มต้นที่ 273):

วิธีการหนึ่งคือผ่าน bootstrap:สามารถแก้ไขได้หรือเราอาจปรับให้เหมาะสมกับสำหรับตัวอย่าง bootstrap แต่ละตัวอย่าง การแก้ไขนั้นคล้ายคลึงกับการเลือกชุดย่อยที่ดีที่สุด ( จากคุณสมบัติ ) แล้วใช้ข้อผิดพลาดมาตรฐานกำลังสองน้อยที่สุดสำหรับชุดย่อยนั้นเสื้อเสื้อเสื้อ

สิ่งที่ฉันเข้าใจคือ: ติดตั้ง Lasso regression ซ้ำ ๆ กับชุดข้อมูลทั้งหมดจนกว่าเราจะหาค่าที่ดีที่สุดสำหรับพารามิเตอร์การทำให้เป็นมาตรฐาน (นี่ไม่ใช่ส่วนหนึ่งของ bootstrap) จากนั้นใช้คุณสมบัติที่ Lasso เลือกให้พอดี ของข้อมูลและใช้สูตรปกติเพื่อคำนวณผลต่างจากการถดถอยแต่ละครั้ง (แล้วฉันควรทำอย่างไรกับความแปรปรวนทั้งหมดของสัมประสิทธิ์แต่ละอย่างเพื่อให้ได้การประมาณความแปรปรวนสุดท้ายของสัมประสิทธิ์แต่ละตัว?

นอกจากนี้มันถูกต้องหรือไม่ที่จะใช้การทดสอบความสำคัญตามปกติ (ตัวอย่างเช่นการทดสอบของ Wald ซึ่งใช้เบตาและความแปรปรวนโดยประมาณ) กับการประมาณค่า Lasso ของค่าสัมประสิทธิ์และความแปรปรวนที่ประมาณ bootstrap? ฉันค่อนข้างแน่ใจว่ามันไม่ได้ แต่ความช่วยเหลือใด ๆ (ใช้การทดสอบที่แตกต่างกันให้ใช้วิธีการที่ตรงไปตรงมามากยิ่งขึ้นสิ่งที่ ... ) เป็นมากกว่าการต้อนรับ

จากคำตอบที่นี่ฉันสงสัยว่าการอนุมานและค่า p ไม่สามารถหาได้ ในกรณีของฉันค่า p เป็นข้อกำหนดภายนอก (แม้ว่าการใช้การทำให้เป็นมาตรฐาน L1 เป็นตัวเลือกของฉัน)

ขอบคุณมาก

แก้ไข จะเกิดอะไรขึ้นถ้าฉันเหมาะสมกับการถดถอยโลจิสติก OLS โดยใช้ตัวแปรที่เลือกโดยการเรียกใช้การถดถอยโลจิสติก Lasso ก่อนหน้านี้เท่านั้น เห็นได้ชัด (ดูที่นี่ )

ไม่จำเป็นต้องเรียกใช้โมเดลอีกครั้งหลังจากทำการตรวจสอบข้าม (คุณเพิ่งได้ค่าสัมประสิทธิ์จากเอาต์พุตของ cv.glmnet) และในความเป็นจริงถ้าคุณพอดีกับโมเดลการถดถอยโลจิสติกใหม่โดยไม่มีการลงโทษคุณจะต้องเอาชนะวัตถุประสงค์ของการใช้ เชือก

แต่ถ้าฉันทำสิ่งนี้โดยมีวัตถุประสงค์เพียงอย่างเดียวในการคำนวณค่า p ในขณะที่รักษาจำนวนตัวแปรต่ำ มันเป็นวิธีที่สกปรกมากหรือไม่? :-)


ในการหาข้อสรุปเกี่ยวกับโมเดล LASSO คุณสามารถตรวจสอบแพ็คเกจ CRAN hdiซึ่งให้การอนุมานสำหรับโมเดลมิติสูงคุณอาจต้องการดูว่า ...
Tom Wenseleers

วิธีการอธิบายแบบเต็มในบทความนี้: projecteuclid.org/euclid.ss/1449670857
Tom Wenseleers

และยังมีแพ็คเกจcran.r-project.org/web/packages/selectiveInference/index.htmlที่อาจเป็นประโยชน์ในการหาข้อสรุปสำหรับ LASSO ...
Tom Wenseleers

นี่เป็นคำถามที่ดีและสำคัญที่จะถาม
Jinhua Wang

คำตอบ:


5

ปัญหาเกี่ยวกับการใช้การทดสอบความสำคัญตามปกติคือพวกเขาคิดว่าเป็นโมฆะนั่นคือมีตัวแปรสุ่มโดยไม่มีความสัมพันธ์กับตัวแปรผลลัพธ์ อย่างไรก็ตามสิ่งที่คุณมีกับบ่วงบาศเป็นตัวแปรสุ่มซึ่งคุณเลือกสิ่งที่ดีที่สุดกับบ่วงบาศได้เช่นกัน ดังนั้นคุณไม่สามารถใช้งานได้ผลลัพธ์จะมีอคติ

เท่าที่ฉันรู้ bootstrap ไม่ได้ใช้ในการประเมินค่าความแปรปรวน แต่เพื่อให้ได้ความน่าจะเป็นของตัวแปรที่ถูกเลือก และนั่นคือค่า p ของคุณ ตรวจสอบหนังสือเรียนฟรีของ Hasie, สถิติการเรียนรู้ด้วย Sparsity, บทที่ 6 กำลังพูดถึงสิ่งเดียวกัน http://web.stanford.edu/~hastie/StatLearnSparsity/

ตรวจสอบบทความนี้เพื่อหาวิธีอื่นในการรับค่า p จาก lasso https://arxiv.org/pdf/1408.4026.pdfอาจมีอีกมาก


4

n

โชคดีที่มีความคืบหน้ามากในปีที่ผ่านมาในการพัฒนาวิธีการอนุมานที่บัญชีสำหรับการเลือกโพสต์ บางอ้างอิงที่เกี่ยวข้องกับกรณีของคุณ: http://projecteuclid.org/euclid.aos/1460381681 และ https://arxiv.org/pdf/1602.07358.pdf เทคนิคที่กล่าวถึงในการอ้างอิงเหล่านี้จะดำเนินการในแพคเกจการ R selectiveInference- https://cran.r-project.org/web/packages/selectiveInference/index.html แพ็คเกจ selectiveInference ควรสร้างช่วงความมั่นใจที่ถูกต้องที่คุณต้องการ


1
ในความเชี่ยวชาญด้านการเรียนรู้ของเครื่องใน Coursera โดย Univ จากวอชิงตันอาจารย์ของหลักสูตร 2 (การถดถอย) อุทิศทั้งสัปดาห์เพื่อการถดถอยของ Lasso ในหนึ่งในสไลด์ขั้นตอนที่ฉันอธิบาย (การใช้ Lasso เพื่อเลือกคุณสมบัติและจากนั้นปรับการถดถอย LS ด้วยตัวแปรเหล่านั้นเท่านั้น) คือการลดขนาดและถือเป็นการแก้ไขที่ถูกต้องและแสดงด้วยกราฟจากกระดาษโดย Mario Figueiredo ตรวจสอบสไลด์ 105 ได้ที่นี่: github.com/MaxPoon/coursera-Machine-Learning-specialization/…
Pablo

ในขณะที่พวกเขาแนะนำให้ทำการบ่วงบาศพวกเขาไม่หารือเกี่ยวกับการทดสอบสมมติฐานเลย นอกจากนี้คำว่า de-biasing นั้นทำให้เข้าใจผิดเพราะในขณะที่ refitting โมเดลนั้นได้กำจัดอคติลงที่เกิดจาก Lasso มันไม่ได้ช่วยให้มีอคติสูงขึ้นที่เกิดจากคำสาปของผู้ชนะ เท่าที่ฉันรู้วิธีเดียวที่จะลดอคติการประมาณค่าสัมประสิทธิ์การถดถอยของตัวแบบที่เลือกคือการคำนวณการประมาณความน่าจะเป็นตามเงื่อนไขสูงสุด arxiv.org/abs/1705.09417
user3903581
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.