ทำซ้ำตารางที่ 18.1 จาก“ องค์ประกอบของการเรียนรู้เชิงสถิติ”


13

ตารางที่ 18.1 ในองค์ประกอบของการเรียนรู้ทางสถิติสรุปประสิทธิภาพของตัวแยกประเภทหลายตัวในชุดข้อมูลระดับ 14 ฉันกำลังเปรียบเทียบอัลกอริธึมใหม่กับ lasso และ elastic net สำหรับปัญหาการจำแนกประเภทมัลติคลาส

การใช้glmnetเวอร์ชั่น 1.5.3 (R 2.13.0) ฉันไม่สามารถทำซ้ำจุดที่ 7 ( -multalomial multinomial) ในตารางซึ่งรายงานจำนวนยีนที่ใช้เป็น 269 และข้อผิดพลาดในการทดสอบคือ 13 out 54 ข้อมูลที่ใช้เป็นแบบนี้14 มะเร็งชุดข้อมูล ไม่ว่าฉันจะพยายามทำอะไรฉันจะได้แบบจำลองที่มีประสิทธิภาพสูงสุดโดยใช้ยีนใกล้เคียงกับ 170-180 ยีนที่มีข้อผิดพลาดในการทดสอบ 16 จาก 54 ข้อL1

โปรดทราบว่าในตอนต้นของส่วน 18.3 ในหน้า 654 มีการอธิบายการประมวลผลข้อมูลล่วงหน้าบางส่วน

ฉันได้ติดต่อผู้เขียนแล้วโดยไม่ตอบสนองและฉันถามว่าใครสามารถยืนยันว่ามีปัญหาในการทำซ้ำตารางหรือให้วิธีแก้ปัญหาในการสร้างตาราง


1
glmnet ได้รับการเปลี่ยนแปลงเล็กน้อยเมื่อเร็ว ๆ นี้และมีปัญหากับตัวเลขในอดีต อาจเป็นเพราะสาเหตุนี้? นานแค่ไหนที่คุณติดต่อผู้เขียน? ฉันเห็นเวอร์ชันปัจจุบันคือ 1.7 และอัปโหลดไปยัง CRAN เพียงประมาณหนึ่งสัปดาห์ที่ผ่านมา
พระคาร์ดินัล

@ cardinal เป็นเวลาประมาณสี่สัปดาห์ตั้งแต่ฉันทำการทดลองครั้งล่าสุดกับ glmnet แต่เราก็มีการนำไปใช้ที่แตกต่างกันซึ่งให้ผลลัพธ์ที่คล้ายกันซึ่งไม่สอดคล้องกับตารางใน ESL ตารางเก่ากว่าแน่นอนดังนั้นฉันเดาว่าตารางไม่ถูกต้อง แต่มันคงจะดีถ้าได้รู้แน่นอน
NRH

ฉันอ่านส่วนเหล่านั้นสั้น ๆ และคำถามหนึ่งที่เกิดขึ้นในใจของฉันคือการตรวจสอบความถูกต้องไขว้กันเพื่อเลือกพารามิเตอร์การหดตัวใน (18.19) ในหน้า 661 (การพิมพ์ที่สาม) ความคิดใด ๆ บางทีฉันอาจจะพลาดหรืออธิบายไว้ที่อื่น? ดูเหมือนว่าเป็นสถานที่ที่คุณพยายามสร้างการวิเคราะห์ของพวกเขาใหม่อาจอ่อนไหวต่อความแตกต่างของวิธีการ
พระคาร์ดินัล

@cardinal ขอบคุณแรกที่สนใจสิ่งนี้ ถูกต้องที่ CV สามารถสร้างความแตกต่างได้ แต่ผู้แต่งมีส่วนย่อย (ดัชนี) ที่ใช้สำหรับ CV บนหน้าเว็บพร้อมกับข้อมูล อย่างไรก็ตาม CV จะใช้สำหรับการเลือกแลมบ์ดาบทลงโทษที่ดีที่สุดเท่านั้นจากนั้นชุดข้อมูลการฝึกอบรมทั้งหมดจะถูกใช้เพื่อให้พอดีกับโมเดลซึ่งจะถูกประเมินจากข้อมูลการทดสอบ ดังนั้นแม้ว่าขั้นตอน CV จะเลือกแลมบ์ดาที่แตกต่างกันแลมบ์ดานั้นอยู่บนเส้นทางการแก้ปัญหาสำหรับข้อมูลการฝึกอบรมและเราไม่สามารถหามันได้ ...
NRH

คำตอบ:


2

คุณตรวจสอบแพ็คเกจ R ของหนังสือหรือยัง มันมีชุดข้อมูลทั้งหมดฟังก์ชั่นและสคริปต์ส่วนใหญ่ที่ใช้ในการมี ...


7
พยายามได้ดี. ใช่ฉันได้ตรวจสอบแพ็คเกจแล้ว แต่อ้างว่ามันมีข้อมูลฟังก์ชั่นและสคริปต์ส่วนใหญ่ทั้งหมดเป็นการพูดเกินจริง ไม่สมบูรณ์และไม่มีชุดข้อมูลที่เป็นปัญหา
NRH
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.