คำถามติดแท็ก machine-learning

อัลกอริทึมการเรียนรู้ของเครื่องสร้างโมเดลของข้อมูลการฝึกอบรม คำว่า "การเรียนรู้ของเครื่อง" มีการกำหนดอย่างคลุมเครือ มันรวมถึงสิ่งที่เรียกว่าการเรียนรู้ทางสถิติการเรียนรู้เสริมการเรียนรู้แบบไม่สำรอง ฯลฯ มักเพิ่มแท็กเฉพาะเพิ่มเติม

1
สถิติสำหรับการเรียนรู้ของเครื่องจักรเอกสารที่จะเริ่ม?
ฉันมีพื้นหลังในการเขียนโปรแกรมคอมพิวเตอร์และทฤษฎีจำนวนเบื้องต้น แต่ไม่มีการฝึกอบรมทางสถิติที่แท้จริงและเมื่อเร็ว ๆ นี้ "ค้นพบ" ว่าโลกมหัศจรรย์ของเทคนิคทั้งหมดเป็นจริงโลกทางสถิติ ดูเหมือนว่าความจริงของเมทริกซ์, การสร้างเมทริกซ์, เมตริกซ์มิติสูง, งานแต่งงาน, การประมาณความหนาแน่น, การอนุมานแบบเบย์, พาร์ติชั่นมาร์คอฟ, การคำนวณ eigenvector, PageRank เป็นเทคนิคทางสถิติอย่างมากและอัลกอริทึม . เป้าหมายของฉันคือการสามารถอ่านเอกสารที่พูดถึงสิ่งต่าง ๆ และนำไปใช้หรือสร้างอัลกอริทึมในขณะที่เข้าใจสัญลักษณ์ "การพิสูจน์" และการใช้ข้อโต้แย้งทางสถิติ ฉันเดาว่าสิ่งที่ยากที่สุดคือทำตามบทพิสูจน์ทั้งหมดที่เกี่ยวข้องกับเมทริกซ์ เอกสารพื้นฐานอะไรที่ทำให้ฉันเริ่มต้นได้ หรือตำราเรียนที่ดีกับแบบฝึกหัดที่ควรค่าแก่การทำงาน โดยเฉพาะเอกสารบางอย่างที่ฉันอยากจะเข้าใจอย่างสมบูรณ์คือ: แน่นอนเมทริกซ์เสร็จสมบูรณ์ผ่านการเพิ่มประสิทธิภาพนูน, Candes, Recht, 2008 การแปลง Cauchy อย่างรวดเร็วและการถดถอยเชิงเส้นที่รวดเร็วกว่า, Clarkson และคณะ, 2013 เครื่องฉายภาพแบบสุ่มสำหรับรองรับ Vector Machines, Paul et al, 2013 การประมาณความน่าจะเป็นมิติสูงด้วยโมเดลความหนาแน่นลึก, Rippel, Adams, 2013 การรับการประมาณค่าข้อผิดพลาดที่ลดลงและขอบเขตของข้อผิดพลาดในการเข้าใช้งานสากลสำหรับการสร้างเมทริกซ์ระดับต่ำให้เสร็จสมบูรณ์, Király, …

1
แบบจำลองของ P (Y | X) สามารถฝึกผ่านการไล่ระดับสีแบบสุ่มจากตัวอย่างที่ไม่ใช่ iid ของ P (X) และตัวอย่าง iid ของ P (Y | X) ได้หรือไม่?
เมื่อการฝึกอบรมแบบจำลองพารามิเตอร์ (เช่นเพื่อเพิ่มโอกาส) ผ่านการไล่ระดับสีแบบสุ่มในชุดข้อมูลบางอย่างก็มักจะสันนิษฐานว่าตัวอย่างการฝึกอบรมจะถูกดึงออกมาจากการกระจายข้อมูลการฝึกอบรม ดังนั้นหากเป้าหมายคือการสร้างแบบจำลองการแจกแจงร่วมดังนั้นตัวอย่างการฝึกอบรมแต่ละตัวอย่างควรถูกดึงออกมาจากการกระจายนั้น( x i , y i )P( X, วาย)P(X,Y)P(X,Y)( xผม, yผม)(xi,yi)(x_i,y_i) หากเป้าหมายคือการจำลองแบบการแจกแจงแบบมีเงื่อนไขดังนั้นความต้องการของ iid จะเปลี่ยนไปอย่างไรถ้าหากทั้งหมดP( Y| X)P(Y|X)P(Y|X) เราจะต้องดึงตัวอย่างแต่ละตัวอย่าง iid จากการกระจายข้อต่อหรือไม่?( xผม, yผม)(xi,yi)(x_i,y_i) เราควรจะวาด IID จากแล้ววาด IID จาก ? P ( X ) y i P ( Y | X )xผมxix_iP( X)P(X)P(X)Yผมyiy_iP( Y| X)P(Y|X)P(Y|X) เราสามารถวาดไม่ IID จาก (เช่นความสัมพันธ์ในช่วงเวลา) แล้ววาด …

3
วิธีการฝึกอบรมข้อมูลที่มีประสิทธิภาพที่สุดโดยใช้หน่วยความจำน้อยที่สุดคืออะไร?
นี่คือข้อมูลการฝึกอบรมของฉัน: 200,000 ตัวอย่าง x 10,000 คุณสมบัติ เมทริกซ์ข้อมูลการฝึกอบรมของฉันคือ - 200,000 x 10,000 ฉันจัดการเพื่อบันทึกสิ่งนี้ในไฟล์ flat โดยไม่ต้องมีปัญหาหน่วยความจำโดยบันทึกทุกชุดข้อมูลหนึ่งโดยหนึ่ง (หนึ่งตัวอย่างหลังจากที่อื่น) ในขณะที่ฉันสร้างคุณสมบัติสำหรับแต่ละตัวอย่าง แต่ตอนนี้เมื่อฉันใช้Milk , SVM lightหรืออัลกอริทึมการเรียนรู้ของเครื่องจักรอื่น ๆ ทุกอย่างพยายามโหลดข้อมูลการฝึกอบรมทั้งหมดลงในหน่วยความจำแทนการฝึกอบรมทีละคน อย่างไรก็ตามฉันเพิ่งมี RAM 8 GB ดังนั้นฉันจึงไม่สามารถดำเนินการต่อได้ คุณรู้หรือไม่ว่าฉันสามารถฝึกอัลกอริทึมหนึ่งชุดข้อมูลโดยหนึ่งชุดข้อมูล? นั่นคือเพื่อที่ทันทีฉันมีเพียงหนึ่งชุดข้อมูลที่โหลดลงในหน่วยความจำในขณะที่การฝึกอบรม

2
regularization
มีหลายวิธีในการดำเนินการทำให้เป็นมาตรฐาน - L0L0L_0, L1L1L_1และ L2L2L_2บรรทัดฐานตามบรรทัดฐานเช่น ตามFriedman Hastie & Tibsharani , regularizer ที่ดีที่สุดขึ้นอยู่กับปัญหา: คือธรรมชาติของฟังก์ชั่นเป้าหมายที่แท้จริง, พื้นฐานที่ใช้เฉพาะ, อัตราส่วนสัญญาณต่อเสียงรบกวน, และขนาดตัวอย่าง มีการวิจัยเชิงประจักษ์เปรียบเทียบวิธีการและประสิทธิภาพของวิธีการทำให้เป็นมาตรฐานแบบต่างๆหรือไม่?

3
วิธีการเปรียบเทียบความแม่นยำของแบบจำลองที่แตกต่างกันสองแบบโดยใช้นัยสำคัญทางสถิติ
ฉันกำลังทำงานกับการทำนายอนุกรมเวลา ฉันมีสองชุดข้อมูลและ\} ฉันมีสามรูปแบบการทำนาย:M3 ทั้งหมดของรูปแบบเหล่านี้จะได้รับการฝึกฝนโดยใช้ตัวอย่างในชุดข้อมูลและประสิทธิภาพการทำงานของพวกเขาจะวัดโดยใช้กลุ่มตัวอย่างในชุดข้อมูลD2สมมติว่าตัวชี้วัดประสิทธิภาพคือ MSE (หรืออย่างอื่น) ค่า MSE ของแบบจำลองเหล่านั้นเมื่อวัดสำหรับชุดข้อมูลมีและMSE_3ฉันจะทดสอบได้อย่างไรว่าการปรับปรุงโมเดลหนึ่งเหนืออีกโมเดลหนึ่งนั้นมีนัยสำคัญทางสถิติD 1 = { x1, x2, . . . . xn}D1={x1,x2,....xn}D1=\{x_1, x_2,....x_n\}D 2 = { xn+ 1 , xn+ 2 , xn+ 3 , . . . , xn+ k }D2={xn+1,xn+2,xn+3,....,xn+k}D2=\{x_n+1, x_n+2, x_n+3,...., x_n+k\}M1 , M2 , M3M1,M2,M3M1, M2, M3D 1D1D1D 2D2D2D …

3
เกี่ยวกับการใช้โมเดล bigram (N-gram) เพื่อสร้างฟีเจอร์ vector สำหรับเอกสารข้อความ
วิธีการดั้งเดิมของการสร้างฟีเจอร์สำหรับการขุดข้อความเป็นวิธีถุงแบบคำและสามารถปรับปรุงได้โดยใช้ tf-idf สำหรับการตั้งค่าคุณลักษณะเวกเตอร์ที่แสดงลักษณะของเอกสารข้อความที่กำหนด ในปัจจุบันฉันกำลังพยายามใช้โมเดลภาษาสองแกรมหรือ (N-Gram) เพื่อสร้างเวกเตอร์คุณลักษณะ แต่ไม่ทราบวิธีการทำเช่นนั้นใช่หรือไม่ เราสามารถทำตามวิธีการของคำพูดเช่นการคำนวณจำนวนความถี่ในรูปแบบของ bi-gram แทนที่จะเป็นคำพูดและปรับปรุงมันด้วยวิธีการถ่วงน้ำหนัก tf-idf?

1
นอกเหนือจากเมล็ดฟิชเชอร์
ชั่วครู่หนึ่งดูเหมือนว่าFisher Kernelsอาจจะได้รับความนิยมเนื่องจากพวกมันดูเหมือนจะเป็นวิธีในการสร้างเมล็ดจากแบบจำลองความน่าจะเป็น อย่างไรก็ตามฉันไม่ค่อยเห็นพวกเขาใช้ในทางปฏิบัติและฉันมีสิทธิ์ที่ดีที่พวกเขามักจะไม่ทำงานได้ดี พวกเขาพึ่งพาการคำนวณข้อมูลฟิชเชอร์ - การอ้างอิง Wikipedia: ข้อมูลฟิชเชอร์เป็นข้อมูลเชิงลบของความคาดหวังของอนุพันธ์อันดับสองเกี่ยวกับ ar ของลอการิทึมธรรมชาติของ f ข้อมูลอาจถูกมองว่าเป็นมาตรวัดของ "ความโค้ง" ของเส้นโค้งการสนับสนุนใกล้กับค่าประมาณความน่าจะเป็นสูงสุด (MLE) ของθ เท่าที่ฉันสามารถบอกได้ว่านี่หมายความว่าฟังก์ชั่นเคอร์เนลระหว่างสองจุดคือระยะทางตามพื้นผิวโค้งนี้ - ใช่ไหม? อย่างไรก็ตามนี่อาจเป็นปัญหาสำหรับใช้ในวิธีเคอร์เนลเช่น MLE อาจเป็นการประเมินที่แย่มากสำหรับรุ่นที่กำหนด ความโค้งของเส้นโค้งการสนับสนุนรอบ ๆ MLE อาจไม่มีประโยชน์ใด ๆ สำหรับการแยกแยะระหว่างอินสแตนซ์ตัวอย่างเช่นถ้าพื้นผิวที่มีโอกาสสูงแหลมมาก ดูเหมือนว่าจะทิ้งข้อมูลจำนวนมากเกี่ยวกับโมเดล หากเป็นกรณีนี้มีวิธีการสร้างเมล็ดที่ทันสมัยกว่าจากวิธีการที่น่าจะเป็นหรือไม่? ตัวอย่างเช่นเราสามารถใช้ชุดการระงับเพื่อใช้การประมาณค่า MAP ด้วยวิธีเดียวกันได้หรือไม่ แนวคิดอื่น ๆ ของระยะทางหรือความคล้ายคลึงกันจากวิธีความน่าจะเป็นสามารถทำงานเพื่อสร้างฟังก์ชั่นเคอร์เนล (ที่ถูกต้อง)?

1
การจัดการกับชุดข้อมูลอนุกรมเวลาที่มีขนาดใหญ่มาก
ฉันสามารถเข้าถึงชุดข้อมูลที่มีขนาดใหญ่มาก ข้อมูลมาจากการบันทึกMEGของผู้คนที่ฟังเพลงที่ตัดตอนมาจากหนึ่งในสี่ประเภท ข้อมูลมีดังนี้: 6 วิชา 3 การทดลองซ้ำ (ตอน) 120 การทดลองต่อยุค 8 วินาทีของข้อมูลต่อการทดลองที่ 500Hz (= 4000 ตัวอย่าง) จาก 275 MEG channel ดังนั้น "ตัวอย่าง" นี่คือเมทริกซ์ขนาด [4000x275] และมีตัวอย่าง 2160 ตัวอย่างและนั่นคือก่อนการแยกคุณลักษณะใด ๆ เป้าหมายคือการทำนายประเภทตามสัญญาณสมอง (การจำแนก 4 ระดับ) เห็นได้ชัดว่ามีบางประเด็นที่ท้าทายที่นี่คือ: ชุดข้อมูลไม่พอดีกับหน่วยความจำ ข้อมูลจะมีความสัมพันธ์ทางโลกที่แข็งแกร่งและความแปรผันระหว่างหัวข้อจะมีขนาดใหญ่มาก ดังนั้นจึงไม่ชัดเจนว่าจะแบ่งข้อมูลอย่างไร อัตราส่วนสัญญาณต่อเสียงรบกวนต่ำมาก ไม่ชัดเจนว่าคุณสมบัติที่ถูกต้องสำหรับตัวจําแนกจะเป็นอย่างไร สิ่งเหล่านี้ในทางกลับกัน: มีหลายสิ่งที่เราทำได้ ประการแรกเราสามารถลดตัวอย่างได้อย่างปลอดภัยจาก 500Hz ถึง ~ 200Hz แม้ว่าการ จำกัด Nyquist เข้าบัญชีกิจกรรมสมองไม่ได้เกิดขึ้นจริงที่ 100Hz …

3
วิธีการเมื่อเรียนรู้จากชุดข้อมูลขนาดใหญ่?
โดยทั่วไปมีสองวิธีทั่วไปในการเรียนรู้กับชุดข้อมูลขนาดใหญ่ (เมื่อคุณเผชิญกับข้อ จำกัด ด้านเวลา / พื้นที่): การโกง :) - ใช้ชุดย่อยที่ "จัดการได้" เพื่อการฝึกอบรม การสูญเสียความถูกต้องอาจเล็กน้อยเนื่องจากกฎของผลตอบแทนลดลง - ประสิทธิภาพการทำนายของตัวแบบมักจะแบนนานก่อนที่ข้อมูลการฝึกอบรมทั้งหมดจะถูกรวมเข้าไป การคำนวณแบบขนาน - แบ่งปัญหาออกเป็นส่วนเล็ก ๆ และแก้ปัญหาแต่ละเรื่องด้วยเครื่อง / โปรเซสเซอร์ที่แยกต่างหาก คุณต้องใช้อัลกอริทึมรุ่นขนาน แต่ข่าวดีก็คือว่าอัลกอริทึมทั่วไปจำนวนมากนั้นขนานกันตามธรรมชาติ: เพื่อนบ้านที่ใกล้ที่สุดต้นไม้ตัดสินใจ ฯลฯ มีวิธีอื่นไหม มีกฎของหัวแม่มือเมื่อใช้แต่ละ? ข้อเสียของแต่ละวิธีคืออะไร?

1
MFCCs เป็นวิธีที่ดีที่สุดในการแสดงเพลงไปยังระบบดึงข้อมูลหรือไม่?
เทคนิคการประมวลสัญญาณที่Mel frequency Cepstrumมักใช้เพื่อดึงข้อมูลจากชิ้นดนตรีเพื่อใช้ในงานการเรียนรู้ของเครื่อง วิธีนี้ให้สเปกตรัมพลังงานระยะสั้นและค่าสัมประสิทธิ์ถูกใช้เป็นอินพุต ในการออกแบบระบบดึงเพลงค่าสัมประสิทธิ์ดังกล่าวถือเป็นลักษณะของชิ้นส่วน (เห็นได้ชัดว่าไม่จำเป็นต้องเป็นเอกลักษณ์ แต่แตกต่าง) มีคุณสมบัติใดบ้างที่เหมาะกับการเรียนรู้กับเครือข่ายมากขึ้น? ลักษณะที่เปลี่ยนแปลงตามเวลาเช่นความก้าวหน้าของเสียงเบสของชิ้นส่วนที่ใช้ในบางอย่างเช่นเครือข่าย Elmanทำงานได้อย่างมีประสิทธิภาพมากขึ้นหรือไม่ ลักษณะใดที่จะก่อให้เกิดการจัดหมวดหมู่ที่ครอบคลุมพอที่จะเกิดขึ้น

8
อัลกอริทึมใดที่สามารถใช้ในการทำนายการใช้วัสดุสิ้นเปลืองที่ได้รับข้อมูลจากการซื้อในอดีต
คิดเกี่ยวกับปัญหาที่เรียบง่าย แต่น่าสนใจฉันต้องการเขียนโค้ดบางอย่างเพื่อคาดการณ์วัสดุสิ้นเปลืองฉันจะต้องใช้ในอนาคตอันใกล้นี้เนื่องจากมีประวัติการซื้อที่ผ่านมาอย่างสมบูรณ์ ฉันแน่ใจว่าปัญหาประเภทนี้มีคำจำกัดความทั่วไปและศึกษาดีกว่า (มีคนแนะนำว่านี่เกี่ยวข้องกับแนวคิดบางอย่างในระบบ ERP และอื่น ๆ ) ข้อมูลที่ฉันมีคือประวัติการซื้อที่ผ่านมาอย่างสมบูรณ์ สมมติว่าฉันกำลังดูวัสดุกระดาษข้อมูลของฉันดูเหมือน (วันที่แผ่น): 2007-05-10 500 2007-11-11 1000 2007-12-18 1000 2008-03-25 500 2008-05-28 2000 2008-10-31 1500 2009-03-20 1500 2009-06-30 1000 2009-09-29 500 2009-12-16 1500 2010-05-31 500 2010-06-30 500 2010-09-30 1500 2011-05-31 1000 มันไม่ 'สุ่มตัวอย่าง' ในช่วงเวลาปกติดังนั้นฉันคิดว่ามันไม่มีคุณสมบัติเป็นข้อมูลอนุกรมเวลา ฉันไม่มีข้อมูลเกี่ยวกับระดับหุ้นจริงทุกครั้ง ฉันต้องการใช้ข้อมูลที่เรียบง่ายและ จำกัด นี้เพื่อคาดการณ์จำนวนกระดาษที่ฉันต้องการใน (ตัวอย่าง) 3,6,12 เดือน จนถึงตอนนี้ฉันก็รู้ว่าสิ่งที่ฉันกำลังมองหาเรียกว่าการคาดการณ์และไม่มาก …

6
เปรียบเทียบ R-squared จาก Random Forest สองรุ่นที่แตกต่างกัน
ฉันใช้แพ็คเกจสุ่มป่าไม้ใน R เพื่อพัฒนาโมเดลฟอเรสต์แบบสุ่มเพื่อพยายามอธิบายผลลัพธ์อย่างต่อเนื่องในชุดข้อมูล "กว้าง" ที่มีตัวทำนายมากกว่าตัวอย่าง โดยเฉพาะฉันเหมาะสมกับโมเดล RF หนึ่งตัวที่อนุญาตให้กระบวนการเลือกชุดตัวแปรพยากรณ์ 75 ตัวที่ฉันคิดว่าสำคัญ ฉันกำลังทดสอบว่าตัวแบบนั้นทำนายผลที่แท้จริงสำหรับชุดการทดสอบที่สงวนไว้อย่างไรโดยใช้วิธีการโพสต์ที่นี่ก่อนหน้านี้คือ ... หรือใน R: 1 - sum((y-predicted)^2)/sum((y-mean(y))^2) แต่ตอนนี้ฉันมีตัวแปรทำนายอีก 25 ตัวที่ฉันสามารถเพิ่มได้ เมื่อใช้ชุดตัวทำนาย ~ 100 ตัวR²จะสูงกว่า ฉันต้องการที่จะทดสอบทางสถิติในคำอื่น ๆ เมื่อใช้ชุดของ ~ 100 ทำนายที่จะทดสอบแบบจำลองอย่างมีนัยสำคัญที่ดีกว่าในการทดสอบข้อมูลกว่ารุ่นพอดีโดยใช้ ~ 75 พยากรณ์ นั่นคือR²จากการทดสอบโมเดล RF บนชุดข้อมูลแบบเต็มสูงกว่าR²อย่างมากจากการทดสอบโมเดล RF บนชุดข้อมูลที่ลดลง นี่เป็นสิ่งสำคัญสำหรับฉันที่จะทดสอบเพราะนี่คือข้อมูลนำร่องและการได้รับผู้ทำนายเพิ่มอีก 25 คนนั้นมีค่าใช้จ่ายสูงและฉันจำเป็นต้องรู้ว่าฉันควรจ่ายเงินเพื่อวัดผู้ทำนายเหล่านั้นในการศึกษาติดตามครั้งใหญ่กว่าหรือไม่ ฉันพยายามคิดถึงวิธี resampling / permutation บางอย่าง แต่ไม่มีสิ่งใดในใจ

2
เหตุผลในการใช้ AUC?
โดยเฉพาะอย่างยิ่งในด้านวิทยาศาสตร์คอมพิวเตอร์ของวรรณกรรมการเรียนรู้ของเครื่อง AUC (พื้นที่ภายใต้เส้นโค้งลักษณะตัวดำเนินการรับ) เป็นเกณฑ์ยอดนิยมสำหรับการประเมินตัวแยกประเภท การใช้ AUC มีเหตุผลอะไรบ้าง เช่นมีฟังก์ชั่นการสูญเสียพิเศษซึ่งการตัดสินใจที่เหมาะสมที่สุดคือตัวจําแนกด้วย AUC ที่ดีที่สุดหรือไม่

1
ความสำคัญของสัมประสิทธิ์การถดถอย (GAM) เมื่อความน่าจะเป็นแบบจำลองไม่สูงกว่าค่า null อย่างมีนัยสำคัญ
ฉันใช้การถดถอยแบบอิง GAM โดยใช้gamlssแพ็คเกจ R และสมมติว่ามีการกระจายข้อมูลเบต้าที่ไม่มีศูนย์ mymodel = gamlss(response ~ input, family=BEZI)ฉันมีเพียงตัวแปรอธิบายเดียวในรูปแบบของฉันดังนั้นมันเป็นพื้น: อัลกอริทึมทำให้ฉันสัมประสิทธิ์สำหรับผลกระทบของตัวแปรอธิบายในค่าเฉลี่ย ( ) และค่า p ที่เกี่ยวข้องสำหรับคล้าย:kkkμμ\muk(input)=0k(input)=0k(\text{input})=0 Mu link function: logit Mu Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.58051 0.03766 -68.521 0.000e+00 input -0.09134 0.01683 -5.428 6.118e-08 ดังที่คุณเห็นในตัวอย่างด้านบนสมมติฐานของถูกปฏิเสธด้วยความมั่นใจสูงk(input)=0k(input)=0k(\text{input})=0 จากนั้นฉันเรียกใช้โมเดลว่าง: null = gamlss(response ~ 1, family=BEZI)และเปรียบเทียบความน่าจะเป็นโดยใช้การทดสอบอัตราส่วนความน่าจะเป็น: p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)). ในหลายกรณีฉันได้รับแม้ว่าค่าสัมประสิทธิ์ที่อินพุตมีการรายงานว่ามีความสำคัญสูง …

2
วิธีที่ดีที่สุดในการเลือกคุณสมบัติสำหรับการถดถอยแบบไม่มีพารามิเตอร์
คำถามใหม่ที่นี่ ขณะนี้ฉันกำลังทำการถดถอยแบบไม่ใช้พารามิเตอร์โดยใช้แพ็คเกจ np ในอาร์ฉันมีฟีเจอร์ 7 อย่างและใช้วิธีการบังคับเดรัจฉานฉันระบุว่าดีที่สุด 3. แต่ไม่นานฉันจะมีฟีเจอร์มากกว่า 7 อย่าง! คำถามของฉันคืออะไรเป็นวิธีที่ดีที่สุดในปัจจุบันสำหรับการเลือกคุณสมบัติสำหรับการถดถอยแบบไม่มีพารามิเตอร์ และถ้าหากแพ็กเกจใด ๆ ใช้วิธีการ ขอบคุณ.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.