ตัวแบบทำนายผล: สถิติไม่สามารถเอาชนะการเรียนรู้ของเครื่องได้? [ปิด]


14

ขณะนี้ฉันกำลังติดตามโปรแกรมหลักที่เน้นเรื่องสถิติ / เศรษฐมิติ ในอาจารย์ของฉันนักเรียนทุกคนต้องทำวิจัย 3 เดือน สัปดาห์ที่แล้วทุกกลุ่มต้องนำเสนองานวิจัยของพวกเขากับนักศึกษาปริญญาโทคนอื่น ๆ

เกือบทุกกลุ่มมีการสร้างแบบจำลองทางสถิติและแบบจำลองการเรียนรู้ของเครื่องสำหรับหัวข้อการวิจัยและการคาดการณ์นอกเวลาตัวอย่างทุกครั้งจะมาพูดคุยเกี่ยวกับแบบจำลองการเรียนรู้ของเครื่องอย่างง่าย ๆ เอาชนะแบบจำลองทางสถิติที่ซับซ้อนมาก เดือน ไม่ว่าแบบจำลองทางสถิติของทุกคนจะดีแค่ไหนป่าสุ่มที่เรียบง่ายก็มีข้อผิดพลาดน้อยกว่าตัวอย่างมาก

ฉันสงสัยว่านี่เป็นข้อสังเกตที่ยอมรับกันโดยทั่วไปหรือไม่? ถ้ามันมาจากการพยากรณ์นอกตัวอย่างไม่มีวิธีใดที่จะเอาชนะรูปแบบป่าเรียบง่ายหรือรูปแบบการไล่ระดับสีที่รุนแรง ทั้งสองวิธีนี้ง่ายมากที่จะใช้งานโดยใช้แพ็คเกจ R ในขณะที่โมเดลสถิติทั้งหมดที่ทุกคนสร้างขึ้นนั้นต้องการทักษะความรู้และความพยายามในการประเมินค่อนข้างมาก

คุณคิดอย่างไรกับเรื่องนี้? ประโยชน์เพียงอย่างเดียวของตัวแบบเชิงสถิติ / เศรษฐมิติที่คุณได้รับการตีความคืออะไร? หรือโมเดลของเราไม่ดีพอที่พวกเขาล้มเหลวที่จะมีประสิทธิภาพสูงกว่าการทำนายป่าแบบสุ่มอย่างง่ายหรือไม่? มีเอกสารใดบ้างที่ตอบปัญหานี้?


5
สิ่งนี้อาจถูกปิดเป็น "กว้างเกินไป" (หวังว่าจะไม่เป็น "อิงตามความคิดเห็น"!) เวลาของฉัน: ฉันไม่คิดว่าจะมีคำตอบสากล ประสบการณ์ของฉันคือแบบจำลองทางสถิติจะดีกว่าหากมีการสังเกตน้อยกว่าเพราะจะทำให้โครงสร้างบางประเภทดีขึ้นโดยใช้แบบจำลองฟรี ในทางกลับกัน RFs จะดีกว่าหากมีข้อสังเกตมากมาย ...
Stephan Kolassa

4
... คำถามอื่น ๆ คือสิ่งที่ถูกประเมินอย่างแม่นยำและอย่างไร หากการทำนายจุดได้รับการประเมินอย่างเหมาะสม (การวัดความแม่นยำสามารถทำให้เข้าใจผิดได้อย่างน่าประหลาดใจ) นั่นเป็นเรื่องที่แตกต่างจากการทำนายความหนาแน่น แบบจำลองทางสถิติอาจดีกว่าที่การคาดการณ์ความหนาแน่นอีกครั้งเพราะคุณต้องการข้อมูลมากขึ้น
เตฟาน Kolassa

1
@StephanKolassa: ฉันคิดว่าคำตอบที่ดี (หรือชุดของคำตอบหลายข้อ) สำหรับคำถามนี้จะประกอบด้วยเหตุผลที่ทำไมไม่มีคำตอบสากล - ในทางทฤษฎีและปฏิบัติ - การประเมินประสิทธิภาพการคาดเดาวิธีการแยกความแตกต่างระหว่างสถิติและเครื่องจักร วิธีการเรียนรู้มีเป้าหมายอะไรที่เกินคาดการณ์และสองสิ่งที่ฉันไม่ได้คิด ขอบเขตที่กว้าง แต่ไม่กว้างเกินไปในความคิดของฉันและการพยายาม จำกัด มันอาจขัดขวางการสร้างจุดทั่วไปที่มีประโยชน์
Scortchi - Reinstate Monica

5
สิ่งที่เราไม่ต้องการคือชุดของเกร็ดเล็กเกร็ดน้อย - ฉันขอให้ผู้ใช้ตั้งค่าสถานะสำหรับคำตอบการลบที่มาน้อยกว่าเช่น "ฉันพบเสมอว่าป่าสุ่มเอาชนะการถดถอยโลจิสติก" แต่พูดมาก เราอาจเป็นคนเกียจคร้านเกี่ยวกับความคิดเห็น แต่กระทู้ที่ยาวจะถูกย้ายไปที่การแชท
Scortchi - Reinstate Monica

14
ฉันไม่คิดว่ามีความแตกต่างที่มีความหมายระหว่างสถิติและการเรียนรู้ของเครื่อง ตัวอย่างเช่น Leo Breiman นักวิจัยป่าสุ่มที่โดดเด่นเป็นศาสตราจารย์ด้านสถิติที่ UC Berkeley ในบริบทของเรื่องเล็ก ๆ น้อย ๆ ของคุณ RF เกิดขึ้นได้ดีกว่าโมเดลอื่น ๆ ที่ผู้คนพอดี แต่ฉันไม่เห็นเหตุผลว่าสิ่งนี้จะต้องเป็นเรื่องจริงโดยทั่วไป บางทีนี่อาจพูดถึงข้อมูลชุดข้อมูล (หรือแม้แต่นักเรียน) มากกว่าวิธีการ
Sycorax พูดว่า Reinstate Monica

คำตอบ:


20

การสร้างแบบจำลองทางสถิติแตกต่างจากการเรียนรู้ของเครื่อง ตัวอย่างเช่นการถดถอยเชิงเส้นเป็นทั้งโมเดลเชิงสถิติและโมเดลการเรียนรู้ของเครื่อง ดังนั้นถ้าคุณเปรียบเทียบการถดถอยเชิงเส้นกับฟอเรสต์แบบสุ่มคุณแค่เปรียบเทียบโมเดลการเรียนรู้ของเครื่องที่ง่ายกว่ากับแบบที่ซับซ้อนกว่า คุณไม่ได้เปรียบเทียบโมเดลเชิงสถิติกับโมเดลการเรียนรู้ของเครื่อง

การสร้างแบบจำลองทางสถิติให้มากกว่าการตีความ มันให้รูปแบบของพารามิเตอร์ประชากรบางอย่าง มันขึ้นอยู่กับกรอบขนาดใหญ่ของคณิตศาสตร์และทฤษฎีซึ่งช่วยให้สูตรสำหรับสิ่งต่าง ๆ เช่นความแปรปรวนของสัมประสิทธิ์ความแปรปรวนของการทำนายและการทดสอบสมมติฐาน อัตราผลตอบแทนที่เป็นไปได้ของการสร้างแบบจำลองทางสถิตินั้นยิ่งใหญ่กว่าการเรียนรู้ของเครื่องเนื่องจากคุณสามารถสร้างงบที่แข็งแกร่งเกี่ยวกับพารามิเตอร์ประชากรแทนที่จะวัดความผิดพลาดที่เกิดขึ้น แต่ก็ยากที่จะเข้าถึงปัญหาด้วยแบบจำลองทางสถิติ


1
เท่าที่ฉันเข้าใจคุณพูดว่าด้วยสถิติคุณจะได้รับประโยชน์มากขึ้นเช่นความแปรปรวนของค่าสัมประสิทธิ์ความแปรปรวนของการทำนายและการทดสอบสมมติฐาน แต่เมื่อพูดถึงการสร้างแบบจำลองการทำนายอย่างหมดจดนั่นคือการคาดการณ์จุดของตัวแปรตอบสนองบางอย่างคุณคิดว่าแบบจำลองทางสถิติสามารถเอาชนะโมเดลการเรียนรู้ของเครื่องได้หรือไม่
dubvice

5
นี่คือคำตอบ (+1) ในมุมมองของฉัน (และอาจเป็นของคนอื่นด้วย) มีการวิเคราะห์ทางสถิติหลายประเภท: การบรรยายเชิงอนุมานเชิงพยากรณ์เชิงสำรวจ ฯลฯ การเรียนรู้ของเครื่องส่วนใหญ่จะอยู่ในการวิเคราะห์เชิงทำนายและส่วนใหญ่ไม่อนุญาตให้คุณอนุมาน ยืนยันในสิ่งต่าง ๆ ดังนั้นทุกอย่างจึงลงไปที่"ใช้เครื่องมือที่เหมาะสมสำหรับงานที่อยู่ในมือ" (จากตัวอย่างการถดถอยเชิงเส้นมันสามารถใช้ในทุกสาขาได้เช่นการประมาณความคาดหวังตามเงื่อนไขซึ่งเป็นงานบรรยาย)
Firebug

2
ดูเหมือนว่าการยืนยันว่าการสร้างแบบจำลองทางสถิติมาตรฐานสามารถอนุมานได้ดีกว่าการเรียนรู้ของเครื่องซึ่งสามารถช่วยในการตีความโมเดล ในขณะที่มันเป็นเรื่องจริงถ้าเราเปรียบเทียบการถดถอยกำลังสองน้อยที่สุดธรรมดากับเครือข่ายนิวรัลลึกเนื่องจากคำถามดั้งเดิมอ้างอิงป่าสุ่ม (อัลกอริธึม ML ที่ดีสำหรับการอนุมาน) การยืนยันดังกล่าวนั้นค่อนข้างคลุมเครือ
Greenstick

2
นี่คือบางส่วนหลักฐานที่มั่นคงจากโดเมนอนุกรมเวลาที่แบบจำลองทางสถิติอย่างต่อเนื่องเอาชนะกลไกการเรียนรู้วิธีการ: Makridakis "ทางสถิติและการเรียนรู้เครื่องวิธีการพยากรณ์: ความกังวลและวิธีการไปข้างหน้า"
Richard Hardy

1
นั่นเป็นเพียงคำตอบที่สมบูรณ์แบบ นี่คือตัวอย่าง: สมมติว่าคุณมีมาตรการที่ทำนายการอยู่รอดของผู้ป่วยที่เป็นโรค มีมาตรฐานสากลเกี่ยวกับวิธีการกำหนดว่ามาตรการนี้ใช้ได้ในทางการแพทย์หรือไม่ (โดยทั่วไปถ้าค่าสัมประสิทธิ์แตกต่างจาก 0 โดยมีค่าต่ำกว่า 5% ในรูปแบบ univariate หรือหลายตัวแปร) แม้ว่าฉันจะแน่ใจอย่างแน่นอนว่า 99% ของเวลาที่ป่าสุ่มที่มีข้อมูลเพียงพอจะเป็นวิธีการทำนายแบบจำลองที่ดีกว่า
Rémy Nicolle

5

มันผิดที่จะระบุคำถามในแบบที่คุณพูด ยกตัวอย่างเช่นก้อนที่สำคัญของการเรียนรู้ของเครื่องสามารถเรียกว่าการเรียนรู้ทางสถิติ ดังนั้นการเปรียบเทียบของคุณเป็นเหมือนแอปเปิ้ลกับทาร์ตผลไม้

อย่างไรก็ตามฉันจะไปกับวิธีที่คุณวางกรอบและอ้างถึงสิ่งต่อไปนี้: เมื่อมันมาถึงการทำนายไม่มีอะไรสามารถทำได้ถ้าไม่มีรูปแบบของสถิติเพราะการทำนายมีความสุ่ม (ความไม่แน่นอน) ในตัวมัน พิจารณาสิ่งนี้: แม้จะประสบความสำเร็จอย่างมากในการเรียนรู้ของเครื่องจักรในบางแอปพลิเคชั่น แต่ก็ไม่มีอะไรจะแสดงในการทำนายราคาสินทรัพย์ ไม่มีไรเลย. ทำไม? เพราะในตลาดของเหลวที่พัฒนาแล้วส่วนใหญ่ราคาสินทรัพย์จะสุ่ม

คุณสามารถเรียกใช้เครื่องเรียนรู้ตลอดทั้งวันเพื่อสังเกตและเรียนรู้เกี่ยวกับการสลายตัวของกัมมันตภาพรังสีของอะตอมและมันจะไม่สามารถทำนายเวลาการสลายตัวของอะตอมต่อไปได้เพียงเพราะมันเป็นแบบสุ่ม

ในฐานะนักสถิติที่ต้องการมันจะเป็นเรื่องโง่ ๆ ที่จะไม่เรียนรู้ด้วยกลไกเพราะมันเป็นหนึ่งในแอพพลิเคชั่นที่ร้อนแรงที่สุดของสถิติเว้นแต่แน่นอนคุณรู้แน่นอนว่าคุณกำลังจะไปเรียน ใครก็ตามที่มีแนวโน้มว่าจะไปทำงานในอุตสาหกรรมจะต้องมีความเชี่ยวชาญใน ML ไม่มีความเกลียดชังหรือการแข่งขันระหว่างสถิติและ ML ฝูงชนเลย อันที่จริงถ้าคุณชอบเขียนโปรแกรมคุณจะรู้สึกเหมือนอยู่บ้านในฟิลด์ ML


2

โดยทั่วไปไม่ได้ แต่อาจใช่ภายใต้การสะกดผิด ปัญหาที่คุณกำลังมองหาเรียกว่าการยอมรับ การตัดสินใจสามารถยอมรับได้หากไม่มีวิธีการคำนวณที่มีความเสี่ยงน้อยกว่า

โซลูชันแบบเบย์ทั้งหมดนั้นเป็นโซลูชันที่ยอมรับได้และไม่ใช่แบบเบย์สามารถยอมรับได้ในระดับที่พวกเขาสามารถจับคู่โซลูชันแบบเบย์ในทุกตัวอย่างหรือไม่เกินขีด จำกัด การแก้ปัญหาที่ยอมรับได้บ่อยหรือการแก้ปัญหาแบบเบย์จะเอาชนะโซลูชัน ML ได้เสมอเว้นแต่จะยอมรับเช่นกัน จากที่กล่าวมามีข้อสังเกตเชิงปฏิบัติบางประการที่ทำให้ข้อความนี้เป็นจริง แต่ไร้สาระ

ก่อนอื่นตัวเลือกแบบเบย์จะต้องเป็นตัวจริงของคุณก่อนและไม่ใช่การแจกจ่ายก่อนหน้านี้บางส่วนที่ใช้ในการทำบรรณาธิการในวารสารให้มีความสุข ประการที่สองโซลูชั่นสำหรับผู้ใช้บ่อยเป็นสิ่งที่ยอมรับไม่ได้และควรใช้ตัวประมาณค่าการหดตัวแทนโซลูชันมาตรฐาน ผู้คนจำนวนมากไม่ทราบถึงบทแทรกของสไตน์และผลกระทบจากข้อผิดพลาดจากตัวอย่าง ในที่สุด ML อาจมีความทนทานมากกว่าเดิมเล็กน้อยในหลาย ๆ กรณีถึงข้อผิดพลาดการสะกดผิด

เมื่อคุณย้ายเข้าไปในต้นไม้ตัดสินใจและลูกพี่ลูกน้องของพวกเขาในป่าคุณไม่ได้ใช้วิธีการที่คล้ายกันเว้นแต่ว่าคุณกำลังใช้สิ่งที่คล้ายกับตาข่ายของเบย์ โซลูชันกราฟประกอบด้วยข้อมูลโดยนัยจำนวนมากโดยเฉพาะกราฟกำกับ เมื่อใดก็ตามที่คุณเพิ่มข้อมูลลงในกระบวนการความน่าจะเป็นหรือสถิติคุณจะลดความแปรปรวนของผลลัพธ์และเปลี่ยนแปลงสิ่งที่จะได้รับการพิจารณา

หากคุณดูที่การเรียนรู้ของเครื่องจากองค์ประกอบของมุมมองของฟังก์ชั่นมันจะกลายเป็นโซลูชันทางสถิติ แต่ใช้การประมาณเพื่อทำให้การแก้ปัญหานั้นง่ายขึ้น สำหรับการแก้ปัญหาแบบเบย์ MCMC ช่วยประหยัดเวลาได้อย่างไม่น่าเชื่อเช่นเดียวกับการไล่ระดับสีสำหรับปัญหา ML จำนวนมาก หากคุณต้องสร้างหลังที่แน่นอนเพื่อรวมหรือใช้กำลังดุร้ายกับปัญหา ML หลายอย่างระบบสุริยะจะตายจากความร้อนก่อนที่คุณจะได้รับคำตอบ

ฉันเดาว่าคุณมีรูปแบบการสะกดผิดสำหรับผู้ที่ใช้สถิติหรือสถิติที่ไม่เหมาะสม ฉันสอนการบรรยายที่ฉันพิสูจน์ว่าทารกแรกเกิดจะลอยออกไปนอกหน้าต่างถ้าไม่เหมาะสมและที่ซึ่งวิธีการแบบเบย์อย่างรุนแรงกว่าวิธีการแบบผู้นิยมใช้บ่อยในการเลือกแบบพหุภาษาที่วิธีการแบบทวีคูณ . ตอนนี้ฉันใช้สถิติในทางที่ผิดในอดีตและใช้ประโยชน์จากความไม่สามารถจะยอมรับได้ของตัวประมาณบ่อยครั้ง แต่ผู้ใช้ที่ไร้เดียงสาของสถิติสามารถทำสิ่งที่ฉันทำได้อย่างง่ายดาย ฉันทำให้พวกมันสุดขั้วเพื่อทำให้ตัวอย่างชัดเจน แต่ฉันใช้ข้อมูลจริงอย่างแน่นอน

ป่าสุ่มเป็นตัวประมาณที่สอดคล้องกันและดูเหมือนว่าจะคล้ายกับกระบวนการของเบย์บางอย่าง เนื่องจากการเชื่อมโยงไปยังตัวประมาณเคอร์เนลพวกเขาอาจจะค่อนข้างใกล้เคียง หากคุณเห็นความแตกต่างอย่างมีนัยสำคัญในประสิทธิภาพระหว่างประเภทโซลูชันแสดงว่ามีบางสิ่งในปัญหาพื้นฐานที่คุณเข้าใจผิดและหากปัญหามีความสำคัญคุณก็ต้องมองหาแหล่งที่มาของความแตกต่างเพราะอาจเป็น กรณีที่ทุกรุ่นไม่ได้ระบุไว้


1

การเรียนรู้ของเครื่องจำนวนมากอาจไม่แตกต่างจากการแฮ็คข้อมูลอย่างน้อยก็เพื่อวัตถุประสงค์บางอย่าง

หากคุณทดสอบแบบจำลองที่เป็นไปได้ทุกรูปแบบเพื่อค้นหาว่าแบบจำลองนั้นมีความแม่นยำในการทำนายสูงที่สุด (การทำนายทางประวัติศาสตร์หรือการทำนายกลุ่มนอก) โดยอิงจากข้อมูลในอดีตนี่ไม่ได้หมายความว่าผลลัพธ์จะช่วยให้เข้าใจสิ่งที่เกิดขึ้น อย่างไรก็ตามอาจเป็นไปได้ที่จะพบความสัมพันธ์ที่เป็นไปได้ที่อาจแจ้งสมมติฐาน

การกระตุ้นสมมติฐานที่เฉพาะเจาะจงจากนั้นทำการทดสอบโดยใช้วิธีการทางสถิติสามารถทำการแฮ็ก p-hacked (หรือคล้ายกัน) ได้เช่นกัน

แต่ประเด็นก็คือว่าหากเกณฑ์คือ "ความแม่นยำในการทำนายที่สูงที่สุดบนพื้นฐานของข้อมูลในอดีต" แสดงว่ามีความเสี่ยงสูงที่จะเกิดความมั่นใจในบางรุ่นที่ไม่เข้าใจโดยที่ไม่มีความคิดใด ๆ เกี่ยวกับผลลัพธ์ทางประวัติศาสตร์เหล่านั้น หรืออาจเป็นข้อมูลสำหรับอนาคต

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.