ความประหยัดควรเป็นมาตรฐานทองคำหรือไม่


31

แค่ความคิด:

แบบจำลองทางเลือกมักเป็นตัวเลือกเริ่มต้นในการเลือกรุ่น แต่วิธีนี้ล้าสมัยไปมากแค่ไหน? ฉันอยากรู้ว่าแนวโน้มของเราที่มีต่อช่วงเวลาที่เป็น parsimony นั้นเป็นเพียงช่วงเวลาหนึ่งของกฎ abaci และสไลด์ (หรือคอมพิวเตอร์ที่ไม่ทันสมัยอย่างจริงจังมากขึ้น) พลังการคำนวณของวันนี้ทำให้เราสามารถสร้างแบบจำลองที่ซับซ้อนมากขึ้นพร้อมความสามารถในการทำนายที่มากขึ้น จากผลของเพดานที่เพิ่มขึ้นในพลังการคำนวณนี้เรายังคงต้องหันเหความสนใจไปยังความเรียบง่ายหรือไม่

แน่นอนว่าโมเดลที่เรียบง่ายนั้นง่ายต่อการเข้าใจและตีความ แต่ในยุคของชุดข้อมูลที่มีจำนวนเพิ่มขึ้นเรื่อย ๆ พร้อมกับจำนวนตัวแปรที่มากขึ้นและการเปลี่ยนไปสู่การมุ่งเน้นที่ความสามารถในการทำนายมากขึ้น

คิด?


4
ด้วยการขอโทษริชาร์ดแฮมมิง: จุดประสงค์ของการสร้างแบบจำลองนั้นมีความเข้าใจลึกซึ้งไม่ใช่เป็นตัวเลข โมเดลที่ซับซ้อนทำให้เกิดความเข้าใจลึกซึ้ง
Eric Towers

12
แบบจำลองที่มีความเข้าใจผิดเป็นอุปสรรคมากยิ่งขึ้น
Frank Harrell

6
มันอาจขึ้นอยู่กับแอปพลิเคชัน; ในวิชาฟิสิกส์ฉันคิดว่าอาร์กิวเมนต์สำหรับ parsimony จะมีพื้นฐานที่แข็งแกร่ง อย่างไรก็ตามแอปพลิเคชันจำนวนมากจะมีโฮสต์ของเอฟเฟกต์เล็ก ๆ ที่ไม่สามารถกำจัดได้ (เช่นพิจารณาโมเดลสำหรับการกำหนดลักษณะทางการเมืองเป็นต้น) มีคนงานจำนวนหนึ่งแนะนำให้ใช้การทำให้เป็นมาตรฐาน (เช่นวิธีการที่นำไปสู่การหดตัวหรือในหลาย ๆ แอพพลิเคชั่นการหดตัวของความแตกต่างหรือทั้งสองอย่าง) มากกว่าการกำจัดตัวแปร คนอื่นโน้มตัวไปทางเลือกและการหดตัวบางอย่าง (เช่น LASSO ทำทั้งสองอย่าง)
Glen_b -Reinstate Monica

3
แบบจำลองที่ไม่ได้เป็นตัวเลือกไม่ใช่ "go-to" ในการเลือกแบบจำลอง มิฉะนั้นเราจะทำแบบจำลองทุกอย่างด้วยค่าเฉลี่ยตัวอย่างและเรียกมันว่าวัน
shadowtalker

1
นอกจากนี้อาหารบางอย่างสำหรับความคิด: Mease และ Wyner (2008)แนะนำผู้เรียนที่ดียิ่งขึ้นใน AdaBoost ซึ่งค่อนข้างใช้งานง่าย คำถามที่เปิดกว้างในสายงานวิจัยนั้นดูเหมือนว่าผู้เรียนที่มีพื้นฐานการถ่อมตนจริง ๆ จะนำไปสู่การแสดงตระการตาหรือไม่
shadowtalker

คำตอบ:


25

คำตอบเริ่มแรกของ @ Matt นั้นเป็นงานที่ยอดเยี่ยมในการอธิบายถึงหนึ่งในประโยชน์ของการประหยัดเงิน แต่ฉันไม่คิดว่ามันจะตอบคำถามของคุณได้จริง ในความเป็นจริง parsimony ไม่ใช่มาตรฐานทองคำ ไม่ใช่ตอนนี้หรือไม่เคยเป็นมาก่อน "มาตรฐานทองคำ" ที่เกี่ยวข้องกับ parsimony เป็นข้อผิดพลาดทั่วไป เราต้องการพัฒนาแบบจำลองที่ไม่เหมาะสม ที่มีประโยชน์สำหรับการคาดการณ์ (หรือตีความได้หรือมีข้อผิดพลาดน้อยที่สุด) จากตัวอย่างตามที่อยู่ในตัวอย่าง ปรากฎ (เพราะสิ่งที่วางไว้ด้านบน) ที่จริง parsimony เป็นพร็อกซีที่ดีสำหรับข้อผิดพลาดในการวางนัยทั่วไป

จริงๆลองคิดดูว่าทำไมเราถึงใช้การตรวจสอบความถูกต้องหรือความไม่สอดคล้องกัน เป้าหมายคือการสร้างแบบจำลองที่มีความแม่นยำในการวางนัยทั่วไปที่ดี หลายครั้งที่วิธีการประมาณประสิทธิภาพตัวอย่างเหล่านี้ทำให้เลือกรุ่นที่มีความซับซ้อนลดลง แต่ไม่เสมอไป ในฐานะที่เป็นตัวอย่างที่ยอดเยี่ยมจินตนาการว่า oracle ส่งแบบจำลองที่แท้จริง แต่ซับซ้อนอย่างยิ่งให้กับเรา ถ้า parsimony เป็นเป้าหมายของเราจริงๆแล้วเราจะเลือกอันดับที่สอง แต่ในความเป็นจริงอันดับแรกคือสิ่งที่เราต้องการเรียนรู้หากทำได้ น่าเสียดายที่หลายครั้งที่ประโยคสุดท้ายคือนักเตะ "ถ้าเราทำได้"


"คำตอบดั้งเดิม" คืออะไร
mattdm

:) ยุติธรรมเพียงพอ ความคิดเห็นของแมตต์
Nick Thieme

22

แบบจำลองที่มีคุณสมบัติเป็นที่พึงปรารถนาไม่เพียง แต่เกิดจากความต้องการด้านการประมวลผลเท่านั้น แต่ยังรวมถึงประสิทธิภาพทั่วไป มันเป็นไปไม่ได้ที่จะบรรลุถึงอุดมคติของข้อมูลที่ไม่มีที่สิ้นสุดซึ่งครอบคลุมพื้นที่ตัวอย่างอย่างสมบูรณ์และถูกต้องซึ่งหมายความว่าแบบจำลองที่ไม่มีการให้คะแนนมีศักยภาพที่จะทำให้เกิดสัญญาณรบกวนมากเกินไป

แน่นอนว่ามีความเป็นไปได้ที่จะสร้างแบบจำลองที่มีตัวแปรนับล้าน แต่คุณจะใช้ตัวแปรที่ไม่มีผลกระทบต่อผลลัพธ์ในการสร้างแบบจำลองระบบ คุณสามารถบรรลุผลการทำนายที่ยอดเยี่ยมในชุดข้อมูลการฝึกอบรมของคุณ แต่ตัวแปรที่ไม่เกี่ยวข้องเหล่านั้นจะลดประสิทธิภาพของคุณลงในชุดทดสอบที่มองไม่เห็น

หากตัวแปรการส่งออกอย่างแท้จริงเป็นผลมาจากตัวแปรล้านแล้วคุณจะทำอย่างไรดีที่จะนำพวกเขาทั้งหมดในรูปแบบการทำนายของคุณ แต่ถ้าคุณมีข้อมูลเพียงพอ หากต้องการสร้างแบบจำลองขนาดนี้อย่างถูกต้องคุณต้องมีจุดข้อมูลหลายล้านจุดอย่างน้อยที่สุด แบบจำลองทางด้านจิตใจนั้นเป็นสิ่งที่ดีเพราะในหลาย ๆ ระบบในโลกแห่งความจริงชุดข้อมูลขนาดนี้ก็ไม่สามารถใช้งานได้และนอกจากนี้ผลลัพธ์ยังถูกกำหนดโดยตัวแปรจำนวนเล็กน้อย


5
+1 ฉันขอแนะนำให้อ่านองค์ประกอบของการเรียนรู้เชิงสถิติ (มีให้บริการบนเว็บ)ซึ่งกล่าวถึงปัญหานี้ในเชิงลึก
S. Kolassa - Reinstate Monica

3
ในทางกลับกันเมื่อคุณมีตัวแปรนับล้านและวัตถุบางอย่างมีแนวโน้มว่าตัวแปรบางตัวจะอธิบายผลลัพธ์ที่ได้ว่าเป็นการโต้ตอบที่แท้จริงโดยบังเอิญ ในกรณีดังกล่าวการจำลองแบบอิงตามส่วนจะมีความอ่อนไหวต่อการ overfitting มากกว่าวิธีการใช้กำลังดุร้าย

@CagdasOzgenc ยกตัวอย่างเช่นพื้นที่ย่อยสุ่มขนาดใหญ่

ฉันรู้สึกว่าบางสิ่งเช่นวิธี Lasso สามารถสมัครได้ที่นี่
วิทยาศาสตร์ด้านป่าไม้

17

ฉันคิดว่าคำตอบก่อนหน้านี้ทำงานได้ดีในการทำประเด็นสำคัญ:

  • แบบจำลองทางการเงินมักจะมีลักษณะทั่วไปที่ดีกว่า
  • Parsimony ไม่ได้เป็นมาตรฐานทองคำอย่างแท้จริง แต่เป็นเพียงการพิจารณา

ฉันต้องการที่จะเพิ่มความคิดเห็นบางส่วนที่มาจากประสบการณ์การทำงานแบบวันต่อวัน

การวางหลักเกณฑ์การโต้แย้งความถูกต้องแม่นยำโดยทั่วไปนั้นมีความแข็งแกร่ง แต่มีอคติเชิงวิชาการในการมุ่งเน้น โดยทั่วไปเมื่อสร้างแบบจำลองทางสถิติเศรษฐกิจไม่ได้เป็นเช่นนั้นว่าประสิทธิภาพการทำนายเป็นการพิจารณาที่โดดเด่นอย่างสมบูรณ์ บ่อยครั้งที่มีข้อ จำกัด จากภายนอกขนาดใหญ่ว่าโมเดลที่มีประโยชน์มีลักษณะอย่างไรสำหรับแอปพลิเคชันที่ระบุ:

  • โมเดลต้องสามารถนำไปใช้งานได้ภายในกรอบงานหรือระบบที่มีอยู่
  • โมเดลต้องเข้าใจได้โดยนิติบุคคลที่ไม่ใช่ด้านเทคนิค
  • ตัวแบบต้องมีประสิทธิภาพในการคำนวณ
  • รูปแบบจะต้องdocumentable
  • รูปแบบจะต้องผ่านข้อ จำกัด ของกฎระเบียบ

ในโดเมนแอปพลิเคชันจริงจำนวนมากถ้าไม่ใช่ทั้งหมดของการพิจารณาเหล่านี้มาก่อนไม่ใช่หลังประสิทธิภาพการทำนาย - และการเพิ่มประสิทธิภาพของแบบฟอร์มและพารามิเตอร์ถูกจำกัดโดยความต้องการเหล่านี้ ข้อ จำกัด เหล่านี้ทำให้นักวิทยาศาสตร์มีอคติต่ออคติ

อาจเป็นจริงว่าในหลายโดเมนข้อ จำกัด เหล่านี้จะถูกยกขึ้นอย่างค่อยเป็นค่อยไป แต่เป็นนักวิทยาศาสตร์ที่โชคดีที่ได้รับการเพิกเฉยพวกเขาจะมุ่งเน้นไปที่การลดข้อผิดพลาดทั่วไป

สิ่งนี้น่าหงุดหงิดมากสำหรับนักวิทยาศาสตร์ครั้งแรกที่เพิ่งออกจากโรงเรียน (มันแน่นอนสำหรับฉันและยังคงเป็นเมื่อฉันรู้สึกว่าข้อ จำกัด ในการทำงานของฉันไม่ได้เป็นธรรม) แต่ในที่สุดการทำงานอย่างหนักเพื่อผลิตผลิตภัณฑ์ที่ไม่สามารถยอมรับได้ก็คือของเสียและนั่นทำให้รู้สึกแย่ไปกว่าความภาคภูมิใจทางวิทยาศาสตร์ของคุณ


2
ไม่มีการเก็บซ่อนเร้น ขั้นตอนการอนุมานด้วยเสียงต้องจัดอันดับโมเดลที่มีลักษณะเฉพาะมากกว่าแบบจำลองที่ไม่ใช้เวลาหากพวกเขาอธิบายข้อมูลได้ดีพอ ๆ กัน มิฉะนั้นความยาวรวมที่ถูกบีบอัดของโมเดลและข้อมูลที่เข้ารหัสโดยโมเดลจะไม่เล็กที่สุด ใช่มันเป็นมาตรฐานทองคำ
Cagdas Ozgenc

3
Parsimony ไม่ใช่ "มาตรฐานทองคำ"! คำสั่งนั้นผิดปกติ ถ้ามันเป็นเรื่องจริงทำไมเราไม่สร้างแบบจำลองที่ไม่เข้ากับอะไรนอกจากค่าเฉลี่ยที่ไม่มีเงื่อนไข? เราแลกเปลี่ยนความลำเอียงและความแปรปรวนโดยอ้างอิงจากชุดทดสอบหรือการสังเกตใหม่ที่สมบูรณ์และดีกว่าและเราดำเนินการภายใต้ข้อ จำกัด ของสาขาองค์กรและกฎหมายของเรา บางครั้งคุณมีข้อมูลเพียงพอที่จะคาดการณ์ที่ไร้เดียงสา บางครั้งคุณมีเพียงพอที่จะเพิ่มความซับซ้อน
Brash Equilibrium

1
@BrashEquilibrium ฉันคิดว่าสิ่งที่ Cagdas กำลังพูดคือได้รับตัวเลือกระหว่างแบบจำลองการทำนายที่เท่าเทียมกันเราควรเลือกรูปแบบที่ดีที่สุด
Matthew Drury

1
อา นั่นคือสิ่งที่แตกต่าง ใช่ในกรณีนั้นเลือกรูปแบบที่น่าสังเวชที่สุด ฉันยังไม่คิดว่าจำนวน parsimony เป็น "มาตรฐานทองคำ" แม้ว่า
Brash Equilibrium

1
@MatthewDrury Brash, Cagdas น่าสนใจ บางทีการแยกวิเคราะห์เป็นเพียงองค์ประกอบหนึ่งของมาตรฐานทองคำ ซึ่งอาจเป็น (หรือควรจะ) ดีกว่าขึ้นอยู่รอบ ๆ ความคิดของการครอบคลุม การแสดงออกที่ดีของความคิดนี้ให้ไว้ในดาราศาสตร์ต่อไปบรรยายจากมหาวิทยาลัยเยล: oyc.yale.edu/astronomy/astr-160/lecture-11 7:04 เป็นต้นไป แนวคิดนี้ยังมีอยู่ในวรรณกรรมทางเศรษฐศาสตร์ / พยากรณ์โดย David Hendry และ Grayham Mizon พวกเขาให้เหตุผลว่าการรวมเป็นส่วนหนึ่งของกลยุทธ์การวิจัยที่ก้าวหน้าซึ่ง parsimony เป็นแง่มุมเดียว
แกรมวอลช์

14

ฉันคิดว่านี่เป็นคำถามที่ดีมาก ในความคิดของฉัน parsimony overrated ธรรมชาตินั้นไม่ค่อยให้ความสำคัญและดังนั้นเราไม่ควรคาดหวังว่าแบบจำลองการทำนายหรือแบบพรรณนาที่แม่นยำจะเป็นเช่นนั้น เกี่ยวกับคำถามเกี่ยวกับการตีความถ้าคุณเลือกรูปแบบที่เรียบง่ายกว่าที่สอดคล้องกับความเป็นจริงเพียงเพราะคุณสามารถเข้าใจได้สิ่งที่คุณเข้าใจคืออะไร? สมมติว่าแบบจำลองที่ซับซ้อนยิ่งกว่านั้นมีพลังการทำนายที่ดีกว่ามันก็จะปรากฏขึ้นใกล้กับข้อเท็จจริงที่แท้จริงอย่างไรก็ตาม


8
ดีกล่าวว่า @ dsaxton มีความเข้าใจผิดอย่างมากเกี่ยวกับความประหยัดและความชื่นชมอย่างมากต่อการเลือกคุณลักษณะที่เปลี่ยนแปลงได้อย่างไร Parsimony เป็นสิ่งที่ดีเมื่อเป็นผลมาจากข้อกำหนดเบื้องต้น ความเหลื่อมล้ำส่วนใหญ่ที่เกิดจากการขุดลอกข้อมูลทำให้เข้าใจผิดและเข้าใจได้เฉพาะเพราะมันผิด
Frank Harrell

2
@ Frankankarrell คุณจะอธิบายรายละเอียดเกี่ยวกับ "เข้าใจเท่านั้นเพราะมันผิด" หรืออาจจะลิงค์ไปยังบางสิ่งที่คุณเคยเขียนเกี่ยวกับเรื่องนี้มาก่อน? นี่เป็นจุดที่น่าสนใจที่ฉันต้องการให้แน่ใจว่าฉันเข้าใจ
gui11aume

8
นี่เป็นตัวอย่างที่ยอดเยี่ยม แต่ผู้ที่มีส่วนร่วมในการจัดทำโปรไฟล์ทางเชื้อชาติคิดว่าพวกเขาเข้าใจด้วยคุณลักษณะเดียว (เช่นสีผิว) สิ่งที่มีคุณค่าต่อผู้อื่น สำหรับพวกเขาแล้วคำตอบนั้นง่ายมาก พวกเขาเข้าใจเพียงเพราะพวกเขากำลังตัดสินใจผิดโดยการใช้คำสั่งเกินจริง Parsimony มักเป็นมายา (ยกเว้นในกลศาสตร์ของนิวตันและพื้นที่อื่น ๆ )
Frank Harrell

1
"ธรรมชาติไม่ค่อยนิยม": และจุดหนึ่งที่ธรรมชาติไม่เฉพาะบุคคลคือบุคคลทั่วไป (ตรงข้ามกับขนาดตัวอย่างทั่วไปของเรา!) วิวัฒนาการใช้ประชากรใหม่ทั้งหมดของบุคคลใหม่ในแต่ละรุ่น ... IMHO the parsimony (ประเภทที่ระบุไว้ล่วงหน้าของ Frank Harrell - การอนุญาตให้คุณสมบัติใด ๆ ของ n ที่มีอยู่ในแบบจำลองเป็นจริงแบบจำลองที่ซับซ้อนมาก - แม้ว่า n << m, นี่เป็นส่วนที่ไม่เล็กของพื้นที่การค้นหาดั้งเดิม) คือวิธีที่เราพยายามดึงชุดข้อมูลที่เล็กเกินไปจนเกินไป
cbeleites รองรับ Monica

2

Parsimony ไม่ใช่จุดเริ่มต้นที่เป็นสีทอง มันเป็นมุมมองในการสร้างแบบจำลอง การสร้างแบบจำลองและการพยากรณ์โดยเฉพาะไม่สามารถเขียนสคริปต์ได้เช่นคุณไม่สามารถส่งสคริปต์ไปยังผู้สร้างโมเดลเพื่อติดตามได้ คุณควรกำหนดหลักการที่กระบวนการสร้างแบบจำลองจะต้องใช้ ดังนั้น parsimony เป็นหนึ่งในหลักการเหล่านี้การประยุกต์ใช้ซึ่งไม่สามารถสคริปต์ (อีกครั้ง!) ผู้สร้างแบบจำลองจะพิจารณาความซับซ้อนเมื่อเลือกรุ่น

พลังการคำนวณมีส่วนเกี่ยวข้องกับสิ่งนี้เพียงเล็กน้อย หากคุณอยู่ในอุตสาหกรรมโมเดลของคุณจะถูกใช้โดยกลุ่มธุรกิจคนผลิตภัณฑ์หรือใครก็ตามที่คุณโทรหาพวกเขา คุณต้องอธิบายรูปแบบของพวกเขาก็ควรให้ความรู้สึกให้กับพวกเขา การมีแบบจำลองทางการเงินช่วยในเรื่องนี้

ตัวอย่างเช่นคุณคาดการณ์ยอดขายผลิตภัณฑ์ คุณควรจะสามารถอธิบายสิ่งที่เป็นแรงผลักดันการขายและวิธีการทำงาน สิ่งเหล่านี้ต้องเกี่ยวข้องกับแนวคิดที่ดำเนินธุรกิจและความสัมพันธ์จะต้องเข้าใจและยอมรับโดยธุรกิจ ด้วยแบบจำลองที่ซับซ้อนอาจเป็นเรื่องยากมากที่จะตีความผลลัพธ์ของแบบจำลองหรือแอตทริบิวต์ความแตกต่างกับของจริง หากคุณไม่สามารถอธิบายแบบจำลองของคุณกับธุรกิจคุณจะไม่ได้รับความสนใจ

อีกสิ่งหนึ่งที่สำคัญอย่างยิ่งสำหรับการพยากรณ์ สมมติว่าแบบจำลองของคุณขึ้นอยู่กับตัวแปรภายนอก ซึ่งหมายความว่าคุณต้องรับการคาดการณ์ของตัวแปรเหล่านี้ก่อนเพื่อคาดการณ์ตัวแปรตาม การมี N ที่เล็กกว่าจะทำให้ชีวิตของคุณง่ายขึ้นดังนั้นโมเดลที่ง่ายกว่าจึงใช้งานได้ง่ายกว่า


แม้ว่าคุณจะพูดถึงการคาดการณ์คำตอบส่วนใหญ่ของคุณดูเหมือนจะใช้กับการสร้างแบบจำลองที่อธิบายเท่านั้น
rolando2

@ rolando2 ดูเหมือนว่าเพราะในโดเมนของฉันคุณไม่สามารถส่งการคาดการณ์ให้กับผู้ใช้ได้ เราต้องอธิบายการพยากรณ์เชื่อมโยงมันกับคนขับ ฯลฯ เมื่อคุณได้รับการพยากรณ์อากาศโดยปกติคุณไม่ได้ขอให้ผู้ทำนายอธิบายว่าทำไมพวกเขาคิดว่าฝนจะตกโดยมีโอกาส 50% ในกรณีของฉันฉันไม่เพียงต้องทำเท่านั้น แต่ทำในวิธีที่ผู้บริโภคของฉันเข้าใจผลลัพธ์โดยการเชื่อมโยงไปยังโปรแกรมควบคุมทางธุรกิจที่พวกเขาจัดการกับรายวัน นั่นเป็นเหตุผลว่าทำไมการประหยัดเวลาจึงมีค่าในตัวของมันเอง
อั

1

บางทีอาจมีการทบทวนAkaike Information Criterionซึ่งเป็นแนวคิดที่ฉันค้นพบโดยบังเอิญเมื่อวานนี้เท่านั้น AIC พยายามที่จะระบุว่าตัวแบบใดและพารามิเตอร์จำนวนมากที่สุดคือคำอธิบายที่ดีที่สุดสำหรับการสังเกตการณ์ที่อยู่ในมือแทนที่จะเป็น Razor พื้นฐานของ Occam

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.