บนกล่องจอร์จ Galit Shmueli และวิธีการทางวิทยาศาสตร์?


16

(คำถามนี้ดูเหมือนว่าจะเหมาะกว่าสำหรับปรัชญา SE ฉันหวังว่านักสถิติสามารถอธิบายความเข้าใจที่คลาดเคลื่อนเกี่ยวกับคำแถลงของ Box และ Shmueli ได้ดังนั้นฉันจึงโพสต์ไว้ที่นี่)

George Box (จากชื่อเสียงของ ARIMA) กล่าวว่า:

"ทุกรุ่นผิด แต่บางรุ่นก็มีประโยชน์"

Galit Shmueli ในกระดาษชื่อดังของเธอ"เพื่ออธิบายหรือทำนาย" , (และอ้างอิงคนอื่นที่เห็นด้วยกับเธอ) ระบุว่า:

การอธิบายและการทำนายไม่เหมือนกันและบางรุ่นทำหน้าที่อธิบายได้ดีถึงแม้ว่าพวกเขาจะทำงานได้ดีในการทำนาย

ฉันรู้สึกว่าหลักการเหล่านี้ขัดแย้งกับสิ่งใด

หากแบบจำลองไม่สามารถคาดเดาได้ดีจะเป็นประโยชน์หรือไม่

ที่สำคัญกว่านั้นถ้าแบบจำลองอธิบายได้ดี (แต่ไม่จำเป็นต้องคาดเดาได้ดี) มันจะต้องเป็นจริง (เช่นไม่ผิด) ไม่ทางใดก็ทางหนึ่ง แล้วตาข่ายกับกล่องของ "ทุกรุ่นผิด" อย่างไร

ท้ายที่สุดถ้าแบบจำลองอธิบายได้ดี แต่ไม่คาดการณ์ได้ดีมันจะเป็นไปได้อย่างไรทางวิทยาศาสตร์? เกณฑ์การแบ่งเขตทางวิทยาศาสตร์ส่วนใหญ่ (การตรวจสอบยืนยันการปลอมแปลง ฯลฯ ) หมายถึงว่าคำสั่งทางวิทยาศาสตร์จะต้องมีอำนาจการทำนายหรือเรียกขาน: ทฤษฎีหรือรูปแบบที่ถูกต้องเฉพาะถ้ามันสามารถทดสอบเชิงประจักษ์ (หรือเท็จ) ซึ่งหมายความว่ามัน ต้องทำนายผลลัพธ์ในอนาคต

คำถามของฉัน:

  • คำแถลงของ Box และความคิดของ Shmueli ขัดแย้งหรือไม่หรือฉันขาดบางสิ่งบางอย่างเช่นแบบจำลองไม่มีพลังการทำนาย แต่ยังคงมีประโยชน์หรือไม่?
  • หากคำแถลงของ Box และ Shmueli ไม่ขัดแย้งนั่นหมายความว่าแบบจำลองนั้นผิดและไม่สามารถทำนายได้ดี แต่ยังมีอำนาจอธิบายอยู่ วางไว้แตกต่างกัน: ถ้าใครเอาความถูกต้องและความสามารถในการคาดเดาออกไปสิ่งที่เหลืออยู่ของแบบจำลอง?

การตรวจสอบเชิงประจักษ์ใดที่เป็นไปได้เมื่อแบบจำลองมีอำนาจอธิบาย แต่ไม่สามารถทำนายพลังได้? Shmueli กล่าวถึงสิ่งต่าง ๆ เช่น: ใช้ AIC เพื่อคำอธิบายและ BIC สำหรับการทำนาย ฯลฯ ... แต่ฉันไม่เห็นว่าวิธีแก้ปัญหานั้นได้อย่างไร ด้วยโมเดลการทำนายคุณสามารถใช้ AIC หรือ BIC หรือหรือการทำให้เป็นมาตรฐานฯลฯ ... แต่สุดท้ายจากการทดสอบตัวอย่างและประสิทธิภาพในการผลิตคือสิ่งที่กำหนดคุณภาพของแบบจำลอง แต่สำหรับโมเดลที่อธิบายได้ดีฉันไม่เห็นว่าฟังก์ชั่นการสูญเสียใดสามารถประเมินโมเดลได้อย่างแท้จริง ในปรัชญาวิทยาศาสตร์มีแนวคิดเรื่องบ่อนทำลายR2L1L L p < 0.05 p < 0.1 p < 0.01ซึ่งดูเหมือนว่าตรงประเด็นที่นี่: สำหรับชุดข้อมูลใด ๆ เราสามารถเลือกการแจกแจง (หรือการผสมผสานของการแจกแจง) และฟังก์ชันการสูญเสียในลักษณะที่เหมาะสมกับข้อมูล (และสามารถอ้างได้ว่าอธิบาย) นอกจากนี้เกณฑ์ที่ควรอยู่ภายใต้สำหรับคนที่จะเรียกร้องว่ารูปแบบเพียงพออธิบายข้อมูลที่มีพล (ชนิดเช่น P-ค่าทำไมมันและไม่หรือ )LLp<0.05p<0.1p<0.01

  • จากข้างต้นเราสามารถตรวจสอบความถูกต้องของโมเดลที่อธิบายได้ดี แต่ไม่สามารถคาดการณ์ได้ดีเนื่องจากไม่สามารถทำการทดสอบตัวอย่างได้

ดูเพิ่มเติมคำถามที่เกี่ยวข้อง: Paradox ในการเลือกรูปแบบ (AIC, BIC จะอธิบายหรือทำนาย?)
Richard Hardy

3
เท่าที่ฉันจำได้ Shmueli สำหรับเธอที่จะอธิบายวิธีที่ดีที่จะได้รับแบบฟอร์มการทำงานที่ถูกต้อง (แต่อาจจะมีการประมาณค่าขนาดใหญ่เมื่อมันมาถึงพารามิเตอร์ของรูปแบบการทำงานนั้น) ในขณะที่การทำนายอย่างดีหมายความว่า ขวา (ประนีประนอมในแบบฟอร์มการทำงานเพื่อเพิ่มความแม่นยำในการประมาณค่า) นอกจากนี้ปรัชญาแท็กก็มีประโยชน์ที่นี่
Richard Hardy

1
ฉันไม่คิดว่า "หรือ" จะต้องเป็นเอกสิทธิ์ ความเรียบง่ายและการรวมเป็นเกณฑ์การคัดเลือกแบบไม่ขัดแย้งสำหรับทฤษฎีที่มีค่าการทำนายเท่ากันและหากเป็นเช่นนั้นการเสียสละความแม่นยำสำหรับพวกเขาอาจเป็นธรรมในหลายบริบท คำขวัญของ Box สะท้อนมุมมองที่แตกต่างกันของวิทยาศาสตร์ขั้นสูงเช่นในภาพทางวิทยาศาสตร์ของ Van Fraassen (และกลับไปที่ Kant): มันเป็นการสร้างคำอธิบายที่เพียงพอ / มีประโยชน์สำหรับผู้สังเกตการณ์ ความเพียงพอที่หยาบอาจพอเพียงสำหรับงานหลายอย่างและ "แบบจำลองที่ถูกต้องเพียงอันเดียว" อาจเป็นเรื่องไร้สาระ
Conifold

2
@ Conifold แท้จริงแล้วการวิเคราะห์วนรอบของ Richard Levins ของระบบเชิงสาเหตุที่ซับซ้อน (ไม่ใช่วิธีการทางสถิติแม้ว่าจะมีการใช้งานของมันที่เกี่ยวข้องโดยตรงกับการทำนายทางสถิติ) เสียสละเกือบแม่นยำในความเป็นจริงของแบบจำลอง (ตัวแปรและความสัมพันธ์ระหว่างพวกเขา) การบังคับใช้ผลการวิเคราะห์ในแบบจำลองกับตัวแปรทั้งหมดที่ใช้โครงสร้างสาเหตุเดียวกัน ดูเลวินส์อาร์ (2509) กลยุทธ์การสร้างแบบจำลองทางชีววิทยาประชากร . นักวิทยาศาสตร์อเมริกัน 54 (4), 421–431
Alexis

(+1. ฉันยังหวังว่าจะหาเวลาเพื่อโพสต์คำตอบได้ที่นี่ ... )
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


9

ให้ฉันเริ่มต้นด้วยคำพูดแหลมคมโดย George Box ว่า ​​"ทุกรุ่นผิด แต่มีประโยชน์" คำกล่าวนี้เป็นการห่อหุ้มของวิธีการเชิงวิธีการของ "positivism" ซึ่งเป็นแนวทางปรัชญาที่มีอิทธิพลอย่างมากในวิทยาศาสตร์ วิธีการนี้จะอธิบายในรายละเอียด (ในบริบทของทฤษฎีทางเศรษฐกิจ) ในการเขียนเรียงความเกี่ยวกับระเบียบวิธีคลาสสิกของฟรีดแมน (1966) ในบทความนั้นฟรีดแมนระบุว่าทฤษฎีทางวิทยาศาสตร์ที่มีประโยชน์ใด ๆ จำเป็นต้องมีการทำให้เข้าใจง่ายของความเป็นจริงและดังนั้นสมมติฐานของมันจะต้องออกจากความเป็นจริงไปสู่ระดับหนึ่งและอาจออกจากความเป็นจริงในการลดความซับซ้อนของโลกเป็นชุดของหลักการที่สามารถจัดการได้และความแม่นยำในการทำนายเกี่ยวกับความเป็นจริงและสร้างสมมติฐานที่ทดสอบได้ใหม่เกี่ยวกับความเป็นจริง ดังนั้น Friedman ให้เหตุผลว่า "แบบจำลองทั้งหมดผิด" ตราบเท่าที่พวกเขาทุกคนมีสมมติฐานที่ทำให้ความเป็นจริง (และจากไป) ง่ายขึ้น แต่ "บางคนมีประโยชน์" ตราบเท่าที่พวกเขาให้กรอบการทำงานที่ง่าย ๆ

ทีนี้ถ้าคุณอ่านBox (1976) (บทความที่เขาระบุไว้ว่า "ทุกรุ่นผิด") คุณจะเห็นว่าเขาไม่ได้กล่าวถึง Friedman และเขาไม่ได้พูดถึงวิธีการเชิงบวก อย่างไรก็ตามคำอธิบายของเขาเกี่ยวกับวิธีการทางวิทยาศาสตร์และลักษณะของมันนั้นใกล้เคียงกับที่พัฒนาโดย Friedman โดยเฉพาะอย่างยิ่งผู้เขียนทั้งสองเน้นว่าทฤษฎีทางวิทยาศาสตร์จะทำการทำนายเกี่ยวกับความจริงที่สามารถทดสอบกับข้อเท็จจริงที่สังเกตได้และข้อผิดพลาดในการทำนายนั้นสามารถนำมาใช้เป็นพื้นฐานสำหรับการแก้ไขทฤษฎี

ตอนนี้เพื่อขั้วที่กล่าวถึงโดย Galit Shmueli ในShmueli (2001) ในบทความนี้ Shmueli เปรียบเทียบคำอธิบายเชิงสาเหตุและการทำนายผลลัพธ์ที่สังเกตได้และระบุว่าสิ่งเหล่านี้เป็นกิจกรรมที่แตกต่างกัน โดยเฉพาะเธอให้เหตุผลว่าความสัมพันธ์เชิงสาเหตุอยู่บนพื้นฐานของโครงสร้างที่ไม่ได้เปิดเผยโดยตรงในผลลัพธ์ที่สามารถวัดได้และ "ข้อมูลที่วัดได้นั้นไม่ได้เป็นตัวแทนที่ถูกต้องของโครงสร้างพื้นฐานของพวกเขา" (หน้า 293) เธอจึงให้เหตุผลว่ามีแง่มุมหนึ่งของการวิเคราะห์เชิงสถิติที่เกี่ยวข้องกับการอนุมานเกี่ยวกับความสัมพันธ์เชิงสาเหตุที่ไม่สามารถสังเกตได้ซึ่งไม่ปรากฏในความแตกต่าง counterfactual ที่วัดได้ในผลลัพธ์

ถ้าฉันไม่เข้าใจผิดฉันคิดว่ามันยุติธรรมที่จะพูดว่าความคิดนี้ตึงเครียดกับมุมมองเชิงบวกของ Box และ Friedman ดังที่แสดงในเครื่องหมายคำพูดของ Box มุมมองที่เป็นไปในทางบวกนั้นบอกว่าไม่มี "อภิปรัชญา" ที่ยอมรับได้เกินกว่าสิ่งที่ปรากฏในผลลัพธ์ที่วัดได้ Positivism จำกัด ตัวเองเพื่อพิจารณาข้อมูลที่สังเกตได้และแนวคิดที่สร้างขึ้นจากข้อมูลนี้ มันไม่รวมการพิจารณาของนิรนัยแนวคิดเชิงเลื่อนลอย ดังนั้นนักปฏิฐานนิยมจะยืนยันว่าแนวคิดของความเป็นเวรกรรมสามารถใช้ได้กับขอบเขตที่กำหนดไว้ในแง่ของผลลัพธ์ที่สามารถวัดได้ในความเป็นจริง --- เท่าที่มันถูกกำหนดเป็นสิ่งที่แตกต่างจากนี้ (ขณะที่ Shmueli ปฏิบัติต่อมัน) สิ่งนี้จะถูกมองว่าเป็นการเก็งกำไรทางอภิปรัชญาและจะถือว่าไม่สามารถยอมรับได้ในวาทกรรมทางวิทยาศาสตร์

ดังนั้นฉันคิดว่าคุณพูดถูก --- สองแนวทางนี้ขัดแย้งกันมาก วิธีการในเชิงบวกที่ใช้โดย Box ยืนยันว่าแนวคิดทางวิทยาศาสตร์ที่ถูกต้องนั้นมีเหตุผลทั้งหมดในการแสดงออกของพวกเขาในความเป็นจริงในขณะที่วิธีการทางเลือกที่ใช้โดย Shmueli กล่าวว่ามี "โครงสร้าง" บางอย่างที่เป็นแนวคิดทางวิทยาศาสตร์ที่สำคัญ จะแสดงอย่างสมบูรณ์แบบเมื่อพวกเขา "ปฏิบัติการ" โดยเกี่ยวข้องกับพวกเขาเพื่อผลลัพธ์ที่วัดได้ในความเป็นจริง


แน่นอน !!! ดูเหมือนว่า Shmueli จะขัดแย้งกันมากที่สุดคำจำกัดความ positivist (และ falsificationist) ของสิ่งที่เป็นคำสั่งทางวิทยาศาสตร์และฉันสงสัยว่าความตั้งใจของเธอเป็นจริงเพื่อให้คำสั่งปรัชญาหนาเช่นนี้? หรือว่าเธอในฐานะนักสถิติไม่ทราบว่าคำพูดของเธอเป็นตัวหนาแค่ไหน?
Skander H. - Reinstate Monica

ฉันโพสต์คำถามที่เกี่ยวข้องกับปรัชญา SEสนใจที่จะชั่งน้ำหนักหรือไม่
Skander H. - Reinstate Monica

1
แม้ว่าการมองในแง่บวกและลัทธินิยมนิยมมีลักษณะต่อต้านความจริง แต่วิธีการของบ็อกซ์เป็นสิ่งหลัง นี่คือเหตุผลที่ Box ไม่ได้กล่าวถึงฟรีดแมนหรือผู้นิยมในแง่บวกอื่น ๆ การปฏิบัตินิยมไม่ได้ จำกัด อยู่ที่ข้อมูลที่สังเกตได้และไม่มีปัญหากับแนวคิดเบื้องต้นหรือสิ่งก่อสร้างทางอภิปรัชญา มันไม่ได้มองว่าพวกเขากำลังเข้าใกล้ "ความจริง" และด้วยเหตุนี้การเล็งไปที่คุณสมบัติ "ถูกต้อง" ที่ไม่ซ้ำกัน ความสัมพันธ์เชิงสาเหตุเป็นโครงสร้างดังกล่าวดังนั้นจึงไม่มีความขัดแย้งระหว่าง Box และ Shmueli
Conifold

ไม่ว่า Box จะเป็นนักปฏิบัตินิยมคำพูดที่เขาให้ที่นี่คือในมุมมองของฉันเอื้อต่อการมองโลกในแง่บวกมากกว่าลัทธิปฏิบัตินิยมมากกว่า ปรัชญาหลังใช้มุมมองที่หลากหลายของอภิปรัชญาซึ่งถือได้ว่ามีหลายวิธีที่สอดคล้องกันของความเป็นจริง conceptualising และสิ่งเหล่านี้เป็น "ความจริง" ในแง่ของการเป็นแนวคิดที่มีประโยชน์ของความเป็นจริง ดังนั้น positivism จะพูดว่า "แบบจำลองทั้งหมดผิด แต่มีประโยชน์" ในขณะที่จุดสูงสุดของลัทธินิยมนิยมจะใกล้ชิดกับ "แบบจำลองหลายแบบนั้นถูกต้องเพราะมันมีประโยชน์"
Reinstate Monica

การระบุความจริงที่มีประโยชน์เป็นเพียงความเข้าใจผิดพื้นบ้านเกี่ยวกับลัทธิปฏิบัตินิยม นางแบบทุกคนผิดเพราะ "ถูกต้อง" แสดงว่าพวกเขามีบางสิ่งบางอย่างที่สอดคล้องกันซึ่งนักปฏิบัตินิยมปฏิเสธ และหลักการของความอดทน "นางแบบที่ถูกต้องตราบเท่าที่พวกเขามีจุดประสงค์" เนื่องจาก Carnap พ่อแห่งความคิดเชิงบวก
Conifold

4

แบบจำลองเมื่อใช้อธิบายสิ่งต่าง ๆ เป็นการทำให้เข้าใจง่ายของความเป็นจริง การทำให้เข้าใจง่ายเป็นอีกคำหนึ่งสำหรับ "ผิดด้วยวิธีที่มีประโยชน์" ตัวอย่างเช่นถ้าเราปัดจำนวน 3.1415926535898 เป็น 3.14 เรากำลังทำผิด แต่ข้อผิดพลาดนี้ช่วยให้มนุษย์เรามุ่งเน้นไปที่ส่วนที่สำคัญที่สุดของตัวเลขนั้น นี่คือวิธีการใช้แบบจำลองในการอธิบายมันให้ข้อมูลเชิงลึกเกี่ยวกับปัญหาบางอย่าง แต่โดยความจำเป็นจะต้องแยกออกจากสิ่งอื่น ๆ อีกมากมาย: มนุษย์เราไม่เก่งที่จะมองสิ่งต่าง ๆ นับพันพร้อมกัน หากเราใส่ใจในการคาดการณ์เป็นหลักเราต้องการรวมสิ่งต่าง ๆ หลายพันรายการทุกครั้งที่เป็นไปได้ แต่ด้วยการอธิบายการแลกเปลี่ยนแตกต่างกัน


1
π

1
@SkanderH เท่าที่ "กราฟที่สวยงามและใช้งานง่าย" อำนวยความสะดวกในการใช้งานทางวิศวกรรมหรือการพัฒนาทฤษฎีใหม่ค่าของพวกเขาไม่ได้เป็นอัตนัยอย่างหมดจดหรือไม่ใช่ทางวิทยาศาสตร์มันเป็นในทางปฏิบัติ ผสมผสานพลังงานอธิบายความเรียบง่ายและการเชื่อมโยงกันเป็นที่ยอมรับในวงกว้างเป็นepistemicไม่งามค่า ทางเลือกระหว่างทฤษฎีอีเธอร์ของลอเรนซ์กับทฤษฎีสัมพัทธภาพพิเศษทำขึ้นจากการพิจารณาเช่นนั้นพวกมันคาดการณ์ได้เทียบเท่า
Conifold

3

ตัวอย่างของแบบจำลองที่ยอดเยี่ยมในการคาดการณ์ แต่ไม่ได้อธิบายอะไรเลยในบทความ Wikipedia“ แบบจำลองทั้งหมดผิดพลาด ” ตัวอย่างคือรูปแบบความโน้มถ่วงของนิวตัน แบบจำลองของนิวตันเกือบจะให้การทำนายที่แยกไม่ออกจากการสังเกตเชิงประจักษ์ กระนั้นโมเดลก็ไม่น่าเป็นไปได้อย่างยิ่งเพราะมันเป็นแรงที่สามารถกระทำได้ในระยะทางไกลโดยพลการ

แบบจำลองของนิวตันถูกแทนที่ด้วยแบบจำลองที่กำหนดในทฤษฎีสัมพัทธภาพทั่วไปของ Einstein ด้วยทฤษฎีสัมพัทธภาพทั่วไปแรงโน้มถ่วงเดินทางผ่านอวกาศด้วยความเร็ว จำกัด (ความเร็วของแสง)

โมเดลของนิวตันนั้นไม่ได้เป็นการทำให้ง่ายขึ้นของโมเดลเชิงความสัมพันธ์ทั่วไป เพื่อแสดงว่าพิจารณาแอปเปิ้ลที่ตกลงมาจากต้นไม้ ตามทฤษฏีสัมพัทธภาพทั่วไปแอปเปิ้ลตกลงมาโดยที่โลกไม่ได้ใช้กำลังใด ๆ (เหตุผลหลักที่แอปเปิ้ลตกคือว่าโลกประลองยุทธ์เวลาเพื่อให้นาฬิกาใกล้ฐานของการทำงานต้นไม้ช้ากว่านาฬิกาสูงขึ้นในต้นไม้.) ดังนั้นที่บันทึกบทความวิกิพีเดีย, รุ่นของนิวตันเป็นอย่างสมบูรณ์ที่ไม่ถูกต้องจากการอธิบาย มุมมอง

กระดาษโดย Shmueli [2010] ทึกทักเอาว่ามีสองวัตถุประสงค์สำหรับรูปแบบ: การทำนายและคำอธิบาย ในความเป็นจริงผู้เขียนหลายคนระบุว่ามีวัตถุประสงค์สามประการ (ดูเช่น Konishi & Kitagawa [ เกณฑ์ข้อมูลและการสร้างแบบจำลองทางสถิติ , 2008: §1.1] และ Friendly & Meyer [ การวิเคราะห์ข้อมูลไม่ต่อเนื่อง , 2016: § 11.6]) วัตถุประสงค์สามประการนั้นสอดคล้องกับเหตุผลเชิงตรรกะทั้งสามประเภท:

  • การทำนาย (สอดคล้องกับการหัก);
  • การประมาณค่าพารามิเตอร์ (สอดคล้องกับการเหนี่ยวนำ);
  • คำอธิบายของโครงสร้าง (สอดคล้องกับการลักพาตัว)

เพื่อบอกว่าแบบจำลองความโน้มถ่วงของนิวตัน "ไม่ได้อธิบายอะไรเลย" ก็คือตรงไปตรงมาน่าหัวเราะ -1
อะมีบาพูดว่า Reinstate Monica

อะมีบาโมเดลของนิวตันไม่ได้อธิบายอะไรเกี่ยวกับความโน้มถ่วงทำงานภายใต้สมมติฐานที่ว่าทฤษฎีสัมพัทธภาพทั่วไปมีความแม่นยำ ถ้าแอปเปิลตกโมเดลของนิวตันจะอ้างว่าโลกมีแรงกระทำต่อแอปเปิลและสมมุตินั้นเป็นจริงโดยสมบูรณ์ ฉันขอให้คุณพิจารณาคำตอบของฉันเพิ่มเติม หากคุณยังไม่เข้าใจโปรดบอกฉันว่ามีอะไรไม่ชัดเจน
SolidPhase

สิ่งที่คุณพูดค่อนข้างชัดเจน แต่ฉันไม่เห็นด้วยอย่างยิ่ง
อะมีบาพูดว่า Reinstate Monica

อะมีบาฉันขอให้คุณอธิบายว่าทำไมคุณถึงไม่เห็นด้วยคุณมีเหตุผลไหม? (โปรดทราบว่าฉันได้เพิ่มประโยคพิเศษลงในคำตอบ)
SolidPhase

ขอบคุณ ฉันจะค้นหาข้อมูลอ้างอิงที่คุณพูดถึง ฉันเข้าใจว่าแบบจำลองสามารถทำนายได้แม้ว่าจะไม่ได้อธิบาย สิ่งที่ฉันไม่ได้รับคือทิศทางตรงกันข้าม: แบบจำลองสามารถอธิบายได้อย่างไรโดยไม่ต้องทำนาย ตัวอย่างของคุณกับนิวตัน vs. ไอน์สไตน์ทำให้โคลนมากขึ้นทุกอย่าง: เหตุผลทั้งหมดที่ทฤษฎีไอน์สไตน์แทนที่นิวตันคือเพราะมันทำนายได้ดีกว่า ดูอีกวิธี: ถ้าเรามีแบบจำลองการแข่งขันเราจะประเมินมันได้อย่างไรถ้าเราทดสอบว่าแบบใดมีพลังการทำนายมากที่สุด
Skander H. - Reinstate Monica

1

ฉันเป็นนักศึกษาระดับปริญญาตรีด้านสถิติดังนั้นฉันจะไม่เรียกตัวเองว่าเป็นผู้เชี่ยวชาญ แต่นี่คือสองเซ็นต์ของฉัน

แบบจำลองไม่ได้อธิบายตัวเอง มนุษย์ตีความมัน แบบจำลองเชิงเส้นนั้นง่ายต่อการเข้าใจมากกว่าเครือข่ายประสาทเทียมและฟอเรสต์แบบสุ่มเพราะใกล้เคียงกับวิธีการตัดสินใจ อันที่จริงแล้ว ANN เลียนแบบสมองมนุษย์ แต่คุณไม่ได้ตัดสินใจว่าภัตตาคารไหนจะไปพรุ่งนี้ด้วยการทำชุดเมทริกซ์ทวีคูณ แต่คุณให้น้ำหนักกับปัจจัยบางอย่างในใจของคุณตามความสำคัญของพวกเขาซึ่งเป็นชุดค่าผสมเชิงเส้น

"พลังแห่งการอธิบาย" วัดว่าแบบจำลองนั้นเข้ากับสัญชาตญาณของมนุษย์ได้ดีเพียงใดในขณะที่ "พลังเชิงทำนาย" จะวัดว่ามันสอดคล้องกับกลไกพื้นฐานของกระบวนการที่อยู่ในความสนใจ ความแตกต่างระหว่างพวกเขาเป็นช่องว่างระหว่างโลกและวิธีที่เราสามารถรับรู้ / เข้าใจมัน ฉันหวังว่านี่จะอธิบายว่าทำไม "บางรุ่นทำงานได้ดีในการอธิบายแม้ว่าพวกเขาจะทำงานได้แย่ในการทำนาย"

เอียนสจ๊วตเคยกล่าวไว้ว่า "ถ้าสมองของเราเรียบง่ายพอที่เราจะเข้าใจพวกเขาเราก็จะเป็นคนง่ายๆที่เราทำไม่ได้" น่าเสียดายที่สมองของมนุษย์ตัวเล็ก ๆ ของเรานั้นง่ายมากเมื่อเทียบกับเอกภพหรือแม้แต่ตลาดหุ้น (ซึ่งเกี่ยวข้องกับสมองจำนวนมาก :) ถึงตอนนี้ทุกรุ่นเป็นผลิตภัณฑ์ของสมองมนุษย์ดังนั้นจึงต้องไม่ถูกต้องมากขึ้นหรือน้อยลงซึ่งนำไปสู่ ​​"รุ่นทั้งหมดผิด" ในทางกลับกันโมเดลไม่จำเป็นต้องถูกต้องทางเทคนิคเพื่อให้มีประโยชน์ ตัวอย่างเช่นกฎการเคลื่อนที่ของนิวตันได้รับการพิสูจน์โดยไอน์สไตน์ แต่มันก็ยังมีประโยชน์เมื่อวัตถุไม่ใหญ่หรือเร็วจนน่าขัน

เพื่อตอบคำถามของคุณฉันไม่สามารถเห็นความไม่ลงรอยกันระหว่างคะแนน Box และ Shmueli ได้โดยสุจริต ดูเหมือนว่าคุณคิดว่า "พลังการอธิบาย" และ "พลังงานเชิงทำนาย" เป็นคุณสมบัติของทวินาม แต่ฉันคิดว่าพวกมันนั่งที่ปลายทั้งสองของสเปกตรัม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.