ฉันอ่าน Black Swan เมื่อสองสามปีก่อน ความคิดแบล็กสวอนเป็นสิ่งที่ดีและการโจมตีความผิดพลาดที่น่าหัวเราะ (ดูสิ่งต่าง ๆ ราวกับว่าพวกเขาเป็นเกมลูกเต๋าที่มีความน่าจะเป็นที่รู้จัก) เป็นสิ่งที่ดี แต่สถิติมีการบิดเบือนความจริง ไม่กระจายตามปกติ ฉันรู้สึกหงุดหงิดอย่างมากจากการเขียนตัวอักษร Taleb ด้านล่าง:
เรียนดร. ทาเลบ
ฉันเพิ่งอ่าน "The Black Swan" เช่นคุณฉันเป็นแฟนของ Karl Popper และฉันพบว่าตัวเองเห็นด้วยกับสิ่งที่อยู่ในนั้น ฉันคิดว่าการอธิบายความผิดพลาดของคุณนั้นน่าฟังและให้ความสนใจกับปัญหาที่แท้จริงและเป็นเรื่องธรรมดา อย่างไรก็ตามฉันคิดว่าส่วนที่สามส่วนใหญ่ทำให้การโต้แย้งโดยรวมของคุณแย่ลงถึงขั้นที่อาจทำให้เสียชื่อเสียงในหนังสือเล่มที่เหลือ นี่เป็นความอัปยศเพราะฉันคิดว่าข้อโต้แย้งเกี่ยวกับ Black Swans และ "unknown unknowns" ยืนอยู่บนข้อดีของพวกเขาโดยไม่ต้องพึ่งพาข้อผิดพลาดบางอย่างในส่วนที่สาม
ประเด็นหลักที่ฉันต้องการชี้ให้เห็น - และขอคำตอบจากคุณโดยเฉพาะอย่างยิ่งถ้าฉันมีปัญหาที่เข้าใจผิด - เป็นการนำเสนอข้อมูลที่ผิดของคุณเกี่ยวกับสถิติที่ใช้ ในการตัดสินของฉันบทที่ 14, 15 และ 16 ขึ้นอยู่กับการโต้แย้งของคนฟางการแสดงสถิติและเศรษฐมิติในทางที่ผิด สาขาวิชาเศรษฐศาสตร์ที่คุณอธิบายไม่ใช่สาขาวิชาที่ฉันได้รับการสอนเมื่อฉันศึกษาสถิติประยุกต์เศรษฐมิติและทฤษฎีความเสี่ยงด้านคณิตศาสตร์ประกันภัย (ที่มหาวิทยาลัยแห่งชาติออสเตรเลีย แต่ใช้ตำราที่ดูค่อนข้างมาตรฐาน) ประเด็นที่คุณยกระดับ (เช่นข้อ จำกัด ของการแจกแจงแบบเกาส์) นั้นดีและมีความเข้าใจและสอนอย่างแท้จริงแม้ในระดับปริญญาตรี
ตัวอย่างเช่นคุณไปที่ความยาวบางส่วนเพื่อแสดงว่าการกระจายรายได้ไม่เป็นไปตามการกระจายแบบปกติและนำเสนอสิ่งนี้เป็นอาร์กิวเมนต์สำหรับการปฏิบัติทางสถิติโดยทั่วไป นักสถิติที่มีความสามารถจะไม่อ้างว่าเป็นเช่นนั้นและวิธีการจัดการกับปัญหานี้ได้รับการยอมรับอย่างดี ตัวอย่างเช่นการใช้เทคนิคจากระดับ "เศรษฐมิติปีแรก" พื้นฐานที่สุดอย่างเช่นการเปลี่ยนตัวแปรโดยการใช้ลอการิทึมจะทำให้ตัวอย่างตัวเลขของคุณดูน่าเชื่อถือน้อยลง อันที่จริงแล้วการแปลงเช่นนั้นจะทำให้สิ่งที่คุณพูดไม่ถูกต้องเนื่องจากความแปรปรวนของตัวแปรดั้งเดิมเพิ่มขึ้นเมื่อค่าเฉลี่ยเพิ่มขึ้น
ฉันแน่ใจว่ามีนักเศรษฐศาสตร์ที่ไร้ความสามารถบางคนที่ใช้วิธีถดถอยแบบ OLS และตัวแปรตอบกลับที่ไม่ได้แปลในแบบที่คุณพูด แต่นั่นทำให้พวกเขาไร้ความสามารถ แน่นอนว่าพวกเขาจะล้มเหลวแม้ในหลักสูตรระดับปริญญาตรีซึ่งใช้เวลามากมายในการหาวิธีที่เหมาะสมกว่าในการสร้างแบบจำลองตัวแปรเช่นรายได้สะท้อนให้เห็นถึงการกระจายตัวจริงที่ไม่ใช่แบบเกาส์
ตระกูลของโมเดลเชิงเส้นทั่วไปเป็นชุดของเทคนิคที่พัฒนาขึ้นเพื่อแก้ไขปัญหาที่คุณพบ ตระกูลของการแจกแจงแบบเอ็กซ์โพเนนเชียลจำนวนมาก (เช่นแกมม่า, เอ็กซ์โปเนนเชียลและการแจกแจงปัวซง) นั้นมีลักษณะเฉพาะและมีความแปรปรวนที่เพิ่มขึ้นเมื่อศูนย์กลางของการแจกแจงเพิ่มขึ้น หากนี่ยัง จำกัด อยู่มากเกินไปก็เป็นไปได้ที่จะลด "รูปร่าง" ที่มีอยู่แล้วทั้งหมดและเพียงแค่ระบุความสัมพันธ์ระหว่างค่าเฉลี่ยของการแจกแจงและความแปรปรวน (เช่นการอนุญาตให้ความแปรปรวนเพิ่มขึ้นตามสัดส่วนของค่าเฉลี่ย) ใช้วิธี "quasi-likelihood" ของการประมาณค่า
แน่นอนคุณอาจโต้แย้งว่ารูปแบบของการสร้างแบบจำลองนี้ยังง่ายเกินไปและกับดักทางปัญญาที่ทำให้เราคิดว่าอนาคตจะเป็นเหมือนอดีต คุณอาจถูกต้องและฉันคิดว่าความแข็งแกร่งของหนังสือของคุณคือการทำให้คนอย่างฉันพิจารณาสิ่งนี้ แต่คุณต้องการอาร์กิวเมนต์ที่แตกต่างจากที่คุณใช้ในบทที่ 14-16 น้ำหนักที่ยอดเยี่ยมของคุณจากข้อเท็จจริงที่ว่าความแปรปรวนของการกระจายแบบเกาส์เซียนนั้นคงที่ไม่ว่าค่าเฉลี่ยของมันจะเป็นเท่าใด ดังนั้นคุณจึงให้ความสำคัญกับความจริงที่ว่าการแจกแจงชีวิตจริงมีแนวโน้มที่จะมีความหลากหลายมากกว่าที่จะเป็นเส้นโค้ง
โดยทั่วไปคุณใช้วิธีการพื้นฐานทางสถิติมากที่สุด (การสร้างแบบจำลองของตัวแปรดิบแบบที่มีการแจกแจงแบบเกาส์) และแสดงให้เห็นว่ามีข้อบกพร่องของวิธีการที่ซับซ้อน จากนั้นคุณใช้สิ่งนี้เพื่อสร้างช่องว่างในการทำลายชื่อเสียงของฟิลด์ทั้งหมด นี่เป็นทั้งตรรกะและเทคนิคการโฆษณาชวนเชื่อ มันโชคร้ายเพราะมันเบี่ยงเบนจากการโต้แย้งโดยรวมของคุณซึ่งส่วนมาก (อย่างที่ฉันพูด) ฉันพบว่าถูกต้องและโน้มน้าวใจ
ฉันจะสนใจฟังสิ่งที่คุณพูดตอบ ฉันสงสัยว่าฉันเป็นคนแรกที่แจ้งปัญหานี้
ขอแสดงความนับถือ
วิชาพลศึกษา