นักสถิติภาคเอกชนพยายามหาสาเหตุหรือไม่?


12

นักเศรษฐศาสตร์เชิงวิชาการมักให้ความสนใจในการกำหนดเวรกรรม ดูเหมือนว่างานด้านวิทยาศาสตร์สถิติ / ข้อมูลภาคเอกชนทั้งหมดที่ฉันได้ยินเกี่ยวกับการหาแบบจำลองการทำนาย

มีงานใดในภาคเอกชน (หรืองานของรัฐ) ที่เป็นสาเหตุการวิจัย?


5
เมื่อใดก็ตามที่เราต้องการแทรกแซงคุณพนันได้เลยว่าเราห่วงใย คิดเกี่ยวกับการทดสอบ A / B ทั้งหมดของ Google เพื่อทำการเปลี่ยนแปลงการออกแบบที่เรียบง่าย
Matthew Drury

8
แน่นอน. ในที่สุดคดีความใด ๆ ก็ตามจะขึ้นอยู่กับคำถามเกี่ยวกับความเป็นเหตุเป็นผล รูปแบบการควบคุมคุณภาพที่เหมาะสมเกือบทั้งหมดเกี่ยวข้องกับความเป็นเหตุเป็นผล วิศวกรและนักวิทยาศาสตร์สนใจเรื่องนี้เป็นอย่างมาก
whuber

6
อีกคำถามภาคเอกชนคลาสสิคคือ "โฆษณาของฉันทำให้ยอดขายเพิ่มขึ้นหรือไม่"
Matthew Gunn

2
@MatthewGunn: +1 โดยทั่วไป: "การเปลี่ยนแปลงนี้ (ราคาแพง) จะสร้างความแตกต่างหรือไม่" สมมติว่าธุรกิจจำเป็นต้องลอยตัว (และอาจจะเจริญเติบโต) การมีความเข้าใจในระดับของการเปลี่ยนแปลงเชิงสาเหตุของตลาด - เป็นสิ่งสำคัญ
usεr11852

4
ฉันเริ่มละเว้นการแปลงเธรดนี้เป็น CW โดยเชื่อว่าเป็นไปได้ว่าคำตอบที่เชื่อถือได้ เนื่องจากมันไม่ได้เป็นอย่างนั้นด้วยเหตุผลหลายประการที่หลายคนอาจพบว่าน่าสนใจและมีประโยชน์ฉันจึงแปลงมันเป็น CW ขอบคุณสำหรับการสนับสนุนของคุณ!
whuber

คำตอบ:


15

ฉันเป็นนักเศรษฐศาสตร์ในเทคโนโลยีที่ทำงานเกี่ยวกับการอนุมานสาเหตุด้วยข้อมูลเชิงสังเกตการณ์หรือข้อบกพร่อง บริษัท เทคโนโลยีรายใหญ่ส่วนใหญ่จะมีกลุ่มคนที่ชอบทำงานวิจัยเกี่ยวกับการกำหนดราคาการตลาดและการออกแบบผลิตภัณฑ์ นอกจากนี้ยังมีทีมนโยบายสาธารณะในบาง บริษัท

นอกจากนี้ยังมีผู้คนจำนวนมากที่ทำงานในการทดสอบเว็บ นี่เป็นกลุ่มที่ใหญ่กว่ามาก

ในที่สุดก็มีการให้คำปรึกษาด้านเศรษฐศาสตร์บางประเภทโดยเฉพาะอย่างยิ่งการต่อต้านความไว้วางใจซึ่งเป็นจุดสนใจหลัก


7

[การตอบสนองทางอารมณ์ห้าข้อแรกถูกเซ็นเซอร์]

นั่นเป็นหนึ่งในคำถามที่แปลกที่สุดในเว็บไซต์ตรงไปตรงมา และแสดงให้เห็นว่ามีการตัดการเชื่อมต่อระหว่างสิ่งที่อาจารย์พูดและชีวิตจริง - นั่นคือชีวิตนอกหอคอยงาช้าง เป็นเรื่องดีที่คุณจะแอบดู ... แต่คุณ (หมายถึงนักศึกษาปริญญาเอกด้านเศรษฐศาสตร์) ต้องทำสิ่งนี้บ่อยขึ้น

ใช่มีงานนอกสถานศึกษาที่ผู้คน (แปลกใจประหลาดใจ) ใช้วิธีการอนุมานเชิงสาเหตุ และ (ประหลาดใจประหลาดใจ) เผยแพร่เอกสาร คำตอบของฉันเป็นแบบเฉพาะของสหรัฐอเมริกา แต่ฉันมั่นใจว่าคุณจะพบองค์กรที่คล้ายกันในประเทศอื่น

  • ตัวอย่างที่ 1 (เพราะฉันคุ้นเคยกับงานของฉัน) การทำงานของผมใน บริษัท ย่อยเป็น organizatoin สัญญาการวิจัยขนาดใหญ่Abt Associates มีพนักงานประมาณ 2,300 คนใน 50 ประเทศและส่วนใหญ่ทำงานเพื่อดำเนินการหรือสนับสนุนงานวิจัยประเมินผลและดำเนินการแทรกแซง หนึ่งในหกนักวิชาการชั้นแนวหน้า (หรือที่เรียกว่ากลุ่มอาวุโส ) Jacob Klerman เป็นบรรณาธิการของReview Reviewดูแลคณะบรรณาธิการซึ่งมีประมาณ 5/6 คนที่มีความเกี่ยวข้องทางวิชาการ นั่นคือตัวอย่างของภาคเอกชนสำหรับคุณ (ตรวจสอบโฆษณาตำแหน่งของ บริษัท เพื่อดูว่าทักษะแบบใดที่ บริษัท แบบนั้นน่าจะมองหา - ฉันไม่แน่ใจว่าทุกคนโฆษณาที่ JOE เพราะมีราคาแพงฉันสามารถตั้งชื่ออีกโหลในสหรัฐอเมริกาที่มีความสุขได้อย่างง่ายดาย จ้างนักเศรษฐศาสตร์ฝีมือดี)
  • ตัวอย่างที่ 2 (ฉันมี แต่ความคุ้นเคยที่ผ่านมาเพราะฉันรู้จักผู้ที่เริ่มโครงการนี้จากสถานที่อื่น): สำนักหักบัญชีทำงานอย่างไรที่กระทรวงศึกษาธิการของสหรัฐอเมริกาเป็นเว็บไซต์ที่อุทิศให้กับการวิเคราะห์อภิมานของการวิเคราะห์ที่ตีพิมพ์ของโปรแกรมการศึกษา WWC ดำเนินงานผ่านเครือข่ายผู้ตรวจสอบซึ่งได้รับคำแนะนำเฉพาะเกี่ยวกับสิ่งที่ถูกพิจารณาว่าเป็นงานวิจัยที่มีความเข้มงวดเพียงพอที่จะสนับสนุนการอ้างเหตุผลและสิ่งที่ไม่ ปรากฎว่างานวิจัยที่ตีพิมพ์ส่วนใหญ่นั้นเป็นเรื่องไร้สาระ ในขณะที่พล่าม ไม่มีกลุ่มควบคุม ไม่มีการตรวจสอบยอดเงินคงเหลือในข้อมูลประชากรโควาเรียต / การเทียบเคียงพื้นฐาน เพียงประมาณ 3-5% ของการศึกษา (ตีพิมพ์ในวรรณกรรมทบทวนเพื่อประโยชน์) "ตรงตามมาตรฐานโดยไม่ต้องจอง" - ความหมายพวกเขามีรูปร่างหน้าตาของการสุ่มการควบคุมการขัดสีและการปนเปื้อนข้ามของแขนทดลอง และทำการวิเคราะห์ด้วยวิธีที่ยอมรับได้ไม่มากก็น้อย (โดยทฤษฎีบทของเบย์ เมื่อคุณได้ยินใครบางคนพูดว่า "แต่ฉันเห็นมันตีพิมพ์ว่าหมากฝรั่งเพิ่มความสำเร็จทางคณิตศาสตร์" คุณสามารถตอบสนอง "BS" และคุณจะถูก 90 +% ของเวลา) ไม่ว่าจะด้วยวิธีใดก็ตามนี่เป็นของรัฐบาลกลาง โครงการแผนกดังนั้นนั่นเป็นตัวอย่างสำหรับคุณที่หน่วยงานรัฐบาลตรวจสอบการใช้เครื่องมืออนุมานเชิงสาเหตุที่เหมาะสม (โยนชื่อของคุณลงในหมวกในฐานะนักวิจารณ์การศึกษานี่จะเป็นประสบการณ์การศึกษาที่ยอดเยี่ยมสำหรับคุณถ้าฉันสอนการประเมินผลโปรแกรมฉันจะทำสิ่งนี้เป็นข้อกำหนดสำหรับนักเรียนของฉัน) (สำหรับนักชีวสถิติที่ทำงานกับ FDA ต้องส่งรหัสการวิเคราะห์ของคุณก่อนที่คุณจะเก็บรวบรวมข้อมูลใด ๆ มาตรฐานของ WWC ยังคงเข้มงวดมาก) งเป็น 90% ของเวลา) ไม่ว่าจะด้วยวิธีใดก็ตามนี่เป็นโครงการของรัฐบาลกลางดังนั้นนั่นเป็นตัวอย่างสำหรับคุณที่หน่วยงานของรัฐทบทวนการใช้เครื่องมืออนุมานเชิงสาเหตุที่เหมาะสม (โยนชื่อของคุณลงในหมวกในฐานะนักวิจารณ์การศึกษานี่จะเป็นประสบการณ์การศึกษาที่ยอดเยี่ยมสำหรับคุณถ้าฉันสอนการประเมินผลโปรแกรมฉันจะทำสิ่งนี้เป็นข้อกำหนดสำหรับนักเรียนของฉัน) (สำหรับนักชีวสถิติ ต้องส่งรหัสการวิเคราะห์ของคุณก่อนที่คุณจะเก็บรวบรวมข้อมูลใด ๆ มาตรฐานของ WWC ยังคงเข้มงวดมาก) งเป็น 90% ของเวลา) ไม่ว่าจะด้วยวิธีใดก็ตามนี่เป็นโครงการของรัฐบาลกลางดังนั้นนั่นเป็นตัวอย่างสำหรับคุณที่หน่วยงานของรัฐทบทวนการใช้เครื่องมืออนุมานเชิงสาเหตุที่เหมาะสม (โยนชื่อของคุณลงในหมวกในฐานะนักวิจารณ์การศึกษานี่จะเป็นประสบการณ์การศึกษาที่ยอดเยี่ยมสำหรับคุณถ้าฉันสอนการประเมินผลโปรแกรมฉันจะทำสิ่งนี้เป็นข้อกำหนดสำหรับนักเรียนของฉัน) (สำหรับนักชีวสถิติ ต้องส่งรหัสการวิเคราะห์ของคุณก่อนที่คุณจะเก็บรวบรวมข้อมูลใด ๆ มาตรฐานของ WWC ยังคงเข้มงวดมาก)

ฉันไม่คิดว่าอาจารย์เศรษฐศาสตร์บอกว่าคุณไม่ได้ใช้วิธีการเชิงสาเหตุในทางปฏิบัติ (ไม่มีใครเริ่มพูดคุยกับ "นี่คือวิธีการทางสถิติบางอย่างที่ไม่มีใครสนใจ)" แต่นักเรียนมักจะกังวลว่าการอนุมานเชิงสาเหตุเป็นเพียงงาช้าง หัวข้อหอคอย (เช่นการประมาณความหนาแน่นของ log-concave: ฉันรับรองว่าไม่มีใครในอุตสาหกรรมทำเช่นนั้นและด้วยเหตุผลที่ดี) ยังไม่ชัดเจนว่าตัวอย่างที่ 2 แสดงผู้คนในอุตสาหกรรมโดยใช้วิธีเชิงสาเหตุได้อย่างไร
หน้าผา AB

@CliffAB OP ขอตัวอย่างอุตสาหกรรมและรัฐบาลดังนั้น # 2 จึงเหมาะกับการเรียกเก็บเงิน ฉันยังคิดว่าจุดของ StasK เกี่ยวกับความรู้ที่ไม่เพียงพอของชีวิตนอกหอคอยงาช้างในหมู่นักศึกษาปริญญาเอกเศรษฐศาสตร์และอาจารย์ของพวกเขามีความถูกต้องน้อยกว่าแม้ว่าจะมีความหลากหลายมากในสาขาและภาควิชาและแม้แต่เวลา
Dimitriy V. Masterov

@ DimitriyV.Masterov: # 2 ดูเหมือนเป็นตัวอย่างของการไม่ใช้เครื่องมือสาเหตุที่เหมาะสม และฉันอ่าน (อาจเข้าใจผิด) คำตอบของ StasK ซึ่งหมายความว่าอาจารย์กำลังพูดว่า "ไม่มีนักวิชาการคนใดใช้วิธีการเชิงสาเหตุ" หากอาจารย์ที่เชี่ยวชาญในวิธีการเชิงสาเหตุกล่าวเช่นนี้พวกเขายอมรับว่าล้มเหลว หากคุณกำลังสร้างวิธีการทางสถิติประยุกต์ที่ไม่มีใครนอกโลกวิชาการใช้นั่นก็ไม่ถือว่าเป็นสิ่งที่ดี ทฤษฎีสถิติแน่นอนว่าเป็นเรื่องที่แตกต่าง
หน้าผา AB

ฉันอ่าน (อีกครั้งอาจเข้าใจผิด) ของคำถามของ OP คืออาจารย์กำลังบอกพวกเขาว่า "สถิติเชิงสาเหตุเป็นสิ่งสำคัญ!" และการตอบสนองของพวกเขาคือ "มันสำคัญจริง ๆ หรือไม่ผู้คนในอุตสาหกรรมใช้วิธีการเหล่านี้จริงหรือ?" แต่อีกครั้งฉันอาจจะเข้าใจผิด
หน้าผา AB

1
@CLIFF WWCH แสดงความคิดเห็นงานวิจัยทางวิชาการโดยแยกข้าวสาลีออกจากแกลบเท่าที่อนุมานเชิงสาเหตุดังนั้นจึงเป็นตัวอย่างที่ดีของพื้นที่ที่มาตรฐานของรัฐบาลสูงกว่าในบางส่วนของสถาบันการศึกษา
Dimitriy V. Masterov

6

ในสถิติด้านเภสัชกรรมและสาขาที่เกี่ยวข้องจำนวนหนึ่งการเชื่อมโยงเชิงสาเหตุระหว่างการแทรกแซงและผลลัพธ์ด้านสุขภาพเป็นคำถามสำคัญที่น่าสนใจเมื่อตัดสินใจว่าควรใช้การแทรกแซงหรือไม่ มีหลากหลายสาขาย่อยเช่นการทดลองแบบสุ่ม (คลินิกหรือก่อนคลินิก) การทดลองที่ไม่สุ่มหรือแขนเดียวการทดลองในห้องปฏิบัติการการวิเคราะห์อภิมานการเฝ้าระวังความปลอดภัยของยาตามรายงานที่เกิดขึ้นเองตามธรรมชาติของการระบาดวิทยา แนวคิดเช่นการสุ่ม Mandelian) และการวิจัยประสิทธิภาพ (เช่นการใช้ข้อมูลเชิงสังเกตการณ์เช่นฐานข้อมูลการเคลมประกัน) แน่นอนในการออกแบบการทดลองแบบสุ่ม (เช่นการทดลองทางคลินิกแบบสุ่ม) การอ้างถึงสาเหตุเป็นเรื่องง่ายกว่าการใช้งานอื่น ๆ


ฉันคิดว่าการตั้งค่าการพัฒนายาจะเป็นหนึ่งในไม่กี่แห่งที่ผู้คนสนใจเกี่ยวกับสาเหตุของคนที่จะดีขึ้นมากกว่าว่าพวกเขาจะดีขึ้นหรือเปล่าเพราะท้ายที่สุดคุณต้อง 'ปลอดภัย' ในประชากรทั้งหมด - ดังนั้นแน่นอนคำตอบที่ดี แต่เมื่อคุณพูดถึงค่อนข้างพิเศษ
Dennis Jaheruddin

4

ฉันเป็นนักวิจัยที่ A Place for Mom บริการอ้างอิงอาวุโสที่ใหญ่ที่สุดของประเทศ เราได้ออกแบบแบบสำรวจที่มีจุดมุ่งหมายเพื่อทำความเข้าใจว่าการย้ายเข้าสู่ชุมชนที่มีชีวิตที่ช่วยเหลือมีผลต่อคุณภาพชีวิตอย่างไร การอนุมานเชิงสาเหตุเป็นศูนย์กลางของงานวิจัยนี้และวิธีการวิเคราะห์เชิงสาเหตุ (เช่นการจับคู่กระบวนการคัดเลือกตัวแบบจำลองการประมาณผลการรักษาโดยเฉลี่ย) เป็นสิ่งจำเป็น


-3

ในสถานการณ์ภาคเอกชนส่วนใหญ่คุณจะไม่สนใจเกี่ยวกับเวรกรรม

ในทางปฏิบัติแม้จะมีการใช้ภาษาทั่วไปผู้คนก็มักให้ความสนใจกับผลกระทบที่เข้าใจกันดีกว่าเป็นเหตุเป็นผล (เข้าใจดี)

จากมุมมองทางวิชาการมันน่าสนใจมากที่รู้:

ถ้าฉันทำ A เพราะผลลัพธ์จะเป็น B

แต่จากมุมมองที่ใช้งานได้จริงในเกือบทุกสถานการณ์สิ่งต่อไปนี้เป็นสิ่งที่ผู้คนต้องการรู้จริง ๆ :

ถ้าฉันทำ A ผลลัพธ์จะเป็น B

แน่นอนว่าคุณอาจสนใจผลกระทบของ A แต่ไม่ว่าจะเป็นสาเหตุอย่างแท้จริงหรือมีสาเหตุซ่อนเร้นที่เพิ่งเกิดขึ้นเพื่อสร้างความสัมพันธ์นี้มักไม่น่าสนใจ

หมายเหตุเกี่ยวกับข้อ จำกัด

คุณอาจคิดว่า: โอเค แต่ถ้าเราไม่รู้ว่า A เป็นสาเหตุของ B ดังนั้นจึงมีความเสี่ยงมากที่จะทำงานกับสมมติฐานนั้น

สิ่งนี้เป็นจริงในทางหนึ่ง แต่ในทางปฏิบัติคุณจะต้องกังวลอีกครั้ง: มันจะได้ผลหรือมีข้อยกเว้นหรือไม่

ในการอธิบายเรื่องนี้คุณอาจทราบว่าสถานการณ์นี้:

ถ้าฉันทำ A ในสถานการณ์ X เนื่องจาก A ผลลัพธ์จะเป็น B และเพราะ X ผลลัพธ์จะเบี่ยงเบนโดยเดลต้า

ไม่เป็นประโยชน์มากกว่าสถานการณ์นี้มากนัก (สมมุติว่าคุณสามารถวัดผลกระทบได้เท่า ๆ กัน):

ถ้าฉันทำ A ในสถานการณ์ X ผลลัพธ์จะเป็น B และผลลัพธ์จะเบี่ยงเบนโดยเดลต้า

ตัวอย่างง่าย ๆ : ความสัมพันธ์ที่จะทำให้เกิด

  • ตอบ: เติมน้ำมันเครื่องให้เต็ม
  • B: ลดความผิดเพี้ยนของเบรก
  • C: ตรวจสภาพรถยนต์

ตรรกะ: C ทำให้เกิด A และ B เสมอ

ผลลัพธ์สัมพันธ์: ถ้า A ขึ้นไป B ขึ้นไป แต่ไม่มีความสัมพันธ์เชิงสาเหตุระหว่าง A และ B

ประเด็นของฉัน: คุณสามารถสร้างแบบจำลองผลกระทบของ A ต่อ B A ไม่ก่อให้เกิด B แต่โมเดลจะยังคงถูกต้องและหากคุณมีข้อมูลเกี่ยวกับ A คุณจะมีข้อมูลเกี่ยวกับ B

ผู้ที่สนใจในการทำ faillure brake โดยมีข้อมูลเกี่ยวกับ A จะสนใจเกี่ยวกับการรู้จักความสัมพันธ์ของ A ถึง B เท่านั้นและเพียงใส่ใจว่าความสัมพันธ์นั้นถูกต้องหรือไม่โดยไม่คำนึงว่าความสัมพันธ์นี้เป็นสาเหตุหรือไม่


1
ฉันไม่คิดว่าฉันเป็นคนเดียวที่สับสนกับความแตกต่างระหว่าง "สาเหตุ" และ "ผลกระทบ" ตัวอย่างของคุณดูเหมือนจะให้ความกระจ่างเล็กน้อย: การถอนรายละเอียดของห่วงโซ่สาเหตุอาจไม่สำคัญอย่างยิ่ง การซื้อโฆษณาแบบต้นทุนต่อคลิกมากขึ้นจะทำให้ยอดขายเพิ่มขึ้น - ไม่เป็นไร - และนั่นคือสิ่งที่ลูกค้าของคุณสำคัญ
Scortchi - Reinstate Monica

@Scortchi สิ่งที่ฉันหมายถึงโดยสาเหตุ: 'ถ้า A แล้วเพราะ B ที่' สิ่งที่ฉันหมายถึงโดยผลกระทบ (อาจไม่ใช่คำจำกัดความที่ธรรมดาที่สุด แต่ไม่เกี่ยวกับภาษา): 'ถ้าเป็น A แล้ว B' - ตัวอย่างหนังสือของความแตกต่างที่เกี่ยวข้อง: C ทำให้ A และ B ดังนั้น A ไม่ก่อให้เกิด B แต่ฉันจะบอกว่ามันสมเหตุสมผลที่จะทำแบบจำลองผลกระทบของ A ต่อ B - หลังจากอ่านความคิดเห็นของฉันเองอีกครั้ง 'อาจถูกแทนที่ด้วย' ความสัมพันธ์ที่แท้จริงกับช่วงเวลาที่ล่าช้า '
Dennis Jaheruddin

5
ฉันไม่คิดว่าฉันเห็นด้วยกับตัวอย่างโฆษณา - ถ้าฉันต้องตัดสินใจว่าจะซื้อโฆษณาออนไลน์เพิ่มเติมหรือไม่ฉันสนใจว่าการทำเช่นนั้นจะส่งผลให้ยอดขายเพิ่มขึ้นมากกว่าการไม่ซื้อโฆษณาเหล่านี้ (ไม่ว่าจะผ่านการคลิกผ่านหรืออื่น ๆ หมายถึง = เวรกรรม) ซึ่งอาจแตกต่างจากการที่ บริษัท ที่เพิ่มการโฆษณาออนไลน์ของพวกเขาในปีที่แล้วมียอดขายเพิ่มขึ้นสูงกว่า บริษัท ที่ไม่ได้เกี่ยวข้องกัน เวรกรรมไม่ได้เกี่ยวกับวิธีการที่แน่นอนซึ่งผลลัพธ์ที่เกิดขึ้น (จะดีที่จะรู้แน่นอน) แต่ค่อนข้างว่าสิ่งที่เกิดขึ้นเนื่องจากการทำหรือไม่ทำ A.
Björn

6
ในการขายคุณควรใส่ใจเกี่ยวกับเวรกรรม หากคุณดำเนินการทดลองในการที่กระทำตามด้วยผล , แต่ผลที่ไม่ได้เป็นสาเหตุแล้วคุณคุณจะไม่ผิดหวังเมื่อ - ตามที่เป็นไปตามธรรมชาติเท่านั้นและจะหวัง - ว่าเมื่อคุณทำซ้ำการกระทำในอนาคต ก็จะไม่ลงรอยกัน (ถ้าเคย) จะตามมาด้วยBในระยะสั้นความแตกต่างระหว่าง "สาเหตุ" และ "ผลกระทบ" ที่ใช้ในคำตอบนี้ดูเหมือนจะคล้ายคลึงกับระหว่าง "นัยสำคัญทางสถิติ" - ตีความอย่างหลวม ๆ ว่า "คู่ควรกับความเชื่อและพื้นฐานสำหรับการกระทำในอนาคต" - และ "ปลอม " B A BABAB
whuber

ฉันไม่คิดว่าฉันเห็นด้วยกับความคิดเห็นนี้ แต่จากประสบการณ์ของฉันมันเป็นเรื่องจริงไม่ได้หาสาเหตุเวรกรรมแม้ว่าในหลายปัญหามันควร ในทางปฏิบัติฉันเห็นสิ่งนี้ใกล้เคียงกับความแตกต่างระหว่างแบบจำลองการทำนายและแบบจำลองที่อธิบายได้
Thomas Speidel
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.