ภาษา R น่าเชื่อถือสำหรับสาขาเศรษฐศาสตร์หรือไม่?


64

ฉันเป็นนักศึกษาระดับบัณฑิตศึกษาในสาขาเศรษฐศาสตร์ซึ่งเพิ่งเปลี่ยนมาใช้ R จากแพ็คเกจทางสถิติที่รู้จักกันดีอื่น ๆ (ฉันใช้ SPSS เป็นหลัก) ปัญหาเล็ก ๆ ของฉันในตอนนี้คือฉันเป็นผู้ใช้ R คนเดียวในชั้นเรียนของฉัน เพื่อนร่วมชั้นของฉันใช้ Stata และ Gauss และอาจารย์คนหนึ่งของฉันบอกว่า R เหมาะสำหรับงานวิศวกรรม แต่ไม่ใช่เพื่อเศรษฐศาสตร์ เขากล่าวว่าแพ็คเกจจำนวนมากถูกสร้างขึ้นโดยผู้ที่มีความรู้เกี่ยวกับการเขียนโปรแกรมมาก แต่ไม่มากนักเกี่ยวกับเศรษฐศาสตร์และดังนั้นจึงไม่น่าเชื่อถือ นอกจากนี้เขายังกล่าวถึงความจริงที่ว่าเนื่องจากไม่มีเงินเกี่ยวข้องกับการสร้างแพ็คเกจ R ดังนั้นจึงไม่มีแรงจูงใจที่จะทำอย่างถูกต้อง (ต่างจาก Stata เช่น) และเขาใช้ R เป็นเวลาและได้ผลลัพธ์ที่ "ไร้สาระ" ใน เขาพยายามประเมินบางสิ่ง ยิ่งไปกว่านั้นเขาบ่นว่าเขาสร้างตัวเลขสุ่มใน R ซึ่งเขาบอกว่า "

ฉันใช้ R มานานกว่าหนึ่งเดือนและต้องบอกว่าฉันตกหลุมรักมันแล้ว ทุกสิ่งที่ฉันได้ยินจากอาจารย์ของฉันมันทำให้ฉันท้อใจ

ดังนั้นคำถามของฉันคือ: "R เชื่อถือได้สำหรับสาขาเศรษฐศาสตร์หรือไม่"


30
"แพ็คเกจจำนวนมากถูกสร้างขึ้นโดยผู้ที่มีความรู้เกี่ยวกับการเขียนโปรแกรมมาก แต่ไม่มากนักเกี่ยวกับเศรษฐศาสตร์" นักเขียนแพ็กเกจมักจะเป็นนักวิทยาศาสตร์หรือนักวิชาการเป็นอันดับแรกเสมอและโปรแกรมเมอร์เป็นเวลาหนึ่งวินาที ที่จริงแล้วฉันคิดว่ามันจะเป็นความท้าทายที่จะหาแพคเกจที่เขียนขึ้นโดย "โปรแกรมเมอร์"
Brandon Bertelsen

9
ฉันขอเชิญคุณและนักเศรษฐศาสตร์สถิติคนอื่น ๆ ของเรามาที่economics.stackexchange.com ได้เช่นกัน - เรายินดีต้อนรับคำถามและคำตอบของคุณเกี่ยวกับเศรษฐศาสตร์ที่นั่น
EnergyNumbers

18
ดูเหมือนว่ายังมีความเป็นมืออาชีพเล็กน้อยในความคิดเห็นของอาจารย์ การเป็นนักเศรษฐศาสตร์รับประกันความน่าเชื่อถือได้อย่างไร ฉันค่อนข้างไว้วางใจนักพัฒนาซอฟต์แวร์ (จริงๆแล้วเป็นอาชีพไม่ใช่สิ่งที่ใคร ๆ ก็สามารถทำได้โดยไม่ต้องมีประสบการณ์หรือการฝึกอบรมมาก่อน) และนักสถิติเพื่อผลิตซอฟต์แวร์ทางสถิติที่เชื่อถือได้
งานกาลา

23
"เหมาะสำหรับงานวิศวกรรม แต่ไม่ใช่เพื่อเศรษฐศาสตร์" เพราะความน่าเชื่อถือ? เขาอยากตึกระฟ้าทรุดตัวลงมากกว่าเศรษฐกิจหรือไม่ ชายคนนั้นเป็นคนงี่เง่า ออกจากโรงเรียนนั้นและหาโรงเรียนที่ไม่ได้รับการฝึกฝนโดยคนโง่
Spacedman

10
ซอฟต์แวร์เชิงพาณิชย์อาจดีหรือไม่ดี ซอฟต์แวร์โอเพนซอร์ซอาจดีหรือไม่ดี สิ่งที่สำคัญคือซอฟต์แวร์ที่คุณใช้นั้นมีประโยชน์หรือไม่ อย่าตัดสินใจด้วยความลำเอียงและความเชื่อ ใช้หลักฐานจริง
David Heffernan

คำตอบ:


83

ให้ฉันแชร์จุดชมวิวที่ตัดกัน ฉันเป็นนักเศรษฐศาสตร์ ฉันได้รับการฝึกฝนด้านเศรษฐมิติโดยใช้ SAS ฉันทำงานในบริการด้านการเงินและเพิ่งคืนนี้ฉันได้อัปเดตโมเดลที่ใช้ R ซึ่งเราจะใช้ในวันพรุ่งนี้เพื่อเสี่ยงต่อการถูกล้านดอลลาร์

อาจารย์ของคุณผิดธรรมดา แต่ความผิดพลาดที่เขาทำนั้นเป็นเรื่องธรรมดาและคุ้มค่าที่จะพูดคุยกัน สิ่งที่อาจารย์ของคุณกำลังทำอยู่คือการนำแนวคิดของซอฟต์แวร์ R (การนำ GNU ไปใช้ในภาษา S) เทียบกับแพ็คเกจ (หรือรหัสอื่น ๆ ) ที่ใช้ในอาร์ฉันสามารถเขียนการใช้งานอึของการถดถอยเชิงเส้นโดยใช้ SAS IML ตามความเป็นจริงฉันได้ทำสิ่งนั้นมาก นั่นหมายความว่า SAS เป็นอึหรือไม่ ไม่แน่นอน SAS เป็นเรื่องน่าสนใจเพราะราคาของพวกเขานั้นไม่โปร่งใสราคาแพงและน่าประหลาดใจและที่ปรึกษาของพวกเขาในเรื่องสัญญาภายใต้การส่งมอบและเรียกเก็บเบี้ยประกันภัยเพื่อความสุข แต่ฉันเชือนแช ...

การเปิดกว้างของ R เป็นดาบสองคม: การเปิดกว้างช่วยให้ทอมดิ๊กหรือแฮร์รี่เขียนการใช้งานอัลกอริทึมใด ๆ ที่พวกเขาคิดขึ้นในขณะที่สูบบุหรี่ในห้องใต้ดินของอาคารเศรษฐศาสตร์ ความเปิดกว้างเดียวกันนี้ช่วยให้นักเศรษฐศาสตร์ที่ฝึกหัดแบ่งปันรหัสอย่างเปิดเผยและปรับปรุงรหัสของกันและกัน กฎการออกใบอนุญาตที่มี R หมายความว่าฉันสามารถเขียนโค้ดการทำให้ขนานสำหรับการรัน R แบบขนานบนคลาวด์ของ Amazon และไม่ต้องกังวลเกี่ยวกับค่าลิขสิทธิ์สำหรับคลัสเตอร์ 30 โหนด นี่เป็นชัยชนะที่ยิ่งใหญ่สำหรับการวิเคราะห์ด้วยการจำลองซึ่งเป็นส่วนสำคัญของสิ่งที่ฉันทำ

ความคิดเห็นของอาจารย์ของคุณว่า "แพ็คเกจจำนวนมากถูกสร้างขึ้นโดยคนที่รู้เรื่องการเขียนโปรแกรม แต่ไม่มากเกี่ยวกับเศรษฐศาสตร์" ไม่ต้องสงสัยเลยว่าถูกต้อง แต่มี 3716 แพ็คเกจใน CRAN คุณสามารถมั่นใจได้ว่าพวกเขาส่วนใหญ่ไม่ได้เขียนโดยนักเศรษฐศาสตร์ ในทำนองเดียวกับที่คุณมั่นใจได้ว่าโมดูล 105,089 ใน CPAN จำนวนมากไม่ได้ถูกเขียนขึ้นโดยนักเศรษฐศาสตร์

เลือกซอฟต์แวร์ของคุณอย่างระมัดระวัง ตรวจสอบให้แน่ใจว่าคุณเข้าใจและได้ทดสอบเครื่องมือที่คุณใช้ ตรวจสอบให้แน่ใจว่าคุณเข้าใจเศรษฐกิจที่แท้จริงที่คุณเลือกใช้ การล็อคเข้ากับโซลูชันซอฟต์แวร์แบบปิดมีค่าใช้จ่ายสูงกว่าเพียงแค่ค่าลิขสิทธิ์


ขอขอบคุณสำหรับการตอบสนองของคุณ. คุณจะแนะนำให้ฉันพยายามเรียนรู้อย่างอื่นหรือไม่? คุณจะแนะนำอะไรให้ฉันเรียนรู้?
SavedByJESUS

5
ไม่ฉันใช้ R เกือบทั้งหมด มีแพคเกจบางอย่างที่อาจารย์หรือนักเศรษฐศาสตร์คนอื่น ๆ ใช้บ่อยไหม ฉันไม่ได้ใช้แพ็คเกจเฉพาะของ econ ฉันใช้ plyr เมทริกซ์และแพ็คเกจอื่น ๆ อีกมากมาย แต่ไม่มีใครได้รับการออกแบบมาโดยเฉพาะสำหรับนักเศรษฐศาสตร์
JD Long

ดังนั้นคุณหมายถึง "แพ็คเกจ" และคุณบอกว่าฉันไม่ควรถูกล็อคในโซลูชันซอฟต์แวร์แบบปิด?
SavedByJESUS

3
"การเปิดกว้างอนุญาตให้ Tom, Dick หรือ Harry เขียนอัลกอริทึมใด ๆ ก็ได้" - นี่ไม่ใช่สิ่งที่เกี่ยวข้องกับ openness มันเป็นผลมาจากการมี API สาธารณะซึ่งผลิตภัณฑ์แหล่งปิดต่าง ๆ มี (เช่นกรรมสิทธิ์ใด ๆ ) ซอฟต์แวร์ที่มีส่วนต่อประสานปลั๊กอิน) คำตอบที่ดีแม้ว่า
naught101

3
"ไม่มีตอนนี้และไม่เคยมีหรือจะไม่เคยมีภาษาการเขียนโปรแกรมใด ๆ ที่เป็นเรื่องยากที่จะเขียนโค้ดไม่ดี"
ardave

33

ไม่น่าเชื่อถือมากกว่าหรือน้อยกว่าซอฟต์แวร์อื่น ๆ ฐานและแนะนำ R อาจมีแนวโน้มที่จะเกิดข้อผิดพลาดน้อยกว่าแพ็คเกจที่สนับสนุน แต่ขึ้นอยู่กับผู้แต่ง

แต่ข้อได้เปรียบที่ใหญ่ที่สุดของ R คือคุณสามารถตรวจสอบตัวเองได้ว่ามันเป็น! มันเป็นซอฟต์แวร์ฟรีไม่เหมือน Stata หรือ SPSS หรือคล้ายกัน ดังนั้นแม้ว่ามันจะไม่น่าเชื่อถือก็ตามมันก็จะถูกตรวจจับได้ในที่สุด นั่นอาจไม่ใช่กรณีของซอฟต์แวร์ที่เป็นกรรมสิทธิ์ และคุณสามารถช่วยทำให้มันน่าเชื่อถือยิ่งขึ้น

สำหรับความคิดเห็นที่เหลือของอาจารย์ของคุณเขาเห็นได้ชัดว่าผิดและมีคนกระจาย FUD แต่ให้ฉันบอกว่าซอฟต์แวร์ที่ไม่น่าเชื่อถือควรเป็นข้อกังวลน้อยที่สุดของนักเศรษฐศาสตร์ที่ตัดสินโดยแบบจำลองและสมมติฐานที่ใช้และการคาดการณ์ที่ทำในสาขานี้

ติดกับ R ถ้าคุณชอบและบางทีคุณและอาจารย์สามารถมีส่วนร่วมในการพัฒนาซอฟต์แวร์ที่ดีสำหรับเศรษฐศาสตร์ นี่คือจุดเริ่มต้นที่น่าสนใจของhttp://cran.r-project.org/web/views/Econometrics.htmlและhttp://cran.r-project.org/web/views/TimeSeries.html


1
ขอบคุณมาก! ฉันอยากติดกับอาร์ฉันคิดว่ามันเป็นซอฟต์แวร์ที่ยอดเยี่ยม นอกจากนี้ฉันยังเป็นแฟนตัวยงของโอเพ่นซอร์สมาโดยตลอด
SavedByJESUS

17
+1 สำหรับการระบุความจริงที่โชคร้ายในยุคของเรา "ซอฟต์แวร์ที่ไม่น่าเชื่อถือควรเป็นสิ่งที่นักเศรษฐศาสตร์กังวลน้อยที่สุดเมื่อพิจารณาจากแบบจำลองและสมมติฐานที่ใช้และการคาดการณ์ที่เกิดขึ้นในสาขานี้"
ดิจิทัล

2
ฉันซาบซึ้งกับเสียงที่ไม่ดีที่นี่ แต่ความขัดแย้งบางอย่างเป็นไปได้ ข้อผิดพลาดในซอฟต์แวร์ที่เป็นกรรมสิทธิ์สามารถปรากฏขึ้นได้หลายวิธีเช่นหากมีข้อขัดแย้งที่ชัดเจนกับผลลัพธ์ใน R ที่ปรากฏอย่างถูกต้อง มี FUD บางส่วนเกี่ยวกับซอฟต์แวร์ลิขสิทธิ์ที่ไม่เหมาะสมเช่นเดียวกับโง่ FUD เกี่ยวกับ R Checkability ใน R คือหลักการในการตรวจสอบสำหรับผู้ใช้ R ทุกคน มันเป็นคุณสมบัติที่มีอยู่ แต่การบอกว่าคุณสามารถตรวจสอบรหัสด้วยตัวคุณเองก็เป็นเพียงแค่วาทศิลป์เช่นกัน โปรดทราบว่าสำหรับ Stata รหัสส่วนใหญ่จะปรากฏแก่ผู้ใช้ มันเป็นเพียงไฟล์ปฏิบัติการที่ไม่ใช่
Nick Cox

23

อาจารย์ของคุณอ้างสิทธิ์อย่างกล้าหาญ ฉันสงสัยว่าปัญหานี้ไม่คุ้นเคยกับภาษา R ไม่ใช่ผลลัพธ์ที่เกิดขึ้นจริง ฉันทำงานใน บริษัท ที่ทำแบบจำลองเศรษฐมิติและเราทำทุกอย่างในอาร์ฉันยังเปลี่ยนเพื่อนร่วมงานนักเศรษฐศาสตร์ของฉันให้ใช้อาร์

เกี่ยวกับสาขาเศรษฐศาสตร์ในประสบการณ์ส่วนตัวของฉันปัญหาความน่าเชื่อถืออาจเป็นอีกทางหนึ่ง ตัวอย่างเช่น EVIEWS เวอร์ชัน 5 มีข้อผิดพลาดบางอย่างเมื่อทำงานกับข้อมูลพาเนล และรายงานสถิติ Durbin-Watson ปกติสำหรับ pooled OLS ซึ่งในการตั้งค่าพาเนลข้อมูลนั้นผิดปกติ แพ็กเกจ R สำหรับการทำงานกับข้อมูลพาเนลมีปัญหาเช่นกัน แต่อาร์กิวเมนต์เงินที่นี่เล่นอย่างยิ่งในความโปรดปราน R

เมื่อเร็ว ๆ นี้ฉันอยู่ในหลักสูตรเกี่ยวกับวิธีอนุกรมเวลาที่ไม่อยู่นิ่ง วิทยากรใช้ซอฟต์แวร์ RATS เมื่อสาธิตรหัสบางอย่างเขาแนะนำให้คลิกที่ไอคอนซึ่งล้างพื้นที่ทำงานหลายครั้งในกรณี พูดเกี่ยวกับความน่าเชื่อถือ


20

ฉันเป็นนักเศรษฐศาสตร์และฉันทำงานวิจัยมา 4 ปีแล้วส่วนใหญ่ทำเศรษฐศาสตร์ประยุกต์ มีแพ็คเกจเศรษฐมิติมากมายและมีที่ว่างสำหรับพวกเขาทั้งหมด ในมุมมองของฉันในทางเศรษฐศาสตร์ Stata ใช้สำหรับเกือบทุกอย่างยกเว้นอนุกรมเวลา Rats, Eviews และ Ox ถูกใช้สำหรับอนุกรมเวลา Matlab และ Gauss ใช้สำหรับการเขียนโปรแกรมระดับต่ำมากขึ้น

ข้อได้เปรียบของ R คือสามารถทำเกือบทุกอย่างที่โปรแกรมอื่นทำและฟรีและเปิดอยู่ มันต้องมีการเขียนโปรแกรมเพิ่มเติมและมีขั้นตอนการบรรจุกระป๋องน้อยลง แต่มันก็เสร็จสิ้นลงในที่สุด ฉันใช้ Stata เป็นส่วนใหญ่ แต่ถ้าฉันต้องเลือกซอฟต์แวร์หนึ่งตัวที่จะทำทุกอย่างฉันจะเลือก R

R ค่อนข้างน่าเชื่อถือสำหรับปัญหาเศรษฐมิติส่วนใหญ่ แต่ฉันสามารถให้ตัวอย่างของกิจวัตรบางอย่างที่เขียนขึ้นสำหรับ R ที่ไม่น่าเชื่อถือ ฉันมีปัญหากับ 3SLS และการประเมินระบบตามความต้องการ รูทีนการเพิ่มประสิทธิภาพเชิงตัวเลขไม่แข็งแกร่งเท่าใน Stata หรือ Gauss ในทางกลับกัน R ก็ดีกว่าปัญหาเช่นควอนตัมถดถอย ยังมีความรู้ในการทำงานที่ดีของ R คุณสามารถค้นหาสิ่งที่เป็นปัญหาใน R ประจำผู้ใช้ที่เป็นลายลักษณ์อักษรแก้ไขและทำงานต่อไป ดังนั้นฉันจึงไม่คิดว่าการขาดความน่าเชื่อถือในกิจวัตรบางอย่างเป็นเหตุผลที่น่าสนใจที่จะไม่ใช้ R เลย

คำแนะนำของฉันคือการใช้ R ต่อไป แต่จะมีประสบการณ์ในโปรแกรมอื่น ๆ ที่ใช้กันอย่างแพร่หลายในสาขาของคุณเช่น Stata สำหรับ microeconometrics หรือ Rats สำหรับอนุกรมเวลา


13

เมื่อฉันสอนสถิติระดับบัณฑิตศึกษาฉันบอกนักเรียนของฉันว่า: "ฉันไม่สนใจแพ็คเกจที่คุณใช้และคุณสามารถใช้อะไรก็ได้สำหรับการบ้านของคุณเพราะฉันคาดหวังว่าคุณจะให้คำอธิบายที่สำคัญและจะชี้ให้เห็นถ้าฉัน ดู tr23y5mชื่อตัวแปรในการส่งของคุณ ฉันสามารถสนับสนุนการเรียนรู้ของคุณเป็นอย่างดีใน Stata และที่สมเหตุสมผลในอาร์เอสด้วย SAS คุณอยู่ในตัวของคุณเองตามที่คุณอ้างว่าคุณเข้าเรียนในหลักสูตรนี้ ด้วย SPSS หรือ Minitab ขอให้พระเจ้าคุ้มครองคุณ "ฉันจินตนาการว่านายจ้างที่มีเหตุผลจะคิดเหมือนกันสิ่งที่สำคัญคือประสิทธิผลของคุณในแง่ของผลลัพธ์ของโครงการถ้าคุณสามารถบรรลุเป้าหมายใน R ด้วย 40 ชั่วโมงของการทำงานดีถ้า คุณสามารถทำได้ใน C ++ ในการทำงาน 40 ชั่วโมงใช้ได้ถ้าคุณรู้วิธีการทำใน R ใน 40 ชั่วโมง แต่หัวหน้างานของคุณต้องการให้คุณทำใน SAS และคุณต้องใช้เวลา 60 ชั่วโมงเพื่อเรียนรู้พื้นฐานบางอย่าง และในที่ที่เครื่องหมายอัฒภาคสามารถทำได้ในบริบทของภาพใหญ่ของรหัสที่เหลืออยู่ใน SAS ... จากนั้นผู้จัดการก็ไม่ฉลาดนักในการจ้างโปรแกรมเมอร์ R

จากมุมมองของค่าใช้จ่ายทั้งหมดนี้ "ฟรี" R เป็นตำนานที่เปิดเผยอย่างมหาศาล โครงการที่จริงจังใด ๆ จำเป็นต้องใช้รหัสที่กำหนดเองหากเพียงเพื่อการป้อนข้อมูลและการจัดรูปแบบผลลัพธ์และนั่นคือค่าใช้จ่ายที่ไม่ใช่ศูนย์ของเวลาระดับมืออาชีพ หากการป้อนข้อมูลและการจัดรูปแบบข้อมูลนี้ต้องใช้รหัส SAS 10 ชั่วโมงและรหัส R 20 ชั่วโมง R เป็นซอฟต์แวร์ที่มีราคาแพงกว่าที่ขอบตามที่นักเศรษฐศาสตร์จะกล่าวคือในแง่ของค่าใช้จ่ายเพิ่มเติมในการผลิตฟังก์ชั่นที่กำหนด . หากโครงการขนาดใหญ่ต้องการเวลาโปรแกรมเมอร์ R 200 ชั่วโมงและเวลาโปรแกรมเมอร์ Stata 100 ชั่วโมงเพื่อให้การทำงานเหมือนกัน Stata จะถูกกว่าโดยรวมแม้แต่บัญชีสำหรับใบอนุญาต ~ $ 1K ที่คุณต้องซื้อ มันน่าสนใจที่จะเห็นการเปรียบเทียบโดยตรงเช่นนั้น ฉันมีส่วนร่วมในการเขียนระเบียบใหม่ของรหัส SPSS ขนาด 2 เมกะไบต์ซึ่งได้รับการกล่าวขวัญกันมานานกว่า 10 ปีคนในรหัส Stata ~ 150K ที่วิ่งเร็วอาจจะเร็วกว่าเล็กน้อย นั่นคือโครงการประมาณ 1 คนต่อปี ฉันไม่ทราบว่าอัตราส่วนประสิทธิภาพ 10: 1 นี้เป็นเรื่องปกติสำหรับ SPSS: การเปรียบเทียบแบบ Stata แต่ฉันจะไม่แปลกใจถ้าเป็นเช่นนั้น สำหรับฉันการทำงานกับ R เป็นค่าใช้จ่ายจำนวนมากเสมอเนื่องจากค่าใช้จ่ายในการค้นหา: ฉันต้องพิจารณาว่าแพ็คเกจใดที่มีชื่อคล้ายกันห้าอย่างที่ฉันต้องทำและประเมินว่ามันน่าเชื่อถือเพียงพอหรือไม่สำหรับฉันที่จะใช้ใน งานของฉัน. บ่อยครั้งที่มันถูกกว่าสำหรับฉันที่จะเขียนรหัส Stata ของตัวเองในเวลาที่น้อยลงซึ่งฉันจะใช้เวลาหาวิธีที่จะทำให้ R ทำงานในหน้าที่ที่ได้รับ ควรเข้าใจว่านี่เป็นนิสัยส่วนตัวของฉัน; คนส่วนใหญ่ในเว็บไซต์นี้มีการใช้งานที่ดีกว่าฉัน

ตลกที่ศาสตราจารย์ของคุณจะชอบ Stata หรือ GAUSS มากกว่า R เพราะ "R ไม่ได้เขียนโดยนักเศรษฐศาสตร์" ไม่ว่าจะเป็น Stata หรือ GAUSS เขียนโดยนักวิทยาศาสตร์คอมพิวเตอร์โดยใช้เครื่องมือของนักวิทยาศาสตร์คอมพิวเตอร์ หากศาสตราจารย์ของคุณได้รับแนวคิดเกี่ยวกับการเขียนโปรแกรมจาก CodeAcademy.com นั้นดีกว่าไม่มีอะไรเลย แต่การพัฒนาซอฟต์แวร์ระดับมืออาชีพนั้นแตกต่างจากการพิมพ์ในกล่องข้อความ CodeAcademy.com เนื่องจากการขับรถบรรทุกสินค้าแตกต่างจากการขี่จักรยาน (Stata เริ่มต้นโดยนักเศรษฐศาสตร์คอมพิวเตอร์ที่แปลงโฉมหน้านักวิทยาศาสตร์คอมพิวเตอร์ แต่เขาไม่ได้ทำเรื่องเศรษฐมิติด้านแรงงานมาเป็นเวลาประมาณ 25 ปีแล้ว)

อัปเดต : ตามที่ AndyW แสดงความคิดเห็นด้านล่างคุณสามารถเขียนรหัสแย่ ๆ ในภาษาใดก็ได้ คำถามเกี่ยวกับราคาจะกลายเป็นภาษาที่ง่ายต่อการตรวจแก้จุดบกพร่อง สำหรับฉันนี่ดูเหมือนการรวมกันของผลลัพธ์ที่ถูกต้องและให้ข้อมูลและวิธีการที่ง่ายและโปร่งใสไวยากรณ์คือตัวเองและฉันไม่มีคำตอบที่ดีสำหรับการที่แน่นอน ตัวอย่างเช่น Python บังคับใช้การเยื้องโค้ดซึ่งเป็นความคิดที่ดี รหัส Stata และ R สามารถพับทับวงเล็บและนั่นจะไม่ทำงานกับ SAS การใช้รูทีนย่อยเป็นดาบสองคม: การใช้*apply()ad-hoc functions ใน R นั้นเห็นได้ชัดว่ามีประสิทธิภาพมาก แต่ยากที่จะดีบั๊ก โดยโทเค็นที่คล้ายกัน Stata locals สามารถปกปิดได้เกือบทุกอย่างและการกำหนดค่าเริ่มต้นให้เป็นสตริงว่างเปล่าในขณะที่มีประโยชน์อาจทำให้เกิดข้อผิดพลาดที่ยากต่อการจับ


1
นี่เป็นคำตอบที่ดี แต่ IMO มีการใช้งานทั่วไปมากเกินไป (คุณสามารถเขียนโค้ดที่ไม่ดีหรือดีในภาษาใด ๆ Stata ไม่ได้ใช้เวทมนตร์ในการบังคับใช้มาตรฐานการเข้ารหัสที่ดี) ฉันมีเวลายากที่จะเห็นว่ารหัส SPSS 2mb เป็นรหัส SPSS ที่มีประสิทธิภาพในการเริ่มต้นอย่างไร (ด้วยรุ่นที่ใหม่กว่าที่มีการเน้นไวยากรณ์ควรแนะนำให้เปิดไฟล์ดังกล่าวในโปรแกรมแก้ไข) ดูเหมือนว่ามีโอกาสที่ดีที่จะใช้เวลาในการเขียนภาษาใหม่ ๆ
Andy W

1
ฉันไม่ได้เขียนโค้ด SPSS เลยและความเข้าใจของฉันว่ารหัสที่ฉันทำงานด้วยไม่ได้เขียนเป็นรหัสเช่นกัน แต่ได้รับการบันทึกจากจุดและส่วนต่อคลิกแล้วจากนั้นอาจถูกขัดจังหวะเล็กน้อย ฉันคิดว่า SPSS จะใส่ค่าเริ่มต้นทั้งหมดและใช้การแปลงอินเทอร์เฟซเป็นรหัสดังนั้นมันจึงไม่ใช่รหัสที่มีประสิทธิภาพมากนักที่จะเริ่มต้นด้วย
StasK

12

ฉันจะต้องระมัดระวังทุกคนที่อ้างข้อเท็จจริง แต่ไม่สำรองข้อมูลใด ๆ

คุณสามารถเปลี่ยนข้อโต้แย้งของเขาได้อย่างง่ายดาย

ตัวอย่างเช่นผู้ที่รับเงินเพื่อเขียนรหัสอาจมีแรงจูงใจน้อยกว่าเพื่อทำให้ถูกต้องเนื่องจากมีความคาดหวังว่ารหัสของพวกเขาจะถูกต้องในขณะที่ผู้พักอาศัยชั้นใต้ดินทั่วไปต้องการสร้างความมุ่งมั่นที่จะสร้างความประทับใจให้หัวหน้าโครงการ บางทีเขาอาจจะไม่สนใจอะไรมากไปกว่านี้ว่าเขาจะใช้เวลาว่างให้มากขึ้นถ้ามันหมายถึงงานที่มีคุณภาพ

หากตัวสร้างตัวเลขสุ่มคือ 'ยุ่ง' (ซึ่งเป็นคำที่คลุมเครือ; แทนที่ความจริงได้อย่างง่ายดายเพื่อสำรองอาร์กิวเมนต์ของเขา) จากนั้นเขาควรจะสามารถพิสูจน์ได้หรือแสดงให้คุณเห็นคนที่สามารถ

หากเขาได้รับผลลัพธ์ที่ไม่ต่อเนื่องกันจากแพ็คเกจเขาควรจะสามารถชี้ขั้นตอนที่เขาใช้เพื่อให้ได้ผลลัพธ์นั้น หากเป็นข้อผิดพลาดจริงๆและคุณมีทักษะการเขียนโปรแกรมที่ดีคุณสามารถลองและแก้ไขให้เขาได้!

ฉันรู้ว่าคำตอบของฉันไม่ตอบคำถามของคุณโดยตรง (ขออภัย) เพียงแค่จากวิธีที่เขาพูดถึงคะแนนของคุณคุณจะเห็นได้ว่าไม่มีเนื้ออยู่ด้านหลัง ถ้ามีอย่าลังเลที่จะแก้ไขในคำถามของคุณสำหรับคนที่นี่เพื่อหารือเพิ่มเติม!


5

ใน ReplicationWiki (ที่ฉันทำงาน) คุณจะเห็นว่า R เป็นหนึ่งในชุดซอฟต์แวร์ที่ใช้บ่อยที่สุดสำหรับการศึกษาเชิงประจักษ์ 2000 ครั้งที่ตีพิมพ์ในวารสารที่ได้รับการยอมรับอย่างดีในช่วงปี 2000-2013 ดูเหมือนว่ามันถูกใช้มากขึ้นในไม่กี่ปีที่ผ่านมา Stata ถูกใช้บ่อยที่สุด (> 900 ครั้ง), ตามด้วย MATLAB (280), SAS (60), GAUSS (60), Excel (50), Excel (50), R (30), FORTRAN (30), Mathematica (19), ตัวอย่าง (18), z-Tree (16), dynare (15), RATS (12), C (8), C ++ (6), python (5, การศึกษาล่าสุด), SPSS (5) และอื่น ๆ บ่อยครั้งมีการใช้แพ็คเกจมากกว่าหนึ่งครั้ง


นี่เป็นหลักฐานที่น่าสนใจเกี่ยวกับการใช้ซอฟต์แวร์ แต่มันไม่ได้มีผลโดยตรงกับคำถามอื่น ๆ นอกเหนือจากการให้ข้อบ่งชี้ที่ชัดเจนว่า R ใช้กันอย่างแพร่หลาย
Nick Cox

2

ฉันใช้ R มานานครึ่งทศวรรษแล้วและยังใช้ SAS, SPSS, Calc, WEKA และเครื่องมืออื่น ๆ ฉันไม่เคยสนุกกับเครื่องมือใด ๆ มากเท่าที่เคยทำผ่านอาร์ Basically R สำหรับคนที่คิดอิสระและลองเรียนรู้ด้วยตนเอง เมื่อพูดถึงสถิติมันคือทั้งหมดที่เกี่ยวกับวิธีการ ผู้ใช้อาจไม่ทราบว่าวิธีการกำหนดและสร้างแบบจำลองในซอฟต์แวร์เชิงพาณิชย์และพวกเขาอาจถูกหรือผิด R สำหรับผู้ที่ต้องการกำหนดวิธีการและใช้วิธีการที่เหมาะกับความต้องการของพวกเขา มันคือทั้งหมดที่เกี่ยวกับเสรีภาพ เสรีภาพนี้ไม่ได้มีอยู่กับซอฟต์แวร์เชิงพาณิชย์แม้จะมีการใช้จ่ายเงินและการซื้อ ความรู้เป็นสมบัติของชุมชน (สังคม) ไม่มีใครสามารถเรียกร้องการประพันธ์ในสิ่งเดียวกันได้ การวิจัยคือทั้งหมดที่เกี่ยวกับการค้นหาวิธีแก้ไขปัญหา เท่าที่เกี่ยวข้องกับ R ไม่จำเป็นต้องกังวลเกี่ยวกับวิธีการสำหรับผู้ใช้มีอิสระในการกำหนดและปรับปรุง ตัวอย่างเช่นหากมีปัญหาเฉพาะรุ่นหรือวิธีการที่กำหนดไม่ถูกต้องซึ่งสามารถแก้ไขได้โดยการแก้ไขหรือพัฒนารหัสใหม่ การทำเช่นนี้นักวิจัยไม่เพียง แต่พัฒนาความรู้ แต่ยังวิวัฒนาการ

ข้อดีของ R คือไม่จำเป็นต้องเป็นโปรแกรมเมอร์คอมพิวเตอร์ วิธีการทางสถิติทั้งหมดเกี่ยวกับการเขียนฟังก์ชั่นเพียงแค่คำสั่งควบคุมและลูป (เริ่มต้นด้วยสิ่งที่ระดับที่สูงขึ้นมาในภายหลัง) R มีสภาพแวดล้อมการเขียนโปรแกรมที่ง่ายมากสำหรับมือใหม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.