ArXiv ได้รับความนิยมในชุมชนสถิติหรือไม่?


25

ฉันรู้ว่าชุมชนฟิสิกส์และคณิตศาสตร์นั้นเข้ามาใน ArXiv มาก แต่ชุมชนสถิติจะเป็นอย่างไร? เป็นเรื่องปกติไหมที่จะโพสต์ที่นั่นก่อนส่ง


ฉันไม่เคยโพสต์ที่นั่นและจำไม่ได้ว่าต้องมองหาเอกสารที่นั่นเช่นกัน
Christoph Hanck

@ ลึกลงไปใช่ว่าจะน่าสนใจ ฉันถามทั้งอยากรู้อยากเห็นและเพราะฉันเพิ่งโพสต์ร่าง "ตามที่ส่ง" เมื่อเร็ว ๆ นี้ใน ArXiv กำลังสงสัยว่ามันจะไปถึงลูกตาพิเศษจริง ๆ หรือ

1
ใช่; พวกเราบางคนดู arXiv อย่างน้อยก็บางครั้ง ฉันทำเมื่อฉันสามารถหรือเมื่อมีคนชี้ฉันที่นั่นและฉันมักจะเชื่อมโยงผู้คนกับเอกสารที่นั่น
Glen_b

3
กำหนด "สถิติ" ในพื้นที่ที่ฉันทำงานระเบียบวิธีการสำรวจผู้ค้นหาที่ไร้เดียงสาของฉันสำหรับ "การสำรวจเชิงซ้อน" และ "ประชากร จำกัด " ได้นำผลการสำรวจ 2 และ 42 เรื่องมาใช้ arXiv ตามลำดับ ทุกปีส่วนวิธีวิจัยเชิงสำรวจของสมาคมสถิติอเมริกันมีการประชุมประมาณ 40 ครั้งในการประชุมสถิติร่วมระหว่าง 1 ถึง 3 ในทุกช่วงเวลาตลอด 4 วันของการประชุม เท่าที่ฉันสามารถบอกได้ว่าไม่มีสิ่งใดที่ทำให้ arXiv
StasK

คำตอบ:


19

ใช่ Arxiv ได้รับความนิยมในสถิติและชุมชนวิทยาศาสตร์ข้อมูล

เนื่องจากโลกแห่งสถิติและวิทยาศาสตร์ข้อมูลวิวัฒนาการขึ้นทุกวันจึงเป็นสิ่งสำคัญที่นักสถิติและนักวิทยาศาสตร์ด้านข้อมูลจะต้องพัฒนาตนเองให้ทันกับเหตุการณ์ล่าสุดเทคนิคและอัลกอริธึม

มันอาจไม่ได้รับความนิยมเท่ากับในชุมชนฟิสิกส์ แต่มันมีส่วนแบ่งที่มีความสำคัญในโลกที่เต็มไปด้วยข้อมูล

คุณอาจสนใจGitxivซึ่งรวมการวิจัยที่ล้ำสมัยเข้ากับโค้ด / ไลบรารีแบบเปิดที่สอดคล้องกัน


3
+1 สำหรับลิงก์ไปยัง Gitxiv ... ดูสิ คุณตรวจสอบ ArXiv เป็นประจำหรือสมัครเป็นสมาชิกหนึ่งในรายชื่ออีเมลหรือไม่?

2
ด้วยความยินดี. Gitxiv ได้นำโลกของการวิจัยเข้ามาใกล้กับโลกแห่งสถิติและวิทยาศาสตร์คอมพิวเตอร์มากขึ้น รุ่งโรจน์กับพวกเหล่านั้น ไม่ฉันไม่สมัครเป็นสมาชิกรายการส่งเมล แต่เนื่องจากเอกสารการเรียนรู้ของเครื่องและการวิเคราะห์ส่วนใหญ่อาศัยอยู่ที่นั่นฉันจะตรวจสอบทุกสัปดาห์
Dawny33

3
มันจะดีกว่าถ้าคุณมีหลักฐานสนับสนุนมาด้วย ตอนนี้มันเป็นเพียงคำเดียว "ใช่" และที่เหลือไม่ได้ให้ข้อมูล (แต่ Gitxiv น่าสนใจขอบคุณที่พูดถึง)
Richard Hardy

19

ฉันจะให้คำตอบตามหลักฐานที่ชัดเจน คำตอบคือใช่

ดูที่ วัดความน่าจะเป็นและสถิติของ Google Scholar , แหล่งข้อมูล 10 อันดับแรกจากดัชนี h5:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

หมายเหตุรายการนี้ไม่ได้ขึ้นอยู่กับจำนวนของสิ่งพิมพ์ก็ขึ้นอยู่กับการที่ดัชนีอ้างอิง

ดัชนีการอ้างอิงของ Google กำลังได้รับความนิยมเท่ากับ Scopus และ Reuters (โอเคฉันไม่มีหลักฐานของคำแถลงนี้) ดังนั้นคำตอบของฉันจึงมีวัตถุประสงค์ตามที่ได้รับ

เปรียบเทียบสิ่งนี้กับรายการจาก Scimagojr.comบนสถิติและความน่าจะเป็น:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

มีการซ้อนทับที่ดีกับ 10 อันดับแรกของ Google Scholar อย่างที่คุณเห็น รายการหลังนั้นขึ้นอยู่กับดัชนี h เช่นกัน แต่ไม่ใช่การอ้างอิงของ Google สิ่งนี้จะตรวจสอบความถูกต้องของตารางเดิมเท่านั้นและข้อสรุปจากมัน: arXiv isรับความนิยมในหมู่นักสถิติในด้านวิชาการ

SSRNเป็นสถานที่อีกแห่งหนึ่งในการทิ้ง preprint มันเป็นที่นิยมในหมู่นักเศรษฐศาสตร์


+1 - ทำงานได้ยอดเยี่ยมด้วยการใช้ Google metrics! ดัชนี h ทำให้มันอยู่ที่นั่นแน่นอน

@ สำคัญสิ่งหนึ่งที่ต้องระวัง: การเคลื่อนไหวการเข้าถึงแบบเปิด arXiv เป็นสถานที่ที่ผู้คนทิ้ง preprints ของพวกเขานั่นคือวิธีที่มันเริ่มต้นในฟิสิกส์ ดังนั้นคุณจะเห็นกระดาษแผ่นเดียวกันใน arXiv หลังจากนั้นใน Phys Rev ตัวอย่างเช่น ดังนั้น arXiv จึงถูกสร้างขึ้นเป็นวิธีการเผยแพร่การวิจัยได้เร็วขึ้น เอกสารที่ดีมักไม่ปรากฏบน arXiv แต่เพียงผู้เดียว
Aksakal

อ๋อ ฉันมักจะอ้างถึงกระดาษที่ฉันพบใน ArXiv หากฉันสามารถหาได้ในวารสารที่ผ่านการตรวจสอบด้วย กระดาษของฉันอยู่ที่นั่นในขณะที่มันผ่านการตรวจสอบและการปรับปรุงป่วยด้วย preprint ยอมรับหลังจากระยะเวลาการคว่ำบาตร (สมมติว่ามันไม่ได้ปฏิเสธ)

@Bey ขณะที่เราอยู่ในนั้นมีอีกสองที่ที่คุณสามารถทิ้ง preprints ของคุณ: RePec และ SSRN นักเศรษฐศาสตร์อาจใช้สิ่งเหล่านี้บ่อยกว่า arXiv
Aksakal

14

มันไม่ใช่เรื่องของความเห็นส่วนตัวดังนั้นเรามาดูตัวเลขบางคำที่ปรากฏบนหน้า arXiv (บางข้อความค้นหาแบบสุ่มของ Google ที่มีคำศัพท์เฉพาะโดเมนน้อย):

ไซต์การตรวจสอบข้าม: arxiv.orgส่งคืน

ประมาณ 17,800 รายการ

ไซต์ monte carlo: arxiv.orgส่งคืน

ประมาณ 187,000 ผลลัพธ์

ไซต์ตัวอย่าง: arxiv.orgส่งคืน

ประมาณ 141,000 ผลลัพธ์

ไซต์การคาดการณ์: arxiv.orgส่งคืน

ประมาณ 11,300 ผล

ไซต์การถดถอย: arxiv.orgส่งคืน

ประมาณ 51,100 ผล

แก้ไข

ในฐานะที่เป็น@Scortchiสังเกตเห็นโพสต์ arXiv สถิติของตัวเอง หมวดหมู่สถิติปรากฏในรายงานในช่วงสามปีที่ผ่านมาดังต่อไปนี้:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

อย่างไรก็ตามสิ่งนี้อาจไม่ได้แสดงเนื้อหาของเอกสารที่ตีพิมพ์อย่างสมบูรณ์เนื่องจากบางรายการอาจเกี่ยวข้องกับสถิติอย่างสูง แต่ถูกติดแท็กเป็นโดเมนอื่น (เช่นคณิตศาสตร์หรือcs )

นอกจากนี้บล็อกของซีอานก็สามารถทำเป็นกรณีศึกษาได้ เขาเขียนมากเกี่ยวกับสถิติแบบเบย์และมักกล่าวถึงเอกสารที่มีการจัดเก็บไว้ (มีแท็กของตนเอง )

ดูเหมือนว่าเราพูดถึง "arXiv" ใน CrossValidated ใน 689 โพสต์และความคิดเห็นจนถึงตอนนี้ (รวมถึงที่นี่)

สิ่งนี้ทำให้เป็นที่นิยมหรือไม่? ถึงกระนั้นก็ยังยากที่จะพูด แต่สำหรับเอกสารที่เกี่ยวข้องกับสถิติหลายพันรายการถูกโพสต์บน arXiv และความนิยมเพิ่มขึ้น


3
หรืออย่างน้อยก็มีเอกสารนับพันฉบับที่ใช้ / กล่าวถึงวิธีการทางสถิติ
Glen_b -Reinstate Monica

@Glen_b ใช่มันเป็นเรื่องของคำหลักที่จะตรวจสอบ แต่ฉันไม่เห็นวิธีที่ดีกว่าในการตรวจสอบว่ามันเป็น "ยอดนิยม"
ทิม

4
'สถิติ' เป็นหัวข้อเรื่องของ arXiv โดยมีการส่ง 7,711 ครั้งจนถึงสิ้นปี 2557 ซึ่งคิดเป็น 0.9% ของจำนวนทั้งหมด arxiv.org/help/stats/2014_by_area/index
Scortchi - Reinstate Monica

@Scortchi ฉันไม่เคยขุดลึกลงไปในเว็บไซต์นี้ขอบคุณ!
ทิม

+1 :) ฉันไม่ได้นึกคำถามนี้เป็นแบบฝึกหัดวิเคราะห์ ... แต่คุณพบวิธีที่จะได้รับมัน ... มันเจ๋งมาก :) ไม่คาดหวังอะไรจากคนในไซต์นี้! ฉันจะบอกว่าตาม @Aksakal และการวิเคราะห์ของคุณ ArXiv เป็นสมาชิกที่ดีพอสมควรสำหรับสถิติ :-)

8

วารสารทุกฉบับที่ตีพิมพ์โดยสถาบันคณิตศาสตร์สถิติ (IMS) - และรวมถึงThe Annals of Statistics (หนึ่งในวารสารสถิติชั้นนำ), The พงศาวดารของสถิติประยุกต์ฯลฯ - สนับสนุนให้ผู้เขียนใส่อย่างชัดเจนใน arXiv และ นอกจากนี้ดูแลการวางโพสต์บน arXiv ด้วย จริง ๆ แล้วฉันไม่ได้ตระหนักถึงวารสารคณิตศาสตร์หรือฟิสิกส์ใด ๆ ที่อัปโหลดเอกสารไปยัง arXiv หากผู้เขียนไม่ได้ทำเอง!

IMS สนับสนุนให้สมาชิกทุกคนโพสต์บทความของตนใน arXiv

( http://www.imstat.org/publications/arxiv.html )

บทความ IMS ทั้งหมด 2004 และไปข้างหน้ามีอิสระในรูปแบบ postprint บน arXiv รวมถึงบทความที่โพสต์โดยผู้แต่ง

ArXiv เป็นระบบจัดเก็บถาวรแบบอัตโนมัติที่มีการเข้าถึงและจัดเก็บโดยอัตโนมัติสำหรับบทความวิจัยปัจจุบันเป็นเจ้าของและดำเนินการโดย Cornell University และได้รับทุนบางส่วนจาก NSF สาขาหลักที่ครอบคลุมคือฟิสิกส์คณิตศาสตร์วิทยาศาสตร์ที่ไม่ใช่เชิงเส้นวิทยาการคอมพิวเตอร์และชีววิทยาเชิงปริมาณ เมื่อเร็ว ๆ นี้ arXiv ได้ร่วมมือกับ IMS และ Bernoulli Society เพื่อเปิดหมวดหมู่สถิติใหม่ภายในคณิตศาสตร์ เราคาดหวังว่าหมวดหมู่นี้จะเติบโตไปสู่การเก็บถาวรระดับบนสุดในที่สุดเทียบได้กับคณิตศาสตร์และฟิสิกส์

( http://www.imstat.org/publications/eaccess.htm )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.