การตรวจสอบสถิติในเอกสาร


43

สำหรับพวกเราบางคนเอกสารการตัดสินเป็นส่วนหนึ่งของงาน เมื่อผู้ตัดสินเอกสารวิธีการทางสถิติที่ผมคิดว่าคำแนะนำจากสาขาวิชาอื่น ๆ ที่เป็นประโยชน์อย่างเป็นธรรมเช่นวิทยาศาสตร์คอมพิวเตอร์และคณิตศาสตร์

คำถามนี้เกี่ยวข้องกับการตรวจสอบเอกสารทางสถิติที่มีการใช้มากขึ้น โดยสิ่งนี้ฉันหมายความว่ากระดาษถูกส่งไปยังวารสารที่ไม่ใช่สถิติ / คณิตศาสตร์และสถิติที่กล่าวถึงเพียงในส่วน "วิธีการ"

บางคำถาม:

  1. เราควรพยายามทำความเข้าใจเกี่ยวกับพื้นที่การสมัครมากแค่ไหน?
  2. ฉันควรใช้เวลาในการรายงานนานเท่าใด
  3. คุณจู้จี้จุกจิกแค่ไหนเมื่อดูรูป / ตาราง
  4. คุณรับมือกับข้อมูลที่ไม่มีอยู่ได้อย่างไร
  5. คุณลองและรันการวิเคราะห์ที่ใช้อีกครั้ง
  6. จำนวนเอกสารสูงสุดที่คุณจะตรวจสอบในหนึ่งปีคือเท่าใด

มีคำถามที่พลาดไปหรือไม่? รู้สึกอิสระที่จะแก้ไขหรือเพิ่มความคิดเห็น

แก้ไข

ฉันมาถึงคำถามนี้ในฐานะนักสถิติทบทวนบทความทางชีววิทยา แต่ฉันสนใจในการตรวจสอบทางสถิติเกี่ยวกับวินัยที่ไม่ใช่คณิตศาสตร์


ฉันไม่แน่ใจว่าควรเป็น CW หรือไม่ ในอีกด้านหนึ่งมันเปิดเล็กน้อย แต่อีกด้านหนึ่งฉันเห็นว่าตัวเองยอมรับคำตอบ นอกจากนี้คำตอบอาจจะค่อนข้างยาว

คำตอบ:


21

ฉันไม่แน่ใจว่าคุณหมายถึงสาขาวิชาวิทยาศาสตร์ใด (ฉันแน่ใจว่าคำตอบจะแตกต่างกันอย่างมากหากจัดการกับชีววิทยากับฟิสิกส์เป็นต้น)

อย่างไรก็ตามในฐานะนักชีววิทยาฉันจะตอบจากมุมมอง "ชีวภาพ":

เราควรพยายามทำความเข้าใจเกี่ยวกับพื้นที่การสมัครมากแค่ไหน?

อย่างน้อยฉันก็มักจะอ่านบทความก่อนหน้านี้จากผู้เขียนคนเดียวกันและมองหาบทวิจารณ์บางเรื่องหากฉันไม่คุ้นเคยกับมัน นี่เป็นเรื่องจริงโดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับเทคนิคใหม่ที่ฉันไม่รู้เพราะฉันต้องเข้าใจว่าพวกเขาทำสิ่งที่ถูกต้องหรือไม่

ฉันควรใช้เวลาในการรายงานนานเท่าใด

เท่าที่จำเป็น (ตกลงตอบโง่ฉันรู้!: P) โดยทั่วไปฉันไม่ต้องการให้ใครบางคนตรวจสอบกระดาษของฉันเพื่อทำงานโดยประมาณเพียงเพราะเขา / เธอมีสิ่งอื่นที่ต้องทำดังนั้นฉันจึงพยายามไม่ทำเอง .

คุณจู้จี้จุกจิกแค่ไหนเมื่อดูรูป / ตาราง

ค่อนข้างจู้จี้จุกจิก ตัวเลขเป็นสิ่งแรกที่คุณมองเมื่อเรียกดูกระดาษ พวกเขาจะต้องสอดคล้องกัน (เช่นชื่อที่ถูกต้องบนแกน, ตำนานที่ถูกต้อง ฯลฯ ) ในบางครั้งฉันแนะนำให้ใช้พล็อตชนิดอื่นเพื่อแสดงข้อมูลเมื่อฉันคิดว่าแบบที่ใช้นั้นไม่ดีที่สุด สิ่งนี้เกิดขึ้นมากมายในวิชาชีววิทยาซึ่งเป็นเขตข้อมูลที่มีกราฟประเภท "barplot +/- SEM" ฉันยังค่อนข้างจู้จี้จุกจิกในส่วน "วัสดุและวิธีการ": การวิเคราะห์ทางสถิติที่สมบูรณ์แบบในรูปแบบทางชีวภาพที่ผิดโดยเนื้อแท้ไม่มีประโยชน์อย่างสมบูรณ์

คุณรับมือกับข้อมูลที่ไม่มีอยู่ได้อย่างไร

คุณเพียงแค่ทำและไว้วางใจผู้เขียนฉันเดา ในหลายกรณีทางชีววิทยาไม่มีอะไรที่คุณสามารถทำได้โดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับสิ่งต่าง ๆ เช่นการถ่ายภาพหรือพฤติกรรมสัตว์และสิ่งที่คล้ายกัน หากคุณไม่ต้องการให้ผู้คนเผยแพร่รูปภาพวิดีโอ ฯลฯ (ที่คุณมักจะไม่ผ่านอยู่ดี) แต่นั่นอาจจะไม่ได้ผลมากนัก หากคุณคิดว่าข้อมูลมีความจำเป็นจริงๆขอให้ผู้เขียนให้ข้อมูล / ตัวเลขเพิ่มเติม

คุณลองและรันการวิเคราะห์ที่ใช้อีกครั้ง

เฉพาะในกรณีที่ฉันมีข้อสงสัยอย่างจริงจังเกี่ยวกับข้อสรุปที่เขียนโดยผู้เขียน ในทางชีววิทยามักจะมีความแตกต่างระหว่างสิ่งที่ (หรือไม่) "สำคัญทางสถิติ" และ "ความสำคัญทางชีวภาพ" คืออะไร ฉันชอบการวิเคราะห์ทางสถิติทินเนอร์ด้วยเหตุผลทางชีววิทยาที่ดี แต่อีกครั้งในเหตุการณ์ที่ไม่น่าจะเป็นไปได้ที่ฉันจะทบทวนบทความสถิติทางชีวภาพ (อ่านั่นน่าจะสนุก !!!) ฉันอาจจะให้ความสนใจกับสถิติมากกว่าทางชีววิทยาในนั้น


6
ฉันจะได้รับคำตอบเหมือนกันเกือบทุกอย่าง แต่ที่นี่มีการระบุไว้อย่างชัดเจนเช่นกัน ให้ฉันเพิ่มสองสิ่งโดยอิงจากประสบการณ์ ก่อนอื่นฉันพบว่ามันเกือบคุ้มค่าที่จะทำการวิเคราะห์ใด ๆ ที่ฉันสามารถทำได้: ทำหน้าที่ตรวจสอบความเข้าใจของฉันและบ่อยครั้งที่มากกว่าหนึ่งคาดว่าจะเกิดข้อผิดพลาดในกระดาษ ประการที่สองมันเป็นสิ่งสำคัญในการค้นหาการอ้างอิงที่สำคัญและการค้นหาการอ้างอิงของคุณเองโดยการค้นหาเว็บสำหรับวลีในกระดาษ เมื่อไม่นานมานี้มีส่วนร่วมจำนวนมากคือการลอกเลียนแบบ (อัตโนมัติ -) หรือการพยายามทำให้หัวล้านได้รับกระดาษแผ่นอื่นจากงานเก่า
whuber

ฉันได้เพิ่มคำถามเพิ่มเติม หากไม่ยุ่งยากมากเกินไปคุณจะอัพเดตคำตอบของคุณหรือไม่
csgillespie

1
@csgillespie: ฉันคิดว่าฉันเร็วเกินไปในอาชีพของฉันที่จะตอบว่าเพราะฉันอาจไม่ได้รับการขอให้ตรวจสอบเอกสารให้มากที่สุดเท่าที่มีคนมีประสบการณ์มากขึ้นแล้วฉัน ฉันคิดว่าคำตอบของ @whuber นั้นสมเหตุสมผลมาก
โก้

16

สิ่งนี้ตอบคำถามใหม่ # 6: "จำนวนเอกสารที่คุณต้องการตรวจสอบในหนึ่งปีมีเท่าไหร่" ฉันกำลังตอบสนองในฐานะสมาชิกของกระดานบรรณาธิการหลายแห่ง ปัญหายืนต้นคือการหาผู้ตรวจสอบที่เพียงพอ กระดาษที่ส่งมาทุกฉบับจะต้องมีผู้ตรวจทานหนึ่งถึงสามคนขึ้นอยู่กับวารสาร หากวารสารมี % อัตราการได้รับการยอมรับแล้วจำนวนเฉลี่ยของความคิดเห็นต่อกระดาษได้รับการยอมรับอย่างเห็นได้ชัดคือประมาณ100) เช่นหากอัตราการตอบรับเป็น 33% ผู้แก้ไขจะต้องได้รับการตรวจสอบเก้าครั้งสำหรับทุกบทความที่ตีพิมพ์ หากคุณเป็นผู้เขียนสิ่งนี้อย่างจริงจังคุณควรพยายามให้ความเห็นเก้าข้อ (หรือจำนวนที่เป็นวารสารวารสารเป้าหมายของคุณ) สำหรับบทความที่คุณตีพิมพ์ทุกฉบับ!x3/(x/100)

ฉันถูกย้ายไปเขียนสิ่งนี้เนื่องจากการขนานที่แข็งแกร่งกับการลงคะแนนในเว็บไซต์นี้: เพื่อให้คุณได้รับชื่อเสียงของคนอื่น ๆ ต้องถอนการรวมกันของคำตอบของคุณและคำถามของคุณ ดังนั้นหากคุณดึงน้ำหนักของคุณการตรวจสอบโปรไฟล์ของคุณควรแสดงอย่างน้อย upvotes เป็นกรณีสำหรับสมาชิกจำนวนมาก แต่ไม่แน่นอนว่าเป็นสมาชิกที่แข็งขันที่สุดของเว็บไซต์นี้ บางสิ่งบางอย่างที่ต้องคิดถึง ... อย่าลืมโหวต!rr/10r/5 r/10


1
@chl ของทุกคนที่นี่คุณควรจะกังวลน้อยที่สุดเกี่ยวกับการลงคะแนนมากพอ!
whuber

1
@chl: คุณตั้งแถบสูงในทุก ๆ ด้าน! :) บางทีโครงการ polystats แรกของเราควรจะตั้งค่าสคริปต์บางส่วนเพื่อรักษาและปรับปรุงชุดของชาร์ตเช่นนี้: meta.stats.stackexchange.com/questions/314/...
ARS

11

POV ของฉันจะทบทวนบทความทางจิตวิทยาหรือการคาดการณ์เกี่ยวกับข้อดีทางสถิติ ฉันจะกล่าวคำพูดที่ดีมากของนิโก้เป็นส่วนใหญ่

เราควรพยายามทำความเข้าใจเกี่ยวกับพื้นที่การสมัครมากแค่ไหน?

ที่จริงแล้วค่อนข้างมาก ฉันจะไม่ไว้ใจตัวเองที่จะแสดงความคิดเห็นมากกว่าปัญหาพื้นฐานทางสถิติโดยไม่ต้องทำความเข้าใจกับพื้นที่ โชคดีที่สิ่งนี้มักจะไม่ยากนักในสาขาจิตวิทยาหลายแห่ง

ฉันควรใช้เวลาในการรายงานนานเท่าใด

ฉันจะออกไปตามแขนขาและระบุเวลาที่กำหนด: ฉันจะใช้เวลาระหว่างสองถึงแปดชั่วโมงในการตรวจสอบบางครั้งก็มากขึ้น หากฉันพบว่าฉันใช้เวลามากกว่าหนึ่งวันบนกระดาษมันอาจหมายความว่าฉันไม่มีคุณสมบัติที่จะเข้าใจมันดังนั้นฉันจะแนะนำให้วารสารหาคนอื่น (และพยายามแนะนำคนบางคน)

คุณจู้จี้จุกจิกแค่ไหนเมื่อดูรูป / ตาราง

จู้จี้จุกจิกมากแน่นอน ตัวเลขจะเป็นสิ่งที่ผู้คนจำได้จากบทความและสิ่งที่เกิดขึ้นในการนำเสนอการบรรยายโดยไม่มีบริบทมากดังนั้นสิ่งเหล่านี้จำเป็นต้องทำได้ดี

คุณรับมือกับข้อมูลที่ไม่มีอยู่ได้อย่างไร

ในทางจิตวิทยาข้อมูลมักจะไม่ถูกแชร์ - การวัด 50 คนโดย MRI นั้นแพงมากและผู้เขียนต้องการใช้ข้อมูลเหล่านี้สำหรับเอกสารเพิ่มเติมดังนั้นฉันเข้าใจว่าพวกเขาลังเลที่จะให้ข้อมูล ดังนั้นใครก็ตามที่แชร์ข้อมูลของพวกเขาจะได้รับโบนัสก้อนใหญ่ในหนังสือของฉัน แต่การแบ่งปันไม่เป็นที่เข้าใจได้

ในการคาดการณ์ชุดข้อมูลจำนวนมากจะเปิดเผยต่อสาธารณะ ในกรณีนี้ฉันมักจะแนะนำให้ผู้เขียนแบ่งปันรหัสของพวกเขา (และทำด้วยตัวเอง)

คุณลองและรันการวิเคราะห์ที่ใช้อีกครั้ง

หากไม่มีข้อมูลมีเพียงคนเดียวเท่านั้นที่สามารถเรียนรู้จากสิ่งนี้ ฉันจะเล่นกับข้อมูลจำลองหากมีสิ่งที่น่าแปลกใจมากเกี่ยวกับผลลัพธ์ของกระดาษ มิฉะนั้นจะสามารถบอกวิธีที่เหมาะสมจากวิธีที่ไม่เหมาะสมได้โดยไม่ต้องมีข้อมูล (เมื่อมีคนเข้าใจพื้นที่ดูด้านบน)

จำนวนเอกสารสูงสุดที่คุณจะตรวจสอบในหนึ่งปีคือเท่าใด

มีน้อยมากที่จะเพิ่มไปยังประเด็นของ whuber ด้านบน - สมมติว่ากระดาษที่มีค่าเฉลี่ยn coauthors I (co-) ยอมส่งได้รับ 3 บทวิจารณ์จริง ๆ ควรมุ่งที่จะตรวจสอบอย่างน้อย 3 / ( n + 1 ) เอกสารสำหรับแต่ละการส่งของตนเอง (การนับการส่งแทนที่จะเป็นเอกสารของตัวเองซึ่งอาจถูกปฏิเสธและส่งซ้ำ) และแน่นอนจำนวนของการส่งเช่นเดียวกับจำนวนผู้เขียนร่วมแตกต่างกันอย่างมากกับวินัย


ฉันได้เพิ่มคำถามเพิ่มเติม หากไม่ยุ่งยากมากเกินไปคุณจะอัพเดตคำตอบของคุณหรือไม่
csgillespie

1
น่าสนใจนักวิจัยส่วนใหญ่ในการศึกษาพันธุศาสตร์ได้รับการสนับสนุนหรือยินดี (ขึ้นอยู่กับการทบทวน) เพื่อให้มีข้อมูล ฉันยังนึกถึง @csgillepsie คำตอบที่ดีเกี่ยวกับการวิจัยที่ทำซ้ำ , stats.stackexchange.com/questions/1980/…
chl

@chl: ใช่การทำให้ข้อมูลมีอยู่มากขึ้นอยู่กับระเบียบวินัยและฉันชอบที่จะเห็นสิ่งนี้มากขึ้นในจิตวิทยา "กระแสหลัก" - ฉันจำไม่ได้เลยว่าเคยเห็นตัวอย่างกระดาษจิตวิทยาที่แจกจริง ๆ ข้อมูล.
S. Kolassa - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.