แบบสำรวจ: 25% ของตัวแทนฐานผู้ใช้ขนาดใหญ่หรือไม่


13

ปัจจุบันนายจ้างของฉันกำลังสำรวจความคิดเห็นของ บริษัท เกี่ยวกับทัศนคติที่มีต่อสำนักงานเช่นความเชื่อมั่น ในอดีตพวกเขาเปิดการสำรวจไปยังทุกพื้นที่ของธุรกิจ (สมมติว่ามี 10 แผนกที่แตกต่างกันมาก) และพนักงานทุกคนในนั้น (สมมติว่ามีพนักงาน 1,000 คนใน บริษัท ทั้งหมด) จำนวนพนักงานในแต่ละแผนกไม่เท่ากัน แผนกเฉพาะอาจเป็น 50% ขององค์กรประชากรทั้งหมด

ในปีนี้การสำรวจมีการเปิดถึง 25% ของฐานพนักงานทั้งหมดและการเลือกคือ 'สุ่ม'

ดังนั้นฉันมีสองคำถาม:

  • หากเป็นการเลือกแบบสุ่มอย่างแท้จริงของฐานพนักงานทั้งหมดจะเป็นอย่างไรตัวอย่างที่ถูกต้องทางสถิติที่สมมติว่าพนักงานทุกคนตอบสนองอย่างไร

  • หากเป็นการสุ่มในแต่ละแผนกเช่น 25% ของแต่ละแผนกเป็นอย่างไรตัวอย่างที่ถูกต้องเมื่อพิจารณาจากหนึ่งแผนกมีมากกว่า 50% ของประชากรทั้งหมด

ฉันจะสันนิษฐานว่าเพื่อกำหนดความเชื่อมั่นส่วนใหญ่ใน บริษัท หนึ่งต้องมีอย่างน้อย 50% ของฐานพนักงานในแต่ละแผนกเพื่อให้ความเชื่อมั่นการอ่านที่แท้จริง

อัปเดต : การสำรวจไม่ได้บังคับใช้ ไม่สามารถรับประกันอัตราการตอบสนอง 100% จาก 25% ที่เลือก ไม่มีแรงจูงใจหรือบทลงโทษหากการสำรวจเป็นหรือไม่ได้กรอก


2
ฉันขอแนะนำให้ทำแบบสำรวจขนาดเล็ก (จำนวน / ประเภทของคำถาม) เท่าที่จำเป็นแล้วทำแบบนั้นให้น้อยที่สุดเท่าที่คุณต้องการเพื่อให้พนักงาน / ผู้จัดการจะไม่บ่นว่ามันเป็นช่วงเวลาที่ยิ่งใหญ่ หากคนเลือกเองนั่นเป็นการรับประกันว่ามีอคติอย่างเป็นระบบในบางรูปแบบ
Nick T

หากคุณมีการวัดแล้วค่าเฉลี่ยของตัวแปรบางอย่างที่มีการกระจายตามปกติแล้วหลังจากที่เกี่ยวกับการตอบสนอง 20 ขนาดของ +/- 1/sqrt(# responses)ช่วงเวลาของคุณจะเติบโตในอัตราประมาณ ตัวอย่างเช่นมี 20 +/- .468 * sigmaการตอบสนองของคุณจะมี 100 +/- .198 * sigmaการตอบสนองก็จะเป็น 1000 +/- .062 * sigmaการตอบสนองก็จะเป็น
Pace

คำตอบ:


22

คิดเกี่ยวกับการสำรวจประชากรทั่วไปว่าสหรัฐฯ หากเราต้องการประชากร 50% ในการพิจารณาความเห็นส่วนใหญ่เราจะต้องมีตัวอย่างประมาณ 160 ล้านคนซึ่งเป็นสิ่งต้องห้ามอย่างแท้จริง แม้แต่ตัวอย่าง 1% นั้นรุนแรงมาก (ประมาณ 3.2 ล้าน) และแทบจะไม่ได้ทำ การสำรวจที่สำคัญในสหรัฐอเมริกาการสำรวจสังคมทั่วไปมีขนาดตัวอย่างระหว่าง 1,500 ถึงเกือบ 3,000 ตัวอย่าง 25% นั้นไม่มีปัญหา

จำไว้ว่าการสำรวจไม่ใช่การเลือกตั้งหรือการลงประชามติ เพื่อให้หลังถูกต้องตามกฎหมายทุกคนที่มีสิทธิ์ต้องมีโอกาสพูด สำหรับการสำรวจมีจุดประสงค์เพื่อให้ได้การประเมินความคิดเห็นโดยเฉลี่ยที่ดีและคุณสามารถรับตัวอย่างแบบสุ่มได้ ดังนั้น บริษัท จำเป็นต้องตัดสินใจว่าจุดประสงค์ของการสำรวจคืออะไร: เป็นวิธีที่พนักงานจะให้ความเห็นและมีส่วนร่วมใน บริษัท หรือเป็นวิธีที่ผู้จัดการจะได้รับข้อมูลหรือไม่

การออกแบบตัวอย่างทั้งสองแบบช่วยให้มั่นใจได้ว่าพนักงาน 25% จะถูกถาม ฝ่ายหลังช่วยให้มั่นใจว่าแผนกเล็ก ๆ จะถูกนำเสนอในแบบสำรวจ หากคุณสนใจเกี่ยวกับข้อผิดพลาดมาตรฐานคุณควรคำนึงถึงลักษณะที่ซ้อนกันของการสุ่มตัวอย่างด้วยแม้ว่าฉันจะไม่สงสัยว่ามันจะมีความสำคัญอย่างมากในกรณีนี้


2
+1 แต่มันก็คุ้มค่าที่เน้นว่าถ้าคุณไม่สนใจ "ความเห็นโดยเฉลี่ย" แต่อย่างอื่นก็อาจจำเป็นต้องใช้ตัวอย่างขนาดใหญ่
ทิม

1
ขอบคุณสำหรับคำตอบ อย่างไรก็ตามและนี่คือการละเว้นของฉันไม่มีการบังคับใช้การสำรวจ จะมีเพียง 25% เท่านั้นที่จะถูกถาม แต่พวกเขาไม่จำเป็นต้องตอบกลับ
โคลิน

2
นั่นเป็นเรื่องปกติ ถ้าฉันสำรวจความคิดเห็นมันก็ยากที่จะบังคับให้คนตอบเช่นกัน ฉันสามารถลองจ้างนักเลงบางคนเพื่อ "ชักชวน" ผู้ตอบแบบสอบถามของฉันได้ แต่นั่นจะมีผลทางจริยธรรมและทางกฎหมาย ... ไม่มีการตอบสนองที่น้อยกว่าการไม่ตอบสนองเป็นปัญหา
Maarten Buis

7

โดยนิรุกติศาสตร์ " survey " ( sur-จาก 'super' ดังใน 'จากด้านบน' และ-veyจาก 'view') หมายถึงการรับภาพรวมไม่ใช่ภาพเต็ม

ตราบใดที่ 25% เป็นการสุ่มอย่างแท้จริงและไม่เช่นเลือกด้วยตนเอง (เลือกใช้) ดังนั้นมันจึงค่อนข้างตรงกับคำจำกัดความของคำ หากการสำรวจนั้นเป็นทางเลือกคำตอบนั้นจะเป็นตัวแทนของผู้ที่รู้สึกว่าจำเป็นต้องตอบเท่านั้น ตัวอย่างเช่นลองนึกภาพร้านอาหารที่สามารถกรอกบัตรตอบรับหลังจากทานอาหาร แม้ว่านักทานส่วนใหญ่จะมีความสุขความคิดเห็นส่วนใหญ่จะเป็นลบเพราะลูกค้าที่มีความสุขเห็นเหตุผลเพียงเล็กน้อยที่จะให้ข้อเสนอแนะ


1
คุณสามารถขยายผลของ 'การเลือกด้วยตนเอง' ได้หรือไม่? แบบสำรวจนี้ไม่ได้บังคับใช้เป็นทางเลือกทั้งหมดและไม่มีวิธีการจูงใจหรือเป็นการลงโทษหากคุณทำหรือไม่กรอกข้อมูล ฉันจะอัปเดตคำถามเปิดของฉัน
โคลิน

6
@Colin: หากการสำรวจเป็นทางเลือกคำตอบนั้นจะเป็นตัวแทนของผู้ที่รู้สึกว่าจำเป็นต้องตอบเท่านั้น ตัวอย่างเช่นลองนึกภาพร้านอาหารที่สามารถกรอกบัตรตอบรับหลังจากทานอาหาร แม้ว่านักทานส่วนใหญ่จะมีความสุขความคิดเห็นส่วนใหญ่จะเป็นลบเพราะลูกค้าที่มีความสุขเห็นเหตุผลเพียงเล็กน้อยที่จะให้ข้อเสนอแนะ
dotancohen

1
@dotancohen ฉันคิดว่าคำตอบจะได้รับประโยชน์มากมายจากความคิดเห็นนี้ที่รวมอยู่ในนั้น
Pere

@Pere: ขอบคุณฉันเป็นห่วงว่าการใส่ความคิดเห็นลงในคำตอบอาจเบี่ยงเบนความสนใจไปจากจุดที่นิรุกติศาสตร์ แต่คุณพูดถูกและฉันกำลังเพิ่มเข้ามา
dotancohen

4

อีกมุมมองหนึ่งมาจากทฤษฎีการออกแบบการทดลอง

กำลังทางสถิติคือความน่าจะเป็นในการค้นหาเอฟเฟกต์หากเป็นของจริง ( แหล่งที่มา )

ปัจจัยสี่ประการที่ส่งผลต่อพลังงาน:

  1. ขนาดของเอฟเฟกต์
  2. ค่าเบี่ยงเบนมาตรฐานของคุณลักษณะ
  3. ขนาดตัวอย่างใหญ่ขึ้น
  4. ต้องการระดับความสำคัญ

ขึ้นอยู่กับองค์ประกอบเหล่านี้คุณสามารถเขียนสมการทางคณิตศาสตร์อย่างเป็นทางการที่เกี่ยวข้องกับพลังงานขนาดตัวอย่างขนาดผลกระทบส่วนเบี่ยงเบนมาตรฐานและระดับนัยสำคัญ ( แหล่งที่มา )

ภายใต้ชุดของสมมติฐานคุณสามารถกำหนดลักษณะแบบสำรวจของคุณเป็นแบบทดสอบและแตะลงในการออกแบบกรอบการทดสอบ ( ที่นี่มีตัวอย่างอยู่สองตัวอย่าง) มีการคาดเดาการศึกษาจำนวนมากที่ต้องทำ อย่างไรก็ตามโมเดลที่ไม่สมบูรณ์อาจดีกว่ารุ่นอื่นเลย


3

ฉันรู้สึกสองคำถาม หนึ่งในขนาดตัวอย่าง (25% ทำไมไม่ใช้เสียงข้างมาก) และอีกอันเกี่ยวกับเทคนิคการสุ่มตัวอย่าง (มันสุ่มอย่างแท้จริงตัวอย่าง 25% สุ่มจาก บริษัท ทั้งหมดตัวอย่าง 25% สุ่มในทุกแผนกหรือใช้การกระจายอื่น ๆ )

1) ขนาดตัวอย่างไม่จำเป็นต้องเป็นเสียงส่วนใหญ่ ขนาดตัวอย่างที่ต้องการสามารถอยู่ระหว่าง 0 ถึง 100% ขึ้นอยู่กับความถูกต้องที่จำเป็นสำหรับอัตราส่วนความเชื่อมั่นหรือความน่าจะเป็นที่กำหนด

ไม่เคยได้รับความแน่นอน 100% (เช่นเดียวกับเซตย่อย 50% หรือใหญ่กว่า) การได้รับความแม่นยำสูงนั้นไม่ใช่จุดของการสุ่มตัวอย่างและการประมาณ

ดูเพิ่มเติมเกี่ยวกับขนาดตัวอย่าง: https://en.wikipedia.org/wiki/Sample_size_determination

หากคุณได้รับกฎจำนวนมากคุณอาจมีความคิดที่เข้าใจง่าย

การกระจายของค่าเฉลี่ยของชุดย่อยที่เป็นไปได้ทั้งหมด (และตัวอย่างของคุณจะเป็นหนึ่งในชุดย่อยเหล่านี้) จะเล็กลงและใกล้เคียงกับค่าเฉลี่ยของการแจกแจงเริ่มต้นมากขึ้นหากขนาดของชุดย่อยเพิ่มขึ้น หากคุณเลือกบุคคลหนึ่งมีโอกาสที่สมเหตุสมผลที่คุณจะพบข้อยกเว้น แต่การค้นหาข้อยกเว้นเดียวกันในทิศทางเดียวกันนั้นมีโอกาสน้อยกว่า ดังนั้นขนาดของเซตย่อยที่ใหญ่ขึ้นจะยิ่งมีโอกาสของเซตย่อยที่น้อยลง

n

โน๊ตสำคัญ! การประมาณของคุณจะไม่ขึ้นอยู่กับขนาดของประชากรที่คุณสุ่มตัวอย่าง แต่ขึ้นอยู่กับการกระจายตัวของประชากรนั้น

ในกรณีของแผนกขนาด 500 ของคุณ ค่าเบี่ยงเบนของค่าเฉลี่ยของชุดย่อยแบบสุ่ม (ขนาด 125) จะเล็กกว่าค่าเบี่ยงเบนดั้งเดิม 11 เท่า โปรดทราบว่าข้อผิดพลาดในการวัด (ส่วนเบี่ยงเบนของค่าเฉลี่ยของชุดย่อยที่เลือกแบบสุ่ม) เป็นอิสระจากขนาดของแผนก อาจเป็น 500, 5,000, หรือ 50000 ในทุกกรณีการประมาณการจะไม่ได้รับผลกระทบตราบใดที่มีการแจกแจงแบบเดียวกัน (ตอนนี้แผนกเล็ก ๆ อาจมีการกระจายตัวแปลก ๆ แต่ก็เริ่มหายไปสำหรับกลุ่มใหญ่)

2) การสุ่มตัวอย่างไม่จำเป็นต้องสุ่มอย่างสมบูรณ์ คุณสามารถนำข้อมูลประชากรเข้าบัญชีได้

ในที่สุดคุณจะปฏิบัติต่อแต่ละแผนกแยกกันในการวิเคราะห์ประเภทนี้และแก้ไขความแปรปรวนระหว่างแผนกต่างๆและวิธีที่คุณสุ่มตัวอย่างในแผนกเหล่านี้ขนาดต่างกัน

ในการแก้ไขนี้มีความแตกต่างที่สำคัญสองประการ หนึ่งอาจสันนิษฐานว่าการกระจายระหว่างกลุ่มเป็นตัวแปรสุ่มหรือไม่ หากคุณปฏิบัติต่อมันเป็นตัวแปรสุ่มการวิเคราะห์ก็จะรุนแรงขึ้น (นำองศาความเป็นอิสระในแบบจำลองออกไป) แต่อาจเป็นข้อสันนิษฐานที่ผิดถ้ากลุ่มต่าง ๆ ไม่สามารถแลกเปลี่ยนกันได้เป็นเอนทิตีแบบสุ่มที่ไม่มีผลเฉพาะ กรณีของคุณเนื่องจากฉันจินตนาการว่าแผนกมีหน้าที่แตกต่างกันและอาจมีความรู้สึกที่แตกต่างกันอย่างกว้างขวางซึ่งไม่ได้สุ่มในความสัมพันธ์กับแผนก)


1
ขอบคุณสำหรับคำตอบ อย่างไรก็ตามและนี่คือการละเว้นของฉันไม่มีการบังคับใช้การสำรวจ จะมีเพียง 25% เท่านั้นที่จะถูกถาม แต่พวกเขาไม่จำเป็นต้องตอบกลับ
โคลิน

1
จากนั้นมีคำถามที่สามเพิ่มเติมเกี่ยวกับเทคนิคการสุ่มตัวอย่างและวิธีการรวบรวมข้อมูล สำหรับปัญหาดังกล่าววิธีจัดการกับการไม่ตอบสนองและด้านคุณภาพอื่น ๆ ของข้อมูลนั้นไม่มีคำตอบเดียว ไม่ว่าในกรณีใด (ไม่ว่าจะขอ 50% หรือ 25%) หากมีปัญหาใหญ่กับการตอบสนองการสนทนาใด ๆเกี่ยวกับการวิเคราะห์ทางสถิตินั้นมีความสำคัญรอง คุณจะไม่ปรับปรุงการศึกษานี้ด้วย การสุ่มตัวอย่างมากขึ้น (เช่นถาม> 50%) และเป็นการดีกว่าที่จะมุ่งเน้นไปที่การสุ่มตัวอย่างที่ดี
Sextus Empiricus

2

คำถามของคุณเกี่ยวกับขนาดตัวอย่างสำหรับประชากร จำกัด แต่สิ่งแรกที่คุณต้องการคือขนาดตัวอย่างที่ต้องการในประชากรที่ไม่มีที่สิ้นสุดซึ่งสามารถใช้ในการคำนวณขนาดตัวอย่างสำหรับประชากรที่มี จำกัด

n=(z2pq)/d2
n
z2
p
q=1p
d2

(1.96×0.5×0.5)/0.032=1,068

m=n/(1+((n1)/N))
m
n
N

N=1,0001068/(1+((10681)/1000))=517

หากคุณใช้ 25% ของประชากรระดับข้อผิดพลาดจะออกมาเป็น 5.4% ระดับข้อผิดพลาดนี้อาจใช้ได้ตามแบบสำรวจก่อนหน้า ด้วยการสำรวจจะมีการแลกเปลี่ยนระหว่างระดับของข้อผิดพลาดที่คุณยินดีที่จะยอมรับและค่าใช้จ่ายในการทำแบบสำรวจ

517/0.65=796

สิ่งต่าง ๆ มีความซับซ้อนมากขึ้นถ้าคุณต้องการแบ่งประชากรตามแผนก (รู้จักกันในชื่อการแบ่งชั้น) โดยทั่วไปคุณต้องปฏิบัติต่อแต่ละแผนกในฐานะประชากรแยกต่างหากหากคุณต้องการให้ข้อมูลมีความถูกต้องสำหรับแต่ละแผนกซึ่งอาจไม่สามารถนำไปใช้ได้จริง แต่คุณสามารถทำตัวอย่างแบบแบ่งชั้นแบบสุ่มแทนแบบสุ่มแบบง่าย ๆ โดยที่ 50% ของกลุ่มตัวอย่างจะถูกสุ่มเลือกจากแผนกที่มีประชากร 50% และเปอร์เซ็นต์ที่เหมาะสมจะถูกสุ่มจากแผนกอื่น หมายความว่าขนาดตัวอย่างของคุณจะเพิ่มขึ้นเล็กน้อยเนื่องจากคุณต้องปัดเศษทศนิยมทั้งหมดขึ้น (คุณไม่สามารถสำรวจ 0.1 คน) อย่างไรก็ตามผลลัพธ์ควรได้รับการตรวจสอบในระดับประชากร (บริษัท ) และไม่ได้อยู่ในระดับแผนกเพราะจะไม่มีการตอบสนองที่เพียงพอจากแต่ละแผนกเพื่อความถูกต้อง


1

ในขณะที่พูดถึงตัวอย่างที่ถูกต้องความคิดพื้นฐานมักจะเป็นหนึ่งในตัวแทน ตัวอย่าง "แสดง" ประชากรเพียงพอหรือไม่ เพื่อให้ได้ตัวอย่างตัวแทนเราต้องแน่ใจว่าขนาดตัวอย่างเพียงพอ (เพื่อลดความแปรปรวนของค่าประมาณ) และกลุ่มตัวอย่างประกอบด้วยสมาชิกที่เป็นสมาชิกของกลุ่มย่อยของประชากรที่แสดงพฤติกรรมที่แตกต่างกัน ภายใต้การพิจารณา

ก่อนอื่นสัดส่วนของผู้ใช้ที่เลือกสำหรับการสำรวจมีความสำคัญน้อยกว่าเมื่อเปรียบเทียบกับจำนวนผู้ใช้ที่เลือก ขนาดตัวอย่างที่ต้องการจะขึ้นอยู่กับความต้องการของความถูกต้องหรือช่วงความมั่นใจในคำตอบที่ได้รับ คุณสามารถอ่านนี้บทความสำหรับข้อมูลเพิ่มเติม

คุณพูดถึงว่า บริษัท ประกอบด้วยหลายแผนก มีความเป็นไปได้หรือไม่ที่หน่วยงานจะแตกต่างกันไปตามการตอบแบบสำรวจ? ถ้าพวกเขาทำ (หรือคุณไม่รู้แน่) มันจะเป็นความคิดที่ดีที่จะ "แบ่งชั้น" ตัวอย่างของคุณข้ามแผนก ในรูปแบบที่ง่ายที่สุดนั่นหมายถึงการเลือกสัดส่วนที่เท่าเทียมกันของผู้คนจากทุกแผนก เช่นขนาดของ บริษัท คือ 1,000 และขนาดตัวอย่างที่เลือกคือ 100 จากนั้นคุณจะเลือก 50 จากแผนกขนาด 500, 10 จากแผนกขนาด 100 ฯลฯ เพื่อหลีกเลี่ยงการแสดงแผนกในแผนกใด ตัวอย่าง "สุ่ม" ใด ๆ ที่เฉพาะเจาะจง

คุณยังพูดถึงว่าทุกคนไม่สามารถตอบแบบสำรวจ ถ้าคุณรู้ว่าคนประมาณครึ่งหนึ่งจะตอบกลับดังนั้นเพื่อให้ได้ 100 คำตอบคุณจะต้องส่งแบบสำรวจไปยัง 200 คน คุณจะต้องพิจารณาความเป็นไปได้ที่คำตอบนั้นอาจมีอคติ คนที่มีคำตอบเฉพาะอาจมีแนวโน้มที่จะตอบมากกว่าหรือน้อยกว่า


1

หากเป็นการเลือกแบบสุ่มอย่างแท้จริงของฐานพนักงานทั้งหมดจะเป็นอย่างไรตัวอย่างที่ถูกต้องทางสถิติที่สมมติว่าพนักงานทุกคนตอบสนองอย่างไร

มันเป็นตัวอย่างที่ถูกต้องตราบใดที่มันถูกดึงมาจากประชากรที่มีไว้เพื่ออธิบาย นั่นคือถ้าคุณเป็นแค่ตัวอย่างหัวหน้าเท่านั้นไม่มีอะไรสามารถพูดได้เกี่ยวกับพนักงานคนอื่น ๆ ที่จะไม่เกิดขึ้นในการตั้งค่าที่คุณได้อธิบายไว้ อย่างไรก็ตามมันอาจเกิดขึ้นเนื่องจากการไม่ตอบสนอง (เพิ่มเติมเกี่ยวกับที่นี่ด้านล่าง)

หากเป็นการสุ่มในแต่ละแผนกเช่น 25% ของแต่ละแผนกเป็นอย่างไรตัวอย่างที่ถูกต้องเมื่อพิจารณาจากหนึ่งแผนกมีมากกว่า 50% ของประชากรทั้งหมด

นี่ไม่ใช่คำถามของความถูกต้องของตัวอย่างอีกต่อไป แต่เป็นหนึ่งในข้อผิดพลาดในการสุ่มตัวอย่าง เห็นได้ชัดว่าการประมาณการที่แม่นยำที่สุดจะได้รับจากการสุ่มแบ่งชั้นแบบแบ่งชั้นที่ครอบคลุมอย่างน้อยระดับแผนก ในการตั้งค่าดังกล่าวคุณจะมีตัวอย่างที่ถูกต้องสำหรับแต่ละแผนก แต่โดยทั่วไปแล้วการประมาณการสำหรับแผนกขนาดเล็กจะมีความแม่นยำน้อยกว่าการประมาณการสำหรับแผนกขนาดใหญ่ด้วยขนาดตัวอย่างที่แน่นอนสูงกว่าสำหรับแผนกหลัง สำหรับองค์กรโดยรวมการแสดงตัวอย่างที่สูงขึ้นของแผนกที่ใหญ่กว่านั้นสะท้อนถึงความเป็นจริงขององค์กรและไม่ลดความถูกต้องของตัวอย่าง

การสำรวจไม่ได้บังคับใช้ ไม่สามารถรับประกันอัตราการตอบสนอง 100% จาก 25% ที่เลือก ไม่มีแรงจูงใจหรือบทลงโทษหากการสำรวจเป็นหรือไม่ได้กรอก

คุณจะไม่สามารถบังคับให้ทุกคนให้คำตอบที่ดี แต่การดำเนินการตามแผนเตือนความจำเป็นขั้นต่ำ นอกจากนี้คุณควรอธิบายความเกี่ยวข้องของแบบสำรวจต่อพนักงานและผลกระทบที่มีต่อองค์กรด้วยการสำรวจเช่นเมื่อมีการเผยแพร่ผลลัพธ์เมื่อใด องค์กรมีการดำเนินการอย่างไรบ้างจากการสำรวจ? ทำไมแต่ละคำตอบถึงมีความหมาย?

เมื่อรวบรวมข้อมูลแล้วการไม่ตอบสนองเป็นปัญหาที่ควรได้รับการจัดการ การจัดการกับมันหมายความว่าคุณควรวิเคราะห์พฤติกรรมที่ไม่ตอบสนองเพื่อตรวจหารูปแบบที่อาจเกิดขึ้น: ไม่มีหัวหน้าตอบกลับหรือไม่? แผนกที่ให้มาไม่ตอบสนองเลยใช่ไหม จากนั้นนำกลยุทธ์ที่จำเป็นมาใช้ (โพสต์ strafification, reweighting, imputation เป็นต้น)


1

ฉันกำลังขยายคำตอบของ @ICannotFix นี่คือตัวอย่างเกี่ยวกับปัจจัยสี่ประการที่เกี่ยวข้อง:

  1. ขนาดของเอฟเฟกต์
  2. ค่าเบี่ยงเบนมาตรฐานของคุณลักษณะ
  3. ขนาดตัวอย่างใหญ่ขึ้น
  4. ต้องการระดับความสำคัญ

ปัจจัยเหล่านี้ส่งผลต่อผลลัพธ์ของคุณจะขึ้นอยู่กับสถิติที่คุณใช้ ตัวอย่างเช่นถ้าคุณต้องการที่จะคาดเดาความหมายของตัวแปรบางอย่างที่คุณอาจจะใช้การทดสอบ T ของนักเรียน

สมมติว่าคุณต้องการทราบความสูงเฉลี่ยของพนักงานด้วยแบบสำรวจนี้ คุณไม่ทราบว่าค่าเบี่ยงเบนมาตรฐานของความสูงของพนักงานทุกคนใน บริษัท ของคุณ (โดยไม่ต้องวัดทุกคน) แต่คุณสามารถทำวิจัยและคาดเดาได้ที่ 3 นิ้ว (ประมาณค่าเบี่ยงเบนมาตรฐานของความสูงสำหรับผู้ชายในสหรัฐอเมริกา)

หากคุณสำรวจเพียง 5 คนดังนั้น 95% ของเวลาที่ความสูงเฉลี่ยที่คุณสังเกตในแบบสำรวจของคุณจะอยู่ในระยะ 3.72 นิ้วของความสูงเฉลี่ยจริง

ตอนนี้ปัจจัยของเรามีผลกับสิ่งนี้อย่างไร:

  1. หากคุณต้องการทราบความสูงเฉลี่ยอย่างแม่นยำมาก (เช่นขนาดของเอฟเฟกต์เล็กมาก) คุณจะต้องมีตัวอย่างจำนวนมาก ตัวอย่างเช่นหากต้องการทราบความสูงเฉลี่ยจริงภายใน 2.66 นิ้วคุณจะต้องสำรวจคน 100 คน

  2. หากค่าเบี่ยงเบนมาตรฐานมีขนาดใหญ่ความแม่นยำที่คุณจะได้รับจะถูก จำกัด หากค่าเบี่ยงเบนมาตรฐานคือ 6 นิ้วแทนที่จะเป็น 3 นิ้วและคุณยังมี 5 คำตอบคุณจะรู้ได้เพียง 7.44 นิ้วแทนที่จะเป็น 3.72 นิ้วสำหรับความสูงเฉลี่ยจริง

  3. ข้ามประเด็นนี้ไปเนื่องจากเป็นจุดสนใจของการสนทนาทั้งหมด

  4. หากคุณต้องการให้แน่ใจว่าคุณมีคำตอบที่ถูกต้องคุณจะต้องสำรวจผู้คนมากขึ้น ในตัวอย่างของเราเราเห็นว่าด้วย 5 คำตอบเราสามารถทำได้ภายใน 3.72 นิ้ว 95% ของเวลา หากเราต้องการให้แน่ใจว่าคำตอบของเราอยู่ในช่วงที่ถูกต้อง 99% ของเวลาแล้วช่วงของเราจะเป็น 6.17 นิ้วและไม่ใช่ 3.72 นิ้ว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.