'ข้อมูลพูล' หมายถึงอะไร?


16

ฉันคิดว่า 'การรวมข้อมูล' หมายถึงเพียงการรวมข้อมูลที่เคยแบ่งออกเป็นหมวดหมู่ ... โดยพื้นฐานแล้วไม่สนใจหมวดหมู่และทำให้ชุดข้อมูล 'สระว่ายน้ำ' ขนาดยักษ์หนึ่งชุด ฉันเดาว่านี่เป็นคำถามเกี่ยวกับคำศัพท์มากกว่าการใช้สถิติ

ตัวอย่างเช่นฉันต้องการเปรียบเทียบไซต์ 2 แห่งและในแต่ละไซต์ฉันมีไซต์สองปี (ดีและแย่) หากฉันต้องการเปรียบเทียบ 'โดยรวม' ทั้งสองไซต์ (นั่นคือไม่สนใจประเภทปี) ถูกต้องหรือไม่ที่จะบอกว่าฉันรวมข้อมูลภายในแต่ละไซต์ นอกจากนั้นเนื่องจากข้อมูลหลายปีประกอบด้วยประเภทปีที่ดีและไม่ดีถูกต้องหรือไม่ที่จะบอกว่าฉันรวบรวมข้อมูลระหว่างปีเพื่อให้ได้ชุดข้อมูล 'ปีที่ดี' และ 'ปีที่ไม่ดี' ภายในแต่ละไซต์ ขอบคุณสำหรับความช่วยเหลือของคุณ! Mog

คำตอบ:


13

ใช่ตัวอย่างของคุณถูกต้อง

Oxford English Dictionary ให้นิยามพูลเป็น:

สระว่ายน้ำ, v.

(Pul)

1.1 รายการ เพื่อโยนหุ้นสามัญหรือกองทุนที่จะแจกจ่ายตามข้อตกลง เพื่อรวม (ทุนหรือผลประโยชน์) เพื่อประโยชน์ร่วมกัน ข้อมูลจำเพาะ การแข่งขันของ บริษัท รถไฟ ฯลฯ : เพื่อแชร์หรือหาร (การจราจรหรือใบเสร็จรับเงิน)

อีกตัวอย่างหนึ่งคือ:

คุณวัดระดับเลือดของสาร X ในเพศชายและเพศหญิง คุณไม่เห็นความแตกต่างทางสถิติระหว่างสองกลุ่มเพื่อให้คุณรวมข้อมูลเข้าด้วยกันโดยไม่สนใจเพศของหัวข้อทดลอง

ไม่ว่าจะถูกต้องทางสถิติหรือไม่นั้นขึ้นอยู่กับแต่ละกรณี


12

การรวมกำไรสามารถอ้างถึงการรวมข้อมูล แต่ยังสามารถอ้างถึงการรวมข้อมูลมากกว่าข้อมูลดิบ การใช้งานร่วมกันที่พบบ่อยที่สุดอย่างหนึ่งคือการประมาณค่าความแปรปรวน หากเราเชื่อว่าประชากร 2 คนมีความแปรปรวนเหมือนกัน แต่ไม่ใช่ค่าเฉลี่ยที่ไม่จำเป็นเดียวกันจากนั้นเราสามารถคำนวณการประมาณค่าความแปรปรวน 2 จากกลุ่มตัวอย่างของ 2 กลุ่มจากนั้นรวมกลุ่มพวกเขา (ใช้ค่าเฉลี่ยถ่วงน้ำหนัก) เพื่อให้ได้ค่าประมาณเดียว ความแปรปรวนทั่วไป เราไม่ได้คำนวณค่าความแปรปรวนเดี่ยวจากข้อมูลรวมเนื่องจากถ้าค่าเฉลี่ยไม่เท่ากันจะทำให้ค่าประมาณความแปรปรวนเพิ่มขึ้น


ขอบคุณ @Greg เพื่อชี้แจง (เพราะฉันกำลังพยายามรวมความแปรปรวนรวมทั้งจากวรรณกรรม) สิ่งที่คุณกำลังพูดคือการได้รับความแปรปรวน 'เฉลี่ย' สำหรับประชากรหลายกลุ่มฉันสามารถหาค่าความแปรปรวนที่คำนวณได้หรือไม่ ฉันจะถ่วงน้ำหนักผลต่างเหล่านั้นได้อย่างไร ไม่ใช่ประชากรแต่ละคน = 1 ใช่ไหม
Mog

หากขนาดตัวอย่างเท่ากันค่าเฉลี่ยง่าย ๆ ก็มีแนวโน้มที่จะทำงาน โดยทั่วไปเราให้น้ำหนักเท่ากับจุดข้อมูลแต่ละสูตรมาตรฐานคือการคูณแต่ละความแปรปรวนโดยองศาอิสระ (หรือจำนวนในส่วนสำหรับกว่ากลุ่ม n-1) จากนั้นรวมชิ้นส่วนทั้งหมดแล้วหารด้วยผลรวมของ องศาอิสระ (ทั้งหมด n_i-1)
เกร็กสโนว์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.