ใช่คุณควรคาดหวังทั้งสองตัวอย่าง (ไม่ถ่วงน้ำหนักเทียบกับถ่วงน้ำหนัก) เพื่อให้ผลลัพธ์เดียวกัน
ฉันได้นำอัลกอริธึมทั้งสองมาจากบทความ Wikipedia
อันนี้ใช้ได้ผล:
หากทั้งหมดของxผมถูกดึงมาจากการกระจายเดียวกันและน้ำหนักจำนวนเต็มWผมบ่งบอกถึงความถี่ของการเกิดขึ้นในตัวอย่างแล้วประมาณเป็นกลางของประชากรแปรปรวนถ่วงน้ำหนักโดย:
s2 = 1V1- 1Σยังไม่มีข้อความi = 1Wผม( xผม- μ* * * *)2,
อย่างไรก็ตามอันนี้ (ใช้น้ำหนักเศษส่วน) ไม่ทำงานสำหรับฉัน:
หากว่าแต่ละคน xผม1 / wผม
s2 = V1V21-โวลต์2Σยังไม่มีข้อความi = 1Wผม(xผม-μ* * * *)2
ฉันยังคงตรวจสอบสาเหตุที่สมการที่สองไม่ทำงานตามที่ตั้งใจไว้
/ แก้ไข: พบสาเหตุที่สมการที่สองไม่ทำงานอย่างที่ฉันคิด: คุณสามารถใช้สมการที่สองได้ก็ต่อเมื่อคุณมีน้ำหนักปกติหรือความแปรปรวน ("ความน่าเชื่อถือ") และมันไม่ได้มีความเป็นกลางเพราะถ้าคุณไม่ ใช้น้ำหนัก "ซ้ำ" (นับจำนวนครั้งที่การสังเกตถูกสังเกตและควรทำซ้ำในการดำเนินการทางคณิตศาสตร์ของคุณ) คุณสูญเสียความสามารถในการนับจำนวนการสังเกตทั้งหมดและทำให้คุณไม่สามารถใช้ปัจจัยการแก้ไขได้
ดังนั้นสิ่งนี้จะอธิบายความแตกต่างในผลลัพธ์ของคุณโดยใช้ความแปรปรวนแบบถ่วงน้ำหนักและไม่ถ่วงน้ำหนัก: การคำนวณของคุณมีความเอนเอียง
ดังนั้นหากคุณต้องการความแปรปรวนแบบถ่วงน้ำหนักให้ใช้น้ำหนัก "ซ้ำ" เท่านั้นและใช้สมการแรกที่ฉันโพสต์ไว้ด้านบน หากไม่สามารถทำได้คุณก็ช่วยไม่ได้
ฉันได้อัปเดตบทความของ Wikipedia แล้วหากคุณต้องการข้อมูลเพิ่มเติม:
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
และบทความที่เชื่อมโยงเกี่ยวกับความแปรปรวนร่วมแบบถ่วงน้ำหนักที่เป็นกลาง (ซึ่งอันที่จริงคือความแปรปรวนเดียวกันเนื่องจากตัวตนโพลาไรเซชัน ):
สมการที่ถูกต้องสำหรับความแปรปรวนร่วมแบบถ่วงน้ำหนักที่เป็นกลาง