ป.ร. ให้ไว้ ตัวเลขซึ่งค่าของแต่ละตัวเลขแตกต่างกันแสดงว่า และความน่าจะเป็นในการเลือกแต่ละตัวเลขคือ ตามลำดับ
ตอนนี้ถ้าฉันเลือก ตัวเลขขึ้นอยู่กับความน่าจะเป็นที่กำหนด อะไรคือความคาดหวังของผลรวมของสิ่งเหล่านั้น หมายเลข? โปรดทราบว่าการเลือกจะไม่มีการเปลี่ยนเพื่อให้ตัวเลขต้องไม่เกี่ยวข้องกับตัวเลขที่ซ้ำกัน ฉันเข้าใจว่าหากการเลือกนั้นมาพร้อมการเปลี่ยนความคาดหวังของผลรวมของ ตัวเลขเท่ากับ ที่ไหน
นอกจากนี้สิ่งที่เกี่ยวกับความคาดหวังของความแปรปรวนของเหล่านั้น หมายเลข?
ฉันเป็นนักเรียน CS PhD ที่กำลังทำงานกับปัญหาข้อมูลขนาดใหญ่และฉันไม่มีพื้นฐานทางสถิติ ฉันคาดหวังว่าใครบางคนสามารถให้สูตรฉันเป็นคำตอบได้ อย่างไรก็ตามหากคำตอบนั้นซับซ้อนเกินกว่าที่จะอธิบายโดยสูตรหรือการคำนวณอย่างเข้มข้นต้องมีส่วนเกี่ยวข้องคำตอบโดยประมาณนั้นเป็นที่ยอมรับโดยสิ้นเชิง
คุณสามารถสันนิษฐานได้ ที่นี่ค่อนข้างใหญ่และความน่าจะเป็นอาจแตกต่างกันมาก ในทางปฏิบัติค่าของความน่าจะเป็นเหล่านั้นมาจากบันทึกแบบสอบถามซึ่งบันทึกชุดของแบบสอบถามรวม ประเด็นก็คือความถี่ของแต่ละหมายเลขที่เกี่ยวข้องในแบบสอบถามอาจจะค่อนข้างเบาบางคือบางคนไม่ค่อยมีการสอบถามในขณะที่บางคนถามบ่อยมาก คุณสามารถสันนิษฐานได้ว่าการแจกแจงความน่าจะเป็นการแจกแจงแบบปกติการแจกแจง zipf หรือทางเลือกอื่นที่สมเหตุสมผล
การกระจายค่าเป็นเพียงส่วนย่อยที่ต่อเนื่องกันของการแจกแจงที่เป็นไปได้ใด ๆ กล่าวอีกนัยหนึ่งถ้าคุณมีฮิสโตแกรมที่แสดงถึงการกระจายที่แน่นอนตัวเลขทั้งหมดที่เกี่ยวข้องในปัญหานี้คือตัวเลขทั้งหมดในที่เก็บข้อมูลชุดเดียว
ในแง่ของค่า K คุณอาจคิดว่ามันน้อยกว่าจำนวนขององค์ประกอบที่ถูกถามบ่อย