ฉันพยายามที่จะเข้าใจความแปรปรวนร่วมของตัวแปรสุ่มสองตัวที่ดีขึ้นและเข้าใจว่าคนแรกที่นึกถึงมันมาถึงคำจำกัดความที่ใช้เป็นประจำในสถิติ ฉันไปวิกิพีเดียเพื่อทำความเข้าใจให้ดีขึ้น จากบทความดูเหมือนว่าการวัดหรือปริมาณผู้สมัครที่ดีสำหรับควรมีคุณสมบัติดังต่อไปนี้:
- มัน shoukd มีสัญญาณเชิงบวกเมื่อตัวแปรสุ่มสองตัวมีความคล้ายคลึงกัน (เช่นเมื่อเพิ่มอีกอันหนึ่งทำกับและเมื่อหนึ่งลดลงอีกหนึ่งทำเช่นกัน)
- นอกจากนี้เรายังต้องการให้มันมีเครื่องหมายลบเมื่อตัวแปรสุ่มสองตัวมีลักษณะตรงข้ามกัน (เช่นเมื่อหนึ่งตัวแปรที่เพิ่มขึ้นแบบสุ่มมีแนวโน้มลดลง)
- สุดท้ายเราต้องการให้ปริมาณความแปรปรวนร่วมนี้เป็นศูนย์ (หรืออาจน้อยมาก?) เมื่อตัวแปรสองตัวนั้นเป็นอิสระจากกัน (เช่นพวกมันไม่ได้แปรผันตามกัน)
จากคุณสมบัติข้างต้นเราต้องการกำหนดY) คำถามแรกของฉันคือมันไม่ชัดเจนเลยสำหรับฉันว่าทำไมตอบสนองคุณสมบัติเหล่านั้น จากคุณสมบัติที่เรามีฉันจะคาดหวังมากกว่าของสมการเหมือนอนุพันธ์ "ที่จะเป็นผู้สมัครในอุดมคติ ตัวอย่างเช่นมีอะไรเพิ่มเติมเช่น "ถ้าการเปลี่ยนแปลงในเชิงบวก X แล้วการเปลี่ยนแปลงใน Y ก็ควรจะเป็นบวก" นอกจากนี้ทำไมการแตกต่างจากสิ่งที่ถูกต้องหมายถึงทำอะไรC o v ( X , Y ) = E [ ( X - E [ X ] ) ( Y - E [ Y ] ) ]
คำถามที่น่าสนใจ แต่ยังน่าสนใจมีนิยามที่แตกต่างกันซึ่งอาจทำให้คุณสมบัติเหล่านั้นเป็นที่พอใจและยังคงมีความหมายและมีประโยชน์หรือไม่? ฉันถามสิ่งนี้เพราะดูเหมือนว่าไม่มีใครถามว่าทำไมเราถึงใช้คำจำกัดความนี้ตั้งแต่แรก (มันให้ความรู้สึกเหมือนมัน "เป็นแบบนี้เสมอ" ซึ่งในความคิดของฉันเป็นเหตุผลที่แย่มากและเป็นอุปสรรคต่อวิทยาศาสตร์และ ความอยากรู้ทางคณิตศาสตร์และการคิด) คำจำกัดความที่เป็นที่ยอมรับคือคำนิยามที่ดีที่สุดที่เรามีหรือไม่?
นี่คือความคิดของฉันเกี่ยวกับสาเหตุที่คำจำกัดความที่ยอมรับนั้นสมเหตุสมผล (เป็นเพียงอาร์กิวเมนต์ที่เข้าใจง่าย):
ให้แตกต่างจากตัวแปร X (เช่นเปลี่ยนจากค่าบางค่าเป็นค่าอื่น ๆ ในบางครั้ง) ในทำนองเดียวกันสำหรับกำหนด\
สำหรับหนึ่งอินสแตนซ์ในเวลาเราสามารถคำนวณว่าพวกเขาเกี่ยวข้องหรือไม่โดยทำ:
มันค่อนข้างดี! สำหรับอินสแตนซ์หนึ่งครั้งมันตรงตามคุณสมบัติที่เราต้องการ หากพวกเขาทั้งคู่เพิ่มขึ้นพร้อมกันส่วนใหญ่ปริมาณที่กล่าวข้างต้นควรจะเป็นค่าบวก (และในทำนองเดียวกันเมื่อพวกเขามีลักษณะตรงข้ามกันก็จะเป็นค่าลบเนื่องจากจะมีสัญญาณตรงกันข้าม)
แต่นั่นให้ปริมาณที่เราต้องการเพียงครั้งเดียวและเนื่องจากพวกมันเป็น rv เราอาจมีน้ำหนักเกินถ้าเราตัดสินใจที่จะยึดความสัมพันธ์ของตัวแปรสองตัวตามการสังเกตเพียง 1 ครั้ง แล้วทำไมไม่ลองใช้ความคาดหวังนี้ดูผลิตภัณฑ์ "เฉลี่ย" ของความแตกต่าง
ซึ่งควรจะจับโดยเฉลี่ยว่าความสัมพันธ์โดยเฉลี่ยดังที่นิยามไว้ข้างต้น! แต่ปัญหาเดียวที่คำอธิบายนี้มีคืออะไรเราวัดความแตกต่างนี้ได้อย่างไร ซึ่งดูเหมือนว่าจะได้รับการแก้ไขด้วยการวัดความแตกต่างนี้จากค่าเฉลี่ย (ซึ่งด้วยเหตุผลบางอย่างก็เป็นสิ่งที่ควรทำ)
ผมคิดว่าปัญหาหลักที่ฉันมีกับความหมายคือการรูปแบบแตกต่างค่าเฉลี่ย ฉันดูเหมือนจะไม่สามารถพิสูจน์ให้เห็นว่าตัวเองยัง
การตีความหมายของสัญลักษณ์สามารถทิ้งไว้กับคำถามอื่นได้เนื่องจากดูเหมือนว่าจะเป็นหัวข้อที่ซับซ้อนมากขึ้น