ทำไมเราไม่ใช้ค่าเฉลี่ยถ่วงน้ำหนักแทนค่าเฉลี่ยฮาร์มอนิก


12

ฉันสงสัยว่าอะไรคือคุณค่าที่แท้จริงของการใช้ค่าเฉลี่ยฮาร์มอนิก (ตัวอย่างเช่นการคำนวณค่า F- มาตรการ) ซึ่งต่างจากค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักในการรวมความแม่นยำและการเรียกคืน? ฉันคิดว่าค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสามารถเล่นบทบาทของค่าเฉลี่ยฮาร์มอนิกได้หรือฉันขาดอะไรไป?


9
ค่าเฉลี่ยฮาร์โมนิเป็นค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักแต่ละมีสัดส่วนน้ำหนัก 2 1 / x 2 ixi1/xi2
whuber

คุณช่วยพูดเพิ่มเกี่ยวกับความแม่นยำและการเรียกคืนในแบบนี้ได้อย่างไร
AdamO

6
@whuber ไม่แน่ใจว่าความคิดเห็นของคุณจริงจังหรือไม่ น้ำหนักมักจะสันนิษฐานว่าจะเป็นฟังก์ชั่นของตัวอย่างดัชนีไม่ได้ของกลุ่มตัวอย่างค่า มิฉะนั้นค่าเฉลี่ยใด ๆคือค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก
Luis Mendo

2
@Luis ความจริงอยู่ระหว่าง ดัชนีตัวอย่างมักไม่มีความหมาย น้ำหนักเป็นฟังก์ชั่นของวัตถุ แต่โดยทั่วไปแล้วฟังก์ชั่นเหล่านั้นจะไม่ขึ้นอยู่กับค่าเฉลี่ย ตัวอย่างคือน้ำหนักที่สัมพันธ์กับเวลา (EWMA) โดยมีที่ตั้ง (ในการวัดความสัมพันธ์เชิงพื้นที่) อันดับ (ในการทดสอบ Shapiro-Wilk) และการสุ่มตัวอย่างที่น่าจะเป็น แต่ไม่ใช่ว่าทุกคนจะมีน้ำหนัก AMs: GM ไม่เช่น เนื่องจากฟีลิปปาถามเกี่ยวกับ "คุณค่าของคำสั่ง" ดูเหมือนว่าจะเป็นการชี้ให้เห็นความสัมพันธ์ทางคณิตศาสตร์ระหว่างค่าเฉลี่ยฮาร์มอนิกและค่าเฉลี่ยถ่วงน้ำหนัก
whuber

คำตอบ:


18

โดยทั่วไปแล้วค่าฮาร์มอนิกจะเหมาะสมกว่าเมื่อเราพยายามหาอัตราเฉลี่ยแทนที่จะเป็นจำนวนเต็ม ในกรณีของการวัด F1 ค่าเฉลี่ยฮาร์มอนิกจะลงโทษพื้นที่ขนาดเล็กมากหรือเรียกคืนในขณะที่ค่าเฉลี่ยเลขคณิตที่ไม่ถ่วง ลองจินตนาการถึงค่าเฉลี่ย 100% และ 0%: ค่าเฉลี่ยเลขคณิตคือ 50% และค่าเฉลี่ยฮาร์มอนิกคือ 0% ค่าเฉลี่ยฮาร์มอนิกนั้นต้องการทั้งความแม่นยำและความแม่นยำสูง

นอกจากนี้เมื่อความแม่นยำและการเรียกคืนอยู่ใกล้กันค่าเฉลี่ยฮาร์มอนิกจะใกล้เคียงกับค่าเฉลี่ยเลขคณิต ตัวอย่าง: ค่าเฉลี่ยฮาร์มอนิกของ 95% และ 90% คือ 92.4% เมื่อเทียบกับค่าเฉลี่ยเลขคณิตของ 92.5%

ไม่ว่าจะเป็นคุณสมบัติที่พึงประสงค์อาจขึ้นอยู่กับกรณีการใช้งานของคุณ แต่โดยทั่วไปถือว่าดี

สุดท้ายโปรดทราบว่าตามที่ @whuber ระบุไว้ในความคิดเห็นค่าเฉลี่ยฮาร์มอนิกนั้นเป็นค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก


2
"ฮาร์มอนิกหมายถึงเป็นที่ต้องการเมื่อพยายามอัตราเฉลี่ย" บางทีถ้าคุณเดินทางกม. ที่กม. / ชม. และกม. กลับมาที่กม. / ชม. เพื่อรับความเร็วโดยรวมเฉลี่ยกม. / ชม. เดินทางนาทีที่กม. / ชม. และนาทีที่กม. / ชม. เพื่อรับความเร็วโดยรวมกม. / ชม. แต่ฉันไม่เห็นสาเหตุที่นำไปใช้กับเศษส่วน1012010608010120106090
เฮนรี่

อันที่จริงวรรคแรกเป็นคำแถลงทั่วไปเกี่ยวกับค่าเฉลี่ยฮาร์มอนิก แต่คุณถูกต้องแม่นยำและเรียกคืนเป็นเศษส่วนและไม่ใช่อัตรา ฉันเชื่อว่ามีความคิดว่าค่าเฉลี่ยเลขคณิตเป็นที่ต้องการสำหรับค่าที่มีผลรวมที่ตีความได้ (ซึ่งจะไม่นำไปใช้ในกรณีนี้) แต่แน่นอนว่าเราสามารถใช้ค่าเฉลี่ยความแม่นยำทางคณิตศาสตร์และความจำและเอาท์พุทผลลัพธ์ที่เป็นประโยชน์
ilanman

ยอดเยี่ยม ฉันกำลังมองหา "เหตุผล" มากขึ้นสำหรับการใช้กฎค่าเฉลี่ยฮาร์มอนิก แต่ฉันไม่แน่ใจว่าจะคิดเกี่ยวกับความชอบธรรมได้อย่างไร ..
olga

10

ค่าเฉลี่ยฮาร์มอนิกอาจใช้แทนค่าเลขคณิตได้อย่างสะดวกเมื่อไม่มีความคาดหวังหรือความแปรปรวน อาจเป็นกรณีที่ไม่มีอยู่จริงหรือไม่มีที่สิ้นสุดในขณะที่มีอยู่ ยกตัวอย่างเช่นการกระจาย Pareto ด้วยความหนาแน่นไม่มีขอบเขตแน่นอน ความคาดหวังเมื่อซึ่งหมายความว่าค่าเฉลี่ยเลขคณิตมีความคาดหวังที่ไม่มีที่สิ้นสุดในขณะที่ซึ่งหมายความว่าค่าเฉลี่ยฮาร์มอนิกมีความคาดหวัง จำกัดE[X]E[1/X]

f(x)=αx0αxα+1Ixx0
α1
E[1/X]=x0αx0αxα+2dx=αx0α(α+1)x0α+1=α(α+1)x0

ตรงกันข้ามมีการกระจายที่ค่าเฉลี่ยฮาร์โมนิไม่เคยมีใครคาดหวังเป็นเช่นเบต้ากระจายเมื่อ\และอีกมากมายที่ไม่มีความแปรปรวนBe(α,β)α1

นอกจากนี้ยังมีการเชื่อมโยงกับ Monte Carlo เพื่อ integrals และโดยเฉพาะอย่างยิ่ง normalizing ค่าคงที่ตามตัวตนหลัง Bayesianโดยที่คือความหนาแน่นคือก่อนหน้าโอกาสและร่อแร่ตามที่กล่าวไว้ในคำถามอื่น ๆ ที่เกี่ยวกับการตรวจสอบ X ที่ฉันแสดงความคิดเห็นเกี่ยวกับอันตรายของการใช้สิ่งที่ราดโอนีล (U โตรอนโต) เรียกร้องที่เลวร้ายที่สุด Monte Carlo ประมาณการที่เคย (ฉันยังเขียนหลายรายการในบล็อกของฉันในหัวข้อนั้น) φ()π()L(|x)m()

E[φ(θ)π(θ)L(θ|x)|x]=1m(x)
φ()π()L(|x)m()

2
เหตุใดคุณสมบัติเหล่านี้จึงดีกว่าเมื่อหาอัตราเฉลี่ย
Walrus the Cat

ฉันไม่ทราบผลลัพธ์ที่ดีที่สุด แต่การมีตัวประมาณค่าที่มีความคาดหวัง จำกัด ดูเหมือนว่าจะดีกว่าหากไม่มี!
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.