ทำไมคะแนน f เบต้ากำหนดเบต้าเช่นนั้น


10

นี่คือคะแนน F เบต้า:

Fβ=(1+β2)พีRอีผมsผมโอnRอีaล.ล.(β2พีRอีผมsผมโอn)+Rอีaล.ล.

วิกิพีเดียบทความระบุว่าF_Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

ฉันไม่ได้รับความคิด ทำไมนิยามเช่นนั้น ฉันสามารถกำหนดแบบนี้:F ββFβ

Fβ=(1+β)พีRอีผมsผมโอnRอีaล.ล.(βพีRอีผมsผมโอn)+Rอีaล.ล.

และวิธีการแสดงβ times as much importance?


2
ตรวจสอบคำตอบใหม่ด้านล่างที่มีแคลคูลัสความแตกต่างอยู่ที่ว่า "ทำไม Beta ยืดและไม่เบต้า"
javadba

คำตอบ:


19

การให้เป็นน้ำหนักในคำจำกัดความแรกที่คุณให้และ˜ βน้ำหนักในคำนิยามที่สองคำจำกัดความทั้งสองนั้นเทียบเท่ากันเมื่อคุณตั้งค่า˜ β = β 2ดังนั้นคำจำกัดความทั้งสองนี้แสดงถึงความแตกต่างเชิงสัญญะเท่านั้นในนิยามของคะแนนF β . ฉันได้เห็นมันกำหนดทั้งวิธีแรก (เช่นในหน้า wikipedia ) และวิธีที่สอง (เช่นที่นี่ )ββ~β~=β2Fβ

การวัดนั้นได้มาจากการหาค่าเฉลี่ยฮาร์มอนิกของความแม่นยำและการเรียกคืนซึ่งก็คือค่าตอบแทนส่วนกลับของค่าเฉลี่ยของความแม่นยำซึ่งกันและกันและการเรียกคืนซึ่งกันและกัน:F1

F1=1121ความแม่นยำ+121จำ=2ความแม่นยำจำความแม่นยำ+จำ

แทนที่จะใช้น้ำหนักในตัวส่วนที่เท่ากันและรวมเป็น 1 ( สำหรับการเรียกคืนและ112เพื่อความแม่นยำ) เราอาจกำหนดน้ำหนักที่ยังคงรวมเป็น 1 แต่สำหรับน้ำหนักที่จำได้คือβคูณใหญ่เท่ากับน้ำหนักของความแม่นยำ (β12βสำหรับการเรียกคืนและ1ββ+1เพื่อความแม่นยำ) นี้ผลตอบแทนถัวเฉลี่ยความหมายที่สองของคุณของFβคะแนน:1β+1Fβ

Fβ=11β+11ความแม่นยำ+ββ+11จำ=(1+β)ความแม่นยำจำβความแม่นยำ+จำ

อีกครั้งถ้าเราได้ใช้แทนβที่นี่เราจะได้มาถึงที่หมายแรกของคุณเพื่อให้แตกต่างระหว่างสองคำจำกัดความเป็นเพียงสัญลักษณ์β2β


1
ทำไมพวกเขาคูณด้วยเทอมที่แม่นยำแทนที่จะเป็นเทอมการเรียกคืน? β
Anwarvic

1
ค่าแคลคูลัสว่าที่อยู่ "ทำไม Beta ยืดและไม่เบต้า" จะรวมอยู่ในคำตอบที่ใหม่กว่าด้านล่าง
javadba

@ อันวาร์วิคพวกเขาคูณกับการเรียกคืนแบบผกผัน หลังจากที่แฟออก( 1 + β )และการขยายตัวที่มีความแม่นยำจำมีβ แม่นยำระยะซ้ายβ(1+β)ความแม่นยำจำβความแม่นยำ
user2740

6

เหตุผลสำหรับการกำหนดคะแนน F-เบต้ากับβ2เป็นว่าคำพูดที่คุณให้ (คือต้องการที่จะแนบβครั้งเป็นความสำคัญมากที่จะเรียกคืนความแม่นยำ) ให้คำนิยามโดยเฉพาะอย่างยิ่งสำหรับสิ่งที่มันหมายถึงการแนบβครั้งเป็นความสำคัญมากในการเรียกคืน กว่าความแม่นยำ

วิธีการเฉพาะในการกำหนดความสำคัญเชิงสัมพันธ์ของสองตัวชี้วัดที่นำไปสู่การกำหนดβ2สามารถพบได้ในการสืบค้นข้อมูล (Van Rijsbergen, 1979):

คำจำกัดความ: ความสำคัญสัมพัทธ์ที่ผู้ใช้ยึดติดกับความแม่นยำและการเรียกคืนคืออัตราส่วนP/Rที่E/R=E/Pโดยที่E=E(P,R)เป็นการวัดประสิทธิภาพตามความแม่นยำและ จำ.

แรงจูงใจสำหรับสิ่งนี้:

วิธีที่ง่ายที่สุดที่ฉันรู้ในการหาจำนวนนี้คือการระบุอัตราส่วนP/Rที่ผู้ใช้ยินดีแลกเปลี่ยนความแม่นยำที่เพิ่มขึ้นสำหรับการสูญเสียการเรียกคืนที่เท่ากัน

จะเห็นว่าโอกาสในการขายนี้ไปβ2สูตรที่เราสามารถเริ่มต้นด้วยสูตรทั่วไปสำหรับค่าเฉลี่ยถ่วงน้ำหนักของฮาร์โมนิPและRและคำนวณอนุพันธ์บางส่วนของพวกเขาด้วยความเคารพPและRRแหล่งที่มาอ้างใช้E (สำหรับ "ประสิทธิผลวัด") ซึ่งเป็นเพียง1-Fและคำอธิบายจะเท่ากับว่าเราพิจารณาEหรือFF

F=1(αP+1-αR)

F/P=α(αP+1-αR)2P2

F/R=1-α(αP+1-αR)2R2

ตอนนี้การตั้งค่าสัญญาซื้อขายล่วงหน้าเท่ากับหนึ่งสถานที่อื่นข้อ จำกัด เกี่ยวกับความสัมพันธ์ระหว่างαและอัตราส่วนP/R R ระบุว่าเราต้องการที่จะแนบβครั้งเป็นความสำคัญมากที่จะเรียกคืนความแม่นยำเราจะพิจารณาอัตราส่วนR/P 1 :

F/P=F/RαP2=1-αR2RP=1-αα

การกำหนดβเป็นอัตราส่วนนี้และการจัดเรียงใหม่สำหรับαจะให้น้ำหนักในแง่ของβ2 :

β=1-ααβ2=1-ααβ2+1=1αα=1β2+1

1-α=1-1β2+1β2β2+1

เราได้รับ:

F=1(1β2+11P+β2β2+11R)

ซึ่งสามารถจัดเรียงใหม่เพื่อให้แบบฟอร์มในคำถามของคุณ

ดังนั้นจึงให้ความหมายที่ยกมาถ้าคุณต้องการที่จะแนบβครั้งเป็นความสำคัญมากที่จะเรียกคืนความแม่นยำแล้วβ2สูตรควรใช้ การตีความเช่นนี้ไม่ถือถ้าใครใช้เบต้าβการตีความที่ใช้งานง่ายและเทียบเท่าน้อยกว่าในกรณีที่เราเพิ่งใช้βจะเป็นสิ่งที่เราต้องการแนบβความสำคัญมากในการเรียกคืนความแม่นยำ

คุณสามารถกำหนดคะแนนได้ตามที่คุณแนะนำอย่างไรก็ตามคุณควรตระหนักว่าในกรณีนี้การตีความที่กล่าวถึงไม่ได้เกิดขึ้นอีกต่อไปหรือคุณกำลังอ้างถึงคำจำกัดความอื่น ๆ สำหรับการหาปริมาณการแลกเปลี่ยนระหว่างความแม่นยำและการเรียกคืน

เชิงอรรถ:

  1. P/R

อ้างอิง:

  1. CJ Van Rijsbergen 2522. การสืบค้นสารสนเทศ (2nd ed.), pp.133-134
  2. วายซาซากิ 2550. "ความจริงของการวัดเอฟ", สื่อการสอน, การสอน

1
นี่ควรเป็นคำตอบที่ยอมรับได้
javadba

3

เพื่อชี้สิ่งที่ออกอย่างรวดเร็ว

หมายความว่าเมื่อค่าเบต้าเพิ่มขึ้นคุณจะให้ความแม่นยำมากกว่า

ฉันคิดว่าจริง ๆ แล้วมันตรงกันข้าม - เนื่องจากการให้คะแนนแบบ F-higher สูงกว่าคุณจึงต้องการให้ตัวส่วนเล็ก ดังนั้นหากคุณลดβโมเดลจะถูกลงโทษน้อยลงเนื่องจากมีคะแนนความแม่นยำที่ดี หากคุณเพิ่มβคะแนน F-is จะถูกลงโทษมากขึ้นเมื่อความแม่นยำสูง

หากคุณต้องการให้น้ำหนักการให้คะแนน F-so เพื่อให้ค่าความแม่นยำβควรเป็น 0 <1 <1 โดยที่β-> 0 ค่าความแม่นยำเท่านั้น (ตัวเศษเล็กมากและสิ่งเดียวในตัวหารคือเรียกคืน ดังนั้นคะแนน F-βจะลดลงเมื่อการเรียกคืนเพิ่มขึ้น)

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

เหตุผลที่β ^ 2 ถูกคูณด้วยความแม่นยำนั้นเป็นเพียงวิธีการกำหนดคะแนน F หมายความว่าเมื่อค่าเบต้าเพิ่มขึ้นคุณจะให้ความแม่นยำมากกว่า หากคุณต้องการคูณด้วยการเรียกคืนที่ใช้งานได้ก็หมายความว่าเมื่อค่าเบต้าเพิ่มขึ้นคุณจะได้รับการเรียกคืนมากขึ้น


0

ค่าเบต้าที่มากกว่า 1 หมายความว่าเราต้องการให้แบบจำลองของเราให้ความสำคัญกับรุ่นของ Recall มากกว่าความแม่นยำ ในอีกทางหนึ่งค่าน้อยกว่า 1 ให้ความสำคัญกับความแม่นยำมากขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.