สัมประสิทธิ์ของลูกเต๋าเหมือนกับความถูกต้องหรือไม่?


13

ผมเจอค่าสัมประสิทธิ์ลูกเต๋าสำหรับความคล้ายคลึงกันเสียง ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) และความถูกต้อง ( https://en.wikipedia.org/wiki/Accuracy_and_precision )

สำหรับฉันแล้วดูเหมือนว่ามาตรการทั้งสองนี้เหมือนกัน ความคิดใด ๆ


1
ซึ่งจะให้ข้อมูลสถิติ
อันดับ 1

1
@ rank1 ขอบคุณ ฉันต้องการชี้แจง: ไม่ว่าจะเชื่อมโยงไปยังคำถามของฉัน :)
RockTheStar

คำตอบ:


18

สิ่งเหล่านี้ไม่เหมือนกันและมักใช้ในบริบทที่แตกต่างกัน คะแนนลูกเต๋ามักจะใช้ในปริมาณประสิทธิภาพการทำงานของการแบ่งส่วนภาพวิธีการ ที่นั่นคุณได้ใส่คำอธิบายประกอบขอบเขตความจริงพื้นดินในภาพของคุณแล้วทำอัลกอริทึมอัตโนมัติที่จะทำ คุณตรวจสอบอัลกอริทึมโดยการคำนวณคะแนนลูกเต๋าซึ่งเป็นการวัดความคล้ายคลึงของวัตถุ ดังนั้นมันคือขนาดของการทับซ้อนของการแบ่งส่วนสองส่วนหารด้วยขนาดทั้งหมดของวัตถุทั้งสอง ใช้คำเดียวกันกับการอธิบายความถูกต้องคะแนนลูกเต๋าคือ:

คะแนนลูกเต๋า=2จำนวนการบวกที่แท้จริง2จำนวนบวกจริงบวกจำนวนบวกเท็จบวกจำนวนลบเท็จ
ดังนั้นจำนวนบวกที่แท้จริงที่เป็นตัวเลขที่พบวิธีการของคุณจำนวนบวกคือจำนวนของผลบวกที่สามารถพบได้และจำนวนเท็จ บวกคือจำนวนคะแนนที่เป็นลบที่วิธีการของคุณจัดว่าเป็นบวก

คะแนนลูกเต๋าไม่ได้เป็นเพียงการวัดจำนวนผลบวกที่คุณพบ แต่ยังลงโทษสำหรับผลบวกปลอมที่วิธีการค้นหาคล้ายกับความแม่นยำ ดังนั้นมันจึงคล้ายกับความแม่นยำมากกว่าความแม่นยำ ความแตกต่างเพียงอย่างเดียวคือตัวหารที่คุณมีจำนวนผลบวกทั้งหมดแทนที่จะเป็นเฉพาะผลบวกที่วิธีการค้นหา ดังนั้นคะแนนของลูกเต๋าจึงเป็นการลงโทษสำหรับผลบวกที่อัลกอริทึม / วิธีการของคุณไม่สามารถหาได้

แก้ไข:ในกรณีของการแบ่งส่วนภาพสมมติว่าคุณมีหน้ากากที่มีพื้นจริงเรียกว่าหน้ากากAอย่างที่คุณแนะนำ ดังนั้นหน้ากากจึงมีค่า 1 ในพิกเซลที่มีบางสิ่งที่คุณพยายามค้นหาและเป็นศูนย์อื่น ตอนนี้คุณมีอัลกอริทึมในการสร้างอิมเมจ / มาสก์Bซึ่งต้องเป็นอิมเมจไบนารี่เช่นคุณสร้างมาสก์สำหรับการแบ่งส่วน จากนั้นเรามีดังต่อไปนี้:

  • จำนวนการบวกคือจำนวนพิกเซลทั้งหมดที่มีความเข้ม 1 ในรูปภาพA
  • จำนวนบวกที่แท้จริงคือจำนวนของพิกเซลที่มีมูลค่า 1 ทั้งในและB ดังนั้นจึงเป็นจุดตัดของภูมิภาคของคนในและB มันเป็นเช่นเดียวกับการใช้และผู้ประกอบการในและBABABAB
  • จำนวนบวกเท็จคือจำนวนพิกเซลที่ปรากฏเป็น 1 ในBแต่ศูนย์ในA

หากคุณกำลังทำสิ่งนี้เพื่อตีพิมพ์เขียน Dice ด้วยตัวพิมพ์ใหญ่ D เพราะถูกตั้งชื่อตามชายที่ชื่อ Dice

แก้ไข:เกี่ยวกับความคิดเห็นเกี่ยวกับการแก้ไข: ฉันไม่ได้ใช้สูตรดั้งเดิมในการคำนวณค่าสัมประสิทธิ์ลูกเต๋า แต่ถ้าฉันแปลเป็นเครื่องหมายในคำตอบอื่น ๆ มันจะกลายเป็น:

คะแนนลูกเต๋า=2|AB|2|AB|+|BA|+|AB|

ซึ่งเทียบเท่ากับนิยามดั้งเดิม สะดวกกว่าที่จะเขียนในแบบที่ฉันเขียนไว้ แต่เดิมเพื่อระบุสูตรในแง่ของผลบวกที่ผิดพลาด แบ็กสแลชคือชุดลบ


2
ขอบคุณสำหรับการตอบกลับ. ตรงสำหรับการเปรียบเทียบการแบ่งส่วนภาพ ดังนั้นจึงใช้คะแนนลูกเต๋านี้บอกว่าให้ภาพ A และภาพ B รูปภาพ A เป็นพื้นจริง (0 หรือ 1) และภาพ B คือการแบ่งส่วนของฉัน ดังนั้นจำนวนบวกทั้งหมด (1) คือจำนวนของ 1 ใน A + จำนวน 1 ใน B ?? ฉันสับสนเล็กน้อยที่นี่ เช่นเดียวกับการบวกเท็จ
RockTheStar

1
@RockTheStar ฉันจะแก้ไขคำตอบของฉันในบัญชีสำหรับการแบ่งส่วนภาพ
Gumeo

1
เยี่ยมมากขอบคุณมากสำหรับคำอธิบายของคุณ คำถามติดตามอีกหนึ่งข้อ แล้วช่วง D เป็นเท่าไหร่? นั่นคือระหว่าง 0 และ 1
RockTheStar

2
เยี่ยมมากขอบคุณ! จะใช้สิ่งนี้และดูผลลัพธ์
RockTheStar

2
@Gumeo คุณอาจต้องการที่จะแก้ไขหรืออย่างน้อยอธิบายคำตอบของคุณโปรดดูคำตอบใหม่ของฉันสำหรับรายละเอียด
DVB

20

ลูกเต๋าค่าสัมประสิทธิ์ (หรือเรียกว่าดัชนีความคล้ายคลึงกันลูกเต๋า) เป็นเช่นเดียวกับคะแนน F1แต่มันไม่ได้เป็นเช่นเดียวกับความถูกต้อง แตกต่างที่สำคัญอาจจะมีความจริงที่ว่ามีความถูกต้องคำนึงถึงความจริงเชิงลบในขณะที่ค่าสัมประสิทธิ์ลูกเต๋าและหลายมาตรการอื่น ๆ เพียงแค่จัดการเชิงลบที่แท้จริงเป็นค่าเริ่มต้นจืด (ดูพื้นฐานของการประเมินผลลักษณนามตอนที่ 1 )

เท่าที่ฉันสามารถบอกได้ค่าสัมประสิทธิ์ลูกเต๋าไม่ได้คำนวณตามคำอธิบายก่อนหน้าซึ่งจริง ๆ แล้วมีสูตรสำหรับดัชนี Jaccard (หรือที่รู้จักกันในชื่อ

Dผมอี(A,B)=2|AB||A|+|B|F1(A,B)=2|A|/|AB|+|B|/|AB|JaaRd(A,B)=|AB||ม.ax(A,B)|=|AB||A|+|B|-|AB|AยูRaY(A,B)=|AB|+|A¯B¯||Aล.ล.|

A,BAล.ล.|AB|AB|A¯B¯|AB

ค่าสัมประสิทธิ์ลูกเต๋าและดัชนี Jaccard ที่เกี่ยวข้อง monotonically และ generalizes ดัชนี Tversky พวกเขาทั้งสองเพื่ออ่านรายละเอียดเพิ่มเติมเกี่ยวกับเรื่องนี้ดูF-คะแนนลูกเต๋าและ Jaccard ชุดคล้ายคลึงกัน

ค่าสัมประสิทธิ์ลูกเต๋ายังเป็นค่าเฉลี่ยของความไวและความแม่นยำเพื่อดูว่าทำไมจึงสมเหตุสมผลอ่านทำไม F-Measure ค่าเฉลี่ยฮาร์มอนิกและไม่ใช่ค่าเฉลี่ยเลขคณิตของมาตรการความแม่นยำและการเรียกคืน? .

อ่านเพิ่มเติมเกี่ยวกับหลายคำในคำตอบนี้และความสัมพันธ์ของพวกเขาให้ดูที่การประเมินผลการจําแนกไบนารี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.