อัลกอริทึม Apriori ในภาษาอังกฤษธรรมดา?


9

ฉันอ่านบทความเกี่ยวกับ Apriori ฉันมีปัญหาในการทำความเข้าใจกับลูกพรุนและเข้าร่วมขั้นตอน ทุกคนสามารถอธิบายได้ว่าอัลกอริทึม Apriori ทำงานอย่างไรในเงื่อนไขง่าย ๆ (เช่นสามเณรอย่างฉันสามารถเข้าใจได้ง่าย)

มันจะดีถ้ามีคนอธิบายกระบวนการทีละขั้นตอนที่เกี่ยวข้อง


คุณอาจจะสนใจในการดำเนินงานหลามของฉัน
Martin Thoma

คำตอบ:


11

บทความวิกิพีเดียไม่ได้เป็นที่น่าประทับใจโดยเฉพาะอย่างยิ่ง คุณอาจพบภาพนิ่งเหล่านี้มีประโยชน์มากขึ้น: 1 , 2 , 3

ในแต่ละระดับ k, คุณมี kชุดรายการซึ่งเป็นประจำ (มีการสนับสนุนเพียงพอ)

ในระดับต่อไป k+1- ชุดที่คุณต้องพิจารณาจะต้องมีคุณสมบัติที่แต่ละชุดย่อยของพวกเขาต้องบ่อย (มีการสนับสนุนเพียงพอ) นี่คือคุณสมบัติ apriori : ชุดย่อยของ itemset บ่อย ๆ ต้องเป็นประจำ

ดังนั้นถ้าคุณรู้ว่าระดับ 2 นั้นเป็นตัวกำหนด {1,2}, {1,3}, {1,5} และ {3,5} เป็นชุดเดียวที่มีการสนับสนุนที่เพียงพอจากนั้นในระดับ 3 คุณเข้าร่วมซึ่งกันและกันเพื่อผลิต {1,2,3}, {1,2,5}, {1,3,5} และ {2,3,5} แต่คุณต้องพิจารณาเท่านั้น {1,3,5} เพิ่มเติม: คนอื่น ๆ แต่ละคนมีส่วนย่อยด้วยการสนับสนุนที่ไม่เพียงพอ (เช่น {2,3} หรือ {2,5} )


2

อัลกอริทึม Apriori เป็นอัลกอริทึมการขุดกฎสมาคมที่ใช้ในการขุดข้อมูล มันถูกใช้เพื่อค้นหาชุดรายการที่พบบ่อยในจำนวนการทำธุรกรรมที่กำหนด

มันประกอบด้วยสองขั้นตอนโดยทั่วไป

  1. ตนเองเข้าร่วม
  2. การตัด

ทำซ้ำขั้นตอนเหล่านี้ k คูณโดยที่ k คือจำนวนรายการในการทำซ้ำครั้งล่าสุดคุณจะได้รับชุดรายการที่มีจำนวนรายการ k บ่อยครั้ง

ดูที่นี่สำหรับคำอธิบายที่ง่ายมากด้วยตัวอย่างรายละเอียดhttp://nikhilvithlani.blogspot.com/2012/03/apriori-algorithm-for-data-mining-made.html

มันมีคำอธิบายง่ายๆโดยไม่มีสมการที่ซับซ้อน


2
ฉันออกจากการประกาศโพสต์นี้เนื่องจากโดยปกติแล้วจะเป็นการดีกว่าที่จะสรุปประเด็นหลักที่คุณต้องการเน้นมากกว่าลิงก์ไปยังบล็อกโดยไม่มีคำอธิบายเพิ่มเติม นอกจากนี้วัตถุประสงค์ของเว็บไซต์นี้คือเพื่อสร้างชุดของการตอบสนองที่มีความรู้สำหรับคำถามที่เฉพาะเจาะจงกับการพึ่งพาขั้นต่ำในการเชื่อมโยงห้อยหรือชั่วคราว ดังนั้นหากคุณไม่สามารถรับประกันได้ว่าลิงค์ด้านบนจะยังคงมีชีวิตอยู่ใน 10 ปีกล่าวว่าฉันขอแนะนำให้คุณสรุปประเด็นหลักในคำตอบปัจจุบัน
chl

1

Apriori ในภาษาอังกฤษธรรมดา

Apriori พนักงานวิธีการซ้ำที่รู้จักกันในการค้นหาระดับที่ชาญฉลาดที่K-itemsetsจะใช้ในการสำรวจ(k + 1) -itemsets ขั้นแรกชุดของ1-itemsets ที่พบบ่อยคือการสแกนฐานข้อมูลเพื่อรวบรวมจำนวนสำหรับแต่ละรายการและรวบรวมรายการเหล่านั้นที่ตอบสนองการสนับสนุนขั้นต่ำ ชุดส่งผลให้มีการแสดงเป็นL1 จากนั้น L1 จะใช้ในการค้นหาL2ชุดของชุดรายการ2 ชุดซึ่งใช้ในการค้นหา L3 และต่อไปเรื่อย ๆ จนกว่าจะไม่พบชุดk-items บ่อยขึ้น การค้นหาแอลเคแต่ละครั้งต้องใช้การสแกนแบบเต็มของฐานข้อมูล

ที่ย้ำสุดท้ายที่คุณจะจบลงด้วยหลายK-itemsetsซึ่งเรียกโดยทั่วไปกฎสมาคม เพื่อเลือกกฎที่น่าสนใจจากชุดของกฎที่เป็นไปได้ทั้งหมดข้อ จำกัด ต่างๆมาตรการเช่นการสนับสนุนและความเชื่อมั่นที่จะนำไปใช้

ข้อกำหนดและคำศัพท์

  • 1-itemsets หมายถึง {a}, {b}, {c}
  • 2-itemsets หมายถึง {a, b}, {d, d}, {a, c}
  • K-itemsets หมายถึง {i1, i2, i3, ... ik}, {j1, j2, j3, .... jk}

ขั้นตอนการเข้าร่วม: ความหมาย 1 ชุดรายการถูกสร้างขึ้นเพื่อเข้าร่วมด้วยตัวเองเพื่อสร้างชุด 2 รายการ

ขั้นตอนพรุน: ชุดผลลัพธ์ที่ได้จากการเข้าร่วมถูกกรองด้วยเกณฑ์การสนับสนุนขั้นต่ำ

cardinality set: ชุดผลลัพธ์จากขั้นตอน Prune

Support = no.of การแปลงที่มี 'a' และ 'b' / จำนวนการทำธุรกรรมทั้งหมด

สนับสนุน => supp (a, b) => p (a b ข)

Confident = จำนวนการทำธุรกรรมที่มี 'a' และ 'b' / จำนวนการทำธุรกรรมที่มี 'a'

Confident => con (a, b) ==> P (b | a) ไม่มีอะไรนอกจากความน่าจะเป็นตามเงื่อนไข

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.