จริงๆแล้วกฎของเบ็นฟอร์ดเป็นวิธีที่ทรงพลังอย่างไม่น่าเชื่อ นี่เป็นเพราะการแจกแจงความถี่แรกของ Benford นั้นใช้ได้กับชุดข้อมูลทุกประเภทที่เกิดขึ้นในโลกแห่งความเป็นจริงหรือในธรรมชาติ
คุณมีสิทธิ์ที่จะใช้กฎหมายของ Benford ในบางสถานการณ์เท่านั้น คุณบอกว่าข้อมูลจะต้องมีการกระจายบันทึกที่สม่ำเสมอ เทคนิคนี้ถูกต้องอย่างแน่นอน แต่คุณสามารถอธิบายความต้องการได้อย่างง่ายและผ่อนปรนมาก สิ่งที่คุณต้องมีคือช่วงของชุดข้อมูลมีขนาดอย่างน้อยหนึ่งลำดับ สมมุติว่าจาก 1 ถึง 9 หรือ 10 ถึง 99 หรือ 100 ถึง 999 ถ้ามันข้ามสองคำสั่งของขนาดคุณอยู่ในธุรกิจ และกฎของเบ็นฟอร์ดน่าจะมีประโยชน์ทีเดียว
ความสวยงามของกฎของเบ็นฟอร์ดคือช่วยให้คุณ จำกัด การสอบสวนของคุณให้แคบลงอย่างรวดเร็วในข้อมูลที่กองอยู่ คุณมองหาความผิดปกติที่ความถี่ของตัวเลขตัวแรกนั้นแตกต่างจากความถี่ของ Benford มาก เมื่อคุณสังเกตเห็นว่ามีสอง 6s หลายตัวคุณใช้กฎของ Benford เพื่อมุ่งเน้นที่ 6s แต่ตอนนี้คุณนำตัวเลขสองหลักแรกไปใช้ (60, 61, 62, 63, ฯลฯ ... ) ทีนี้คุณอาจพบว่ามี 63s มากขึ้นแล้วสิ่งที่ Benford แนะนำ (คุณจะทำเช่นนั้นโดยคำนวณความถี่ของ Benford: log (1 + 1/63) ที่ให้ค่าใกล้เคียงกับ 0%) ดังนั้นคุณใช้ Benford กับตัวเลขสามตัวแรก ตามเวลาที่คุณพบว่ามี 632s มากเกินไป (หรืออะไรก็ตามโดยการคำนวณความถี่ของ Benford: log (1 + 1/632)) เกินกว่าที่คุณคาดหวัง ไม่ใช่ความผิดปกติทั้งหมดที่เป็นการฉ้อโกง แต่,
หากชุดข้อมูลที่ Marc Hauser จัดการนั้นเป็นข้อมูลที่ไม่มีข้อ จำกัด ตามธรรมชาติโดยมีช่วงที่เกี่ยวข้องที่กว้างพอกฎหมายของ Benford จะเป็นเครื่องมือวินิจฉัยที่ดีทีเดียว ฉันแน่ใจว่ามีเครื่องมือการวินิจฉัยที่ดีอื่น ๆ ที่ตรวจจับรูปแบบที่ไม่น่าเป็นไปได้และโดยการรวมเข้ากับกฎของ Benford คุณอาจตรวจสอบเรื่อง Marc Hauser ได้อย่างมีประสิทธิภาพมากที่สุด
ฉันอธิบายกฏของ Benford มากขึ้นในงานนำเสนอสั้น ๆ ที่คุณสามารถดูได้ที่นี่:
http://www.slideshare.net/gaetanlion/benfords-law-4669483