เอนโทรปีจะบอกคุณถึงความไม่แน่นอนในระบบ สมมติว่าคุณกำลังมองหาแมวและคุณรู้ว่ามันอยู่ที่ไหนสักแห่งระหว่างบ้านและเพื่อนบ้านซึ่งอยู่ห่างออกไป 1 ไมล์ เด็กของคุณบอกคุณว่าน่าจะเป็นของแมวเป็นในระยะทางที่จากบ้านของคุณมีการอธิบายที่ดีที่สุดโดยเบต้ากระจาย2,2) ดังนั้นแมวอาจจะเป็นที่ใดก็ได้ระหว่าง 0 และ 1 แต่มีแนวโน้มที่จะอยู่ตรงกลางคือ2/1F ( x ; 2 , 2 ) x m x = 1 / 2x f(x;2,2)xmax=1/2
ลองเสียบกระจายเบต้าเป็นสมการของคุณแล้วคุณจะได้รับHH=−0.125
ถัดไปคุณถามภรรยาของคุณและเธอบอกคุณว่าการกระจายที่ดีที่สุดเพื่ออธิบายความรู้ของเธอเกี่ยวกับแมวของคุณคือการกระจายตัวที่สม่ำเสมอ หากคุณเสียบสมเอนโทรปีของคุณคุณจะได้รับ 0H=0
ทั้งชุดเครื่องแบบและค่าเบต้าให้แมวอยู่ที่ใดก็ได้ระหว่าง 0 และ 1 ไมล์จากบ้านของคุณ แต่มีความไม่แน่นอนในชุดเพราะภรรยาของคุณไม่มีเบาะแสที่แมวซ่อนอยู่ในขณะที่เด็ก ๆ มีความคิดพวกเขาคิดว่ามันมากกว่า น่าจะอยู่ตรงกลาง นั่นเป็นเหตุผลที่ว่าทำไมเอนโทรปีของเบต้าจึงต่ำกว่า Uniform
คุณอาจลองแจกแจงอื่น ๆ บางทีเพื่อนบ้านของคุณบอกคุณแมวชอบที่จะอยู่ใกล้อย่างใดอย่างหนึ่งของบ้านเพื่อกระจายเบต้าของเขาอยู่กับ1/2 ใช้จะต้องต่ำกว่าที่ของเครื่องแบบอีกครั้งเพราะคุณจะได้รับความคิดบางอย่างเกี่ยวกับที่จะมองหาแมว เดาสิว่าเอนโทรปีของข้อมูลเพื่อนบ้านของคุณสูงกว่าหรือต่ำกว่าลูก ๆ ของคุณ? ฉันพนันกับเด็ก ๆ ได้ทุกวันในเรื่องเหล่านี้Hα=β=1/2H
UPDATE:
มันทำงานอย่างไร วิธีคิดอย่างหนึ่งคือเริ่มจากการกระจายตัวแบบสม่ำเสมอ หากคุณยอมรับว่าเป็นสิ่งที่มีความไม่แน่นอนมากที่สุดให้คิดว่าเป็นการรบกวน ลองดูที่กรณีที่ไม่ต่อเนื่องเพื่อความเรียบง่าย ใช้จากจุดหนึ่งและเพิ่มไปยังสิ่งอื่นดังนี้:
p ′ i = p - Δ p p ′ j = p + Δ pΔp
p′i=p−Δp
p′j=p+Δp
ตอนนี้เรามาดูวิธีการเปลี่ยนแปลงของเอนโทรปี:
ซึ่งหมายความว่าการรบกวนใด ๆ จากการกระจายเครื่องแบบช่วยลดเอนโทรปี (ความไม่แน่นอน) หากต้องการแสดงแบบเดียวกันในกรณีต่อเนื่องฉันต้องใช้แคลคูลัสของการเปลี่ยนแปลงหรือบางอย่างในบรรทัดนี้ แต่โดยหลักแล้วคุณจะได้ผลลัพธ์แบบเดียวกันโดยหลักการ
H−H′=pilnpi−piln(pi−Δp)+pjlnpj−pjln(pj+Δp)
= - ln ( 1 - Δ p / p ) - ln ( 1 + Δ p / p ) > 0=plnp−pln[p(1−Δp/p)]+plnp−pln[p(1+Δp/p)]
=−ln(1−Δp/p)−ln(1+Δp/p)>0
UPDATE 2: เฉลี่ยของตัวแปรสุ่มเครื่องแบบเป็นตัวแปรสุ่มตัวเองและก็มาจากการกระจายเบตส์ จากCLTเรารู้ว่านี้ตัวแปรสุ่มใหม่ shrinks แปรปรวนเป็นnดังนั้นความไม่แน่นอนของที่ตั้งจะต้องลดลงเมื่อเพิ่มขึ้นใน : เรามั่นใจมากขึ้นว่าแมวอยู่ตรงกลาง เนื้อเรื่องต่อไปของฉันและรหัส MATLAB แสดงให้เห็นว่าเอนโทรปีลดลงจาก 0 สำหรับ (การกระจายแบบสม่ำเสมอ) เป็นได้อย่างไร ฉันใช้ดิสทริบิวชัน 31ที่นี่n → ∞ n n = 1 n = 13nn→∞nn=1n=13
x = 0:0.01:1;
for k=1:5
i = 1 + (k-1)*3;
idx(k) = i;
f = @(x)bates_pdf(x,i);
funb=@(x)f(x).*log(f(x));
fun = @(x)arrayfun(funb,x);
h(k) = -integral(fun,0,1);
subplot(1,5+1,k)
plot(x,arrayfun(f,x))
title(['Bates(x,' num2str(i) ')'])
ylim([0 6])
end
subplot(1,5+1,5+1)
plot(idx,h)
title 'Entropy'