เนื่องจากความน่าจะเป็นองค์ประกอบของคือการเปลี่ยนแปลงของตัวแปรเทียบเท่ากับมาจากXf(x)dx,y=xσ+μx=(y−μ)/σ,
f(x)dx=f(y−μσ)d(y−μσ)=1σf(y−μσ)dy
มันตามมาว่าความหนาแน่นของคือY
fY(y)=1σf(y−μσ).
ดังนั้นเอนโทรปีของคือY
H(Y)=−∫∞−∞log(1σf(y−μσ))1σf(y−μσ)dy
ซึ่งเมื่อเปลี่ยนตัวแปรกลับไปเป็นจะสร้างx=(y−μ)/σ,
H(Y)=−∫∞−∞log(1σf(x))f(x)dx=−∫∞−∞(log(1σ)+log(f(x)))f(x)dx=log(σ)∫∞−∞f(x)dx−∫∞−∞log(f(x))f(x)dx=log(σ)+Hf.
การคำนวณเหล่านี้ใช้คุณสมบัติพื้นฐานของลอการิทึมความเป็นเส้นตรงของการรวมและความจริงที่ว่ารวมเข้ากับเอกภาพf(x)dx
บทสรุปคือ
เอนโทรปีของคือเอนโทรปีของ plusY=Xσ+μXlog(σ).
ในคำพูดการเปลี่ยนตัวแปรสุ่มไม่เปลี่ยนเอนโทรปี (เราอาจคิดว่าเอนโทรปีขึ้นอยู่กับค่าของความหนาแน่นของความน่าจะเป็น แต่ไม่ได้อยู่ที่ค่าเหล่านั้นเกิดขึ้น) ในขณะที่ปรับตัวแปร (ซึ่งสำหรับ "เหยียด" หรือ "เปื้อน" ออกไป) เพิ่มเอนโทรปีโดย สิ่งนี้สนับสนุนสัญชาตญาณว่าการแจกแจงแบบเอนโทรปีสูงคือ "กระจายตัวมากขึ้น" มากกว่าการกระจายแบบเอนโทรปีต่ำσ≥1log(σ).
จากผลของผลลัพธ์นี้เรามีอิสระที่จะเลือกค่าที่สะดวกสบายของและเมื่อคำนวณเอนโทรปีของการแจกแจงใด ๆ ตัวอย่างเช่นเอนโทรปีของการแจกแจงแบบปกติสามารถพบได้โดยการตั้งค่าและลอการิทึมของความหนาแน่นในกรณีนี้คือμσ(μ,σ)μ=0σ=1.
log(f(x))=−12log(2π)−x2/2,
จากไหน
H=−E[−12log(2π)−X2/2]=12log(2π)+12.
ดังนั้นเอนโทรปีของการแจกแจงปรกติทำได้ง่าย ๆ โดยการเพิ่มให้กับผลลัพธ์นี้ทำให้(μ,σ)logσ
H=12log(2π)+12+log(σ)=12log(2πeσ2)
ขณะที่รายงานจากวิกิพีเดีย