“ การทำให้เป็นมาตรฐาน” หมายถึงอะไรและวิธีการตรวจสอบว่าตัวอย่างหรือการกระจายได้รับการทำให้เป็นมาตรฐาน


18

ฉันมีคำถามที่ขอให้ตรวจสอบว่าการแจกแจงแบบฟอร์ม ( Uniform(a,b) ) เป็นมาตรฐานหรือไม่

  1. สำหรับหนึ่งแล้วการกระจายแบบใดที่จะทำให้เป็นมาตรฐาน
  2. และสองเราจะตรวจสอบได้อย่างไรว่าการแจกแจงเป็นแบบปกติหรือไม่?

ฉันเข้าใจโดยการคำนวณ

Xmeansd
เราได้รับข้อมูลที่ทำให้เป็นมาตรฐานแต่ที่นี่มันจะขอให้ตรวจสอบว่าการกระจายเป็นปกติหรือไม่

3
ความหมายสำหรับการแจกแจงที่จะทำให้เป็นมาตรฐานนั้นไม่ใช่เรื่องง่าย (และโดยทั่วไปแล้วไม่ใช่การกระจายตัวที่ถูกทำให้เป็นมาตรฐาน แต่เป็นตัวแปรสุ่ม) ยกตัวอย่างเช่นในกรณีของเครื่องแบบบางคนอาจหมายถึง "rescaled เส้นตรงเพื่อให้ได้รับเครื่องแบบมาตรฐาน" (คือจะได้รับการ= 0และB = 1 ) ... ในขณะที่คนอื่นอาจจะหมายถึง "เส้นตรงให้ปรับเพื่อให้เป็น เพื่อรับค่าเฉลี่ย 0 และ sd 1 " สำหรับเครื่องแบบฉันมักจะถือว่าเป็นคนแรก แต่ตามที่คุณเห็นจากคำตอบด้านล่างคนอื่นอาจใช้มันเพื่อความหมายอย่างอื่น ตัวเลือกที่ดีที่สุดคือการขอให้ผู้ใช้คำนั้นคลุมเครือน้อยลง a=0b=1
Glen_b -Reinstate Monica

1
ข้อตกลงทั่วไปนั้นมีมาตรฐาน (เพื่อให้ได้ค่าเฉลี่ยของศูนย์และ SD ของหนึ่ง) และทำให้เป็นมาตรฐาน (เพื่อนำช่วงไปยังช่วงหรือเพื่อลดเวกเตอร์บรรทัดฐานเป็น1 ) ดังนั้นเรื่องการแสดงออกX ( X - ค่าเฉลี่ย) / S Dเป็นมาตรฐานในขณะที่มีความหนาแน่นคูณโดยคงCเพื่อให้- C F ( x ) d x =[0,1]1X(Xmean)/SDfCเป็นบรรทัดฐานเพราะF ( x ) d xเป็น L 1บรรทัดฐานของฉ Cf(x)dx=1f(x)dxL1f
whuber

ยังถามในวิชาคณิตศาสตร์อีกด้วย
Dilip Sarwate

1
โปรดอย่าข้ามโพสต์ @Ada นั่นเป็นสิ่งที่ขัดต่อนโยบาย SE หากคุณโพสต์คำถามเกี่ยวกับเว็บไซต์ 1 และคิดว่าคุณควรโพสต์ไว้ในเว็บไซต์อื่นให้ตั้งค่าสถานะ Q ของคุณและขอให้ผู้ดำเนินรายการโอนย้ายมาให้คุณ
gung - Reinstate Monica

คำตอบ:


33

น่าเสียดายที่มีการใช้คำศัพท์ต่างกันในสาขาต่าง ๆ โดยบุคคลต่าง ๆ ในสาขาเดียวกันดังนั้นฉันจึงไม่แน่ใจว่าคำตอบนี้จะตอบสนองคุณได้ดีเพียงใด คุณควรตรวจสอบให้แน่ใจว่าคุณทราบคำจำกัดความที่ผู้สอน / หนังสือของคุณใช้สำหรับ อย่างไรก็ตามต่อไปนี้เป็นคำจำกัดความทั่วไป:

อยู่กึ่งกลาง: มาตรฐาน: X - หมายถึง

Xmean
ทำให้เป็นมาตรฐาน:X-min(X)
Xmeansd
Normalizingในแง่นี้ rescales ข้อมูลของคุณในช่วงหน่วย การกำหนดมาตรฐานจะเปลี่ยนข้อมูลของคุณให้เป็นคะแนนzเช่นบันทึกย่อ @Jeff และอยู่ตรงกลางก็ทำให้ค่าเฉลี่ยของข้อมูลของคุณเท่ากับ0
Xmin(X)max(X)min(X)
z0

เป็นมูลค่าการรับรู้นี่ว่าทั้งสามเหล่านี้มีการเปลี่ยนแปลงเชิงเส้น ; เป็นเช่นนี้พวกเขาไม่ได้เปลี่ยนรูปร่างของการกระจายของคุณ นั่นคือบางครั้งผู้คนเรียกการแปลง -score "normalizing" และเชื่อว่าเนื่องจากความสัมพันธ์ของคะแนนzกับการแจกแจงแบบปกตินั่นทำให้ข้อมูลของพวกเขากระจายตามปกติ สิ่งนี้ไม่เป็นเช่นนั้น (ดังที่ @Jeff บันทึกไว้และคุณสามารถบอกได้ด้วยการวางแผนข้อมูลของคุณก่อนและหลัง) หากคุณสนใจคุณสามารถเปลี่ยนรูปร่างของข้อมูลโดยใช้การแปลงในตระกูล Box-Coxเป็นต้น zz

ด้วยความเคารพต่อวิธีที่คุณสามารถตรวจสอบการเปลี่ยนแปลงเหล่านี้ได้นั้นขึ้นอยู่กับความหมายที่แท้จริงของสิ่งนั้น หากพวกเขาหมายถึงเพียงเพื่อตรวจสอบว่ารหัสทำงานอย่างถูกต้องคุณสามารถตรวจสอบหมายถึง SDs, ขั้นต่ำและสูงสุด


1
ฉันเคยเห็นมาตรฐานที่ใช้ในการแนะนำมาตรฐานหรือแนะนำให้พอดีกับการแจกแจงแบบปกติมาตรฐานเช่นดังนั้นทั้งสามมาตรฐานมีแนวโน้มที่จะเข้าใจผิด ความคิดเห็นของ Ada เกี่ยวกับการประยุกต์ใช้ค่าคงที่ normalizingกับฟังก์ชันความน่าจะเป็นยังเป็นอีกการตีความที่เป็นไปได้ Φ1(F(X))
Henry

4

โดยใช้สูตรที่คุณให้กับคะแนนในตัวอย่างของคุณแต่ละท่านมีการแปลงพวกเขาทั้งหมดเพื่อ Z-คะแนน

หากต้องการตรวจสอบว่าคุณคำนวณคะแนน z ทั้งหมดอย่างถูกต้องให้ค้นหาค่าเฉลี่ยใหม่และค่าเบี่ยงเบนมาตรฐานของตัวอย่าง ถ้าค่าเฉลี่ยคือและส่วนเบี่ยงเบนมาตรฐานคือ1คุณก็ทำทุกอย่างถูกต้องแล้ว01

วัตถุประสงค์ของการทำเช่นนี้คือการใส่ทุกอย่างในหน่วยที่สัมพันธ์กับค่าเบี่ยงเบนมาตรฐานของตัวอย่างของคุณ สิ่งนี้อาจมีประโยชน์สำหรับวัตถุประสงค์ที่หลากหลายเช่นการเปรียบเทียบชุดข้อมูลที่แตกต่างกันสองชุดที่ทำคะแนนโดยใช้หน่วยที่แตกต่างกัน (อาจเป็นเซนติเมตรและนิ้ว)

มันเป็นเรื่องสำคัญที่จะไม่สับสนกับการถามว่าการแจกแจงเป็นเรื่องปกติหรือไม่นั่นคือการแจกแจงแบบเกาส์ใกล้เคียงหรือไม่


ดังนั้นเพื่อตรวจสอบว่าการกระจายเครื่องแบบถูกทำให้เป็นมาตรฐานหรือไม่มันจะเทียบเท่ากับ E (X) = 0 และ Var (X) = 1 โดยที่ X ~ Uniform (a, b)?

2
ข้อมูลไม่จำเป็นต้องมาจากการแจกแจงแบบสม่ำเสมอพวกมันสามารถได้จากการกระจายตัวใด ๆ และนี่จะเป็นจริงโดยใช้สูตรที่คุณให้ไว้เท่านั้น ข้อมูลสามารถทำให้เป็นมาตรฐานในรูปแบบอื่นที่ไม่ใช่การใช้คะแนน z ตัวอย่างเช่นคะแนน IQ นั้นถูกทำให้เป็นมาตรฐานด้วยคะแนน 100 และส่วนเบี่ยงเบนมาตรฐานที่ 15
Jeff

1

หลังจากปรึกษาผู้ช่วยสอนแล้วคำถามที่ถามคืออะไรถ้า

f(x)dx=1

f(x)


2
1

นี่คือสิ่งที่เราถูกขอให้ตรวจสอบ f (x) ไม่จำเป็นต้องเป็น pdf จริง ๆ และมันอาจเป็นฟังก์ชั่นที่ไม่ใช่ลบก็ได้ สำหรับฟังก์ชั่นที่ไม่ใช่ลบใด ๆ ที่ด้านบนไม่พอใจเราสามารถคูณด้วยค่าคงที่ normalizing ได้เสมอ
Ada

1
f(x)=ex

มันเป็นความจริงไม่ใช่ฟังก์ชั่นที่ไม่ใช่ลบใด ๆ ที่เราสามารถทำให้เป็นไปตามเงื่อนไขข้างต้นแม้ว่าเราจะคูณด้วยค่าคงที่ปกติ
Ada
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.