อะไรกันแน่? พวกเขาได้รับมาอย่างไร


19

โดยทั่วไปเราได้รับการแนะนำให้รู้จักกับวิธีการประมาณช่วงเวลาโดย "การเทียบช่วงเวลาของประชากรกับตัวอย่างตัวอย่าง" จนกว่าเราจะประมาณพารามิเตอร์ทั้งหมดของประชากร ดังนั้นในกรณีที่มีการแจกแจงแบบปกติเราจะต้องใช้ช่วงเวลาที่หนึ่งและสองเพราะพวกเขาอธิบายการกระจายตัวนี้อย่างเต็มที่

E(X)=μΣผม=1nXผม/n=X¯

E(X2)=μ2+σ2Σผม=1nXผม2/n

และเราสามารถคำนวณทางทฤษฎีได้มากถึงช่วงเวลาเพิ่มเติมตาม:n

E(Xr)i=1nXir/n

ฉันจะสร้างสัญชาตญาณได้อย่างไรว่าช่วงเวลาใดเป็นจริง ฉันรู้ว่าพวกเขามีอยู่เป็นแนวคิดในฟิสิกส์และคณิตศาสตร์ แต่ฉันคิดว่ามันไม่สามารถใช้ได้โดยตรงโดยเฉพาะอย่างยิ่งเพราะฉันไม่รู้วิธีที่จะทำให้นามธรรมจากแนวคิดมวลชนไปสู่จุดข้อมูล ดูเหมือนว่าจะใช้คำเฉพาะในทางสถิติซึ่งแตกต่างจากการใช้งานในสาขาอื่น

อะไรลักษณะของข้อมูลของฉันกำหนดวิธีการที่หลายคน ( ) ในช่วงเวลาที่มีโดยรวม?r


7
คำนี้หมายถึงสิ่งเดียวกันกับฟิสิกส์เมื่อใช้กับการแจกแจงความน่าจะเป็น ดูที่นี่ซึ่งมีสมการ , " โดยที่คือการกระจายของความหนาแน่นของประจุมวลหรือปริมาณใด ๆ ที่กำลังพิจารณา " เมื่อ "สิ่งที่กำลังพิจารณา" คือความหนาแน่นของความน่าจะเป็นคุณจะมีช่วงเวลาที่ตรงกันในความน่าจะเป็น นั่นเป็นช่วงเวลาที่ดิบ (ช่วงเวลาที่เกี่ยวกับกำเนิด) โดยการเปรียบเทียบ ... (ctd)ρμn=rnρ(r)drρ
Glen_b -Reinstate Monica

2
ช่วงเวลาเป็นคุณลักษณะที่กำหนดขอบเขตของการแจกแจงตัวแปรแบบสุ่มเช่นปริมาณ ช่วงเวลาที่มีการแปรโดยจำนวนธรรมชาติและสมบูรณ์ลักษณะการกระจาย (ดูช่วงเวลาที่ฟังก์ชั่นการสร้าง ) นี่ไม่ได้ออกกฎว่าสำหรับการแจกแจงบางอย่างอาจมีการพึ่งพาการทำงานที่สมบูรณ์แบบในช่วงเวลาดังนั้นไม่จำเป็นต้องใช้ทุกช่วงเวลาในการจำแนกลักษณะการกระจาย (1/2)
tchakravarty

ช่วงเวลานั้นขึ้นอยู่กับหน้าที่ของสองตัวแรกสำหรับการแจกแจงแบบปกติดังนั้นสองตัวแรกก็พอเพียงที่จะจำแนกลักษณะการแจกแจงรวมถึงค่าเฉลี่ยและความแปรปรวน (2/2)3
tchakravarty

5
(CTD) ... ช่วงเวลาในคณิตศาสตร์เหมือนกัน ( ) ยกเว้นเกี่ยวกับ cมากกว่า 0 (เช่นเพียงรูปแบบหนึ่งของฟิสิกส์ทั่วไป - แต่เนื่องจากพวกมันเหมือนกันกับการเปลี่ยนแหล่งกำเนิดเพียงนักฟิสิกส์จะพูดอย่างถูกต้องว่า "มันแตกต่างกันอย่างไร") สิ่งเหล่านี้เหมือนกับความน่าจะเป็นเมื่อ fคือความหนาแน่น สำหรับฉันทั้งสามกำลังพูดถึงสิ่งเดียวกันเมื่อพวกเขาพูดว่า 'ช่วงเวลา' ไม่ใช่สิ่งที่แตกต่างกัน μn=(xc)nf(x)dxcf
Glen_b -Reinstate Monica

3
ฉันแน่ใจว่าคุณสามารถหาคำตอบในหัวข้อต่าง ๆ ที่ได้รับการโพสต์เกี่ยวกับช่วงเวลาและสัญชาตญาณ สถิติใช้ช่วงเวลาในลักษณะเดียวกับที่ใช้ในฟิสิกส์และคณิตศาสตร์ - มันเป็นแนวคิดเดียวกันที่มีความหมายเดียวกันในทั้งสามสาขา
whuber

คำตอบ:


17

เป็นเวลานานแล้วที่ฉันเข้าเรียนวิชาฟิสิกส์ดังนั้นแจ้งให้ฉันทราบหากสิ่งนี้ไม่ถูกต้อง

คำอธิบายทั่วไปของเหตุการณ์ที่มี analogs ทางกายภาพ

X nขณะ -th ของXรอบคือ ม. n ( C ) = E [ ( X - ) n ] สอดคล้องตรงกับความรู้สึกทางกายภาพของช่วงเวลานี้ ลองนึกภาพXเป็นชุดของคะแนนตามแนวเส้นจริงพร้อมความหนาแน่นที่กำหนดโดย pdf วางศูนย์กลางไว้ใต้บรรทัดนี้ที่cและเริ่มคำนวณช่วงเวลาที่สัมพันธ์กับศูนย์กลางดังกล่าวและการคำนวณจะสอดคล้องกับช่วงเวลาทางสถิติทุกประการXnX

ม.n()=E[(X-)n]
X

ส่วนใหญ่เวลาที่ขณะ -th ของXหมายถึงช่วงเวลาที่อยู่รอบ ๆ 0 (ช่วงเวลาที่ศูนย์กลางจะอยู่ที่ 0): ม. n = E [ X n ] n -th กลางช่วงเวลาของX คือ: ม. n = m n ( m 1 ) = E [ ( X - m 1 ) n ]nX

ม.n=E[Xn]
nX
ม.^n=ม.n(ม.1)=E[(X-ม.1)n]
สิ่งนี้สอดคล้องกับช่วงเวลาที่ศูนย์กลางที่วางไว้ที่ศูนย์กลางของมวลดังนั้นการกระจายตัวจึงมีความสมดุล ช่วยให้ช่วงเวลาที่จะตีความได้ง่ายขึ้นตามที่เราจะเห็นด้านล่าง ช่วงเวลากลางแรกจะเป็นศูนย์เสมอเนื่องจากการกระจายนั้นมีความสมดุล

-th มาตรฐานช่วงเวลาของXคือ: ~ n = nnX อีกครั้งนี้ชั่งช่วงเวลาโดยการแพร่กระจายของการกระจายช่วยให้การตีความง่ายขึ้นโดยเฉพาะของ Kurtosis ช่วงเวลามาตรฐานแรกจะเป็นศูนย์เสมอครั้งที่สองจะเป็นหนึ่งเสมอ สิ่งนี้สอดคล้องกับช่วงเวลาของคะแนนมาตรฐาน (คะแนน z) ของตัวแปร ฉันไม่มีแอนะล็อกทางกายภาพที่ยอดเยี่ยมสำหรับแนวคิดนี้

ม.~n=ม.^n(ม.^2)n=E[(X-ม.1)n](E[(X-ม.1)2])n

ช่วงเวลาที่ใช้กันทั่วไป

สำหรับการแจกจ่ายใด ๆ อาจมีช่วงเวลาที่ไม่ จำกัด ช่วงเวลาที่เพียงพอจะแสดงลักษณะและการกระจายอย่างเต็มที่เกือบตลอดเวลา (การได้รับเงื่อนไขที่จำเป็นสำหรับสิ่งนี้เพื่อให้แน่ใจว่าเป็นส่วนหนึ่งของปัญหาช่วงเวลา ) มีการพูดถึงช่วงเวลาสี่ช่วงโดยทั่วไปเกี่ยวกับสถิติมากมาย:

  1. Mean - ช่วงเวลาที่ 1 (อยู่ตรงกลางรอบศูนย์) มันคือศูนย์กลางของมวลของการกระจายหรืออีกทางหนึ่งคือสัดส่วนกับช่วงเวลาของแรงบิดของการกระจายเมื่อเทียบกับศูนย์กลางที่ 0
  2. X
  3. ความเบ้ - ช่วงเวลากลางที่ 3 (บางครั้งก็เป็นมาตรฐาน) การวัดความเบ้ของการแจกแจงในทิศทางเดียวหรืออีกทิศทางหนึ่ง สัมพันธ์กับการแจกแจงแบบปกติ (ซึ่งไม่มีความเบ้) การแจกแจงแบบเบ้เชิงบวกมีความน่าจะเป็นที่ต่ำมากของผลลัพธ์ที่สูงมากการแจกแจงแบบเบ้ในทางลบ analogs ทางกายภาพนั้นยาก แต่ก็วัดความไม่สมดุลของการกระจาย ตัวอย่างเช่นรูปด้านล่างจะถูกนำมาจากวิกิพีเดีย ความเบ้จากวิกิพีเดีย
  4. XKurtosis ก็มาจาก WIkipedia

เราไม่ค่อยพูดถึงช่วงเวลาที่เกิน Kurtosis อย่างแม่นยำเพราะมีสัญชาตญาณน้อยมาก สิ่งนี้คล้ายกับนักฟิสิกส์หยุดหลังจากวินาทีที่สอง


6

นี่เป็นบิตเก่าของเธรด แต่ฉันต้องการแก้ไขข้อผิดพลาดในความคิดเห็นโดย Fg Nu ผู้เขียนว่า "Moments มีการกำหนดพารามิเตอร์ตามจำนวนธรรมชาติและอธิบายลักษณะการแจกแจงทั้งหมด"

ช่วงเวลาไม่ได้ระบุลักษณะการกระจายอย่างสมบูรณ์ โดยเฉพาะอย่างยิ่งความรู้เกี่ยวกับช่วงเวลาที่ไม่มีที่สิ้นสุดทั้งหมดแม้ว่าจะมีอยู่ก็ไม่ได้กำหนดการแจกแจงที่ไม่ซ้ำกัน

ตามหนังสือน่าจะเป็น Feller ที่ฉันโปรดปราน Feller "ความรู้เบื้องต้นเกี่ยวกับความน่าจะเป็นทฤษฎีและแอพพลิเคชั่นเล่มที่สอง" (ดูคำตอบของฉันที่ตัวอย่างชีวิตจริงของการแจกแจงทั่วไป ) ส่วน VII.3 ตัวอย่างบนหน้า 227-228 ตามช่วงเวลาของมันหมายความว่ามีการแจกแจงอื่น ๆ ที่มีจำนวนอนันต์ทั้งหมดเท่ากับ Lognormal แต่มีฟังก์ชันการแจกแจงที่แตกต่างกัน ในขณะที่เป็นที่รู้จักกันอย่างกว้างขวางฟังก์ชั่นการสร้างช่วงเวลาไม่ได้มีอยู่สำหรับ Lognormal และไม่สามารถมันสำหรับการแจกแจงอื่น ๆ เหล่านี้ครอบครองช่วงเวลาเดียวกัน

X

Σn=1(E[X2n])-1/(2n)

ลู่ออก โปรดทราบว่านี่ไม่ใช่ถ้าหาก เงื่อนไขนี้ไม่ได้เก็บไว้สำหรับ Lognormal และแน่นอนมันไม่ได้ถูกกำหนดโดยช่วงเวลาของมัน

ในทางกลับกันการแจกแจง (ตัวแปรสุ่ม) ที่ใช้จำนวนช่วงเวลาไม่ จำกัด ทั้งหมดสามารถแตกต่างกันมากเนื่องจากความไม่เท่าเทียมกันซึ่งสามารถได้มาจากช่วงเวลาของพวกเขา


นี่เป็นเรื่องง่ายมากเมื่อการแจกแจงถูก จำกัด ขอบเขตซึ่งในกรณีนั้นช่วงเวลาจะเป็นตัวกำหนดการกระจายอย่างสมบูรณ์ (ไม่ซ้ำกัน)
Alex R.

@Alex นั่นเป็นผลสืบเนื่องทันทีของผลลัพธ์ที่อ้างถึงใน Feller
whuber

มันไม่ถูกต้องอย่างสมบูรณ์ที่จะบอกว่าไม่มีฟังก์ชั่นสร้างช่วงเวลาสำหรับ lognormal ทฤษฏีที่มีประโยชน์มากที่สุดเกี่ยวกับ mgf คิดว่ามันมีอยู่ในช่วงเวลาเปิดที่มีศูนย์และในความหมายที่เข้มงวดไม่มีอยู่ แต่มันมีอยู่ในรังสีที่เกิดจากศูนย์! และนั่นก็ให้ข้อมูลที่เป็นประโยชน์
kjetil b halvorsen

@ kjetil b halvorsen คุณสามารถอธิบาย (บางส่วน) ข้อมูลที่เป็นประโยชน์ที่คุณจะได้รับจากการมี MGF ของ lognormal บนรังสีที่เกิดจากศูนย์หรือไม่? เรย์แบบไหนล่ะ
Mark L. Stone

ชนของความคิดเห็นดังกล่าวเป็นคำถามที่ @kjetil b halvorsen ..
Mark L. Stone

2

ข้อสังเกตจากหมายเหตุของ Glen_b คือช่วงเวลาแรกค่าเฉลี่ยสอดคล้องกับศูนย์กลางของแรงโน้มถ่วงสำหรับวัตถุทางกายภาพและช่วงเวลาที่สองรอบค่าเฉลี่ยความแปรปรวนสอดคล้องกับช่วงเวลาของความเฉื่อย หลังจากนั้นคุณก็ต้องรับผิดชอบตัวเอง


3
E[x2]=x2(x)dx โวลต์aR[x]=E[(x-E[x])2]=(x-E[x])2(x)dx

0

ต้นทวินามมีสองสาขาแต่ละอันมีค่าคงที่ 0.5 ที่จริงแล้ว p = 0.5 และ q = 1-0.5 = 0.5 สิ่งนี้สร้างการแจกแจงแบบปกติที่มีมวลความน่าจะเป็นแบบกระจายอย่างสม่ำเสมอ

ที่จริงแล้วเราต้องสมมติว่าแต่ละระดับในทรีสมบูรณ์ เมื่อเราแบ่งข้อมูลเป็นถังขยะเราจะได้จำนวนจริงจากแผนก แต่เราปัดเศษขึ้น นั่นคือระดับที่ไม่สมบูรณ์ดังนั้นเราจึงไม่ต้องจบด้วยฮิสโตแกรมที่ประมาณค่าปกติ

เปลี่ยนความน่าจะเป็นของการแตกแขนงเป็น p = 0.9999 และ q = 0.0001 และนั่นทำให้เราเบ้ปกติ มวลความน่าจะเปลี่ยนไป บัญชีนั้นสำหรับความเบ้

การมีชั้นหรือถังขยะที่ไม่สมบูรณ์น้อยกว่า 2 ^ n สร้างต้นไม้ทวินามที่มีพื้นที่ที่ไม่มีความน่าจะเป็น สิ่งนี้ทำให้เราเกิดความรุนแรง


การตอบสนองต่อความคิดเห็น:

เมื่อฉันพูดถึงการกำหนดจำนวนของถังขยะปัดเศษขึ้นเป็นจำนวนเต็มถัดไป

เครื่อง Quincunx วางลูกบอลที่ใกล้เคียงกับการแจกแจงปกติผ่านทวินาม สมมติฐานหลายประการที่ทำโดยเครื่องจักรเช่น: 1) จำนวนของถังขยะมี จำกัด 2) ต้นไม้ต้นแบบเป็นไบนารีและ 3) ความน่าจะเป็นคงที่ เครื่อง Quincunx ที่พิพิธภัณฑ์คณิตศาสตร์ในนิวยอร์กช่วยให้ผู้ใช้เปลี่ยนความน่าจะเป็นแบบไดนามิก ความน่าจะเป็นสามารถเปลี่ยนแปลงได้ตลอดเวลาแม้กระทั่งก่อนที่เลเยอร์ปัจจุบันจะเสร็จสิ้น ดังนั้นความคิดนี้เกี่ยวกับถังขยะไม่ได้ถูกเติมเต็ม

ซึ่งแตกต่างจากที่ฉันพูดในคำตอบเดิมของฉันเมื่อคุณมีช่องว่างในต้นไม้การกระจายแสดงให้เห็นถึงความกล้าหาญ

ฉันกำลังดูสิ่งนี้จากมุมมองของระบบกำเนิด ฉันใช้รูปสามเหลี่ยมเพื่อสรุปต้นไม้ตัดสินใจ เมื่อมีการตัดสินใจใหม่ ๆ จะมีการเพิ่มถังขยะที่ฐานของรูปสามเหลี่ยมและในแง่ของการกระจายในส่วนท้าย การตัดทรีย่อยจากต้นไม้จะทำให้เกิดช่องว่างในมวลความน่าจะเป็นของการแจกแจง

ฉันตอบกลับเพื่อให้คุณเข้าใจง่าย ป้าย? ฉันใช้ Excel และเล่นกับความน่าจะเป็นในทวินามและสร้างความเอียงที่คาดหวัง ฉันไม่ได้ทำอย่างนั้นกับ kurtosis มันไม่ได้ช่วยให้เราถูกบังคับให้คิดถึงมวลความน่าจะเป็นว่าเป็นแบบคงที่ในขณะที่ใช้ภาษาแนะนำการเคลื่อนไหว ข้อมูลพื้นฐานหรือลูกทำให้เกิดความรุนแรง จากนั้นเราวิเคราะห์มันอย่างหลากหลายและกำหนดให้เป็นคำที่สื่อความหมายเช่นกึ่งกลางไหล่และท้าย สิ่งเดียวที่เราต้องทำงานกับคือถังขยะ การใช้ชีวิตอยู่ในถังขยะแบบไดนามิกแม้ว่าข้อมูลจะไม่สามารถทำได้


2
นี่เป็นสิ่งที่น่าสนใจ แต่ก็ร่างได้อย่างสุดยอด ยกตัวอย่างเช่นฉลากบนต้นไม้ทวินามของคุณคืออะไร? มันควรจะเป็นต้นไม้ที่ไม่มีที่สิ้นสุดถ้าคุณต้องการได้รับการแจกแจงแบบปกติ - แต่จากนั้นฉลากที่ชัดเจน (โดยใช้การเดินสุ่มหรือใช้การแทนเลขฐานสองของจำนวนจริง) จะไม่นำไปสู่การแจกแจงแบบปกติเลย หากไม่มีรายละเอียดเหล่านี้มากเกินไปก็จะทำให้จินตนาการของผู้อ่านหมดไป คุณสามารถอธิบายรายละเอียดเกี่ยวกับพวกเขา?
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.