ความแตกต่างระหว่างแบบจำลองทางสถิติกับตัวแบบความน่าจะเป็นคืออะไร?


29

ความน่าจะเป็นประยุกต์เป็นสาขาที่สำคัญในความน่าจะเป็นรวมถึงความน่าจะเป็นในการคำนวณ เนื่องจากสถิติใช้ทฤษฎีความน่าจะเป็นในการสร้างแบบจำลองเพื่อจัดการกับข้อมูลเป็นความเข้าใจของฉันฉันจึงสงสัยว่าอะไรคือความแตกต่างที่สำคัญระหว่างตัวแบบเชิงสถิติและตัวแบบความน่าจะเป็น รูปแบบความน่าจะเป็นไม่ต้องการข้อมูลจริงหรือ? ขอบคุณ

คำตอบ:


29

ความน่าจะเป็นรุ่นประกอบด้วยแฝดที่Ωเป็นพื้นที่ตัวอย่างFเป็นσพีชคณิต (เหตุการณ์) และPเป็นตัวชี้วัดความน่าจะเป็นในการเรนไฮน์(Ω,F,P)ΩFσPF

คำอธิบายที่ใช้งานง่าย รูปแบบความน่าจะสามารถตีความได้เป็นที่รู้จักกันเป็น ตัวแปรสุ่ม Xตัวอย่างเช่นให้Xเป็นตัวแปรสุ่มแบบกระจายปกติที่มีค่าเฉลี่ย0และความแปรปรวน1XX01 1ในกรณีนี้การวัดความน่าจะเป็นนั้นสัมพันธ์กับฟังก์ชันการแจกแจงสะสม (CDF) FถึงPF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

ภาพรวม ความหมายของความน่าจะเป็นรุ่นขึ้นอยู่กับความหมายทางคณิตศาสตร์ของความน่าจะดูตัวอย่างความน่าจะเป็นฟรีและควอนตัมน่าจะเป็น

สถิติรุ่น เป็นชุดของแบบจำลองความน่าจะเป็นนี้เป็นชุดของความน่าจะเป็นมาตรการ / กระจายในพื้นที่ตัวอย่างΩSΩ

ชุดการแจกแจงความน่าจะเป็นนี้มักจะถูกเลือกสำหรับการสร้างแบบจำลองปรากฏการณ์ที่เรามีข้อมูล

คำอธิบายที่ใช้งานง่าย ในแบบจำลองทางสถิติพารามิเตอร์และการแจกแจงที่อธิบายปรากฏการณ์บางอย่างไม่เป็นที่รู้จัก ตัวอย่างนี้เป็น familiy ของการกระจายปกติมีค่าเฉลี่ยและแปรปรวนσ 2R +นี้เป็นพารามิเตอร์ทั้งสองเป็นที่รู้จักและคุณมักจะต้องการที่จะใช้ชุดข้อมูลสำหรับการประมาณค่าพารามิเตอร์ (เช่นการเลือกองค์ประกอบของS ) ชุดการแจกแจงนี้สามารถเลือกได้ในΩและFใด ๆแต่ถ้าฉันไม่เข้าใจผิดในตัวอย่างจริงเท่านั้นที่จะถูกกำหนดในคู่เดียวกัน( Ω , F )μRσ2R+SΩF(Ω,F) มีเหตุผลที่จะต้องพิจารณา

ภาพรวม บทความนี้ให้คำจำกัดความอย่างเป็นทางการของแบบจำลองทางสถิติ แต่ผู้เขียนกล่าวว่า "แบบจำลองแบบเบย์ต้องการส่วนประกอบเพิ่มเติมในรูปแบบของการกระจายก่อนหน้า ... แม้ว่าสูตรแบบเบย์ไม่ได้เป็นจุดสนใจหลักของบทความนี้" ดังนั้นคำจำกัดความของแบบจำลองทางสถิติขึ้นอยู่กับชนิดของแบบจำลองที่เราใช้: พารามิเตอร์หรือแบบพารามิเตอร์ นอกจากนี้ในการตั้งค่าพารามิเตอร์ความหมายขึ้นอยู่กับวิธีการปฏิบัติต่อพารามิเตอร์ (เช่น Classical กับ Bayesian)

ความแตกต่างคือ: ในแบบจำลองความน่าจะเป็นที่คุณรู้ว่าการวัดความน่าจะเป็นตัวอย่างเช่นโดยที่μ 0 , σ 2 0เป็นพารามิเตอร์ที่รู้จักในขณะที่ในแบบจำลองทางสถิติคุณพิจารณาชุดการแจกแจง ตัวอย่างเช่นNormal ( μ , σ 2 )โดยที่μ , σ 2เป็นพารามิเตอร์ที่ไม่รู้จักNormal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

ไม่มีใครต้องการชุดข้อมูล แต่ฉันจะบอกว่าแบบจำลองทางสถิติมักจะถูกเลือกสำหรับการสร้างแบบจำลองหนึ่ง


2
@ HonglangWang นั่นถูกต้องพอสมควร ความแตกต่างที่สำคัญคือแบบจำลองความน่าจะเป็นเป็นเพียงการแจกแจงแบบหนึ่ง (รู้จัก) ในขณะที่แบบจำลองทางสถิติเป็นชุดของแบบจำลองความน่าจะเป็น ข้อมูลจะใช้ในการเลือกแบบจำลองจากชุดนี้หรือชุดย่อยขนาดเล็กของโมเดลที่ดีกว่า (ในบางกรณี) อธิบายปรากฏการณ์ (ในแง่ของข้อมูล)

2
(+1) นี่เป็นคำตอบที่ดีแม้ว่าฉันจะมีความคิดเห็นสองสามข้อ ครั้งแรกฉันคิดว่านี่อาจจะขายนัก probabilist สั้น ๆ มันไม่ใช่เรื่องแปลกเลยที่จะพิจารณาชุดของความน่าจะเป็นช่องว่างในแบบจำลองความน่าจะเป็นและแน่นอนมาตรการที่เป็นไปได้อาจเป็นแบบสุ่ม (สร้างบนพื้นที่ขนาดใหญ่กว่าที่เหมาะสม) ประการที่สองแบบเบย์ (โดยเฉพาะ) อาจพบคำตอบนี้เล็กน้อยอึกอักในที่แบบจำลองทางสถิติแบบเบย์ที่มักจะถูกมองว่าเป็นรูปแบบที่น่าจะเป็นเพียงครั้งเดียวบนพื้นที่ผลิตภัณฑ์ที่เหมาะสม Θ Ω×Θ
พระคาร์ดินัล

1
@gung นี่เป็นคำถามที่เกี่ยวข้องกับการวัดเชิงทฤษฎีมากกว่า สำหรับคำถามแรกของคุณถูกกำหนดผ่าน CDF ตอนนี้การตีความของΩเป็นเรื่องยากเพราะอย่างเป็นทางการP ( X x )หมายความว่าP ( ω Ω : X ( ω ) x )แล้วΩไม่ได้ค่าที่สังเกตได้ Fคือσ -พีชคณิตซึ่งเป็นภาพล่วงหน้าของ Borel σ -พีชคณิตภายใต้XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσXอีกครั้งสิ่งนี้ไม่สามารถสังเกตได้ ฉันไม่แน่ใจว่าจะอธิบายเรื่องนี้อย่างไรในระดับที่เข้าใจง่าย

2
ΩΩXtΩXΩXF
whuber

2
@gung F is a sigma algebra: it's a collection of subsets (the "events"). In the financial application, it's a set of price histories; in the forearm measurements application, the events would be sets of people. We can talk about this more if you want in a chat room.
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.