“ ตัวแปรสุ่ม” หมายถึงอะไร?


คำตอบ:


35

ตัวแปรสุ่มคือตัวแปรที่ค่าขึ้นอยู่กับเหตุการณ์ที่ไม่รู้จัก เราสามารถสรุปเหตุการณ์ที่ไม่รู้จักเป็น "สถานะ" จากนั้นตัวแปรสุ่มคือฟังก์ชั่นของรัฐ

ตัวอย่าง:

สมมติว่าเรามีลูกเต๋าสามลูก ( , , ) แล้วรัฐ{3}) D 2 D 3 S = ( D 1 , D 2 , D 3 )D1D2D3S=(D1,D2,D3)

  1. หนึ่งตัวแปรสุ่มคือจำนวน 5s นี่คือ:X

X=(D1=5?)+(D2=5?)+(D3=5?)
  1. ตัวแปรสุ่มคือผลรวมของการทอยลูกเต๋า นี่คือ:Y

Y=D1+D2+D3

ขอบคุณสำหรับคำตอบที่ชัดเจนและรัดกุม มันทำให้เกิดคำถามเกี่ยวกับจุดประสงค์ในการแยกสถานะที่ไม่รู้จักออกจากผลลัพธ์ (ฉันเดาว่านี่เป็นวิธีที่โดเมนและช่วงของ "ตัวแปรสุ่ม" ถูกเรียกในทฤษฎีความน่าจะเป็น) ดูเหมือนว่ารัฐไม่รู้จักเรียกว่าa sampleซึ่งผมขอให้แยกแยะความแตกต่างจากผลลัพธ์ ทำไมคุณต้องแนะนำฟังก์ชั่นและเรียกมันว่าตัวแปรสุ่มแม้ว่ามันจะถูกกำหนดอย่างแน่นอนและไม่แปรเลย ทำไมคุณไม่ลองตัวอย่างผลลัพธ์ในทันที?
Val

2
เมื่อ "เหตุการณ์" กลายเป็น "รู้จัก" จะเกิดอะไรขึ้นกับตัวแปรสุ่ม? ตามคำตอบนี้มันจะไม่มีอีกต่อไป! ความเชื่อมั่นของคำตอบนี้กับความคิดที่คลุมเครือเช่น "รู้" - ซึ่งเป็นอัตนัยล้วน ๆ - ทำให้พอใจน้อยกว่าทั้งคำจำกัดความหรือคำอธิบายของตัวแปรสุ่ม
whuber

1
@whuber ภาษาอังกฤษและภาษามนุษย์อื่น ๆ นั้นไม่แน่ชัด ดูเหมือนว่าคุณกำลังเลือกคำว่า "ขึ้นอยู่กับ" ไม่ใช่ "รู้จัก" "เป็นหน้าที่ของ" ชัดเจนยิ่งขึ้น แต่แล้ว "เหตุการณ์ที่ไม่รู้จัก" นั้นคลุมเครือดังนั้นนักคณิตศาสตร์จึงกำหนด "ความน่าจะเป็นพื้นที่", "พีชคณิตซิกม่า", "ฟังก์ชันที่วัดได้" ฯลฯ หากคุณต้องการการรักษาที่เข้มงวดยิ่งขึ้น Wikipedia มีแล้ว: en.wikipedia.org/wiki/Random_variable
Paul

1
@whuber ในขณะที่วิกิพีเดียวิ่งไปที่ศัพท์แสงทางคณิตศาสตร์เพื่อให้ได้ความแม่นยำฉันสังเกตว่าคำตอบของคุณเป็นตัวอย่างที่ดีของทุกคนในขณะที่การอ่านที่คุ้มค่าต้องใช้ 16 ย่อหน้าในการดำเนินการ แต่จะบอกอะไรกับนักศึกษาระดับปริญญาตรีที่ต้องการคำตอบที่ใช้เวลาอ่าน 5 วินาที? ลูกค้าขอชื่นชมความกระชับในคำจำกัดความ
Paul

5
มันเป็นฟังก์ชั่นมูลค่าจริงที่วัดได้ในพื้นที่ความน่าจะเป็น ด้วยข้อกำหนดทางเทคนิคแต่ละข้อ - "ฟังก์ชันที่วัดได้" "มูลค่าจริง" และ "พื้นที่ความน่าจะเป็น" ฉันประเมินว่าฉันสูญเสียผู้ชมที่มีศักยภาพ 90% เหลือเพียงแค่ 0.1% ที่เข้าใจและชื่นชมคำจำกัดความนั้นจริง อนึ่งนั่นคือนิยามทางคณิตศาสตร์อย่างแท้จริง มันไม่มีประโยชน์จนกว่าจะมีใครระบุว่าจะสามารถนำไปใช้กับปัญหาทางสถิติจริงได้อย่างไร - แต่อย่างน้อยก็ถูกต้อง (ถ้าไม่ใช่แบบทั่วไปอย่างสมบูรณ์)
whuber

69

บทนำ

ในการคิดความคิดเห็นล่าสุดฉันสังเกตเห็นว่าการตอบกลับทั้งหมดประสบจากการใช้คำที่ไม่ได้กำหนดเช่น "ตัวแปร" และคำที่คลุมเครือเช่น "ไม่ทราบ" หรืออุทธรณ์แนวคิดทางคณิตศาสตร์ทางเทคนิคเช่น "ฟังก์ชัน" และ "พื้นที่น่าจะเป็น" เราควรพูดอะไรกับคนที่ไม่ใช่ทางคณิตศาสตร์ที่ต้องการคำจำกัดความ "ตัวแปรแบบสุ่ม" ที่ใช้งานง่าย หลังจากผู้ชนะบางคนได้อธิบายปรากฏการณ์แบบสุ่มอย่างง่ายแล้วฉันได้ให้คำจำกัดความที่สั้นพอที่จะใส่ในหนึ่งบรรทัด เนื่องจากอาจไม่เป็นที่พอใจของcognoscentiดังนั้นจึงอธิบายวิธีการขยายความหมายทางเทคนิคตามปกติ

ตั๋วในกล่อง

วิธีหนึ่งในการเข้าถึงแนวคิดที่อยู่เบื้องหลังตัวแปรสุ่มคือการดึงดูดความสนใจไปที่โมเดลการสุ่มตั๋ว รุ่นนี้แทนที่การทดลองหรือการสังเกตโดยกล่องที่เต็มไปด้วยตั๋ว ในแต่ละตั๋วจะมีการเขียนผลลัพธ์ที่เป็นไปได้ของการทดสอบ (ผลลัพธ์อาจเป็นเรื่องง่ายเหมือน "หัว" หรือ "ก้อย" แต่ในทางปฏิบัติมันเป็นสิ่งที่ซับซ้อนมากขึ้นเช่นประวัติราคาหุ้นการบันทึกที่สมบูรณ์ของการทดลองที่ยาวนานหรือลำดับของคำทั้งหมดในเอกสาร .) ผลลัพธ์ที่เป็นไปได้ทั้งหมดจะปรากฏขึ้นอย่างน้อยหนึ่งครั้งในตั๋ว; ผลลัพธ์บางอย่างอาจปรากฏบนตั๋วหลายใบ

แทนที่จะทำการทดลองจริง ๆ เราจินตนาการอย่างถี่ถ้วน - แต่สุ่มสี่สุ่มห้า - ผสมตั๋วทั้งหมดและเลือกเพียงใบเดียว หากเราสามารถแสดงให้เห็นว่าการทดลองจริงควรทำตัวเหมือนเป็นการทดลองในวิธีนี้เราได้ลดการทดลองในโลกแห่งความจริงที่ซับซ้อน (และมีราคาแพงและมีความยาว) เป็นการทดลองที่ง่ายใช้งานง่ายคิด (หรือ "แบบจำลองทางสถิติ) ") ความชัดเจนและความเรียบง่ายของโมเดลนี้ทำให้สามารถวิเคราะห์การทดสอบได้

ตัวอย่าง

ตัวอย่างมาตรฐานเกี่ยวข้องกับผลลัพธ์ของการโยนเหรียญลูกเต๋าและการวาดไพ่ สิ่งเหล่านี้ค่อนข้างเบี่ยงเบนความสนใจของพวกเขาดังนั้นเพื่อแสดงให้เห็นว่าเรามีความกังวลเกี่ยวกับผลลัพธ์ของการเลือกตั้งประธานาธิบดีสหรัฐในปี 2559 ในฐานะที่เป็นการทำให้เข้าใจง่าย (เล็ก) ฉันจะสันนิษฐานว่าหนึ่งในสองพรรคใหญ่ - รีพับลิกัน (R) หรือ Democratic (D) - จะชนะ เพราะ (ด้วยข้อมูลที่มีอยู่ในปัจจุบัน) ผลลัพธ์ไม่แน่นอนเราจึงนึกภาพใส่ตั๋วลงในกล่อง: บางอันมี "R" เขียนไว้ในบัตรและอื่น ๆ ที่มี "D" แบบจำลองของเราคือการดึงตั๋วหนึ่งใบจากช่องนี้

มีบางอย่างขาดหายไป: เรายังไม่ได้ระบุจำนวนตั๋วสำหรับแต่ละผลลัพธ์ ในความเป็นจริงการค้นพบสิ่งนี้เป็นปัญหาหลักของสถิติ: จากการสังเกต (และทฤษฎี) สิ่งที่สามารถพูดเกี่ยวกับสัดส่วนสัมพัทธ์ของผลลัพธ์แต่ละรายการในกล่อง

(ฉันหวังว่าเป็นที่ชัดเจนว่าสัดส่วนของตั๋วแต่ละประเภทในกล่องเป็นตัวกำหนดคุณสมบัติของมันแทนที่จะเป็นจำนวนจริงของตั๋วแต่ละใบสัดส่วนถูกกำหนด - ตามปกติ - จะนับจำนวนตั๋วแต่ละชนิดหารด้วย จำนวนตั๋วทั้งหมดตัวอย่างเช่นกล่องที่มีตั๋ว "D" หนึ่งใบและตั๋ว "R" หนึ่งใบจะทำงานเหมือนกับกล่องที่มีตั๋ว "D" หนึ่งล้านใบและตั๋ว "R" หนึ่งล้านใบเนื่องจากทั้งสองกรณีแต่ละประเภทคือ 50% ของตั๋วทั้งหมดและดังนั้นจึงมีโอกาส 50% ที่จะถูกดึงเมื่อมีการผสมตั๋วอย่างละเอียด)

ทำแบบจำลองเชิงปริมาณ

แต่อย่ามาติดตามคำถามนี้ตรงนี้เพราะเราใกล้เป้าหมายที่จะกำหนดตัวแปรแบบสุ่ม ปัญหาของตัวแบบจนถึงขณะนี้คือมันไม่สามารถวัดเชิงปริมาณได้ในขณะที่เราต้องการที่จะสามารถตอบคำถามเชิงปริมาณได้ และฉันไม่ได้หมายถึงคำถามเล็ก ๆ น้อย ๆ แต่จริง ๆ แล้วเป็นคำถามเชิงปฏิบัติเช่น "ถ้า บริษัท ของฉันมีเงินลงทุนนับพันล้านยูโรในการพัฒนาเชื้อเพลิงฟอสซิลนอกชายฝั่งสหรัฐฯมูลค่าของการลงทุนนี้จะเปลี่ยนไปมากเท่าไหร่จากการเลือกตั้งปี 2559 ?" ในกรณีนี้แบบจำลองนั้นง่ายมากที่เราไม่สามารถทำได้เพื่อให้ได้คำตอบที่เป็นจริงสำหรับคำถามนี้ แต่เราสามารถไปไกลถึงการปรึกษาเจ้าหน้าที่เศรษฐกิจของเราและขอความคิดเห็นเกี่ยวกับผลลัพธ์ที่เป็นไปได้สองอย่าง:

  1. หากพรรคเดโมแครตชนะการลงทุนจะเปลี่ยนแปลงไปเท่าใด (สมมติว่าคำตอบคือดอลลาร์)d

  2. ถ้ารีพับลิกันชนะจะเปลี่ยนไปเท่าไหร่ (สมมติว่าคำตอบคือดอลลาร์)r

คำตอบคือตัวเลข เพื่อใช้ในแบบจำลองฉันจะขอให้พนักงานของฉันผ่านตั๋วทั้งหมดในกล่องและบนตั๋ว "D" ทุกใบเพื่อเขียน "ดอลลาร์" และทุกตั๋ว "R" เพื่อเขียน "ดอลลาร์" ตอนนี้เราสามารถจำลองความไม่แน่นอนในการลงทุนได้อย่างชัดเจนและเชิงปริมาณ: การเปลี่ยนแปลงหลังการเลือกตั้งในมูลค่านั้นเหมือนกับการรับจำนวนเงินที่เขียนบนตั๋วใบเดียวที่สุ่มมาจากกล่องนี้Rdr

รุ่นนี้ช่วยให้เราตอบคำถามเพิ่มเติมเกี่ยวกับการลงทุน ตัวอย่างเช่นเราไม่แน่ใจเกี่ยวกับมูลค่าการลงทุนอย่างไร? แม้ว่าจะมีสูตรทางคณิตศาสตร์ (ง่าย) สำหรับความไม่แน่นอนนี้เราสามารถทำซ้ำคำตอบของพวกเขาอย่างถูกต้องโดยใช้แบบจำลองของเราซ้ำ ๆ - อาจพันครั้ง - เพื่อดูว่าผลลัพธ์ประเภทใดเกิดขึ้นจริงและวัดการแพร่กระจายของพวกเขา แบบจำลองตั๋วในกล่องทำให้เรามีเหตุผลเชิงปริมาณเกี่ยวกับผลลัพธ์ที่ไม่แน่นอน

ตัวแปรสุ่ม

เพื่อให้ได้คำตอบเชิงปริมาณเกี่ยวกับความไม่แน่นอนหรือปรากฏการณ์แปรปรวนเราสามารถนำรูปแบบตั๋วในกล่องและเขียนหมายเลขบนตั๋ว กระบวนการเขียนตัวเลขนี้ต้องทำตามกฎเดียวเท่านั้น: ต้องสอดคล้องกัน ในตัวอย่างตั๋วประชาธิปไตยทุกใบจะต้องมี "ดอลลาร์" เขียนไว้ - ไม่มีข้อยกเว้น - และตั๋ว Republican ทุกใบจะต้องมี "ดอลลาร์" เขียนไว้Rdr

ตัวแปรสุ่มเป็นวิธีการใด ๆ ที่สอดคล้องกับการเขียนตัวเลขในการจองตั๋วในกล่อง

(สัญกรณ์ทางคณิตศาสตร์สำหรับสิ่งนี้คือให้ชื่อแก่กระบวนการจัดลำดับใหม่โดยทั่วไปจะมีตัวอักษรละตินตัวพิมพ์ใหญ่เช่นหรือข้อมูลที่ระบุบนตั๋วมักจะถูกตั้งชื่อด้วยตัวอักษรเล็ก ๆ โดยทั่วไปคือ (ตัวพิมพ์เล็กกรีก "โอเมก้า "). ค่าที่เกี่ยวข้องโดยใช้วิธีการสุ่มตัวแปรไปยังตั๋วนั้นแทนในตัวอย่างจากนั้นเราอาจพูดว่า somethign เช่น"เป็นตัวแปรสุ่มที่แสดงถึงการเปลี่ยนแปลงในมูลค่าของการลงทุน . "มันจะถูกระบุโดยการระบุและY ω X ω X ( ω ) X X ( D ) = d X ( R ) = r X X XXYωXωX(ω)XX(D)=dX(R)=r. ในกรณีที่ซับซ้อนมากขึ้นค่าของจะได้รับจากคำอธิบายที่ซับซ้อนมากขึ้นและบ่อยครั้งโดยสูตร ตัวอย่างเช่นตั๋วอาจแสดงถึงมูลค่าของราคาปิดของหุ้นหนึ่งปีและตัวแปรสุ่มอาจเป็นมูลค่า ณ เวลาใดเวลาหนึ่งของตราสารอนุพันธ์ในหุ้นนั้นเช่นตัวเลือกการย้าย สัญญาตัวเลือกอธิบายวิธีการคำนวณผู้ค้าตัวเลือกใช้แบบจำลองนี้เพื่อกำหนดราคาผลิตภัณฑ์ของพวกเขา)XXX

คุณสังเกตเห็นว่าดังกล่าวไม่ใช่การสุ่มหรือตัวแปรหรือไม่? ไม่ใช่ "ไม่แน่นอน" หรือ "ไม่รู้จัก" มันเป็นการกำหนดที่ชัดเจน (ของตัวเลขถึงผลลัพธ์) สิ่งที่เราสามารถเขียนลงไปด้วยความรู้เต็มรูปแบบและความมั่นใจที่สมบูรณ์ อะไรคือการสุ่มเป็นกระบวนการของการวาดภาพตั๋วจากกล่องนั้น สิ่งที่เป็นตัวแปรคือค่าตั๋วที่อาจจะวาดX

แจ้งให้ทราบล่วงหน้าเช่นกันการแยกประเด็นที่แตกต่างกันสองประเด็นที่เกี่ยวข้องอย่างชัดเจนในการประเมินการลงทุน: ฉันขอให้นักเศรษฐศาสตร์ของฉันกำหนดให้ฉัน แต่จะไม่เห็นด้วยกับผลการเลือกตั้ง ฉันจะใช้ข้อมูลอื่น ๆ (อาจจะโทรหาที่ปรึกษาทางการเมืองนักโหราศาสตร์ใช้กระดานผีถ้วยแก้วหรืออะไรก็ตาม) เพื่อประมาณสัดส่วนของตั๋ว "D" และ "R" แต่ละใบที่จะใส่ในกล่องX


หลังจากนั้น: เกี่ยวกับการวัดได้

เมื่อคำจำกัดความของตัวแปรสุ่มมาพร้อมกับข้อแม้ "วัดได้" สิ่งที่ผู้นิยามในใจคือความเห็นทั่วไปของแบบจำลองตั๋วในกล่องกับสถานการณ์ที่มีผลลัพธ์ที่เป็นไปได้มากมาย (ในทางเทคนิคมันเป็นสิ่งจำเป็นเท่านั้นที่มีuncountablyผลอนันต์หรือในกรณีที่ไม่มีเหตุผลน่าจะมีส่วนเกี่ยวข้องและแม้กระทั่งในกรณีหลังนี้สามารถหลีกเลี่ยงได้.) ด้วยผลหลายอย่างมากมายมันเป็นเรื่องยากที่จะบอกว่าสิ่งที่เป็นสัดส่วนของทั้งหมดจะเป็น หากมีตั๋ว "D" จำนวนมากและตั๋ว "R" จำนวนมากมายไม่มีขอบเขตสัดส่วนของพวกเขาคืออะไร เราไม่สามารถหาคำตอบได้ด้วยการแบ่งอินฟินิตี้หนึ่งโดยอันอื่น!

ในกรณีเหล่านี้เราต้องการวิธีที่แตกต่างกันในการระบุสัดส่วน ชุดตั๋วที่สามารถวัดค่าได้คือชุดของตั๋วใด ๆ ในกล่องซึ่งสามารถกำหนดสัดส่วนได้ เมื่อดำเนินการเสร็จแล้วจำนวนที่เราคิดว่าเป็น "สัดส่วน" เรียกว่า "ความน่าจะเป็น" (ไม่ใช่ทุกคอลเลกชันของตั๋วที่จำเป็นต้องมีความน่าจะเป็นที่เกี่ยวข้อง)

XX(ω)abab


7
ก่อนหน้านี้สำหรับผู้ที่ไม่คุ้นเคยกับตัวแปรสุ่มหรือรูปแบบตั๋วหนึ่งในกล่องกวดวิชาแบบโต้ตอบอย่างรวดเร็วในเว็บไซต์ของฉันที่quantdec.com/envstats/notes/class_06/tutorial.htmให้การปฏิบัติและบางแนวคิดเพิ่มเติม
whuber

2
เป็นตัวอย่างที่แสดงให้เห็นถึงการทำงานแนวคิดเหล่านี้จะปรากฏขึ้นที่stats.stackexchange.com/a/68782
whuber

2
หมายเหตุฉันสงสัยว่าหลายคนใช้คำว่า "ประชากร" ในแง่ของตั๋วในกล่อง ฉันหลีกเลี่ยงคำศัพท์นั้นเพราะฟังดูเหมือนมากเกินไปที่เราจะสร้างแบบจำลองความน่าจะเป็นสำหรับการสุ่มตัวอย่างประชากร (จริง) แม้ว่าจะมีประชากรทางกายภาพถูกสุ่มตัวอย่างมันก็ยากที่จะมีการโต้ตอบแบบหนึ่งต่อหนึ่งที่สมบูรณ์แบบระหว่างมันและตั๋ว ตัวอย่างเช่นไม่มีใครสามารถจำแนกคนจีนที่มีชีวิตอยู่ได้ในวันที่ 1 มกราคม 2014 ส่วนหนึ่งเป็นเพราะความไม่แน่นอนเกี่ยวกับเวลาที่ผู้คนเกิดเมื่อพวกเขาตายและถึงแม้ว่าพวกเขาจะเป็นคนจีนก็ตาม
whuber

4
@jsk คำนำของคำตอบนี้อธิบายว่าทำไมการดูแลเช่นนี้จึงมีความจำเป็น แม้ว่ามันจะเป็นความจริงที่คำตอบอีกสองคำในหัวข้อนี้มีคำจำกัดความที่ถูกต้องและครบถ้วน ("ฟังก์ชันที่วัดได้จากพื้นที่ความน่าจะเป็นไปในพื้นที่ที่วัดได้ที่รู้จักกันในชื่อพื้นที่รัฐ") คำจำกัดความนั้น และฟังก์ชั่นที่วัดได้ ผู้อ่านจะบ่น"นั่นคือสิ่งที่จบการศึกษาระดับ"
whuber

4
@ user4205580 สำหรับคำจำกัดความทางคณิตศาสตร์อย่างแท้จริงไม่จำเป็นต้องมี "ความมั่นคง" เลยเพราะสำหรับนักคณิตศาสตร์ตัวแปรแบบสุ่มจะถูกกำหนด "เพียงอย่างเดียว" สำหรับแอปพลิเคชันทางสถิติตามที่กล่าวไว้ที่นี่เป็นเงื่อนไขที่สำคัญเนื่องจากข้อมูลจำนวนมากไม่ได้เป็นตัวเลข: ต้องสร้างตัวแปรสุ่มในแบบที่เหมาะสมกับตัวแบบและวัตถุประสงค์ในการวิเคราะห์ คุณอาจตัดสินใจด้วยตัวเองว่ามีคุณค่าสำหรับคุณในความแตกต่างทางแนวคิดนี้หรือไม่
whuber

16

ตัวแปรสุ่มเป็นวิธีการกำหนดรหัสตัวเลขให้กับผลลัพธ์ที่เป็นไปได้แต่ละรายการ *

ตัวอย่างที่ 1

{H,T}

XX(H)=1X(T)=010

ตัวอย่างที่ 2

{A,K,,2,A,K,,2,A,K,,2,A,K,,2}.

ในสะพานเอซจะมีแต้มไพ่สูง 4 แต้มคิง 3 ควีน 2 และแจ็ค 1 การ์ดอื่น ๆ มีแต้ม 0 แต้ม

YY(A)=4Y(J)=1Y(7)=0


HTA

* ตัวแปรสุ่มอย่างเป็นทางการคือฟังก์ชันที่จับคู่ผลลัพธ์แต่ละรายการ (ในพื้นที่ตัวอย่าง) กับจำนวนจริง


5
+1 คำตอบนี้มาถึงจุดถูกต้องและชัดเจน - ดังนั้นหลีกเลี่ยงเรื่องไร้สาระเกี่ยวกับค่า "ไม่ทราบ" และ "เปลี่ยน" ที่แพร่กระจายคำตอบอื่น ๆ ในหัวข้อนี้
whuber

12

แตกต่างจากตัวแปรปกติตัวแปรสุ่มอาจไม่สามารถทดแทนค่าเดียวที่ไม่เปลี่ยนแปลง คุณสมบัติทางสถิติค่อนข้างเช่นการกระจายของตัวแปรสุ่มอาจระบุไว้ การแจกแจงเป็นฟังก์ชันที่ให้ความน่าจะเป็นที่ตัวแปรจะใช้กับค่าที่กำหนดหรืออยู่ภายในช่วงที่กำหนดพารามิเตอร์บางอย่างเช่นค่าเฉลี่ยหรือค่าเบี่ยงเบนมาตรฐาน

ตัวแปรสุ่มอาจถูกจัดประเภทเป็นแบบไม่ต่อเนื่องหากการแจกแจงอธิบายค่าจากชุดที่นับได้เช่นจำนวนเต็ม การจำแนกประเภทอื่นสำหรับตัวแปรสุ่มนั้นต่อเนื่องและใช้หากการแจกแจงนั้นครอบคลุมค่าจากชุดที่นับไม่ได้เช่นจำนวนจริง


2
อาจเป็นการดีที่สุดที่จะไม่ใช้คำว่า "ตัวแปรปกติ" ที่นี่เมื่อคุณไม่ได้หมายถึงตัวแปรสุ่มแบบกระจาย
Rob Hyndman

ตกลง แม้ว่าโดยส่วนตัวแล้วฉันจะมองคนที่ตลกสักสองสามวินาทีถ้าพวกเขาพูดว่า "ตัวแปรปกติ" และไม่ได้โยนคำว่า "สุ่ม" หรือ "กระจาย" ในที่ใดที่หนึ่งเพื่อบอกฉันว่านั่นคือสิ่งที่พวกเขากำลังคุยกัน แต่ฉันก็เป็นวิศวกรและไม่ใช่นักสถิติดังนั้นฉันจึงไม่ใช้สัญลักษณ์เฉพาะโดเมนมากนัก
Sharpie

7
ตัวแปรสุ่มอาจถูกจำแนกอย่างรอบคอบหากพวกเขาไม่ได้ให้ความสนใจตัวเอง หากพวกเขานับได้เพียงเราบอกว่าไม่ต่อเนื่อง :-P คุณหมายถึงการสั่งยามากกว่าที่จะเลิกสมัคร แต่ฉันคิดว่าการอธิบายอาจเหมาะสมกว่า คำตอบที่ดีอยู่แล้ว - หวังว่า +1 จะช่วยลดปัญหาการวางยา!
walkytalky

@walkytalky ขอบคุณสำหรับการแก้ไข - ฉันได้ทำการแก้ไขบางอย่าง
Sharpie

1
ตัวแปรใด ๆ เป็นตัวยึดตำแหน่งสำหรับค่า คุณอาจกำหนดค่านี้หรือค่านั้นให้กับตัวแปร (บางครั้งชุดของค่าที่คุณสามารถกำหนดได้จะถูก จำกัด โดยชุดที่เรียกว่าชนิด ) ตัวแปรที่เก็บค่าเดียวที่ไม่เปลี่ยนแปลงเรียกว่า 'ค่าคงที่' คุณอยากจะบอกว่าตัวแปรสุ่มเก็บค่าที่รู้จักในขณะที่ไม่ทราบค่าของตัวแปรสุ่ม? สิ่งนี้ขัดแย้งกับคำตอบอื่น ๆ ซึ่งบอกว่าตัวแปรสุ่มไม่ใช่ตัวแปรเลย - มันเป็นฟังก์ชั่นที่ (กำหนดค่าล่วงหน้า) แผนที่รัฐที่ไม่รู้จักกับสิ่งอื่น มันไม่ได้สุ่มและไม่ใช่ตัวแปรพวกเขาพูด
Val

6

ฉันบอกเรื่องนี้:

ตัวแปรแบบสุ่มสามารถเปรียบเทียบได้กับจักรวรรดิโรมันอันศักดิ์สิทธิ์: จักรวรรดิโรมันอันศักดิ์สิทธิ์นั้นไม่ศักดิ์สิทธิ์มันไม่ได้เป็นโรมันและมันไม่ใช่จักรวรรดิ

ในทำนองเดียวกันตัวแปรสุ่มไม่ได้เป็นแบบสุ่มหรือตัวแปร มันเป็นเพียงฟังก์ชั่น (เรื่องราวได้รับการบอกเล่าที่นี่: แหล่งที่มา )

อย่างน้อยก็เป็นวิธีที่อธิบายได้ง่ายซึ่งอาจช่วยให้ผู้คนจำได้!


3

จากWikipedia :

ในคณิตศาสตร์ (โดยเฉพาะทฤษฎีความน่าจะเป็นและสถิติ) ตัวแปรสุ่ม (หรือตัวแปรสุ่ม) คือ (โดยทั่วไป) ฟังก์ชันที่วัดได้ซึ่งแมปพื้นที่ความน่าจะเป็นลงในพื้นที่ที่วัดได้ ตัวแปรสุ่มการแมปผลลัพธ์ที่เป็นไปได้ทั้งหมดของเหตุการณ์เข้าสู่จำนวนจริงมักมีการศึกษาในสถิติเบื้องต้นและใช้ในวิทยาศาสตร์เพื่อทำนายตามข้อมูลที่ได้จากการทดลองทางวิทยาศาสตร์ นอกจากการใช้งานทางวิทยาศาสตร์แล้วตัวแปรสุ่มยังได้รับการพัฒนาสำหรับการวิเคราะห์เกมแห่งโอกาสและเหตุการณ์สุ่ม ยูทิลิตี้ของตัวแปรสุ่มมาจากความสามารถในการจับเฉพาะคุณสมบัติทางคณิตศาสตร์ที่จำเป็นในการตอบคำถามที่น่าจะเป็น

จากcnx.org :

ตัวแปรสุ่มคือฟังก์ชันซึ่งกำหนดค่าตัวเลขที่ไม่ซ้ำกันให้กับผลลัพธ์ที่เป็นไปได้ทั้งหมดของการทดสอบแบบสุ่มภายใต้เงื่อนไขคงที่ ตัวแปรสุ่มไม่ใช่ตัวแปร แต่เป็นฟังก์ชั่นที่แมปเหตุการณ์กับตัวเลข


4
คำจำกัดความของ cnx.org ไม่ถูกต้อง: ข้อแรกเนื่องจากความคลุมเครือ - และอาจทำให้เข้าใจผิด - การใช้ "ที่ไม่เหมือนใคร" และ "เงื่อนไขคงที่" และข้อที่สองเพราะมันผิด RV กำหนดไว้กับผลลัพธ์ (องค์ประกอบของพื้นที่ตัวอย่าง) ไม่ใช่เหตุการณ์ (ชุดผลลัพธ์ที่วัดได้)
whuber

P=κλeλtκ=0P(t)dtED(t)=λeλtED(t)

1
f(x)

3

ตัวแปรสุ่มมักจะหมายถึง X เป็นตัวแปรที่ผลลัพธ์ไม่แน่นอน การสังเกตผลลัพธ์เฉพาะของตัวแปรนี้เรียกว่าการทำให้เป็นจริง มันเป็นฟังก์ชั่นที่แมปพื้นที่ความน่าจะเป็นลงในพื้นที่ที่สามารถวัดได้ซึ่งมักจะเรียกว่าพื้นที่ของรัฐ ตัวแปรสุ่มไม่ต่อเนื่อง (สามารถรับค่าที่แตกต่างจำนวนมาก) หรือต่อเนื่อง (สามารถใช้ค่าจำนวนอนันต์)

พิจารณาตัวแปรสุ่ม X ซึ่งเป็นผลรวมที่ได้รับเมื่อหมุนลูกเต๋าสองลูก สามารถใช้ค่าใดก็ได้ 2-12 (โดยมีความน่าจะเป็นเท่ากันเมื่อได้รับลูกเต๋าอย่างเป็นธรรม) และผลลัพธ์นั้นไม่แน่นอนจนกว่าลูกเต๋าจะกลิ้ง


5
แค่ความคิด แต่สิ่งนี้อ่านเหมือนว่าคุณกำลังบอกว่าความน่าจะเป็นที่จะม้วน 12 (1/36) เท่ากับ 7 (1/6)
jefflovejapan

0

ในการศึกษาในมหาวิทยาลัยที่ไม่ใช่คณิตศาสตร์ของฉันเราได้รับการบอกว่าตัวแปรสุ่มเป็นแผนที่จากค่าที่ตัวแปรสามารถนำไปสู่ความน่าจะเป็น สิ่งนี้อนุญาตให้วาดการแจกแจงความน่าจะเป็น

http://mathbits.com/MathBits/TISection/Statistics2/normaldistribution.htm

เมื่อเร็ว ๆ นี้ฉันได้ตระหนักถึงความแตกต่างจากสิ่งที่นักคณิตศาสตร์มีอยู่ในใจ ปรากฎว่าโดยตัวแปรสุ่มพวกเขาหมายถึงฟังก์ชั่นที่เรียบง่าย X: Ω→ R ซึ่งใช้องค์ประกอบของพื้นที่ตัวอย่างΩ ( หรือที่เรียกว่าผลลัพธ์ตั๋วหรือบุคคลตามที่อธิบายไว้ข้างต้น) และแปลมันเป็นจำนวนจริง R ในช่วง ( -∞, ∞) นั่นคือมันถูกบันทึกไว้อย่างเหมาะสมข้างต้นว่ามันไม่ได้สุ่มและไม่มีตัวแปรเลย การสุ่มมักจะมาพร้อมกับการวัดความน่าจะเป็น P ซึ่งเป็นส่วนหนึ่งของพื้นที่การวัด (Ω, P) P แมปตัวอย่างกับ R คล้ายกับตัวแปรสุ่ม แต่ช่วงเวลานี้ จำกัด [0,1] และเราสามารถพูดได้ว่าตัวแปรสุ่มแปล (Ω, P) เป็น (R, P) ดังนั้นตัวแปรสุ่มจะติดตั้งความน่าจะเป็น วัด P: R -> [0,1] เพื่อให้คุณสามารถพูดสำหรับทุก ๆ x ใน R สิ่งที่น่าจะเป็นของการเกิดขึ้นของมัน

Ω

H(Ω)=P(Ωi)ln(Ωi)

อินทิกรัลไม่ต้องการค่าที่แท้จริงของตัวแปรสุ่ม


XAσA
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.