พวกเขาหมายความว่าอย่างไรเมื่อพวกเขาพูดว่า "ตัวแปรสุ่ม"?
พวกเขาหมายความว่าอย่างไรเมื่อพวกเขาพูดว่า "ตัวแปรสุ่ม"?
คำตอบ:
ตัวแปรสุ่มคือตัวแปรที่ค่าขึ้นอยู่กับเหตุการณ์ที่ไม่รู้จัก เราสามารถสรุปเหตุการณ์ที่ไม่รู้จักเป็น "สถานะ" จากนั้นตัวแปรสุ่มคือฟังก์ชั่นของรัฐ
ตัวอย่าง:
สมมติว่าเรามีลูกเต๋าสามลูก ( , , ) แล้วรัฐ{3}) D 2 D 3 S = ( D 1 , D 2 , D 3 )
ในการคิดความคิดเห็นล่าสุดฉันสังเกตเห็นว่าการตอบกลับทั้งหมดประสบจากการใช้คำที่ไม่ได้กำหนดเช่น "ตัวแปร" และคำที่คลุมเครือเช่น "ไม่ทราบ" หรืออุทธรณ์แนวคิดทางคณิตศาสตร์ทางเทคนิคเช่น "ฟังก์ชัน" และ "พื้นที่น่าจะเป็น" เราควรพูดอะไรกับคนที่ไม่ใช่ทางคณิตศาสตร์ที่ต้องการคำจำกัดความ "ตัวแปรแบบสุ่ม" ที่ใช้งานง่าย หลังจากผู้ชนะบางคนได้อธิบายปรากฏการณ์แบบสุ่มอย่างง่ายแล้วฉันได้ให้คำจำกัดความที่สั้นพอที่จะใส่ในหนึ่งบรรทัด เนื่องจากอาจไม่เป็นที่พอใจของcognoscentiดังนั้นจึงอธิบายวิธีการขยายความหมายทางเทคนิคตามปกติ
วิธีหนึ่งในการเข้าถึงแนวคิดที่อยู่เบื้องหลังตัวแปรสุ่มคือการดึงดูดความสนใจไปที่โมเดลการสุ่มตั๋ว รุ่นนี้แทนที่การทดลองหรือการสังเกตโดยกล่องที่เต็มไปด้วยตั๋ว ในแต่ละตั๋วจะมีการเขียนผลลัพธ์ที่เป็นไปได้ของการทดสอบ (ผลลัพธ์อาจเป็นเรื่องง่ายเหมือน "หัว" หรือ "ก้อย" แต่ในทางปฏิบัติมันเป็นสิ่งที่ซับซ้อนมากขึ้นเช่นประวัติราคาหุ้นการบันทึกที่สมบูรณ์ของการทดลองที่ยาวนานหรือลำดับของคำทั้งหมดในเอกสาร .) ผลลัพธ์ที่เป็นไปได้ทั้งหมดจะปรากฏขึ้นอย่างน้อยหนึ่งครั้งในตั๋ว; ผลลัพธ์บางอย่างอาจปรากฏบนตั๋วหลายใบ
แทนที่จะทำการทดลองจริง ๆ เราจินตนาการอย่างถี่ถ้วน - แต่สุ่มสี่สุ่มห้า - ผสมตั๋วทั้งหมดและเลือกเพียงใบเดียว หากเราสามารถแสดงให้เห็นว่าการทดลองจริงควรทำตัวเหมือนเป็นการทดลองในวิธีนี้เราได้ลดการทดลองในโลกแห่งความจริงที่ซับซ้อน (และมีราคาแพงและมีความยาว) เป็นการทดลองที่ง่ายใช้งานง่ายคิด (หรือ "แบบจำลองทางสถิติ) ") ความชัดเจนและความเรียบง่ายของโมเดลนี้ทำให้สามารถวิเคราะห์การทดสอบได้
ตัวอย่างมาตรฐานเกี่ยวข้องกับผลลัพธ์ของการโยนเหรียญลูกเต๋าและการวาดไพ่ สิ่งเหล่านี้ค่อนข้างเบี่ยงเบนความสนใจของพวกเขาดังนั้นเพื่อแสดงให้เห็นว่าเรามีความกังวลเกี่ยวกับผลลัพธ์ของการเลือกตั้งประธานาธิบดีสหรัฐในปี 2559 ในฐานะที่เป็นการทำให้เข้าใจง่าย (เล็ก) ฉันจะสันนิษฐานว่าหนึ่งในสองพรรคใหญ่ - รีพับลิกัน (R) หรือ Democratic (D) - จะชนะ เพราะ (ด้วยข้อมูลที่มีอยู่ในปัจจุบัน) ผลลัพธ์ไม่แน่นอนเราจึงนึกภาพใส่ตั๋วลงในกล่อง: บางอันมี "R" เขียนไว้ในบัตรและอื่น ๆ ที่มี "D" แบบจำลองของเราคือการดึงตั๋วหนึ่งใบจากช่องนี้
มีบางอย่างขาดหายไป: เรายังไม่ได้ระบุจำนวนตั๋วสำหรับแต่ละผลลัพธ์ ในความเป็นจริงการค้นพบสิ่งนี้เป็นปัญหาหลักของสถิติ: จากการสังเกต (และทฤษฎี) สิ่งที่สามารถพูดเกี่ยวกับสัดส่วนสัมพัทธ์ของผลลัพธ์แต่ละรายการในกล่อง
(ฉันหวังว่าเป็นที่ชัดเจนว่าสัดส่วนของตั๋วแต่ละประเภทในกล่องเป็นตัวกำหนดคุณสมบัติของมันแทนที่จะเป็นจำนวนจริงของตั๋วแต่ละใบสัดส่วนถูกกำหนด - ตามปกติ - จะนับจำนวนตั๋วแต่ละชนิดหารด้วย จำนวนตั๋วทั้งหมดตัวอย่างเช่นกล่องที่มีตั๋ว "D" หนึ่งใบและตั๋ว "R" หนึ่งใบจะทำงานเหมือนกับกล่องที่มีตั๋ว "D" หนึ่งล้านใบและตั๋ว "R" หนึ่งล้านใบเนื่องจากทั้งสองกรณีแต่ละประเภทคือ 50% ของตั๋วทั้งหมดและดังนั้นจึงมีโอกาส 50% ที่จะถูกดึงเมื่อมีการผสมตั๋วอย่างละเอียด)
แต่อย่ามาติดตามคำถามนี้ตรงนี้เพราะเราใกล้เป้าหมายที่จะกำหนดตัวแปรแบบสุ่ม ปัญหาของตัวแบบจนถึงขณะนี้คือมันไม่สามารถวัดเชิงปริมาณได้ในขณะที่เราต้องการที่จะสามารถตอบคำถามเชิงปริมาณได้ และฉันไม่ได้หมายถึงคำถามเล็ก ๆ น้อย ๆ แต่จริง ๆ แล้วเป็นคำถามเชิงปฏิบัติเช่น "ถ้า บริษัท ของฉันมีเงินลงทุนนับพันล้านยูโรในการพัฒนาเชื้อเพลิงฟอสซิลนอกชายฝั่งสหรัฐฯมูลค่าของการลงทุนนี้จะเปลี่ยนไปมากเท่าไหร่จากการเลือกตั้งปี 2559 ?" ในกรณีนี้แบบจำลองนั้นง่ายมากที่เราไม่สามารถทำได้เพื่อให้ได้คำตอบที่เป็นจริงสำหรับคำถามนี้ แต่เราสามารถไปไกลถึงการปรึกษาเจ้าหน้าที่เศรษฐกิจของเราและขอความคิดเห็นเกี่ยวกับผลลัพธ์ที่เป็นไปได้สองอย่าง:
หากพรรคเดโมแครตชนะการลงทุนจะเปลี่ยนแปลงไปเท่าใด (สมมติว่าคำตอบคือดอลลาร์)
ถ้ารีพับลิกันชนะจะเปลี่ยนไปเท่าไหร่ (สมมติว่าคำตอบคือดอลลาร์)
คำตอบคือตัวเลข เพื่อใช้ในแบบจำลองฉันจะขอให้พนักงานของฉันผ่านตั๋วทั้งหมดในกล่องและบนตั๋ว "D" ทุกใบเพื่อเขียน "ดอลลาร์" และทุกตั๋ว "R" เพื่อเขียน "ดอลลาร์" ตอนนี้เราสามารถจำลองความไม่แน่นอนในการลงทุนได้อย่างชัดเจนและเชิงปริมาณ: การเปลี่ยนแปลงหลังการเลือกตั้งในมูลค่านั้นเหมือนกับการรับจำนวนเงินที่เขียนบนตั๋วใบเดียวที่สุ่มมาจากกล่องนี้R
รุ่นนี้ช่วยให้เราตอบคำถามเพิ่มเติมเกี่ยวกับการลงทุน ตัวอย่างเช่นเราไม่แน่ใจเกี่ยวกับมูลค่าการลงทุนอย่างไร? แม้ว่าจะมีสูตรทางคณิตศาสตร์ (ง่าย) สำหรับความไม่แน่นอนนี้เราสามารถทำซ้ำคำตอบของพวกเขาอย่างถูกต้องโดยใช้แบบจำลองของเราซ้ำ ๆ - อาจพันครั้ง - เพื่อดูว่าผลลัพธ์ประเภทใดเกิดขึ้นจริงและวัดการแพร่กระจายของพวกเขา แบบจำลองตั๋วในกล่องทำให้เรามีเหตุผลเชิงปริมาณเกี่ยวกับผลลัพธ์ที่ไม่แน่นอน
เพื่อให้ได้คำตอบเชิงปริมาณเกี่ยวกับความไม่แน่นอนหรือปรากฏการณ์แปรปรวนเราสามารถนำรูปแบบตั๋วในกล่องและเขียนหมายเลขบนตั๋ว กระบวนการเขียนตัวเลขนี้ต้องทำตามกฎเดียวเท่านั้น: ต้องสอดคล้องกัน ในตัวอย่างตั๋วประชาธิปไตยทุกใบจะต้องมี "ดอลลาร์" เขียนไว้ - ไม่มีข้อยกเว้น - และตั๋ว Republican ทุกใบจะต้องมี "ดอลลาร์" เขียนไว้R
ตัวแปรสุ่มเป็นวิธีการใด ๆ ที่สอดคล้องกับการเขียนตัวเลขในการจองตั๋วในกล่อง
(สัญกรณ์ทางคณิตศาสตร์สำหรับสิ่งนี้คือให้ชื่อแก่กระบวนการจัดลำดับใหม่โดยทั่วไปจะมีตัวอักษรละตินตัวพิมพ์ใหญ่เช่นหรือข้อมูลที่ระบุบนตั๋วมักจะถูกตั้งชื่อด้วยตัวอักษรเล็ก ๆ โดยทั่วไปคือ (ตัวพิมพ์เล็กกรีก "โอเมก้า "). ค่าที่เกี่ยวข้องโดยใช้วิธีการสุ่มตัวแปรไปยังตั๋วนั้นแทนในตัวอย่างจากนั้นเราอาจพูดว่า somethign เช่น"เป็นตัวแปรสุ่มที่แสดงถึงการเปลี่ยนแปลงในมูลค่าของการลงทุน . "มันจะถูกระบุโดยการระบุและY ω X ω X ( ω ) X X ( D ) = d X ( R ) = r X X X. ในกรณีที่ซับซ้อนมากขึ้นค่าของจะได้รับจากคำอธิบายที่ซับซ้อนมากขึ้นและบ่อยครั้งโดยสูตร ตัวอย่างเช่นตั๋วอาจแสดงถึงมูลค่าของราคาปิดของหุ้นหนึ่งปีและตัวแปรสุ่มอาจเป็นมูลค่า ณ เวลาใดเวลาหนึ่งของตราสารอนุพันธ์ในหุ้นนั้นเช่นตัวเลือกการย้าย สัญญาตัวเลือกอธิบายวิธีการคำนวณผู้ค้าตัวเลือกใช้แบบจำลองนี้เพื่อกำหนดราคาผลิตภัณฑ์ของพวกเขา)
คุณสังเกตเห็นว่าดังกล่าวไม่ใช่การสุ่มหรือตัวแปรหรือไม่? ไม่ใช่ "ไม่แน่นอน" หรือ "ไม่รู้จัก" มันเป็นการกำหนดที่ชัดเจน (ของตัวเลขถึงผลลัพธ์) สิ่งที่เราสามารถเขียนลงไปด้วยความรู้เต็มรูปแบบและความมั่นใจที่สมบูรณ์ อะไรคือการสุ่มเป็นกระบวนการของการวาดภาพตั๋วจากกล่องนั้น สิ่งที่เป็นตัวแปรคือค่าตั๋วที่อาจจะวาด
แจ้งให้ทราบล่วงหน้าเช่นกันการแยกประเด็นที่แตกต่างกันสองประเด็นที่เกี่ยวข้องอย่างชัดเจนในการประเมินการลงทุน: ฉันขอให้นักเศรษฐศาสตร์ของฉันกำหนดให้ฉัน แต่จะไม่เห็นด้วยกับผลการเลือกตั้ง ฉันจะใช้ข้อมูลอื่น ๆ (อาจจะโทรหาที่ปรึกษาทางการเมืองนักโหราศาสตร์ใช้กระดานผีถ้วยแก้วหรืออะไรก็ตาม) เพื่อประมาณสัดส่วนของตั๋ว "D" และ "R" แต่ละใบที่จะใส่ในกล่อง
เมื่อคำจำกัดความของตัวแปรสุ่มมาพร้อมกับข้อแม้ "วัดได้" สิ่งที่ผู้นิยามในใจคือความเห็นทั่วไปของแบบจำลองตั๋วในกล่องกับสถานการณ์ที่มีผลลัพธ์ที่เป็นไปได้มากมาย (ในทางเทคนิคมันเป็นสิ่งจำเป็นเท่านั้นที่มีuncountablyผลอนันต์หรือในกรณีที่ไม่มีเหตุผลน่าจะมีส่วนเกี่ยวข้องและแม้กระทั่งในกรณีหลังนี้สามารถหลีกเลี่ยงได้.) ด้วยผลหลายอย่างมากมายมันเป็นเรื่องยากที่จะบอกว่าสิ่งที่เป็นสัดส่วนของทั้งหมดจะเป็น หากมีตั๋ว "D" จำนวนมากและตั๋ว "R" จำนวนมากมายไม่มีขอบเขตสัดส่วนของพวกเขาคืออะไร เราไม่สามารถหาคำตอบได้ด้วยการแบ่งอินฟินิตี้หนึ่งโดยอันอื่น!
ในกรณีเหล่านี้เราต้องการวิธีที่แตกต่างกันในการระบุสัดส่วน ชุดตั๋วที่สามารถวัดค่าได้คือชุดของตั๋วใด ๆ ในกล่องซึ่งสามารถกำหนดสัดส่วนได้ เมื่อดำเนินการเสร็จแล้วจำนวนที่เราคิดว่าเป็น "สัดส่วน" เรียกว่า "ความน่าจะเป็น" (ไม่ใช่ทุกคอลเลกชันของตั๋วที่จำเป็นต้องมีความน่าจะเป็นที่เกี่ยวข้อง)
ตัวแปรสุ่มเป็นวิธีการกำหนดรหัสตัวเลขให้กับผลลัพธ์ที่เป็นไปได้แต่ละรายการ *
ในสะพานเอซจะมีแต้มไพ่สูง 4 แต้มคิง 3 ควีน 2 และแจ็ค 1 การ์ดอื่น ๆ มีแต้ม 0 แต้ม
* ตัวแปรสุ่มอย่างเป็นทางการคือฟังก์ชันที่จับคู่ผลลัพธ์แต่ละรายการ (ในพื้นที่ตัวอย่าง) กับจำนวนจริง
แตกต่างจากตัวแปรปกติตัวแปรสุ่มอาจไม่สามารถทดแทนค่าเดียวที่ไม่เปลี่ยนแปลง คุณสมบัติทางสถิติค่อนข้างเช่นการกระจายของตัวแปรสุ่มอาจระบุไว้ การแจกแจงเป็นฟังก์ชันที่ให้ความน่าจะเป็นที่ตัวแปรจะใช้กับค่าที่กำหนดหรืออยู่ภายในช่วงที่กำหนดพารามิเตอร์บางอย่างเช่นค่าเฉลี่ยหรือค่าเบี่ยงเบนมาตรฐาน
ตัวแปรสุ่มอาจถูกจัดประเภทเป็นแบบไม่ต่อเนื่องหากการแจกแจงอธิบายค่าจากชุดที่นับได้เช่นจำนวนเต็ม การจำแนกประเภทอื่นสำหรับตัวแปรสุ่มนั้นต่อเนื่องและใช้หากการแจกแจงนั้นครอบคลุมค่าจากชุดที่นับไม่ได้เช่นจำนวนจริง
ฉันบอกเรื่องนี้:
ตัวแปรแบบสุ่มสามารถเปรียบเทียบได้กับจักรวรรดิโรมันอันศักดิ์สิทธิ์: จักรวรรดิโรมันอันศักดิ์สิทธิ์นั้นไม่ศักดิ์สิทธิ์มันไม่ได้เป็นโรมันและมันไม่ใช่จักรวรรดิ
ในทำนองเดียวกันตัวแปรสุ่มไม่ได้เป็นแบบสุ่มหรือตัวแปร มันเป็นเพียงฟังก์ชั่น (เรื่องราวได้รับการบอกเล่าที่นี่: แหล่งที่มา )
อย่างน้อยก็เป็นวิธีที่อธิบายได้ง่ายซึ่งอาจช่วยให้ผู้คนจำได้!
จากWikipedia :
ในคณิตศาสตร์ (โดยเฉพาะทฤษฎีความน่าจะเป็นและสถิติ) ตัวแปรสุ่ม (หรือตัวแปรสุ่ม) คือ (โดยทั่วไป) ฟังก์ชันที่วัดได้ซึ่งแมปพื้นที่ความน่าจะเป็นลงในพื้นที่ที่วัดได้ ตัวแปรสุ่มการแมปผลลัพธ์ที่เป็นไปได้ทั้งหมดของเหตุการณ์เข้าสู่จำนวนจริงมักมีการศึกษาในสถิติเบื้องต้นและใช้ในวิทยาศาสตร์เพื่อทำนายตามข้อมูลที่ได้จากการทดลองทางวิทยาศาสตร์ นอกจากการใช้งานทางวิทยาศาสตร์แล้วตัวแปรสุ่มยังได้รับการพัฒนาสำหรับการวิเคราะห์เกมแห่งโอกาสและเหตุการณ์สุ่ม ยูทิลิตี้ของตัวแปรสุ่มมาจากความสามารถในการจับเฉพาะคุณสมบัติทางคณิตศาสตร์ที่จำเป็นในการตอบคำถามที่น่าจะเป็น
จากcnx.org :
ตัวแปรสุ่มคือฟังก์ชันซึ่งกำหนดค่าตัวเลขที่ไม่ซ้ำกันให้กับผลลัพธ์ที่เป็นไปได้ทั้งหมดของการทดสอบแบบสุ่มภายใต้เงื่อนไขคงที่ ตัวแปรสุ่มไม่ใช่ตัวแปร แต่เป็นฟังก์ชั่นที่แมปเหตุการณ์กับตัวเลข
ตัวแปรสุ่มมักจะหมายถึง X เป็นตัวแปรที่ผลลัพธ์ไม่แน่นอน การสังเกตผลลัพธ์เฉพาะของตัวแปรนี้เรียกว่าการทำให้เป็นจริง มันเป็นฟังก์ชั่นที่แมปพื้นที่ความน่าจะเป็นลงในพื้นที่ที่สามารถวัดได้ซึ่งมักจะเรียกว่าพื้นที่ของรัฐ ตัวแปรสุ่มไม่ต่อเนื่อง (สามารถรับค่าที่แตกต่างจำนวนมาก) หรือต่อเนื่อง (สามารถใช้ค่าจำนวนอนันต์)
พิจารณาตัวแปรสุ่ม X ซึ่งเป็นผลรวมที่ได้รับเมื่อหมุนลูกเต๋าสองลูก สามารถใช้ค่าใดก็ได้ 2-12 (โดยมีความน่าจะเป็นเท่ากันเมื่อได้รับลูกเต๋าอย่างเป็นธรรม) และผลลัพธ์นั้นไม่แน่นอนจนกว่าลูกเต๋าจะกลิ้ง
ในการศึกษาในมหาวิทยาลัยที่ไม่ใช่คณิตศาสตร์ของฉันเราได้รับการบอกว่าตัวแปรสุ่มเป็นแผนที่จากค่าที่ตัวแปรสามารถนำไปสู่ความน่าจะเป็น สิ่งนี้อนุญาตให้วาดการแจกแจงความน่าจะเป็น
เมื่อเร็ว ๆ นี้ฉันได้ตระหนักถึงความแตกต่างจากสิ่งที่นักคณิตศาสตร์มีอยู่ในใจ ปรากฎว่าโดยตัวแปรสุ่มพวกเขาหมายถึงฟังก์ชั่นที่เรียบง่าย X: Ω→ R ซึ่งใช้องค์ประกอบของพื้นที่ตัวอย่างΩ ( หรือที่เรียกว่าผลลัพธ์ตั๋วหรือบุคคลตามที่อธิบายไว้ข้างต้น) และแปลมันเป็นจำนวนจริง R ในช่วง ( -∞, ∞) นั่นคือมันถูกบันทึกไว้อย่างเหมาะสมข้างต้นว่ามันไม่ได้สุ่มและไม่มีตัวแปรเลย การสุ่มมักจะมาพร้อมกับการวัดความน่าจะเป็น P ซึ่งเป็นส่วนหนึ่งของพื้นที่การวัด (Ω, P) P แมปตัวอย่างกับ R คล้ายกับตัวแปรสุ่ม แต่ช่วงเวลานี้ จำกัด [0,1] และเราสามารถพูดได้ว่าตัวแปรสุ่มแปล (Ω, P) เป็น (R, P) ดังนั้นตัวแปรสุ่มจะติดตั้งความน่าจะเป็น วัด P: R -> [0,1] เพื่อให้คุณสามารถพูดสำหรับทุก ๆ x ใน R สิ่งที่น่าจะเป็นของการเกิดขึ้นของมัน
อินทิกรัลไม่ต้องการค่าที่แท้จริงของตัวแปรสุ่ม
a sample
ซึ่งผมขอให้แยกแยะความแตกต่างจากผลลัพธ์ ทำไมคุณต้องแนะนำฟังก์ชั่นและเรียกมันว่าตัวแปรสุ่มแม้ว่ามันจะถูกกำหนดอย่างแน่นอนและไม่แปรเลย ทำไมคุณไม่ลองตัวอย่างผลลัพธ์ในทันที?