คำถามติดแท็ก sampling

การสร้างตัวอย่างจากประชากรที่ระบุอย่างดีโดยใช้วิธีความน่าจะเป็นและ / หรือการสร้างตัวเลขสุ่มจากการแจกแจงที่ระบุ เนื่องจากแท็กนี้ไม่ชัดเจนโปรดพิจารณา [การสำรวจตัวอย่าง] สำหรับอดีตและ [monte-carlo] หรือ [จำลอง] สำหรับหลัง สำหรับคำถามเกี่ยวกับการสร้างตัวอย่างแบบสุ่มจากการแจกแจงที่รู้จักโปรดพิจารณาใช้แท็ก [การสร้างแบบสุ่ม]

8
การสุ่มตัวอย่างเกี่ยวข้องในเวลาของ 'ข้อมูลขนาดใหญ่' หรือไม่
หรือมากกว่านั้น "มันจะเป็น"? ข้อมูลขนาดใหญ่ทำให้สถิติและความรู้ที่เกี่ยวข้องมีความสำคัญมากขึ้น แต่ดูเหมือนว่าจะมีผลต่อทฤษฎีการสุ่มตัวอย่าง ฉันเห็นโฆษณานี้ใน 'บิ๊กดาต้า' และไม่สามารถช่วยสงสัยได้ว่า "ทำไม" ฉันต้องการวิเคราะห์ทุกอย่าง ? ไม่มีเหตุผลสำหรับ "ทฤษฎีการสุ่มตัวอย่าง" ที่จะออกแบบ / นำมาใช้ / ประดิษฐ์ / ค้นพบหรือไม่? ฉันไม่เข้าใจการวิเคราะห์ 'ประชากร' ทั้งหมดของชุดข้อมูล เพียงเพราะคุณสามารถทำได้ไม่ได้หมายความว่าคุณควรจะ (ความโง่เขลาเป็นสิทธิพิเศษ แต่คุณไม่ควรละเมิด :) ดังนั้นคำถามของฉันคือสิ่งนี้: มีความเกี่ยวข้องทางสถิติในการวิเคราะห์ชุดข้อมูลทั้งหมดหรือไม่ สิ่งที่ดีที่สุดที่คุณสามารถทำได้คือลดข้อผิดพลาดให้น้อยที่สุดหากคุณสุ่มตัวอย่าง แต่ค่าใช้จ่ายในการลดข้อผิดพลาดนั้นคุ้มหรือไม่ "คุณค่าของข้อมูล" คุ้มค่ากับความพยายามเวลาที่ต้องเสียไป ฯลฯ ในการวิเคราะห์ข้อมูลขนาดใหญ่บนคอมพิวเตอร์คู่ขนานขนาดใหญ่หรือไม่? แม้ว่าจะมีคนวิเคราะห์ประชากรทั้งหมดผลลัพธ์ก็น่าจะเดาได้ดีที่สุดโดยมีความน่าจะเป็นที่สูงขึ้น อาจจะสูงกว่าการสุ่มตัวอย่างเล็กน้อย (หรือมากกว่านั้นอีก) ความเข้าใจที่ได้จากการวิเคราะห์ประชากรกับการวิเคราะห์ตัวอย่างนั้นแตกต่างกันอย่างกว้างขวางหรือไม่? หรือเราควรยอมรับว่า "เวลามีการเปลี่ยนแปลง"? การสุ่มตัวอย่างเป็นกิจกรรมอาจมีความสำคัญน้อยลงหากให้พลังงานในการคำนวณที่เพียงพอ :) หมายเหตุ: ฉันไม่ได้พยายามที่จะเริ่มการโต้วาที แต่กำลังมองหาคำตอบที่จะเข้าใจว่าทำไมข้อมูลขนาดใหญ่ถึงทำในสิ่งที่มันทำ (เช่นวิเคราะห์ทุกอย่าง) และไม่สนใจทฤษฎีการสุ่มตัวอย่าง (หรือไม่?)

5
ทฤษฎีขีด จำกัด กลางสำหรับค่ามัธยฐานตัวอย่าง
ถ้าฉันคำนวณค่ามัธยฐานของจำนวนการสังเกตที่มากพอจากการแจกแจงแบบเดียวกันทฤษฎีบทขีด จำกัด กลางจะระบุว่าการกระจายของค่ามัธยฐานจะประมาณการกระจายตัวแบบปกติหรือไม่? ความเข้าใจของฉันคือว่านี่เป็นความจริงด้วยวิธีการของกลุ่มตัวอย่างจำนวนมาก แต่มันก็เป็นความจริงกับมัธยฐาน? ถ้าไม่เป็นเช่นนั้นการกระจายตัวพื้นฐานของค่ามัธยฐานตัวอย่างคืออะไร

5
การอนุมานทางสถิติเมื่อกลุ่มตัวอย่าง“ เป็น” ประชากร
ลองนึกภาพคุณต้องรายงานจำนวนผู้สมัครที่ทำแบบทดสอบรายปี ดูเหมือนว่าค่อนข้างยากที่จะอนุมาน% ของความสำเร็จที่สังเกตได้เช่นในประชากรที่กว้างขึ้นเนื่องจากความจำเพาะของประชากรเป้าหมาย ดังนั้นคุณอาจพิจารณาว่าข้อมูลเหล่านี้แสดงถึงประชากรทั้งหมด ผลการทดสอบแสดงให้เห็นว่าสัดส่วนของเพศชายและเพศหญิงแตกต่างกันจริงหรือไม่? การทดสอบเปรียบเทียบสัดส่วนที่สังเกตและสัดส่วนทางทฤษฎีดูเหมือนว่าถูกต้องหรือไม่เนื่องจากคุณพิจารณาประชากรทั้งหมด (ไม่ใช่ตัวอย่าง)?

4
วิธีตัวอย่างจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนที่ทราบโดยใช้ภาษาโปรแกรมทั่วไป
ฉันไม่เคยเรียนวิชาสถิติมาก่อนดังนั้นฉันหวังว่าฉันจะถามถูกที่แล้ว สมมติว่าฉันมีเพียงสองอธิบายข้อมูลการกระจายปกติ: ค่าเฉลี่ยและความแปรปรวน 2 ฉันต้องการใช้คอมพิวเตอร์เพื่อสุ่มตัวอย่างจากการแจกแจงนี้ซึ่งฉันเคารพสถิติทั้งสองนี้σ 2μμ\muσ2σ2\sigma^2 เห็นได้ชัดว่าฉันสามารถจัดการค่าเฉลี่ยด้วยการทำ normalizing ประมาณ 0: เพียงเพิ่มให้กับแต่ละตัวอย่างก่อนส่งออกตัวอย่าง แต่ผมไม่เห็นว่าโปรแกรมสร้างตัวอย่างที่จะเคารพ 2σ 2μμ\muσ2σ2\sigma^2 โปรแกรมของฉันจะเป็นภาษาโปรแกรมทั่วไป ฉันไม่สามารถเข้าถึงแพ็คเกจสถิติใด ๆ ได้

5
ทำไมการเพิ่มขนาดตัวอย่างจึงทำให้ความแปรปรวน (การสุ่มตัวอย่าง) ต่ำลง?
ภาพใหญ่: ฉันพยายามที่จะเข้าใจว่าการเพิ่มขนาดตัวอย่างเพิ่มพลังของการทดสอบอย่างไร สไลด์อาจารย์ของฉันอธิบายสิ่งนี้ด้วยภาพของการแจกแจงปกติ 2 อันหนึ่งอันสำหรับสมมติฐานว่างและอีกอันสำหรับสมมุติฐานทางเลือกและเกณฑ์การตัดสินใจคระหว่างพวกเขา พวกเขายืนยันว่าการเพิ่มขนาดตัวอย่างจะลดความแปรปรวนและทำให้เกิดความรุนแรงสูงขึ้นลดพื้นที่ที่ใช้ร่วมกันภายใต้ส่วนโค้งและความน่าจะเป็นของข้อผิดพลาดประเภท II ภาพเล็ก: ฉันไม่เข้าใจว่าขนาดตัวอย่างที่ใหญ่กว่าจะลดความแปรปรวนได้อย่างไร ฉันสมมติว่าคุณคำนวณความแปรปรวนตัวอย่างและใช้มันเป็นพารามิเตอร์ในการแจกแจงแบบปกติ ฉันเหนื่อย: googlingแต่คำตอบที่ยอมรับมากที่สุดมี 0 upvotes หรือเป็นเพียงตัวอย่าง การคิด : ตามกฎของตัวเลขขนาดใหญ่ทุกค่าในที่สุดควรทำให้มีเสถียรภาพรอบค่าที่เป็นไปได้ตามการแจกแจงปกติที่เราสมมติ และความแปรปรวนจึงควรมาบรรจบกับความแปรปรวนของการกระจายตัวปกติที่เราสมมุติ แต่ความแปรปรวนของการแจกแจงแบบปกตินั้นคืออะไรและมันคือค่าต่ำสุดนั่นคือเราจะแน่ใจได้ว่าความแปรปรวนตัวอย่างของเราลดลงหรือไม่

5
เมทริกซ์ความแปรปรวนร่วมตัวอย่างเป็นสมมาตรและแน่นอนแน่นอนเสมอใช่หรือไม่
เมื่อคำนวณเมทริกซ์ความแปรปรวนร่วมของตัวอย่างจะมีการรับประกันว่าจะได้เมทริกซ์สมมาตรและบวกแน่นอนหรือไม่ ปัจจุบันปัญหาของฉันมีตัวอย่างของเวกเตอร์สังเกต 4600 และ 24 มิติ

5
ทำไมโพลทางการเมืองถึงมีขนาดตัวอย่างขนาดใหญ่เช่นนี้?
เมื่อฉันดูข่าวฉันสังเกตเห็นว่าการสำรวจของ Gallup สำหรับสิ่งต่าง ๆ เช่นการเลือกตั้งประธานาธิบดีมีขนาดตัวอย่างมากกว่า 1,000 ตัวอย่าง จากสิ่งที่ฉันจำได้จากสถิติของวิทยาลัยคือขนาดตัวอย่าง 30 เป็นตัวอย่าง "มีขนาดใหญ่มาก" ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง

5
กลยุทธ์การสอนการกระจายตัวตัวอย่าง
รุ่น tl; dr เวอร์ชัน ใดที่คุณใช้กลยุทธ์ที่ประสบความสำเร็จในการสอนการกระจายตัวตัวอย่าง (ของค่าเฉลี่ยตัวอย่าง) ในระดับปริญญาตรีเบื้องต้น? พื้นหลัง ในเดือนกันยายนฉันจะสอนหลักสูตรสถิติเบื้องต้นสำหรับนักศึกษาปีที่สองทางสังคมศาสตร์ (ส่วนใหญ่เป็นรัฐศาสตร์และสังคมวิทยา) โดยใช้David Basic Moore มันจะเป็นครั้งที่ห้าที่ผมเคยสอนหลักสูตรนี้และปัญหาหนึ่งที่ฉันเคยมีอย่างต่อเนื่องคือการที่นักเรียนได้ต่อสู้จริงๆกับความคิดของการกระจายการสุ่มตัวอย่าง มันครอบคลุมเป็นพื้นหลังสำหรับการอนุมานและปฏิบัติตามการแนะนำเบื้องต้นเกี่ยวกับความน่าจะเป็นที่พวกเขาดูเหมือนจะไม่มีปัญหาหลังจากมีอาการสะอึกเริ่มแรก (และโดยพื้นฐานแล้วฉันหมายถึงพื้นฐาน- หลังจากทั้งหมดนักเรียนเหล่านี้จำนวนมากได้รับการคัดเลือกด้วยตนเองเป็นสตรีมหลักสูตรที่เฉพาะเจาะจงเพราะพวกเขาพยายามที่จะหลีกเลี่ยงสิ่งใดก็ตามด้วยคำใบ้ที่คลุมเครือของ "คณิตศาสตร์") ฉันเดาว่าอาจจะออกจากหลักสูตร 60% โดยไม่มีความเข้าใจน้อยที่สุดประมาณ 25% เข้าใจหลักการ แต่ไม่ใช่การเชื่อมต่อกับแนวคิดอื่น ๆ และอีก 15% ที่เหลือเข้าใจอย่างถ่องแท้ ประเด็นหลัก ปัญหาที่นักเรียนดูเหมือนมีอยู่กับแอปพลิเคชัน เป็นการยากที่จะอธิบายว่าปัญหาที่แม่นยำคืออะไรนอกจากบอกว่าพวกเขาไม่เข้าใจ จากการสำรวจความคิดเห็นที่ฉันได้ดำเนินการภาคการศึกษาที่ผ่านมาและจากการตอบการสอบฉันคิดว่าส่วนหนึ่งของความยากลำบากคือความสับสนระหว่างวลีที่เกี่ยวข้องและคล้ายกันสองเสียง (การกระจายตัวตัวอย่างและการกระจายตัวอย่าง) ดังนั้นฉันจึงไม่ใช้วลี อีกต่อไป แต่แน่นอนว่านี่คือสิ่งที่ในขณะที่เกิดความสับสนในตอนแรกสามารถเข้าใจได้ง่ายด้วยความพยายามเพียงเล็กน้อยและไม่สามารถอธิบายความสับสนทั่วไปเกี่ยวกับแนวคิดของการแจกแจงตัวอย่าง (ฉันตระหนักว่าอาจเป็นฉันและการสอนของฉันที่เป็นปัญหาที่นี่! อย่างไรก็ตามฉันคิดว่าการเพิกเฉยต่อความเป็นไปได้ที่ไม่สะดวกนั้นมีเหตุผลที่จะทำเพราะนักเรียนบางคนดูเหมือนจะเข้าใจและโดยรวมแล้วทุกคน สิ่งที่ฉันได้ลอง ฉันต้องเถียงกับผู้ดูแลระบบระดับปริญญาตรีในแผนกของเราเพื่อแนะนำเซสชันในห้องปฏิบัติการคอมพิวเตอร์ที่คิดว่าการสาธิตซ้ำอาจเป็นประโยชน์ (ก่อนที่ฉันจะเริ่มสอนหลักสูตรนี้ไม่มีการใช้คอมพิวเตอร์ที่เกี่ยวข้อง) ในขณะที่ฉันคิดว่าสิ่งนี้ช่วยให้เข้าใจเนื้อหาโดยรวมของเนื้อหาหลักสูตรโดยทั่วไปฉันไม่คิดว่าหัวข้อนี้จะช่วยได้ ความคิดหนึ่งที่ฉันมีก็คือการไม่สอนอะไรเลยหรือไม่ให้น้ำหนักมากท่าทีที่ได้รับการสนับสนุนจากบางคน (เช่นAndrew Gelman ) ฉันไม่พบสิ่งนี้ที่น่าพึงพอใจโดยเฉพาะเนื่องจากมีการสอนที่รวดเร็วถึงตัวหารร่วมที่ต่ำที่สุดและที่สำคัญกว่านั้นคือปฏิเสธนักเรียนที่แข็งแกร่งและมีแรงจูงใจที่ต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการประยุกต์ใช้ทางสถิติจากการทำความเข้าใจว่า ) ในทางตรงกันข้ามนักเรียนที่เป็นสื่อกลางดูเหมือนจะเข้าใจค่า p …

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

7
ชื่อของการเข้าใจผิดทางสถิติคืออะไรโดยผลของการโยนเหรียญก่อนหน้ามีอิทธิพลต่อความเชื่อเกี่ยวกับการพลิกเหรียญครั้งต่อไป?
อย่างที่เราทุกคนรู้กันดีว่าถ้าคุณพลิกเหรียญที่มีโอกาสเท่ากันในการลงจอดหัวเหมือนหางจากนั้นถ้าคุณพลิกเหรียญหลายครั้งครึ่งเวลาคุณจะได้หัวและครึ่งเวลาคุณจะได้หาง เมื่อพูดถึงเรื่องนี้กับเพื่อนพวกเขาบอกว่าถ้าคุณต้องพลิกเหรียญ 1,000 ครั้งและให้บอกว่า 100 ครั้งแรกที่มันตกลงมาจากหัวแล้วโอกาสในการลงหางก็เพิ่มขึ้น (ตรรกะก็คือถ้ามันไม่เอนเอียง) จากนั้นตามเวลาที่คุณพลิกมัน 1,000 ครั้งคุณจะมีประมาณ 500 หัวและ 500 ก้อยดังนั้นก้อยจะต้องมีโอกาสมากขึ้น) ฉันรู้ว่าการเข้าใจผิดเพราะผลลัพธ์ที่ผ่านมาไม่มีผลต่อผลลัพธ์ในอนาคต มีชื่อสำหรับการเข้าใจผิดที่เฉพาะเจาะจงหรือไม่? นอกจากนี้ยังมีคำอธิบายที่ดีกว่าว่าทำไมนี่ถึงผิดพลาด?

3
“ การสังเกตอย่างอิสระ” หมายความว่าอะไร
ฉันพยายามที่จะเข้าใจว่าสมมติฐานของการสังเกตอิสระหมายถึง คำจำกัดความบางประการคือ: "สองเหตุการณ์ไม่ขึ้นต่อกันหาก " ( พจนานุกรมศัพท์ทางสถิติ )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) "การเกิดเหตุการณ์หนึ่งจะไม่เปลี่ยนความน่าจะเป็นสำหรับเหตุการณ์อื่น" ( Wikipedia ) "การสุ่มตัวอย่างจากการสังเกตหนึ่งครั้งไม่ส่งผลต่อการเลือกการสังเกตครั้งที่สอง" ( David M. Lane ) ตัวอย่างของการสังเกตที่ขึ้นอยู่กับที่มักได้รับคือนักเรียนซ้อนกันภายในครูดังต่อไปนี้ สมมติว่าครูมีอิทธิพลต่อนักเรียน แต่นักเรียนไม่ได้มีอิทธิพลซึ่งกันและกัน ดังนั้นคำจำกัดความเหล่านี้ละเมิดข้อมูลเหล่านี้อย่างไร การสุ่มตัวอย่าง [เกรด = 7] สำหรับ [นักเรียน = 1] ไม่ส่งผลกระทบต่อการแจกแจงความน่าจะเป็นสำหรับเกรดที่จะถูกสุ่มตัวอย่างต่อไป (หรือเป็นอย่างนั้นและถ้าเป็นเช่นนั้นการสังเกต 1 จะทำนายอะไรเกี่ยวกับการสังเกตครั้งต่อไป) ทำไมการสังเกตจึงเป็นอิสระถ้าฉันวัดได้ gender แทนที่จะเป็น teacher_id? พวกเขาไม่ส่งผลกระทบต่อการสังเกตในลักษณะเดียวกันหรือไม่ teacher_id student_id grade 1 1 7 …

3
ถ้าตัวอย่างแบบสุ่มของคุณไม่ได้เป็นตัวแทนอย่างชัดเจนล่ะ
เกิดอะไรขึ้นถ้าคุณใช้ตัวอย่างที่สุ่มและคุณสามารถเห็นมันได้อย่างชัดเจนไม่ได้เป็นตัวแทนเช่นเดียวกับในคำถามที่ผ่านมา ตัวอย่างเช่นถ้าการกระจายตัวของประชากรควรมีความสมมาตรประมาณ 0 และตัวอย่างที่คุณวาดแบบสุ่มนั้นมีการสังเกตเชิงบวกและลบที่ไม่สมดุลและความไม่สมดุลนั้นมีนัยสำคัญทางสถิตินั่นจะทำให้คุณอยู่ที่ไหน คุณสามารถสร้างประโยคที่สมเหตุสมผลเกี่ยวกับประชากรจากกลุ่มตัวอย่างที่มีอคติได้อย่างไร การกระทำที่เหมาะสมในสถานการณ์เช่นนี้คืออะไร? การวิจัยของเรามีความสำคัญเมื่อเราสังเกตเห็นความไม่สมดุลนี้หรือไม่?

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

4
ความน่าจะเป็นที่ไม่ได้วาดคำจากถุงตัวอักษรใน Scrabble
สมมติว่าคุณมีถุงที่มีกระเบื้องแต่ละคนมีตัวอักษรบนมัน มีมีตัวอักษร 'A',พร้อมด้วย 'B' และอื่น ๆ และ 'ไวด์การ์ด' (เรามี ) สมมติว่าคุณมีพจนานุกรมที่มีจำนวนคำ จำกัด คุณเลือกไพ่จากกระเป๋าโดยไม่มีการเปลี่ยน คุณจะคำนวณ (หรือประมาณ) ความน่าจะเป็นที่คุณสามารถจัดรูปแบบศูนย์คำจากพจนานุกรมที่ให้การเรียงตัวnnnnAnAn_AnBnBn_Bn∗n* * * *n_*n=nA+nB+…+nZ+n∗n=nA+nB+...+nZ+n* * * *n = n_A + n_B + \ldots + n_Z + n_*kkkkkk สำหรับผู้ที่ไม่คุ้นเคยกับ Scrabble (TM) สามารถใช้อักขระตัวแทนเพื่อจับคู่กับตัวอักษรใดก็ได้ ดังนั้นคำว่า [ BOOT ] จึงสามารถ 'สะกด' ด้วย 'B', '*', 'O', 'T' เพื่อให้เข้าใจถึงระดับของปัญหามีขนาดเล็กเช่น 7,ประมาณ 100 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.