คำถามติดแท็ก philosophical

สำหรับคำถามเกี่ยวกับปรัชญาหรือความน่าจะเป็น: การตีความความน่าจะเป็น, ปัญหาพื้นฐานที่มีสถิติบ่อยครั้ง / สถิติแบบเบย์ ฯลฯ อย่าใช้แท็กนี้สำหรับคำถามที่คาดเดากันโดยทั่วไป (aka "ปรัชญา")

16
การทดสอบตามปกติคือ 'ไร้ประโยชน์เป็นหลัก' หรือไม่?
อดีตเพื่อนร่วมงานเคยโต้เถียงกับฉันดังนี้: เรามักจะใช้การทดสอบเชิงบรรทัดฐานกับผลลัพธ์ของกระบวนการที่ภายใต้ค่า null จะสร้างตัวแปรสุ่มที่เป็น แบบอะซีพโทติกหรือใกล้เคียงปกติ ในยุคของหน่วยความจำราคาถูก, ข้อมูลขนาดใหญ่และการประมวลผลได้อย่างรวดเร็วการทดสอบภาวะปกติควร เสมอปฏิเสธ null ของการกระจายปกติสำหรับขนาดใหญ่ ( แต่ไม่ใหญ่เมามัน) ตัวอย่าง ดังนั้นจึงควรใช้การทดสอบเชิงบรรทัดฐานในทางที่ผิดสำหรับตัวอย่างเล็ก ๆ น้อย ๆ เท่านั้นเมื่อพวกมันมีพลังงานต่ำและควบคุมอัตราการพิมพ์ที่น้อยลง นี่เป็นอาร์กิวเมนต์ที่ถูกต้องหรือไม่? นี่เป็นข้อโต้แย้งที่รู้จักกันดีหรือไม่? มีการทดสอบที่รู้จักกันดีสำหรับสมมติฐานว่าง 'fuzzier' มากกว่าปกติหรือไม่?

11
การประมาณความน่าจะเป็นสูงสุด (MLE) ในแง่คนธรรมดา
ใครสามารถอธิบายให้ฉันอย่างละเอียดเกี่ยวกับการประมาณค่าความน่าจะเป็นสูงสุด (MLE) ในแง่ของคนธรรมดา ฉันต้องการทราบแนวคิดพื้นฐานก่อนที่จะเข้ามาทางคณิตศาสตร์หรือสมการ

14
ทำไมสถิติที่ไม่ทนทาน (และทนทาน) จึงถูกแทนที่ด้วยเทคนิคแบบดั้งเดิม?
เมื่อแก้ปัญหาทางธุรกิจโดยใช้ข้อมูลเป็นเรื่องธรรมดาที่มีสมมติฐานอย่างน้อยหนึ่งข้อที่ว่าสถิติแบบดั้งเดิมไม่ถูกต้อง ส่วนใหญ่ไม่มีใครมารบกวนการตรวจสอบสมมติฐานเหล่านั้นเพื่อให้คุณไม่เคยรู้จริง ตัวอย่างเช่นเมตริกเว็บทั่วไปจำนวนมากจึงเป็น "แบบหางยาว" (สัมพันธ์กับการแจกแจงแบบปกติ) คือตอนนี้มีการบันทึกไว้เป็นอย่างดีเพื่อให้เราได้รับอนุญาต อีกตัวอย่างหนึ่งชุมชนออนไลน์ - แม้ในชุมชนที่มีสมาชิกนับพันก็มีเอกสารครบถ้วนว่าส่วนแบ่งที่ใหญ่ที่สุดของการมีส่วนร่วมในการมีส่วนร่วมในชุมชนเหล่านี้ส่วนใหญ่เป็นของกลุ่มผู้มีอิทธิพลน้อย (เช่นไม่กี่เดือนที่ผ่านมาหลังจากที่ SO API ให้บริการในรุ่นเบต้าสมาชิกStackOverflowเผยแพร่การวิเคราะห์สั้น ๆ จากข้อมูลที่เขาเก็บรวบรวมผ่านทาง API ข้อสรุปของเขา - น้อยกว่าร้อยละหนึ่งของบัญชีสมาชิก SO ส่วนใหญ่ กิจกรรมบน SO (สมมุติว่าถามคำถามและตอบคำถาม) อีก 1-2% คิดเป็นสัดส่วนที่เหลือและสมาชิกส่วนใหญ่ที่ไม่ทำอะไรเลย) การแจกแจงของการเรียงลำดับนั้น - บ่อยครั้งมากกว่ากฎแทนที่จะเป็นข้อยกเว้น - มักถูกสร้างแบบจำลองที่ดีที่สุดด้วยฟังก์ชันความหนาแน่นของกฎกำลังไฟฟ้า สำหรับการแจกแจงแบบนี้แม้แต่ทฤษฎีบทขีด จำกัด กลางก็เป็นปัญหาที่จะนำมาใช้ ดังนั้นเมื่อมีประชากรจำนวนมากเช่นนี้เป็นที่สนใจของนักวิเคราะห์และเนื่องจากรูปแบบคลาสสิกนั้นมีประสิทธิภาพในการแสดงข้อมูลเหล่านี้ได้ไม่ดีนักและเนื่องจากวิธีการที่แข็งแกร่งและทนทานได้เกิดขึ้นมาระยะหนึ่งแล้ว (อย่างน้อย 20 ปี) พวกเขาไม่ได้ใช้บ่อยขึ้นหรือไม่ (ฉันยังสงสัยว่าทำไมฉันไม่ใช้บ่อยขึ้น แต่นั่นไม่ใช่คำถามสำหรับCrossValidated ) ใช่ฉันรู้ว่ามีบทตำราที่อุทิศให้กับสถิติที่มีประสิทธิภาพและฉันรู้ว่ามี (ไม่กี่) R แพ็คเกจ ( robustbaseเป็นสิ่งที่ฉันคุ้นเคยและใช้) เป็นต้น …

14
เมื่อใด (ถ้าเคย) เป็นวิธีการที่ใช้บ่อยดีกว่า Bayesian อย่างมาก?
ความเป็นมา : ฉันไม่มีการฝึกอบรมอย่างเป็นทางการในสถิติแบบเบย์ (แม้ว่าฉันสนใจที่จะเรียนรู้มากขึ้น) แต่ฉันรู้เพียงพอ - ฉันคิดว่า - ฉันจะได้รับส่วนสำคัญว่าทำไมหลายคนรู้สึกราวกับว่าพวกเขาเป็นที่นิยมมากกว่า แม้แต่นักศึกษาระดับปริญญาตรีในวิชาสถิติเบื้องต้น (ในสังคมศาสตร์) ชั้นที่ฉันกำลังสอนก็พบว่าวิธีการแบบเบส์ดึงดูดความสนใจ - "ทำไมเราถึงสนใจคำนวณความน่าจะเป็นของข้อมูลให้เป็นโมฆะเพราะเหตุใด สมมติฐานว่างเปล่าหรือสมมุติฐานทางเลือกและฉันยังได้อ่านหัวข้อเช่นนี้ซึ่งยืนยันถึงผลประโยชน์เชิงประจักษ์ของสถิติแบบเบย์ด้วยเช่นกัน แต่จากนั้นฉันก็ได้พบกับคำกล่าวของ Blasco (2001; หากผู้เพาะพันธุ์สัตว์ไม่สนใจปัญหาเชิงปรัชญาที่เกี่ยวข้องกับการชักนำ แต่ในเครื่องมือที่ใช้ในการแก้ปัญหาโรงเรียนเบส์เซียนและโรงเรียนที่มีการอนุมานเป็นประจำได้รับการจัดตั้งขึ้นมาอย่างดีและไม่จำเป็นต้องพิสูจน์ว่าทำไมโรงเรียนแห่งใดแห่งหนึ่ง ไม่ใช่ของพวกเขาในขณะนี้มีความยากลำบากในการปฏิบัติงานยกเว้นกรณีที่ซับซ้อนบางอย่าง ... ในการเลือกโรงเรียนหนึ่งหรืออื่น ๆ ควรจะเกี่ยวข้องกับว่ามีการแก้ปัญหาในโรงเรียนหนึ่งที่อื่น ๆ ที่ไม่ได้นำเสนอถึงวิธีการได้อย่างง่ายดายปัญหาจะแก้ไขได้ และเพื่อความสะดวกสบายของนักวิทยาศาสตร์ที่รู้สึกด้วยวิธีการแสดงออกโดยเฉพาะ คำถาม : คำพูดของ Blasco ดูเหมือนว่าจะแนะนำว่าอาจมีบางครั้งที่วิธีการใช้ชีวิตประจำวันเป็นวิธีที่ดีกว่า Bayesian และฉันก็อยากรู้อยากเห็น: เมื่อไรที่วิธีการของนักเล่นแร่แปรธาตุจะดีกว่าการเข้าใกล้แบบเบย์? ฉันสนใจในคำตอบที่จัดการกับคำถามทั้งแนวความคิด (เช่นเมื่อทราบถึงความน่าจะเป็นของข้อมูลที่ตั้งอยู่บนสมมติฐานว่างเปล่าโดยเฉพาะอย่างยิ่งมีประโยชน์หรือไม่) และสังเกตุ (เช่นภายใต้เงื่อนไขว่า มันจะดีกว่าถ้าคำตอบถูกสื่อถึงความเป็นไปได้ - มันดีที่จะตอบกลับไปที่ชั้นเรียนของฉันเพื่อแบ่งปันกับนักเรียนของฉัน ในที่สุดแม้ว่าจะเป็นผู้ใช้สถิติของผู้ใช้บ่อย แต่ฉันก็เปิดกว้างต่อความเป็นไปได้ที่ Bayesian เพิ่งจะชนะในกระดาน

8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

11
ทำไมฉันถึงต้องเป็น Bayesian เมื่อแบบจำลองของฉันผิด
แก้ไข:ฉันได้เพิ่มเป็นตัวอย่างง่ายๆอนุมานของค่าเฉลี่ยของx_iฉันยังได้ชี้แจงด้วยเล็กน้อยว่าทำไมช่วงเวลาที่น่าเชื่อถือและไม่ตรงกับช่วงความมั่นใจไม่ดีXiXผมX_i ฉันเป็นคนเบย์เซียนที่มีใจศรัทธาอย่างยุติธรรมฉันกำลังอยู่ในช่วงวิกฤตการณ์แห่งศรัทธาแปลก ๆ ปัญหาของฉันคือต่อไปนี้ สมมติว่าผมต้องการที่จะวิเคราะห์ข้อมูล IID บางx_iสิ่งที่ฉันจะทำคือ:XiXผมX_i ก่อนเสนอแบบจำลองตามเงื่อนไข: p(X|θ)พี(X|θ) p(X|\theta) จากนั้นเลือกก่อนหน้าบน : θθ\thetap(θ)พี(θ) p(\theta) ในที่สุดใช้กฎของเบย์คำนวณหลัง: (หรือประมาณโดยประมาณถ้ามันไม่ควรคำนวณได้) และตอบคำถามทั้งหมดที่ฉันมีเกี่ยวกับθp(θ|X1…Xn)พี(θ|X1...Xn)p(\theta | X_1 \dots X_n )θθ\theta นี่เป็นวิธีการที่สมเหตุสมผล: ถ้าแบบจำลองที่แท้จริงของข้อมูลเป็น "ข้างใน" ของเงื่อนไขของฉัน (มันสอดคล้องกับค่าบางอย่างθ 0 ) จากนั้นฉันสามารถเรียกทฤษฎีการตัดสินใจทางสถิติเพื่อบอกว่าวิธีการของฉันเป็นที่ยอมรับ (ดู Robert's "ตัวเลือก Bayesian" สำหรับรายละเอียด; "สถิติทั้งหมด" ยังให้ข้อมูลที่ชัดเจนในบทที่เกี่ยวข้องด้วย)XiXผมX_iθ0θ0\theta_0 อย่างไรก็ตามอย่างที่ทุกคนรู้ว่าสมมติว่าแบบจำลองของฉันถูกต้องค่อนข้างหยิ่ง: ทำไมธรรมชาติควรอยู่ในกล่องแบบจำลองที่ฉันได้พิจารณาอย่างเป็นธรรมชาติ มันเป็นจริงมากขึ้นที่จะคิดว่ารูปแบบที่แท้จริงของข้อมูลที่แตกต่างจากP ( X | θ )สำหรับทุกค่าของθ ซึ่งมักเรียกว่าแบบจำลอง "misspecified"ptrue(X)พีเสื้อRยูอี(X)p_{true}(X)p(X|θ)พี(X|θ)p(X|\theta)θθ\theta ปัญหาของฉันคือว่าในกรณีที่สะกดผิดพลาดเหมือนจริงมากขึ้นฉันไม่มีข้อโต้แย้งที่ดีสำหรับการเป็น Bayesian (เช่นการคำนวณการกระจายหลัง) …

10
มีพื้นฐานทางคณิตศาสตร์สำหรับการถกเถียงแบบเบย์กับการถกเถียงกันบ่อยๆหรือไม่?
มันพูดในWikipediaว่า: คณิตศาสตร์ [ของความน่าจะเป็น] ส่วนใหญ่เป็นอิสระจากการตีความความน่าจะเป็นใด ๆ คำถาม:แล้วถ้าเราต้องการที่จะมีความถูกต้องทางคณิตศาสตร์ไม่ควรที่เราไม่อนุญาตใด ๆความหมายของความน่าจะเป็น? คือทั้งแบบเบย์และความถี่ที่ไม่ถูกต้องทางคณิตศาสตร์? ฉันไม่ชอบปรัชญา แต่ฉันชอบวิชาคณิตศาสตร์และฉันต้องการทำงานเฉพาะภายในกรอบของสัจพจน์ของ Kolmogorov หากนี่คือเป้าหมายของฉันควรปฏิบัติตามสิ่งที่กล่าวไว้ใน Wikipedia ว่าฉันควรปฏิเสธทั้ง Bayesianism และบ่อยครั้งหรือไม่ หากแนวคิดมีปรัชญาล้วนๆและไม่ใช่คณิตศาสตร์เลยทำไมพวกเขาจึงปรากฏเป็นสถิติตั้งแต่แรก? ความเป็นมา / บริบท: โพสต์บล็อกนี้ไม่ได้พูดเหมือนกัน แต่มันก็เถียงว่าการพยายามจำแนกเทคนิคเป็น "Bayesian" หรือ "บ่อยครั้ง" นั้นตอบโต้จากมุมมองเชิงปฏิบัติ หากการอ้างอิงจาก Wikipedia เป็นจริงดูเหมือนว่าจากมุมมองทางปรัชญาที่พยายามจำแนกวิธีการทางสถิติก็เป็นวิธีที่มีประสิทธิผลเช่นกันหากวิธีการทางคณิตศาสตร์นั้นถูกต้องก็จะใช้วิธีการเมื่อสมมติฐานของคณิตศาสตร์พื้นฐาน ถือมิฉะนั้นหากไม่ถูกต้องทางคณิตศาสตร์หรือหากสมมติฐานไม่ได้ถือไว้ก็ไม่สามารถใช้งานได้ ในทางกลับกันผู้คนจำนวนมากดูเหมือนจะระบุ "การอนุมานแบบเบย์" ด้วยทฤษฎีความน่าจะเป็น (เช่นสัจพจน์ของ Kolmogorov) แม้ว่าฉันจะไม่แน่ใจว่าทำไม ตัวอย่างบางส่วนเป็นบทความของ Jaynes เกี่ยวกับการอนุมานแบบเบย์ที่เรียกว่า "ความน่าจะเป็น" เช่นเดียวกับหนังสือของ James Stone "กฎของ Bayes '" ดังนั้นถ้าฉันใช้การเรียกร้องเหล่านี้ตามมูลค่าหน้าตัวนั่นก็หมายความว่าฉันควรจะชอบลัทธิเบย์มากกว่า อย่างไรก็ตามหนังสือของ Casella และ …

6
การโต้วาทีแบบ Bayesian เกิดขึ้นที่ไหน
โลกของสถิติถูกแบ่งระหว่างผู้ใช้บ่อยและเบย์ วันนี้ดูเหมือนว่าทุกคนทำทั้งสองอย่าง สิ่งนี้จะเป็นอย่างไร หากวิธีการที่แตกต่างกันเหมาะสำหรับปัญหาที่แตกต่างกันเหตุใดบรรพบุรุษของผู้ก่อตั้งสถิติจึงไม่เห็นสิ่งนี้ อีกทางเลือกหนึ่งการถกเถียงกันได้รับรางวัลจากการถกเถียงกันบ่อยครั้งและ Bayesians ส่วนตัวที่แท้จริงย้ายไปอยู่กับทฤษฎีการตัดสินใจ?

10
ตัวอย่างของการปฏิบัติที่ผิดสมัยในสถิติมีอะไรบ้าง
ฉันหมายถึงวิธีปฏิบัติที่ยังคงรักษาสถานะของพวกเขาแม้ว่าปัญหา (โดยปกติการคำนวณ) พวกเขาได้รับการออกแบบเพื่อรับมือกับได้รับการแก้ไขส่วนใหญ่ ตัวอย่างเช่นการแก้ไขความต่อเนื่องของ Yates ถูกคิดค้นเพื่อการทดสอบที่แน่นอนของฟิชเชอร์ด้วยการทดสอบแต่มันไม่สามารถใช้งานได้อีกต่อไปเนื่องจากซอฟต์แวร์สามารถจัดการการทดสอบของฟิชเชอร์ได้ในขณะนี้ด้วยตัวอย่างขนาดใหญ่ การปรากฏตัว "เนื่องจากตำราเรียนเช่นการวิเคราะห์ข้อมูลหมวดหมู่ของ Agresti มักจะยอมรับว่าการแก้ไขของ Yates" ไม่จำเป็นอีกต่อไป ")χ2χ2\chi^2 ตัวอย่างอื่น ๆ ของการปฏิบัติเช่นนี้มีอะไรบ้าง

3
เราจะกำหนด 'การวิจัยที่ทำซ้ำได้' อย่างไร
ตอนนี้มีคำถามสองสามข้อที่เกิดขึ้นและฉันสงสัยเกี่ยวกับบางสิ่งบางอย่าง ฟิลด์ทั้งหมดย้ายไปที่ "ความสามารถในการทำซ้ำ" โดยมุ่งเน้นไปที่ความพร้อมใช้งานของข้อมูลดั้งเดิมและรหัสที่เป็นปัญหาหรือไม่ ฉันได้รับการสอนอยู่เสมอว่าแกนของความสามารถในการทำซ้ำนั้นไม่จำเป็นอย่างที่ฉันเคยพูดถึงความสามารถในการคลิกเรียกใช้และรับผลลัพธ์เดียวกัน วิธีการดาต้าและรหัสดูเหมือนว่าจะถือว่าข้อมูลนั้นถูกต้อง - ซึ่งไม่มีข้อบกพร่องในการรวบรวมข้อมูลเอง (มักเป็นเท็จในกรณีของการฉ้อโกงทางวิทยาศาสตร์) นอกจากนี้ยังมุ่งเน้นไปที่กลุ่มตัวอย่างเดียวของประชากรเป้าหมายแทนที่จะเป็นความสามารถในการจำลองแบบของการค้นหาตัวอย่างอิสระหลายรายการ เหตุใดจึงมีความสำคัญต่อความสามารถในการวิเคราะห์อีกครั้งแทนที่จะทำซ้ำการศึกษาจากพื้นดินขึ้นมา? บทความที่กล่าวถึงในความคิดเห็นด้านล่างที่มีอยู่ที่นี่

4
อะไรคือข้อโต้แย้ง fiducial และทำไมมันถึงไม่ได้รับการยอมรับ?
หนึ่งในช่วงปลายมีส่วนร่วมของชาวประมง RA เป็นช่วงเวลาที่แม่นยำและการขัดแย้งจริยธรรมแม่นยำ อย่างไรก็ตามวิธีการนี้ไม่ได้รับความนิยมเท่านักโต้เถียงหรือ Bayesian อะไรคือข้อโต้แย้ง fiducial และทำไมไม่ได้รับการยอมรับ?

4
เหตุใดค่า p ต่ำกว่าจึงไม่มีหลักฐานมากขึ้นต่อโมฆะ? ข้อโต้แย้งจาก Johansson 2011
Johansson (2011) ใน " ทักทายสิ่งที่เป็นไปไม่ได้: ค่า p, หลักฐานและโอกาส " (ที่นี่ยังเชื่อมโยงไปยังวารสาร ) ระบุว่าค่าต่ำกว่ามักจะถือว่าเป็นหลักฐานที่แข็งแกร่งต่อโมฆะ Johansson หมายความว่าคนจะพิจารณาหลักฐานโมฆะจะแข็งแกร่งถ้าทดสอบทางสถิติของพวกเขาออกมาพี -value ของ0.01 , กว่าถ้าทดสอบทางสถิติของพวกเขาออกมาพี -value ของ0.45 Johansson แสดงเหตุผลสี่ประการที่ทำให้ไม่สามารถใช้ค่าpเป็นหลักฐานต่อโมฆะ:พีppพีpp0.010.010.01พีpp0.450.450.45พีpp ถูกกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่างดังนั้นจึงไม่สามารถระบุหลักฐานสำหรับโมฆะได้พีpp เป็นเงื่อนไขเพียงอย่างเดียวในสมมติฐานว่างและดังนั้นจึงไม่เหมาะสมที่จะหาหลักฐานเชิงปริมาณเพราะหลักฐานมักจะสัมพันธ์กันในความรู้สึกของการเป็นหลักฐานสำหรับหรือต่อต้านสมมติฐานที่เกี่ยวข้องกับสมมติฐานอื่นพีpp กำหนดความน่าจะเป็นในการได้มาซึ่งหลักฐาน (ให้เป็นโมฆะ) แทนที่จะเป็นความแข็งแกร่งของหลักฐานพีpp ขึ้นอยู่กับข้อมูลที่ไม่ได้ตรวจสอบและความตั้งใจส่วนตัวและดังนั้นจึงมีนัยถึงการตีความที่เป็นหลักฐานว่ากำลังของหลักฐานที่สังเกตได้นั้นขึ้นอยู่กับสิ่งที่ไม่ได้เกิดขึ้นและความตั้งใจส่วนตัวppp น่าเสียดายที่ฉันไม่สามารถเข้าใจได้อย่างง่ายจากบทความของ Johansson ให้ฉัน -value ของ0.01แสดงว่ามีโอกาสน้อย null เป็นจริงกว่าP -value ของ0.45 เหตุใดค่าpต่ำกว่าจึงไม่มีหลักฐานที่ดีกว่าต่อโมฆะ? ppp0.010.010.01ppp0.450.450.45ppp

3
การพิสูจน์จากเอนโทรปีของลูกศร Bayesian แบบย้อนหลังของ Shalizi ของเวลาที่ผิดธรรมดา?
ในบทความนี้นักวิจัยที่มีความสามารถคอสมาชาลิซีีระบุว่าจะยอมรับอย่างเต็มที่มุมมองคชกรรมอัตนัยหนึ่งยังต้องยอมรับผล unphysical ที่ลูกศรของเวลา (ที่ได้รับจากการไหลของเอนโทรปี) จริงควรไปข้างหลัง นี้เป็นส่วนใหญ่ความพยายามที่จะเถียงกับเอนโทรปีสูงสุด / อัตนัยอย่างเต็มที่มุมมองแบบเบย์นำไปข้างหน้าและความนิยมโดยET เจย์นส์ มากกว่าที่LessWrongผู้ให้หลายคนมีความสนใจมากในทฤษฎีความน่าจะเป็นแบบเบย์และยังอยู่ในวิธีการแบบเบย์อัตนัยเป็นพื้นฐานสำหรับทฤษฎีการตัดสินใจอย่างเป็นทางการและหินก้าวต่อที่แข็งแกร่ง AI เอลีเซอร์ยัดคาสกีเป็นผู้สนับสนุนร่วมกันมีและฉันเพิ่งอ่านโพสต์นี้เมื่อฉัน พบกับความคิดเห็นนี้ (ความคิดเห็นที่ดีอื่น ๆ อีกไม่นานหลังจากนั้นในหน้าโพสต์ต้นฉบับ) ทุกคนสามารถให้ความเห็นเกี่ยวกับความถูกต้องของการโต้แย้งของ Shalizi ของ Yudkowsky โดยสังเขปเหตุผลของ Yudkowsky คือกลไกทางกายภาพซึ่งตัวแทนการให้เหตุผลปรับปรุงความเชื่อของตนจำเป็นต้องมีการทำงานดังนั้นจึงมีค่าใช้จ่ายทางอุณหพลศาสตร์ที่ Shalizi กวาดใต้พรม ในความคิดเห็นอื่น Yudkowsky ปกป้องสิ่งนี้พูดว่า: "ถ้าคุณใช้มุมมองของผู้สังเกตการณ์ที่สมบูรณ์แบบที่มีเหตุผลรอบนอกระบบความคิดของ" เอนโทรปี "นั้นค่อนข้างไร้ความหมายเช่นเดียวกับ" ความน่าจะเป็น "- คุณไม่จำเป็นต้องใช้อุณหพลศาสตร์เชิงสถิติในการสร้างแบบจำลองอะไรเลย สมการคลื่น " probabilists หรือ statistcal ใด ๆ สามารถแสดงความคิดเห็นเกี่ยวกับเรื่องนี้ได้หรือไม่? ฉันไม่สนใจข้อโต้แย้งจากผู้มีอำนาจเกี่ยวกับสถานะของ Shalizi หรือ Yudkowsky แต่ฉันอยากจะเห็นบทสรุปของวิธีการที่ Yudkowsky ทั้งสามประเด็นเสนอวิจารณ์ของบทความของ Shalizi …

5
วิธีการ "ไปหาข้อมูลเพิ่มเติม" ของฟิชเชอร์เมื่อใด
การอ้างอิงคำตอบที่ยอดเยี่ยมของ gung นักวิจัยเข้าหา Fisher ด้วยผลลัพธ์ที่“ ไม่สำคัญ” เมื่อถามถึงสิ่งที่เขาควรทำและฟิชเชอร์กล่าวว่า 'ไปหาข้อมูลเพิ่มเติม' จากมุมมองของเพียร์สัน Neyman นี้เป็นที่เห็นได้ชัด -hacking แต่มีกรณีการใช้งานที่ฟิชเชอร์ไปได้รับเพิ่มเติมข้อมูลวิธีการทำให้รู้สึก?ppp

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.