คำถามติดแท็ก references

คำถามที่ค้นหาแหล่งอ้างอิงภายนอก (หนังสือเอกสาร ฯลฯ ) เกี่ยวกับเรื่องเฉพาะ ใช้แท็กเฉพาะเจาะจงเพิ่มเติมทุกครั้ง

3
คำแนะนำในการร่วมมือกับนักวิทยาศาสตร์ประยุกต์
ฉันเป็นนักศึกษาระดับบัณฑิตศึกษาในสถิติและมีส่วนร่วมในความร่วมมือกับนักวิทยาศาสตร์ประยุกต์ (นักเศรษฐศาสตร์ผู้พิทักษ์…) ความร่วมมือเหล่านี้สนุก (ส่วนใหญ่) และฉันเรียนรู้มาก แต่ก็มีบางอย่างที่ซับซ้อนเช่น: บางครั้งฉันเห็นว่าแบบจำลองทางสถิติที่ดีนั้นแตกต่างจากภูมิหลังของผู้ทำงานร่วมกันและการปฏิบัติทั่วไปในสาขาของตน มันยากที่จะโน้มน้าวให้พวกเขาลองทำสิ่งใหม่ ๆ เพราะพวกเขาพยายามเข้าใจรูปแบบหรือเพราะพวกเขาลังเลที่จะเปลี่ยนนิสัย เมื่อเสนอให้ใช้วิธีการทางสถิติที่แตกต่างกันฉันมักจะรู้สึกว่าผู้ทำงานร่วมกันพิจารณาว่าเป็นการวิพากษ์วิจารณ์วิธีการ "มาตรฐาน" ของพวกเขา อย่างไรก็ตามฉันไม่ได้ตั้งใจที่จะวิพากษ์วิจารณ์ใครก็ตามสำหรับความรู้ทางสถิติหรือนิสัยของพวกเขา และในที่สุดก็มีอีกอันหนึ่ง: บางคนคาดหวังมากเกินไป พวกเขาคิดว่าฉันสามารถดึงข้อมูลที่น่าสนใจจากข้อมูลของพวกเขาได้อย่างน่าอัศจรรย์โดยปราศจากความช่วยเหลือ แน่นอนว่านี่ไม่เป็นความจริงโดยเฉพาะอย่างยิ่งถ้าฉันคิดถึงฉากหลังที่เฉพาะเจาะจง ฉันอาจคิดคะแนนเพิ่มเติม แต่สิ่งเหล่านี้เป็นครั้งแรกที่มาถึงใจของฉัน คำถามที่ฉันถามคุณคือ: คุณประสบปัญหาเดียวกันหรือคล้ายกันในการร่วมมือของคุณหรือไม่? คุณเผชิญหน้ากับพวกเขาอย่างไร โดยทั่วไปแล้วคุณจะทำอย่างไรเพื่อเป็นผู้ทำงานร่วมกันทางสถิติที่ดี มีทรัพยากรบุคคลที่สามในหัวข้อนี้หรือไม่เช่นทักษะอ่อน ๆ ที่จำเป็นในการทำงานร่วมกันระหว่างนักสถิติและนักวิทยาศาสตร์ประยุกต์? หมายเหตุ: คำถามนี้จะมากหรือน้อยสนทนาของคนนี้
14 references 

2
มาตรฐานประสิทธิภาพสำหรับ MCMC
เคยมีการศึกษาขนาดใหญ่ของวิธีการ MCMC ที่เปรียบเทียบประสิทธิภาพของอัลกอริทึมที่แตกต่างกันหลายชุดในชุดทดสอบความหนาแน่นหรือไม่? ฉันกำลังคิดถึงบางสิ่งที่เทียบเท่ากับกระดาษของ Rios และ Sahinidis (2013) ซึ่งเป็นการเปรียบเทียบอย่างละเอียดเกี่ยวกับเครื่องมือเพิ่มประสิทธิภาพกล่องดำแบบไร้อนุพันธ์จำนวนมากในฟังก์ชั่นการทดสอบหลายชั้น สำหรับ MCMC สามารถประเมินประสิทธิภาพได้เช่นจำนวนตัวอย่างที่มีประสิทธิภาพ (ESS) ต่อการประเมินความหนาแน่นหรือตัวชี้วัดอื่น ๆ ที่เหมาะสม ความคิดเห็นไม่กี่: ฉันขอขอบคุณที่ประสิทธิภาพจะขึ้นอยู่กับรายละเอียดของเป้าหมาย PDF แต่ข้อโต้แย้งที่คล้ายกัน (อาจไม่เหมือนกัน) สำหรับการเพิ่มประสิทธิภาพและยังมีฟังก์ชั่นมาตรฐานห้องสวีทการแข่งขันเอกสารและอื่น ๆ ที่เกี่ยวข้องกับการเพิ่มประสิทธิภาพการเปรียบเทียบ อัลกอริทึม นอกจากนี้มันเป็นความจริงที่ MCMC แตกต่างจากการปรับให้เหมาะสมเมื่อเปรียบเทียบกับการดูแลและปรับแต่งที่จำเป็นจากผู้ใช้ อย่างไรก็ตามขณะนี้มีวิธีการ MCMC หลายวิธีที่ต้องการการปรับแต่งเพียงเล็กน้อยหรือไม่มีเลย: วิธีการปรับตัวในเฟสเบิร์นอิน, ในระหว่างการสุ่มตัวอย่าง, หรือหลายรัฐ (หรือเรียกว่าensemble ) วิธีการ (เช่นEmcee ) ข้อมูลจากโซ่อื่น ๆ เพื่อเป็นแนวทางในการสุ่มตัวอย่าง ฉันสนใจเป็นพิเศษในการเปรียบเทียบระหว่างวิธีมาตรฐานและหลายรัฐ (aka ensemble) สำหรับคำจำกัดความของหลายรัฐโปรดดูมาตรา 30.6 ของหนังสือของ MacKay : …

3
การอ้างอิงที่แสดงให้เห็นถึงการใช้ Gaussian Mixtures
แบบจำลองการผสมแบบเกาส์ (GMMs) มีความน่าสนใจเพราะง่ายต่อการทำงานกับทั้งในเชิงวิเคราะห์และในทางปฏิบัติ มีคุณสมบัติการวิเคราะห์เล็กน้อยที่เราควรคาดว่าจะมีซึ่งไม่ชัดเจนโดยทั่วไป โดยเฉพาะอย่างยิ่ง: SnSnS_nnnnPPPnnnPPPlimn→∞infP^∈SnD(P||P^)=0?limn→∞infP^∈SnD(P||P^)=0?\lim_{n\rightarrow \infty}\inf_{\hat{P}\in S_n} D(P||\hat{P})=0? บอกว่าเรามีการกระจายอย่างต่อเนื่องและเราได้พบ -component ผสมแบบเกาส์ซึ่งอยู่ใกล้กับPในรูปแบบรวม: \ เดลต้า (P \ hat {P}) &lt;\ varepsilon เราสามารถผูกD (P || \ hat {P})ในแง่ของ\ epsilon ได้หรือไม่?N P P δ ( P , P ) &lt; ε D ( P | | P ) εPPPNNNP^P^\hat{P}PPPδ(P,P^)&lt;εδ(P,P^)&lt;ε\delta(P,\hat{P})<\varepsilonD(P||P^)D(P||P^)D(P||\hat{P})ϵϵ\epsilon ถ้าเราต้องการสังเกตุผ่านเสียงเพิ่มเติมอิสระY \ sim P_Y …

4
ตำรา / การอ่านเกี่ยวกับสิ่งที่ต้องทำเมื่อคุณไม่สามารถสร้างการทดสอบในอุดมคติได้?
การฝึกอบรมทางสถิติของฉันมีรากฐานมาจากสถิติทางคณิตศาสตร์และการเรียนวิธีการเหล่านี้ใน MS ของฉันค่อนข้างน่าตกใจในขณะนี้ ขณะนี้เป็นเรื่องยากสำหรับฉันที่จะสามารถเข้าใจวิธีการ "ใช้งาน" เหล่านี้เนื่องจากฉันไม่มีประสบการณ์ในอุตสาหกรรม หนึ่งในหัวข้อที่เราได้พูดถึงในชั้นเรียนวิธีการของฉันคือแนวคิดของการออกแบบการทดลอง ตัวอย่างเช่นฉันต้องการทำการทดลองเกี่ยวกับประสิทธิผลของโปรแกรมการศึกษาที่อ้างว่าเพิ่มคะแนนการทดสอบของนักเรียน K-12 ในชั้นเรียนวิธีการพวกเขาได้สอนสิ่งต่อไปนี้เพื่อติดตามปัญหาดังกล่าว: ตรวจสอบให้แน่ใจว่าคุณมีคำถามการวิจัยที่ดีวิธีการรวบรวมข้อมูลที่ดีการทดลองแบบสุ่มกลุ่มการรักษาที่เป็นเนื้อเดียวกัน ไม่) ขนาดเท่ากันอย่างสมบูรณ์และจากนั้นเรียกใช้การทดสอบ (หรือการทดสอบสมมติฐานที่ไม่ใช่พารามิเตอร์) และมันก็ดีและสวยหรูใช่ไหม?เสื้อเสื้อt ฉันมีศรัทธาเล็กน้อยว่านี่คือวิธีการทำงานในความเป็นจริง ฉันได้เรียนรู้แล้วว่าคุณอาจต้องทำการสุ่มตัวอย่างเพื่อความสะดวก แต่นอกจากนั้นฉันก็ไม่รู้ว่าจะใช้การออกแบบการทดลองอะไรนอกจากสิ่งที่ฉันเรียนรู้จากตำรา มีหนังสือเล่มไหนอ่าน ฯลฯ ที่สำรวจปัญหาเหล่านี้ในทางปฏิบัติ (และในอุดมคติแล้วก็ไม่ควรปัดเศษคณิตศาสตร์ - ฉันไม่ต้องการการพิสูจน์อย่างละเอียดของทุกสิ่ง แต่ฉันไม่ต้องการบอกว่าทุกอย่างคือ " ชัดเจน "ตัวอย่างเช่น)?

5
เส้นทางสู่สถิติทางคณิตศาสตร์ที่ไม่มีพื้นฐานการวิเคราะห์: หนังสือเรียนที่เหมาะสำหรับการศึกษาด้วยตนเอง
ฉันมีความโน้มเอียงทางคณิตศาสตร์ค่อนข้างมาก - มีคณิตศาสตร์ 6 ภาคการศึกษาในระดับปริญญาตรีของฉัน - แม้ว่าฉันจะไม่ได้ฝึกฝนสักหน่อยและพูดช้าๆด้วยสมการเชิงอนุพันธ์ย่อยบางส่วนและการบูรณาการเส้นทางที่แนวคิดของฉันกลับมา ฉันยังไม่เคยมีหลักสูตรเกี่ยวกับการพิสูจน์ทางคณิตศาสตร์ (การคิดเชิงคณิตศาสตร์) หรือการวิเคราะห์ ฉันเข้าใจความน่าจะเป็นในระดับบัณฑิตศึกษาด้วย - ได้ศึกษาอย่างเป็นทางการและฟื้นฟูความรู้ของฉันเมื่อไม่นานมานี้ ฉันยังมีหลักสูตรระดับบัณฑิตศึกษาสองสามหลักสูตรเกี่ยวกับสถิติและการเรียนรู้ทางสถิติ ฉันต้องการศึกษาสถิติทางคณิตศาสตร์ในอีก 18-24 เดือนข้างหน้าโดยไม่สนใจผลประโยชน์ส่วนตัว ฉันต้องการสละเวลาเรียน 5 ชั่วโมงโดยเฉลี่ยต่อสัปดาห์ ฉันเป็นบิตที่สูญเสียในการทำ ฉันลองศึกษาจากหนังสือCasella และ Bergerแต่ไม่สามารถทำอะไรได้เลย ฉันพบว่าหนังสือเล่มนี้น่าเบื่อนิดหน่อยและวิธีการรักษายาก สิ่งที่ฉันพบยากเกี่ยวกับ Casella และ Berger: อายที่จะพูดแบบนี้ แต่การเริ่มต้นสำหรับการตั้งค่าประเภท - วิธีการบรรจุเพื่อลดพื้นที่สีขาวทำให้ฉันหมดแรง มีหลักฐานมากมายที่อยู่ที่นั่น แต่ฉันรู้สึกว่าขาดสัญชาตญาณว่าทำไมเราจึงพยายามบรรลุผลและสิ่งที่เป็นเป้าหมายที่ใหญ่กว่าในมือ การอ้างอิงของบทพิสูจน์จากบทก่อนหน้านี้เป็นวิธีที่ทำให้วัสดุค่อนข้างยากสำหรับฉัน - ฉันจะกลับไปมากจนกระทั่งในที่สุดฉันก็ยอมแพ้ ตัวอย่างดูเหมือนจะเป็นไปได้มาก แต่ฉันไม่สามารถแก้ไขปัญหาได้ - ปัญหาดูเหมือนว่าจะอยู่ในชั้นเรียนด้วยตัวเอง ฉันไม่สามารถเข้าไปในเนื้อหา - และฉันสงสัยว่าวิธีการทำงานของจิตใจของฉันฉันต้องการการรักษาที่เข้มงวดมากขึ้น - ฉันควรพิจารณาวิธีการทางทฤษฎีการวัดทางสถิติสถิติหรือไม่? ดังนั้นคำถาม : มีตำราเรียนที่ใครบางคนในรองเท้าของฉันสามารถเรียนรู้และสอนตัวเองได้ …

2
หนังสือแนะนำที่ดีที่สุดเกี่ยวกับการสุ่มตัวอย่าง Bootstrap ใหม่?
ฉันแค่อยากจะถามว่าหนังสือที่ดีที่สุดใน bootstrap นั้นในความคิดของคุณ โดยสิ่งนี้ฉันไม่ได้หมายถึงเฉพาะสิ่งที่นักเขียนเขียน คุณช่วยกรุณาระบุว่าหนังสือเล่มใดที่ดีที่สุดสำหรับคุณสำหรับ bootstrap ที่ครอบคลุมเกณฑ์ต่อไปนี้ พื้นฐานทางปรัชญา / ญาณวิทยาสำหรับเทคนิคที่แสดงโดเมนของการบังคับใช้จุดแข็งและจุดอ่อนสำคัญสำหรับการเลือกแบบจำลองหรือไม่ ชุดตัวอย่างง่ายๆที่แสดงการใช้งานการวางรากฐานทางปรัชญาโดยเฉพาะกับ Matlab?

4
มีอคติในการเลือกคณะลูกขุน?
เพื่อนเป็นตัวแทนของลูกค้าเกี่ยวกับการอุทธรณ์หลังจากการพิจารณาคดีทางอาญาซึ่งปรากฏว่าการคัดเลือกคณะลูกขุนมีความลำเอียงทางเชื้อชาติ คณะลูกขุนประกอบด้วย 30 คนในกลุ่มเชื้อชาติ 4 กลุ่ม การฟ้องร้องใช้ความท้าทายแบบไม่ต้องลงแรงเพื่อกำจัดคนเหล่านี้ 10 คนออกจากกลุ่ม จำนวนคนและจำนวนความท้าทายที่เกิดขึ้นจริงในแต่ละกลุ่มเชื้อชาติตามลำดับ: A: 10, 1 B: 10, 4 C: 6, 4 D: 4, 1 total: 30 in pool, 10 challenges จำเลยก็มาจากเชื้อชาติกลุ่มซีและผู้ที่ตกเป็นเหยื่อจากกลุ่มเชื้อชาติและ D เพื่อความกังวลเบื้องต้นไม่ว่าจะเป็นกลุ่ม C มีมากกว่าที่ท้าทายและกลุ่ม A และ D ภายใต้การท้าทาย ถูกต้องตามกฎหมาย (IIUC; IANAL) การป้องกันไม่จำเป็นต้องพิสูจน์ความลำเอียงทางเชื้อชาติ แต่เพียงเพื่อแสดงให้เห็นว่าข้อมูลดูเหมือนจะบ่งบอกถึงความลำเอียงซึ่งทำให้ภาระในการฟ้องร้องอธิบายความท้าทายที่ไม่ใช่เชื้อชาติ การวิเคราะห์ต่อไปนี้ถูกต้องในแนวทางของมันหรือไม่? (ฉันคิดว่าการคำนวณนั้นใช้ได้): มี nCr (30,10) = 30,045,015 ชุดที่แตกต่างกันของสมาชิกพูล …

1
สามารถแนะนำหนังสือ Burnham-Anderson เกี่ยวกับการอนุมานแบบหลายรุ่นได้หรือไม่?
จากการเปลี่ยนแปลงล่าสุดของสถิติการเลือกแบบจำลองเริ่มต้นในแพ็คเกจการพยากรณ์ของ R จาก AIC เป็น AICc ฉันสงสัยว่าอันหลังนั้นสามารถใช้งานได้ทุกที่ในอดีต ฉันมีคำถามหลายข้อเกี่ยวกับความเคารพและนี่คือคำถามแรก ฉันรู้ว่าการแทนที่ AIC ด้วย AICc ทุกที่เป็นสิ่งที่หนังสือที่มีชื่อเสียงใน (1)โดย Burnham และ Anderson (ไม่ใช่นักสถิติ) ตามที่สรุปไว้ที่นี่แนะนำ บางครั้งหนังสือเล่มนี้ถูกอ้างถึงโดยนักสถิติรุ่นเยาว์อย่างไร้ความปราณีดูความคิดเห็นต่อบล็อกโพสต์นี้โดย Rob Hyndmanแต่นักสถิติ Brian Brian Ripley ได้ให้คำแนะนำในลักษณะที่แตกต่างกันอย่างสิ้นเชิง: “Burnham and Anderson (2002) is a book I would recommend people NOT read until they have read the primary literature. I see no evidence …

4
การอนุมานสำหรับตัวอ่านที่สงสัย (แต่ไม่ใช่เชิงคณิตศาสตร์)
ฉันเพิ่งดูการบรรยายเรื่องการอนุมานเชิงสถิติ ("การเปรียบเทียบสัดส่วนและความหมาย") ซึ่งเป็นส่วนหนึ่งของคำแนะนำเกี่ยวกับสถิติหลักสูตรออนไลน์ วัสดุที่ทำให้ฉันรู้สึกเหมือนมันเป็นเรื่องเล็กน้อยเสมอ (โดยตอนนี้ฉันต้องเห็นสิ่งนี้หลายสิบครั้งกระจายออกไปในช่วงสามทศวรรษที่ผ่านมา) ฉันกำลังมองหาหนังสือเกี่ยวกับ "basic Stats-101" (การประมาณจุด, การประเมินแบบประเมิน, การอนุมานเชิงสถิติ, การทดสอบสมมติฐาน, การออกแบบการศึกษา) ที่จริงจังกับปัญหาในการโน้มน้าวผู้อ่านที่สงสัย ... ด้านล่างฉันให้ตัวอย่างของ ประเภทของคำถามที่ผู้เขียนที่ฉันค้นหาจะใช้เวลาอย่างจริงจังและรู้วิธีการพูดอย่างมั่นใจ แต่ก่อนอื่นให้ฉันใช้เวลาสักครู่เพื่อเน้นว่าในโพสต์นี้ฉันไม่ได้ถามคำถามเหล่านี้ ได้โปรดอย่าตอบพวกเขา! ฉันให้พวกเขาเป็นเพียงตัวอย่างและผ่าน "การทดสอบสารสีน้ำเงิน" (สำหรับประเภทของผู้แต่งที่กำลังค้นหา) หาก "สัดส่วน" เป็นเพียงค่าเฉลี่ยของตัวแปรบูลีน (เช่นหนึ่งที่รับเฉพาะค่า 0 และ 1) ทำไมโพรซีเดอร์ที่แตกต่างกันจึงสอนให้ทำการอนุมานเชิงสถิติด้วย "สัดส่วน" และกับ "หมายถึง"? หากการแจกแจงแบบปกตินั้นแข็งแกร่งมากซึ่งสมมติว่า normality ให้ผลลัพธ์ที่ดีแม้ในกรณีที่ข้อมูลนั้นไม่ได้ถูกกระจายตามปกติและหากการแจกแจงแบบปกตินั้นดูธรรมดามากทำไมเอะอะทั้งหมดเกี่ยวกับการใช้การแจกแจงแบบ t แทน ปกติ? สิ่งที่ว่าคือ "องศาความเป็นอิสระ" และทำไมเราต้องกังวลเกี่ยวกับพวกเขา? การพูดถึงค่า "จริง" ของพารามิเตอร์หมายความว่าอย่างไรเมื่อเราเพิ่งใช้การแจกแจงที่เกิดขึ้นเพื่อให้ดูเหมือนกับข้อมูล "การวิเคราะห์ข้อมูลเชิงสำรวจ" ทำไมเป็นสิ่งที่ดีในขณะที่ "การสอดแนมข้อมูล" เป็นสิ่งที่ชั่วร้าย? ดังที่ฉันได้กล่าวไปแล้วฉันถูกเลื่อนออกไปจากทัศนคติที่บอกเป็นนัยจากการละเลยคำถามดังกล่าว …

5
วิธีการสร้างข้อมูลที่ไม่สัมพันธ์กัน
ฉันสนใจที่จะหาวิธีในการสร้างข้อมูลที่มีความสัมพันธ์และไม่ปกติ ดังนั้นการกระจายบางอย่างที่ใช้ในเมทริกซ์ความแปรปรวนร่วม (หรือสหสัมพันธ์) เป็นพารามิเตอร์และสร้างข้อมูลที่ใกล้เคียงกับมัน แต่นี่คือสิ่งที่จับได้: วิธีที่ฉันพยายามค้นหาควรมีความยืดหยุ่นในการควบคุมความเบ้และ / หรือ kurtosis หลายตัวแปรด้วย ฉันคุ้นเคยกับวิธีของเฟลชแมนและวิธีการใช้พลังงานของตัวแปรปกติ แต่ฉันเชื่อว่าส่วนขยายเหล่านั้นส่วนใหญ่อนุญาตให้ผู้ใช้ใช้การรวมกันของความเบ้เล็กน้อยและความโด่งเท่านั้นทำให้เหลือความเบ้ / ความหลายหลาก สิ่งที่ฉันสงสัยคือถ้ามีวิธีที่ช่วยระบุความเบ้หลายตัวแปรและ / หรือ kurtosis พร้อมกับโครงสร้างความสัมพันธ์ / ความแปรปรวนร่วมบางอย่าง ประมาณหนึ่งปีที่ผ่านมาฉันได้สัมมนาเกี่ยวกับการแจกแจงแบบโคคูล่าและฉันจำได้ว่าศาสตราจารย์กล่าวอย่างไม่ตั้งใจว่าผ่านการใช้เถาวัลย์โคโพลีสเราสามารถสร้างข้อมูลซึ่งกล่าวคือสมมาตรในระยะขอบ 1-D แต่ร่วมกันเบ้ -versa หรือยิ่งไปกว่านั้นอัตรากำไรขั้นต้นที่ต่ำกว่าอาจมีความเบ้หรือความโด่งในขณะที่ยังคงมีขนาดสมมาตรสูงสุด (หรือไม่) ฉันประหลาดใจกับความคิดที่ว่ามีความยืดหยุ่นเช่นนี้ฉันพยายามค้นหาบทความหรือเอกสารการประชุมที่อธิบายวิธีการดังกล่าว แต่ฉันไม่ประสบความสำเร็จ :( มันไม่จำเป็นต้องผ่านการใช้ copulas ฉันเปิดรับทุกอย่างที่ใช้ได้ แก้ไข: ฉันได้เพิ่มรหัส R เพื่อพยายามแสดงสิ่งที่ฉันหมายถึง จนถึงตอนนี้ฉันคุ้นเคยกับคำจำกัดความของความเบ้หลายตัวแปรและความโด่งของ Mardia เท่านั้น เมื่อฉันเข้าหาปัญหาของฉันครั้งแรกฉันคิดอย่างไร้เดียงสาว่าถ้าฉันใช้ copula symmetric (Gaussian ในกรณีนี้) กับ marginals ที่เบ้ (เบต้าในตัวอย่างนี้) การทดสอบ …

3
แบบจำลองหัวข้อสำหรับเอกสารสั้น ๆ
ได้รับแรงบันดาลใจจากคำถามนี้ฉันสงสัยว่างานใด ๆ ที่ทำกับแบบจำลองหัวข้อสำหรับคอลเลกชันขนาดใหญ่ของข้อความสั้น ๆ เป็นพิเศษหรือไม่ สัญชาตญาณของฉันคือ Twitter ควรเป็นแรงบันดาลใจตามธรรมชาติสำหรับโมเดลดังกล่าว อย่างไรก็ตามจากการทดลองที่ จำกัด บางครั้งดูเหมือนว่าหัวข้อโมเดลมาตรฐาน (LDA ฯลฯ ) จะทำงานได้ค่อนข้างแย่กับข้อมูลประเภทนี้ มีใครรู้บ้างเกี่ยวกับงานที่ทำในด้านนี้บ้างไหม บทความนี้พูดเกี่ยวกับการใช้ LDA กับ Twitter แต่ฉันสนใจจริง ๆ ว่ามีอัลกอริทึมอื่น ๆ ที่ทำงานได้ดีขึ้นในบริบทของเอกสารระยะสั้นหรือไม่

5
ซอฟต์แวร์ (หรือ webapps) สำหรับการสอนสถิติเด็กหรือความน่าจะเป็น?
ฉันต้องการ (ในอนาคตอันไกล) เพื่อสอนสถิติแก่เด็ก ๆ สำหรับเรื่องนั้นฉันยินดีที่จะรู้เกี่ยวกับซอฟต์แวร์ (เห็นได้ชัดว่าฉันกำลังพุ่งเข้าหา FOSS) หรือ webapps ซึ่งมีประโยชน์ในการอธิบายความคิดทางสถิติ / ความน่าจะเป็นสำหรับเด็ก ๆ (หรือผู้ใหญ่สำหรับเรื่องนั้น) สิ่งนี้สามารถใช้ได้ทั้งโดยผู้สอนเด็ก ๆ หรือทั้งสองอย่าง รูปแบบที่แนะนำของคำตอบ: ชื่อซอฟต์แวร์สิ่งที่ช่วยสอนใครควรใช้ลิงค์

5
รหัส MCMC กระโดดแบบกลับได้ (Matlab หรือ R)
ไม่มีใครรู้รหัสบางเขียนดี (ใน Matlab หรือ R) สำหรับกระโดด MCMC ย้อนกลับได้? เป็นแอพพลิเคชั่นตัวอย่างที่ใช้ง่ายเพื่อชมเชยเอกสารในหัวข้อที่จะเป็นประโยชน์ในการทำความเข้าใจกระบวนการ
14 r  matlab  references  mcmc 

3
ฟิชเชอร์หมายถึงอะไรโดยอ้างนี้?
ฉันเห็นข้อความที่โด่งดังนี้ทุกที่ แต่ไม่เข้าใจส่วนที่ถูกเน้นทุกครั้ง คนที่ 'ปฏิเสธ' สมมติฐานเป็นการชั่วคราวเป็นเรื่องของการฝึกฝนเป็นนิสัยเมื่อความสำคัญอยู่ที่ระดับ 1% หรือสูงกว่าจะถูกเข้าใจผิดในการตัดสินใจเช่นนั้นไม่เกิน 1% เพราะเมื่อสมมติฐานถูกต้องเขาจะถูกเข้าใจผิดในเพียง 1% ของกรณีเหล่านี้และเมื่อมันไม่ถูกต้องเขาจะไม่ผิดในการปฏิเสธ [... ] อย่างไรก็ตามการคำนวณนั้นเป็นเรื่องไร้สาระทางวิชาการเพราะในความเป็นจริงไม่มีนักวิทยาศาสตร์คนใดมีระดับความสำคัญคงที่ซึ่งปีต่อปีและในทุกสถานการณ์เขาปฏิเสธสมมติฐาน; เขาค่อนข้างจะทำให้จิตใจของเขากับแต่ละกรณีโดยเฉพาะในแง่ของหลักฐานและความคิดของเขาไม่ควรลืมว่ากรณีที่เลือกใช้การทดสอบนั้นเป็นชุดที่เลือกอย่างชัดเจนและไม่สามารถระบุเงื่อนไขการเลือกแม้สำหรับผู้ปฏิบัติงานคนเดียว และในการโต้แย้งที่ใช้มันจะผิดกฎหมายอย่างชัดเจนสำหรับคนที่จะเลือกระดับความสำคัญที่แท้จริงที่ระบุโดยการทดลองโดยเฉพาะราวกับว่ามันเป็นนิสัยตลอดชีวิตของเขาที่จะใช้เพียงแค่ระดับนี้ (วิธีการทางสถิติและการอนุมานทางวิทยาศาสตร์, 1956, p. 42-45) โดยเฉพาะอย่างยิ่งฉันไม่เข้าใจ เหตุใดจึงถูกเลือกให้ทำการทดสอบ "เลือกอย่างสูง"? สมมติว่าคุณสงสัยว่าความสูงเฉลี่ยของคนในพื้นที่นั้นน้อยกว่า 165 ซม. หรือไม่และตัดสินใจทำการทดสอบ ขั้นตอนมาตรฐานเท่าที่ฉันรู้คือการสุ่มตัวอย่างจากพื้นที่และวัดความสูง วิธีนี้จะถูกเลือกอย่างมาก? สมมติว่าคดีได้รับการคัดสรรมาอย่างดี แต่สิ่งนี้เกี่ยวข้องกับการเลือกระดับนัยสำคัญอย่างไร ลองพิจารณาตัวอย่างข้างต้นอีกครั้งถ้าวิธีการสุ่มตัวอย่างของคุณ (สิ่งที่ฉันคิดว่าฟิชเชอร์หมายถึงเงื่อนไขการเลือก ) จะเบ้และคนที่มีความสูงก็ช่วยให้งานวิจัยทั้งหมดพังลงและการกำหนดระดับนัยสำคัญ พีพีp

2
ตัวดำเนินการ (x) หมายถึงอะไร
ฉันได้เห็นตัวการทุกหนทุกแห่งในการทบทวนวรรณกรรมที่ฉันทำกับ Causality (ดูตัวอย่างเช่นรายการวิกิพีเดียนี้ ) อย่างไรก็ตามฉันไม่สามารถหาคำจำกัดความที่เป็นทางการและทั่วไปของโอเปอเรเตอร์นี้ได้do ( x )do(x)do(x) ใครสามารถชี้ให้ฉันอ้างอิงที่ดีเกี่ยวกับเรื่องนี้? ฉันสนใจคำจำกัดความทั่วไปมากกว่าการตีความในการทดสอบเฉพาะ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.