คำถามติดแท็ก methodology

สำหรับคำถามเกี่ยวกับวิธีการทางสถิติหรือทางเลือกของวิธีการทางสถิติ

6
การเลือกวิธีการจัดกลุ่ม
เมื่อใช้การวิเคราะห์กลุ่มบนชุดข้อมูลเพื่อจัดกลุ่มกรณีที่คล้ายกันเราจำเป็นต้องเลือกวิธีการจัดกลุ่มจำนวนมากและการวัดระยะทาง บางครั้งตัวเลือกหนึ่งอาจมีผลต่อตัวเลือกอื่น ๆ แต่มีวิธีการที่เป็นไปได้หลายวิธีผสมกัน ใครบ้างมีคำแนะนำเกี่ยวกับวิธีการเลือกระหว่างอัลกอริทึมการจัดกลุ่ม / วิธีการและการวัดระยะทางที่หลากหลาย ? สิ่งนี้เกี่ยวข้องกับธรรมชาติของตัวแปร (เช่นหมวดหมู่หรือตัวเลข) และปัญหาการจัดกลุ่มอย่างไร มีเทคนิคที่ดีที่สุดหรือไม่?

4
เมื่อใดที่จะใช้เฟรมเวิร์ก Fisher และ Neyman-Pearson
ฉันอ่านมากเมื่อเร็ว ๆ นี้เกี่ยวกับความแตกต่างระหว่างวิธีการทดสอบสมมติฐานของฟิชเชอร์กับโรงเรียนแห่งความคิดของเนย์แมน - เพียร์สัน คำถามของฉันคือไม่สนใจการคัดค้านทางปรัชญาสักครู่; เมื่อใดที่เราควรใช้วิธีการของชาวประมงในการสร้างแบบจำลองทางสถิติและเมื่อใดควรใช้วิธีการของเนย์แมน - เพียร์สันในระดับนัยสำคัญและอื่น ๆ ? มีวิธีปฏิบัติหรือไม่ในการตัดสินใจเลือกมุมมองที่จะรับรองในปัญหาการปฏิบัติที่ได้รับ?


2
การกำหนดขนาดตัวอย่างที่จำเป็นสำหรับวิธี bootstrap / วิธีการเสนอ
ฉันรู้ว่านี่เป็นหัวข้อที่ค่อนข้างร้อนแรงซึ่งไม่มีใครสามารถให้คำตอบง่ายๆได้ อย่างไรก็ตามฉันสงสัยว่าวิธีการต่อไปนี้ไม่มีประโยชน์หรือไม่ วิธีบู๊ตสแตรปจะมีประโยชน์ก็ต่อเมื่อตัวอย่างของคุณติดตามการกระจายตัวมากหรือน้อยเช่นเดียวกับประชากรดั้งเดิม เพื่อให้แน่ใจว่าเป็นกรณีนี้คุณต้องทำให้ขนาดตัวอย่างของคุณมีขนาดใหญ่พอ แต่อะไรที่ใหญ่พอ? หากหลักฐานของฉันถูกต้องคุณมีปัญหาเดียวกันเมื่อใช้ทฤษฎีบทขีด จำกัด กลางเพื่อกำหนดค่าเฉลี่ยประชากร เฉพาะเมื่อขนาดตัวอย่างของคุณมีขนาดใหญ่พอคุณสามารถมั่นใจได้ว่าประชากรของค่าเฉลี่ยตัวอย่างของคุณมีการกระจายตามปกติ (รอบค่าเฉลี่ยประชากร) กล่าวอีกนัยหนึ่งตัวอย่างของคุณต้องแสดงถึงประชากรของคุณ (การกระจาย) ที่เพียงพอ แต่อีกครั้งสิ่งที่มีขนาดใหญ่พอ? ในกรณีของฉัน (กระบวนการบริหาร: เวลาที่ต้องการเพื่อให้เสร็จสิ้นความต้องการเทียบกับปริมาณความต้องการ) ฉันมีประชากรที่มีการกระจายแบบหลายคำกริยา (ความต้องการทั้งหมดที่เสร็จสิ้นในปี 2554) ซึ่งฉันมั่นใจ 99% ว่ามันน้อยลง กระจายตามปกติมากกว่าประชากร (ความต้องการทั้งหมดที่เสร็จสิ้นระหว่างวันที่ปัจจุบันและวันที่ผ่านมานึกคิดช่วงเวลานี้มีขนาดเล็กที่สุดเท่าที่เป็นไปได้) ฉันต้องการวิจัย ประชากร 2,011 ของฉันที่มีอยู่ออกมาจากหน่วยพอที่จะทำให้ตัวอย่างขนาดตัวอย่างnฉันเลือกค่า สมมติว่า ( ) ตอนนี้ฉันใช้การลองผิดลองถูกเพื่อกำหนดขนาดตัวอย่างที่ดี ฉันใช้และดูว่าประชากรเฉลี่ยตัวอย่างของฉันกระจายโดยใช้ Kolmogorov-Smirnov หรือไม่ ถ้าเป็นเช่นนั้นฉันจะทำซ้ำขั้นตอนเดียวกัน แต่มีขนาดตัวอย่างถ้าไม่ทำซ้ำด้วยขนาดตัวอย่าง (ฯลฯ )xxxnnnxxx101010x = 10x=10x=10n = 50n=50n=50404040606060 หลังจากที่ในขณะที่ฉันสรุปว่าเป็นขนาดตัวอย่างขั้นต่ำที่แน่นอนเพื่อให้ได้เป็นตัวแทนที่ดีของประชากร 2011 ของฉัน เนื่องจากฉันรู้ว่าประชากรที่ฉันสนใจ (ความต้องการทั้งหมดที่ดำเนินการเสร็จระหว่างวันปัจจุบันและวันหนึ่งในอดีต) มีความแปรปรวนน้อยกว่าฉันจึงสามารถใช้ขนาดตัวอย่างที่เพื่อ …

2
Joel Spolsky ของ“ Hunting of the Snark” โพสต์การวิเคราะห์เนื้อหาทางสถิติที่ถูกต้องหรือไม่?
หากคุณได้อ่านแถลงการณ์ของชุมชนเมื่อเร็ว ๆ นี้คุณน่าจะได้เห็นThe Hunting of the Snarkโพสต์บนบล็อก StackExchange อย่างเป็นทางการโดย Joel Spolsky ซีอีโอของเครือข่าย StackExchange เขากล่าวถึงการวิเคราะห์ทางสถิติที่ดำเนินการบนตัวอย่างของความคิดเห็น SE เพื่อประเมิน "ความเป็นมิตร" ของพวกเขาจากมุมมองของผู้ใช้ภายนอก ความคิดเห็นถูกสุ่มตัวอย่างจาก StackOverflow และนักวิเคราะห์เนื้อหาเป็นสมาชิกของชุมชน Mechanical Turk ของ Amazon ซึ่งเป็นตลาดสำหรับการทำงานที่เชื่อมโยง บริษัท กับคนงานที่ทำงานเล็ก ๆ น้อย ๆ และมีค่าธรรมเนียมสั้น ๆ เมื่อไม่นานที่ผ่านมาผมเป็นนักศึกษาระดับบัณฑิตศึกษาในสาขาวิทยาศาสตร์ทางการเมืองและเป็นหนึ่งในชั้นเรียนที่ผมเอาถูกวิเคราะห์เนื้อหาทางสถิติ โครงการสุดท้ายของชั้นเรียนโดยมีวัตถุประสงค์คือเพื่อทำการวิเคราะห์รายละเอียดเกี่ยวกับการรายงานสงครามของ New York Timesเพื่อทดสอบว่ามีสมมติฐานมากมายหรือไม่ที่ชาวอเมริกันทำเกี่ยวกับการรายงานข่าวในช่วงสงครามอย่างถูกต้อง ไม่). โครงการมีขนาดใหญ่และค่อนข้างสนุก แต่ส่วนที่เจ็บปวดที่สุดคือ 'การฝึกอบรมและการทดสอบความน่าเชื่อถือ' ซึ่งเกิดขึ้นก่อนที่เราจะทำการวิเคราะห์อย่างเต็มรูปแบบ มันมีวัตถุประสงค์สองประการ (ดูหน้า 9 ของกระดาษที่เชื่อมโยงเพื่อดูคำอธิบายโดยละเอียดรวมถึงการอ้างอิงถึงมาตรฐานความน่าเชื่อถือของตัวแปลงรหัสในเอกสารการวิเคราะห์เนื้อหาทางสถิติ): ยืนยันผู้เขียนโค้ดทั้งหมดเช่นผู้อ่านเนื้อหาได้รับการฝึกอบรมตามข้อกำหนดเชิงคุณภาพเดียวกัน ในการวิเคราะห์ของโจเอลสิ่งนี้หมายความว่าทุกคนจะรู้ได้อย่างชัดเจนว่าโครงการกำหนด "เป็นมิตร" …

3
ตัวแยกประเภทห้าอันดับแรกที่ควรลองก่อน
นอกจากลักษณะลักษณนามที่ชัดเจนเช่น ค่าใช้จ่ายในการคำนวณ คุณลักษณะ / ป้ายกำกับและประเภทข้อมูลที่คาดหวัง ความเหมาะสมสำหรับขนาดและมิติของชุดข้อมูล ตัวแยกประเภทห้าอันดับแรก (หรือ 10, 20)) ที่ควรลองใช้กับชุดข้อมูลใหม่เป็นอันดับแรกยังไม่ทราบมากนัก (เช่นความหมายและความสัมพันธ์ของคุณลักษณะส่วนบุคคล) ฉันมักจะลอง Naive Bayes, เพื่อนบ้านที่ใกล้ที่สุด, Decision Tree และ SVM - แม้ว่าฉันจะไม่มีเหตุผลที่ดีสำหรับการเลือกนี้นอกเหนือจากที่ฉันรู้จักพวกเขาและส่วนใหญ่เข้าใจว่าพวกเขาทำงานอย่างไร ฉันเดาว่าควรเลือกตัวแยกประเภทที่ครอบคลุมวิธีการจำแนกประเภททั่วไปที่สำคัญที่สุด คุณจะแนะนำตัวเลือกใดตามเกณฑ์นั้นหรือด้วยเหตุผลอื่นใด UPDATE:การกำหนดทางเลือกสำหรับคำถามนี้อาจเป็น: "วิธีการทั่วไปในการจำแนกประเภทใดที่มีอยู่และวิธีการเฉพาะใดที่ครอบคลุมวิธีที่สำคัญที่สุด / เป็นที่นิยม / มีแนวโน้ม?"

1
การวิเคราะห์พลังงานเบื้องต้นนั้นไร้ประโยชน์หรือไม่?
ฉันเข้าร่วมการประชุมของสมาคมบุคลิกภาพและจิตวิทยาสังคมเมื่อสัปดาห์ที่แล้วซึ่งฉันเห็นการพูดคุยของ Uri Simonsohn กับสถานที่ตั้งว่าการใช้การวิเคราะห์พลังงานเบื้องต้นเพื่อกำหนดขนาดตัวอย่างนั้นไร้ประโยชน์เพราะผลลัพธ์นั้นอ่อนไหวต่อสมมติฐาน แน่นอนการเรียกร้องนี้ขัดกับสิ่งที่ฉันได้รับการสอนในชั้นเรียนวิธีการของฉันและต่อต้านคำแนะนำของนักวิธีการที่โดดเด่นหลายคน (สะดุดตาที่สุดโคเฮน 1992 ) ดังนั้น Uri จึงแสดงหลักฐานบางอย่างเกี่ยวกับการอ้างสิทธิ์ของเขา ฉันพยายามสร้างหลักฐานบางส่วนด้านล่างนี้ใหม่ สำหรับความเรียบง่ายให้จินตนาการสถานการณ์ที่คุณมีสองกลุ่มของการสังเกตและคาดเดาว่าขนาดของผล (วัดจากความแตกต่างของค่าเฉลี่ยมาตรฐาน) เป็น0.5การคำนวณพลังงานมาตรฐาน (ทำโดยใช้แพ็คเกจด้านล่าง) จะบอกให้คุณทราบว่าต้องใช้การสังเกตแบบเพื่อให้ได้พลังงาน 80% จากการออกแบบนี้0.5.5.5Rpwr128128128 require(pwr) size <- .5 # Note that the output from this function tells you the required observations per group # rather than the total observations required pwr.t.test(d = size, sig.level = …

2
การเลือกวิธีการสลายตัวตามฤดูกาล
การปรับตามฤดูกาลเป็นขั้นตอนสำคัญในการประมวลผลข้อมูลล่วงหน้าเพื่อการวิจัยเพิ่มเติม อย่างไรก็ตามนักวิจัยมีตัวเลือกมากมายสำหรับการแยกย่อยของแนวโน้มตามฤดูกาล ที่พบมากที่สุด (ตัดสินโดยจำนวนของการอ้างอิงในวรรณคดีเชิงประจักษ์) คู่แข่งวิธีการสลายตัวตามฤดูกาล X-11 (12) -ARIMA, TRAMO / ที่นั่ง (ทั้งการดำเนินการในDemetra + ) และ 's STL การค้นหาเพื่อหลีกเลี่ยงการสุ่มเลือกระหว่างเทคนิคการสลายตัวที่กล่าวถึงข้างต้น (หรือวิธีการง่าย ๆ เช่นตัวแปรตัวแปรตามฤดูกาล) ฉันต้องการทราบกลยุทธ์พื้นฐานที่นำไปสู่การเลือกวิธีการสลายตัวตามฤดูกาลได้อย่างมีประสิทธิภาพRRR คำถามย่อยที่สำคัญหลายอย่าง (ยินดีต้อนรับลิงก์ไปยังการสนทนาด้วย) อาจเป็น: อะไรคือความเหมือนและความแตกต่างจุดแข็งและจุดอ่อนของวิธีการคืออะไร? มีกรณีพิเศษหรือไม่เมื่อวิธีการหนึ่งเป็นที่นิยมมากกว่าวิธีอื่น? คุณสามารถให้คำแนะนำทั่วไปกับสิ่งที่อยู่ในกล่องดำของวิธีการสลายตัวที่แตกต่างกันได้อย่างไร มีเทคนิคพิเศษในการเลือกพารามิเตอร์สำหรับวิธีการ (ฉันไม่พอใจกับค่าเริ่มต้นเสมอstlตัวอย่างเช่นมีพารามิเตอร์จำนวนมากที่ต้องจัดการกับบางครั้งฉันรู้สึกว่าฉันไม่รู้วิธีเลือกสิ่งเหล่านี้อย่างถูกวิธี) เป็นไปได้หรือไม่ที่จะแนะนำเกณฑ์บางอย่าง (สถิติ) ว่าอนุกรมเวลาได้รับการปรับตามฤดูกาลอย่างมีประสิทธิภาพ (การวิเคราะห์ความสัมพันธ์, ความหนาแน่นของสเปกตรัมหรือไม่? เกณฑ์ขนาดตัวอย่างขนาดเล็ก - ความทนทาน?)

1
วิธีการแสดงภาพฟังก์ชั่นความหนาแน่น 3 มิติ
อะไรคือวิธีที่ดีที่สุดในการแสดงภาพกราฟิกด้วยฟังก์ชั่นความหนาแน่น 3 มิติ ในขณะที่ฉันต้องการเห็นภาพ Z= fX, วาย( x , y)Z=ฉX,Y(x,Y)z=f_{X,Y}(x,y) ? ไม่จำเป็น แต่Rรหัสสำหรับสิ่งนี้จะดีมาก

1
วัตถุประสงค์กับกระบวนทัศน์เบย์เซียนแบบอัตนัย
อะไรคือความแตกต่างระหว่างวัตถุประสงค์และทัศนะแบบเบย์แบบอัตนัย? วัตถุหรือขั้นตอนใดที่พวกเขานิยามหรือตีความแตกต่างกัน มีวิธีใดบ้างในการเลือกวิธีการของพวกเขา?

4
ตัวอย่างผลที่ตามมาราคาแพงจากการใช้เครื่องมือทางสถิติอย่างไม่เหมาะสม
ฉันสงสัยว่าผู้ใช้เครื่องมือทางสถิติส่วนใหญ่เป็นผู้ใช้เสริม (ผู้ที่มีการฝึกอบรมด้านสถิติอย่างเป็นทางการจนถึงไม่มีการฝึกอบรมเล็กน้อย) มันเป็นเรื่องดึงดูดสำหรับนักวิจัยและผู้เชี่ยวชาญด้านอื่น ๆ ที่จะใช้วิธีการทางสถิติกับข้อมูลของพวกเขาเพียงเพราะพวกเขาเห็นว่า "ทำมาก่อน" ในเอกสารที่ผ่านการตรวจสอบโดยผู้เขียนบทความวรรณกรรมสีเทาเว็บหรือการประชุม อย่างไรก็ตามการทำเช่นนั้นโดยไม่มีความเข้าใจที่ชัดเจนเกี่ยวกับสมมติฐานที่ต้องการและข้อ จำกัด ของเครื่องมือทางสถิติสามารถนำไปสู่ผลลัพธ์ที่ผิดพลาดได้ - ข้อผิดพลาดมักไม่ได้รับการยอมรับ! ฉันพบว่านักศึกษาระดับปริญญาตรี (โดยเฉพาะอย่างยิ่งในสังคมศาสตร์และวิทยาศาสตร์ธรรมชาติ) เป็นทั้งที่ไม่รู้ถึงความผิดพลาดทางสถิติหรือพบข้อผิดพลาดที่ไม่แน่นอนเหล่านี้ (ซึ่งส่วนใหญ่เป็นกรณีหลัง) แม้ว่าตัวอย่างของการใช้เครื่องมือทางสถิติอย่างไม่เหมาะสมสามารถพบได้ในหนังสือตำราระดับเบื้องต้นหลายเล่มเว็บหรือ StackExchange แต่ฉันมีเวลายากที่จะหาตัวอย่างในโลกแห่งความจริงที่มีผลลัพธ์ที่เป็นอันตราย (เช่นค่าใช้จ่ายในดอลลาร์ผลกระทบต่อชีวิตและอาชีพสูญหาย) . ด้วยเหตุนี้ฉันกำลังมองหาตัวอย่างในโลกแห่งความจริงที่เน้นการใช้วิธีการทางสถิติที่ผิด: วิธีการทางสถิติที่ใช้มักจะกล่าวถึงในหลักสูตรสถิติเบื้องต้น (เช่นสถิติเชิงอนุมานการถดถอย ฯลฯ ... ) ผลลัพธ์ที่ได้มีผลกระทบค่าใช้จ่าย (ดอลลาร์หายไปชีวิตได้รับผลกระทบอาชีพแตก ฯลฯ ... ) ข้อมูลที่มีความพร้อมสำหรับการใช้งานเป็นตัวอย่างการทำงานในหลักสูตร (มีวัตถุประสงค์เพื่อให้นักเรียนทำงานผ่านตัวอย่างจริงของโลกที่มีผลกระทบโลกแห่งความจริง.) ตัวอย่างที่ไม่ใช่ทางสถิติอย่างหนึ่งที่ฉันต้องการนำมาให้นักเรียนเมื่อพูดคุยถึงความสำคัญของการกำหนดหน่วยในโครงการวิจัยอย่างถูกต้องคือ“ mishap metric”ที่นำไปสู่การสูญเสียดาวเทียม $ 125M! สิ่งนี้มักจะเรียกใช้: - ปัจจัยจากนักเรียนและดูเหมือนว่าจะมีความประทับใจยาวนาน (อย่างน้อยตลอดช่วงชีวิตการศึกษาสั้น ๆ )

2
คุ้มค่าหรือไม่ที่จะเผยแพร่ที่ Statiki ที่อ้างอิงจาก wiki? [ปิด]
ปิด คำถามนี้เป็นคำถามความคิดเห็นตาม ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบข้อเท็จจริงและการอ้างอิงได้โดยแก้ไขโพสต์นี้ ปิดให้บริการใน7 เดือนที่ผ่านมา พื้นหลัง ฉันอ่านเกี่ยวกับStatProb.comจากความคิดเห็นในบล็อกแอนดรู Gelman ของ ตามเว็บไซต์ StatProb คือ: StatProb: สารานุกรมที่สนับสนุนโดยสถิติและความน่าจะเป็นสังคมรวมข้อดีของ wikis แบบดั้งเดิม (สิ่งพิมพ์ที่รวดเร็วและทันสมัย, การพัฒนาที่ผู้ใช้สร้างขึ้น, การเชื่อมโยงหลายมิติและประวัติที่บันทึกไว้) กับการเผยแพร่แบบดั้งเดิม (การประกันคุณภาพการตรวจสอบ และการแสดงข้อมูลที่มีโครงสร้าง) ผลงานทั้งหมดได้รับการอนุมัติจากคณะกรรมการบรรณาธิการที่กำหนดโดยสมาคมสถิติชั้นนำ สมาชิกคณะบรรณาธิการจะอยู่ในหน้าเกี่ยวกับ ฉันไม่ใช่นักสถิติ แต่ฉันใช้สถิติและเว็บไซต์นี้เสนอโอกาสให้ฉันเผยแพร่เนื้อหาที่ในขณะที่อาจเป็นประโยชน์ต่อผู้อื่นอาจมีการเผยแพร่ไม่ได้จนกว่าฉันจะรวมไว้เป็นภาคผนวกหรือโพสต์ไว้บนเว็บไซต์ ตัวเลือกน่าสนใจเพราะกระบวนการตรวจสอบจะช่วยเพิ่มความมั่นใจในวิธีการที่ฉันใช้และให้ความน่าเชื่อถือในพื้นที่สาธารณะ แม้จะมีการสนับสนุนจากสถิติที่สำคัญและสังคมน่าจะเป็น แต่เว็บไซต์ก็ยังไม่ได้รับการแก้ไข อันที่จริงหนึ่งบล็อกเกอร์ถาม 'RIP StatProb?' และความถี่ของการบริจาคลดลงตามกาลเวลา คำถาม: คุ้มค่ากับความพยายามในการเผยแพร่ผ่าน StatProb.com หรือไม่ ปรับปรุง: ณ วันนี้ (2012-02-01) ผลงานล่าสุดคือ2011-05-04 ; การแก้ไขล่าสุด 2011-06 ดังนั้นวันนี้จึงดูน่าดึงดูดน้อยกว่าเมื่อก่อนถามคำถาม

1
กรอบงานที่ดีสำหรับการเลือกวิธีคืออะไร
ฉันได้มองหากรอบการทำงานเชิงทฤษฎีสำหรับการเลือกวิธีการ (หมายเหตุ: ไม่ใช่การเลือกแบบจำลอง) และได้พบงานที่เป็นระบบและมีแรงบันดาลใจทางคณิตศาสตร์น้อยมาก โดย 'การเลือกวิธี' ฉันหมายถึงกรอบการทำงานสำหรับแยกแยะวิธีที่เหมาะสม (หรือดีกว่าดีที่สุด) วิธีการที่เกี่ยวข้องกับปัญหาหรือประเภทของปัญหา สิ่งที่ฉันได้พบเป็นรูปธรรมหากชิ้นงานโดยเฉพาะอย่างยิ่งเกี่ยวกับวิธีการและการปรับแต่งของพวกเขา (คือตัวเลือกก่อนในวิธีการแบบเบย์) และเลือกวิธีการทางเลือกอคติ (เช่นนโยบายการเหนี่ยวนำการเน้นการเลือกอคติ ) ฉันอาจไม่สมจริงในช่วงแรกของการพัฒนาของการเรียนรู้ของเครื่อง แต่ฉันหวังว่าจะพบบางอย่างที่ทฤษฎีการวัดทำในการกำหนดการแปลงและการทดสอบที่ยอมรับได้ตามประเภทของสเกลเพียงเขียนขนาดใหญ่ในเวทีของปัญหาการเรียนรู้ ข้อเสนอแนะใด ๆ

3
เกณฑ์และการตัดสินใจสำหรับความไม่เป็นเส้นตรงในแบบจำลองทางสถิติคืออะไร
ฉันหวังว่าคำถามทั่วไปต่อไปนี้จะสมเหตุสมผล โปรดทราบว่าสำหรับวัตถุประสงค์ของคำถามนี้โดยเฉพาะฉันไม่สนใจเหตุผลทางทฤษฎี (โดเมนหัวเรื่อง) สำหรับการแนะนำที่ไม่ใช่เชิงเส้น ดังนั้นฉันจะกำหนดคำถามแบบเต็มดังนี้: กรอบตรรกะคืออะไร( เกณฑ์และหากเป็นไปได้กระบวนการตัดสินใจ ) สำหรับการนำเสนอแบบไม่เป็นเชิงเส้นในแบบจำลองเชิงสถิติด้วยเหตุผลนอกเหนือจากเชิงทฤษฎี (โดเมนเรื่อง)? เช่นเคยทรัพยากรและการอ้างอิงที่เกี่ยวข้องก็ยินดีต้อนรับเช่นกัน

5
เป็นไปได้หรือไม่ที่จะพอดีกับแบบจำลอง Bayesian ก่อนจากนั้นจึงเริ่มลดระดับ Priors?
เมื่อทำสถิติบ่อยครั้งจะมีรายการไม่ต้องเสียเงินจำนวนมากเช่นการดูผลการทดสอบทางสถิติก่อนตัดสินใจรวบรวมข้อมูลเพิ่มเติม ฉันสงสัยว่าโดยทั่วไปหากมีรายการ no-nos ที่คล้ายกันสำหรับวิธีการที่เกี่ยวข้องในสถิติแบบเบย์และโดยเฉพาะอย่างยิ่งว่าต่อไปนี้เป็นหนึ่งในนั้นหรือไม่ เมื่อไม่นานมานี้ฉันได้ตระหนักว่าสำหรับบางรุ่นที่ฉันทำเหมาะสมขั้นตอนของฉันคือการปรับแบบจำลองให้พร้อมกับนักบวชที่มีข้อมูลเพื่อดูว่ามันทำงานหรือระเบิดได้หรือไม่ ดัดแปลงโมเดลใหม่ แรงจูงใจของฉันสำหรับเรื่องนี้เกี่ยวข้องกับความจริงที่ว่าฉันเขียนแบบจำลองเหล่านี้ใน JAGS / Stan และในใจของฉันฉันได้ปฏิบัติต่อมันเหมือนงานเขียนโปรแกรมมากกว่าสถิติ ดังนั้นฉันจะทำการวิ่งครั้งแรกเรียงลำดับของเสื้อผ้าเพื่อที่จะมาบรรจบกันอย่างรวดเร็วโดยใช้นักบวชที่มีข้อมูลทำให้ง่ายต่อการตรวจจับข้อผิดพลาดในแบบจำลองที่ฉันเขียน จากนั้นหลังจากแก้ไขจุดบกพร่องในแบบจำลองแล้วฉันปรับโฉมใหม่ด้วยนักบวชที่ไม่มีข้อมูลหรือมีข้อมูลน้อย คำถามของฉันคือฉันกำลังทำผิดกฎบางอย่างกับกระบวนการนี้หรือไม่ ตัวอย่างเช่นเพื่อให้ข้อสรุปของฉันถูกต้องและเพื่อหลีกเลี่ยงการใช้ประโยชน์จากองศาอิสระของนักวิจัยฉันต้องผูกมัดให้กับนักบวชที่เฉพาะเจาะจงก่อนที่จะเริ่มปรับรูปแบบใด ๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.