คำถามติดแท็ก experiment-design

การศึกษาวิธีจัดโครงสร้างของแบบฝึกหัดการรวบรวมข้อมูลที่มีการเปลี่ยนแปลง

4
ค้นหาภาพประกอบที่แท้จริงของคำพูดของชาวประมงเกี่ยวกับ DoE
ทีมของฉันและฉันอยากจะนำเสนอให้กับนักสถิติของ บริษัท เกี่ยวกับการออกแบบการทดลอง นักสถิติเหล่านี้ยังเป็นลูกค้าของเราและพวกเขามักจะไม่ปรึกษาเราก่อนรวบรวมข้อมูล คุณรู้หรือไม่ตัวอย่างจริงที่แสดงให้เห็นถึงการอ้างอิงที่มีชื่อเสียงของชาวประมง"ในการโทรหานักสถิติหลังจากการทดลองเสร็จสิ้นอาจไม่มากไปกว่าการขอให้เขาทำการตรวจชันสูตรศพ: เขาอาจจะบอกได้ว่าการทดลองเสียชีวิต ของ." ? โดยเฉพาะอย่างยิ่งเรากำลังมองหาภาพประกอบในบริบทอุตสาหกรรม / ยา / ชีวภาพ เราคิดว่าเป็นตัวอย่างของการวิเคราะห์ทางสถิติที่สรุปไม่ได้ซึ่งอาจประสบความสำเร็จหากได้รับการออกแบบมาเบื้องต้น แต่อาจมีภาพประกอบอื่น ๆ ที่เป็นไปได้

3
การเพิ่มขนาดของกลุ่มตัวอย่างเป็นแบบไดนามิกหรือไม่หากระบุนิรนัย?
ฉันกำลังจะทำการศึกษาเกี่ยวกับข้อดีของการกระตุ้นหนึ่งเมื่อเปรียบเทียบกับการออกแบบภายในเรื่อง ฉันมีรูปแบบการเรียงสับเปลี่ยนที่ออกแบบมาเพื่อลดผลกระทบต่อลำดับของบางส่วนของการศึกษา รูปแบบการเรียงสับเปลี่ยนกำหนดว่าขนาดตัวอย่างสามารถหารด้วย 8 เพื่อกำหนดขนาดตัวอย่างฉันจะต้องเดาอย่างกล้าหาญ (เป็นประเพณีที่ดีในสาขาของฉัน) หรือคำนวณขนาดตัวอย่างสำหรับพลังงานที่ฉันต้องการ ปัญหาคือตอนนี้ฉันไม่ได้มีเงื่อนงำน้อยขนาดขนาดผลที่ฉันจะสังเกต (ยังเป็นประเพณีที่ดีในสาขาของฉัน) นั่นหมายความว่าการคำนวณพลังงานนั้นค่อนข้างยาก ในทางกลับกันการคาดเดาอย่างบ้าคลั่งอาจไม่ดีเพราะฉันสามารถออกตัวอย่างขนาดต่ำเกินไปหรือจ่ายเงินมากเกินไปแก่ผู้เข้าร่วมและใช้เวลามากเกินไปในห้องทดลอง จะเป็นการดีหรือไม่ที่จะกล่าวล่วงหน้าว่าฉันเพิ่มผู้เข้าร่วมเป็นกลุ่ม 8 คนจนกว่าฉันจะออกจากค่า p สองค่า? เช่น 0,05 <p <0,30 หรือคุณจะแนะนำวิธีอื่นฉันควรดำเนินการต่อหรือไม่

1
แพคเกจ GBM กับ Caret ใช้ GBM
ฉันเคยใช้การจูนโมเดลcaretแต่แล้วก็รันโมเดลอีกครั้งโดยใช้gbmแพ็คเกจ ฉันเข้าใจว่าcaretแพ็กเกจที่ใช้gbmและเอาต์พุตควรเหมือนกัน อย่างไรก็ตามการทดสอบการทำงานอย่างรวดเร็วโดยใช้data(iris)แสดงความแตกต่างในรูปแบบประมาณ 5% โดยใช้ RMSE และ R ^ 2 เป็นตัวชี้วัดการประเมินผล ฉันต้องการค้นหาประสิทธิภาพของแบบจำลองที่ดีที่สุดโดยใช้caretแต่เรียกใช้อีกครั้งgbmเพื่อใช้ประโยชน์จากแผนการพึ่งพาบางส่วน รหัสด้านล่างสำหรับการทำซ้ำ คำถามของฉันจะเป็น: 1) เหตุใดฉันจึงเห็นความแตกต่างระหว่างแพ็คเกจทั้งสองนี้ถึงแม้ว่าพวกเขาจะเหมือนกัน (ฉันเข้าใจว่าพวกมันสุ่ม แต่ 5% ค่อนข้างแตกต่างกันมากโดยเฉพาะอย่างยิ่งเมื่อฉันไม่ได้ใช้ชุดข้อมูลที่ดีirisสำหรับการสร้างแบบจำลองของฉัน) . 2) มีข้อดีหรือข้อเสียในการใช้ทั้งสองแพคเกจหรือไม่ 3) ไม่เกี่ยวข้อง: การใช้irisชุดข้อมูลที่ดีที่สุดinteraction.depthคือ 5 แต่สูงกว่าที่ฉันได้อ่านควรจะใช้สูงสุดfloor(sqrt(ncol(iris)))ซึ่งควรจะเป็น 2 นี่เป็นกฎง่ายๆหรือเข้มงวดหรือไม่? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric …

3
โอกาสที่อาจเกิดความสับสนในการออกแบบการทดสอบ
ภาพรวมของคำถาม คำเตือน: คำถามนี้ต้องมีการตั้งค่าจำนวนมาก กรุณาทนกับฉัน เพื่อนร่วมงานของฉันและฉันกำลังทำงานในการออกแบบการทดสอบ การออกแบบต้องแก้ไขข้อ จำกัด จำนวนมากซึ่งฉันจะแสดงรายการด้านล่าง ฉันได้พัฒนาการออกแบบที่สอดคล้องกับข้อ จำกัด และนั่นทำให้เราประเมินค่าผลกระทบที่น่าสนใจของเราโดยไม่ลำเอียง อย่างไรก็ตามเพื่อนร่วมงานของฉันเชื่อว่ามีความสับสนในการออกแบบ เราโต้เถียงประเด็นนี้ได้โดยไม่ต้องมีการแก้ปัญหาดังนั้น ณ จุดนี้ฉันต้องการความเห็นจากภายนอก ฉันจะอธิบายถึงเป้าหมายของการศึกษาข้อ จำกัด ของเราความสับสนที่อาจเกิดขึ้นและสาเหตุที่ฉันเชื่อว่า "ความสับสน" นี้ไม่ใช่ปัญหาด้านล่าง เมื่อคุณอ่านแต่ละส่วนโปรดจำไว้ว่าคำถามโดยรวมของฉัน: มีความสับสนในการออกแบบที่ฉันอธิบายหรือไม่ [รายละเอียดของการทดลองนี้ได้รับการแก้ไข แต่องค์ประกอบสำคัญที่จำเป็นในการถามคำถามของฉันยังคงเหมือนเดิม] เป้าหมายการทดสอบ เราต้องการตรวจสอบว่าเรียงความที่เขียนโดยตัวผู้สีขาวได้รับการประเมินอย่างดีกว่าเรียงความที่เขียนโดยตัวเมียสีขาวตัวผู้ผิวดำหรือตัวเมียดำ ( ตัวแปรการประพันธ์เรียงความ ) นอกจากนี้เรายังต้องการตรวจสอบว่าอคติใด ๆ ที่เราพบปรากฏขึ้นในทุนที่มีคุณภาพสูงหรือต่ำ ( ตัวแปรคุณภาพ ) สุดท้ายเราต้องการรวมบทความที่เขียนประมาณ 12 หัวข้อที่แตกต่างกัน ( ตัวแปรหัวข้อ ) อย่างไรก็ตามมีเพียงสองตัวแปรแรกเท่านั้นที่น่าสนใจ แม้ว่าหัวข้อจะต้องแตกต่างกันไปตามแต่ละบทความ แต่เราไม่สนใจอย่างมากว่าการประเมินแตกต่างกันอย่างไรในแต่ละหัวข้อ ข้อ จำกัด มีข้อ จำกัด ทั้งจำนวนผู้เข้าร่วมและจำนวนเรียงความที่เราสามารถรวบรวมได้ ผลที่ได้คือการประพันธ์ไม่สามารถควบคุมได้อย่างสมบูรณ์ระหว่างผู้เข้าร่วมและไม่สามารถจัดการได้อย่างสมบูรณ์ระหว่างการเขียนเรียงความ …

2
-test ครับ
ฉันเพิ่งอ่านในนิตยสารวิทยาศาสตร์ที่ได้รับความนิยม (PM) จากเยอรมัน, 02/2013, หน้า 38) เกี่ยวกับการทดลองที่น่าสนใจ (ไม่มีแหล่งที่มา, น่าเสียดาย) มันดึงดูดความสนใจของฉันเพราะฉันสงสัยในความสำคัญของผลลัพธ์ แต่ข้อมูลที่ให้นั้นเพียงพอสำหรับการทำซ้ำการทดสอบทางสถิติ นักวิจัยสงสัยว่าการได้รับความเย็นในสภาพอากาศหนาวเย็นช่วยเพิ่มโอกาสที่จะเป็นหวัดได้หรือไม่ ดังนั้นพวกเขาสุ่มแบ่งนักเรียน 180 คนออกเป็นสองกลุ่ม กลุ่มหนึ่งต้องแช่เท้าในน้ำเย็นเป็นเวลา 20 นาที อีกคนเก็บรองเท้าไว้ ฉันคิดว่าการจัดการที่ตลก แต่ในทางกลับกันฉันไม่ใช่หมอและหมออาจจะคิดว่าตลก ประเด็นด้านจริยธรรมกัน อย่างไรก็ตามหลังจาก 5 วันนักเรียน 13 คนในกลุ่มการรักษามีอาการหวัด แต่เพียง 5 คนในกลุ่มที่สวมรองเท้า อัตราส่วนอัตราต่อรองของการทดลองนี้คือ 2.87 ด้วยขนาดตัวอย่างที่ค่อนข้างเล็กฉันเริ่มสงสัยว่าความแตกต่างนี้อาจมีนัยสำคัญหรือไม่ ดังนั้นฉันจึงทำการทดสอบสองครั้ง การทดสอบอย่างง่ายครั้งแรกของความเท่าเทียมกันของสัดส่วนโดยใช้การประมาณปกติ การทดสอบนี้มีz=1.988z=1.988z=1.988กับp=0.0468p=0.0468p=0.0468 0.0468 ฉันเดาว่านี่คือสิ่งที่นักวิจัยทดสอบ นี่เป็นสิ่งสำคัญอย่างแท้จริง อย่างไรก็ตามการทดสอบ z นี้ใช้ได้เฉพาะในกลุ่มตัวอย่างขนาดใหญ่เท่านั้นหากฉันไม่ผิดเนื่องจากการประมาณปกติ นอกจากนี้อัตราความชุกค่อนข้างน้อยและฉันสงสัยว่าสิ่งนี้อาจไม่ส่งผลกระทบต่ออัตราความครอบคลุมของช่วงความเชื่อมั่นของผลกระทบ ดังนั้นความพยายามครั้งที่สองของฉันคือการทดสอบความเป็นอิสระของไคสแควร์ทั้งการจำลองด้วย Monte-Carlo และ Pearson Chi-square มาตรฐาน ที่นี่ผมพบว่าค่า …

2
การแยกข้อมูลออกเป็นการทดสอบและการฝึกอบรมเป็นการกำหนด“ สถิติ” อย่างแท้จริงหรือไม่?
ฉันเป็นนักเรียนฟิสิกส์ที่เรียนการเรียนรู้ด้วยเครื่อง / วิทยาศาสตร์ข้อมูลดังนั้นฉันจึงไม่ได้หมายความว่าคำถามนี้จะเริ่มต้นความขัดแย้งใด ๆ :) อย่างไรก็ตามส่วนใหญ่ของหลักสูตรฟิสิกส์ระดับปริญญาตรีคือการทำห้องปฏิบัติการ / การทดลองซึ่งหมายถึงข้อมูลจำนวนมาก การประมวลผลและการวิเคราะห์ทางสถิติ อย่างไรก็ตามฉันสังเกตเห็นความแตกต่างที่ชัดเจนระหว่างวิธีที่นักฟิสิกส์จัดการกับข้อมูลและวิธีที่วิทยาศาสตร์ข้อมูล / หนังสือการเรียนรู้ทางสถิติจัดการกับข้อมูล ความแตกต่างที่สำคัญคือเมื่อพยายามทำการถดถอยกับข้อมูลที่ได้จากการทดลองทางฟิสิกส์อัลกอริธึมการถดถอยจะถูกนำไปใช้กับชุดข้อมูลWHOLEไม่มีการแยกชุดฝึกอบรมและชุดทดสอบออกมาอย่างแน่นอน ในโลกฟิสิกส์การคำนวณ R ^ 2 หรือการหลอกบางชนิด -R ^ 2 สำหรับแบบจำลองนั้นขึ้นอยู่กับชุดข้อมูลทั้งหมด ในโลกสถิติข้อมูลจะถูกแบ่งออกเป็น 80-20, 70-30 และอื่น ๆ ... จากนั้นโมเดลจะถูกประเมินเทียบกับชุดข้อมูลการทดสอบ นอกจากนี้ยังมีการทดลองทางฟิสิกส์ที่สำคัญ (ATLAS, BICEP2, ฯลฯ ... ) ที่ไม่เคยทำข้อมูลแยกดังนั้นฉันสงสัยว่าทำไมมันมีความแตกต่างอย่างรุนแรงระหว่างวิธีที่นักฟิสิกส์ / นักทดลองทำสถิติและวิธีที่นักวิทยาศาสตร์ด้านข้อมูล ทำสถิติ

1
การออกแบบตัวแบบผสมเอฟเฟกต์พร้อมตัวแปรสุ่มตัวอย่าง
ฉันพยายามระบุสูตรสำหรับโมเดลเอฟเฟกต์แบบผสมเชิงเส้น (พร้อมlme4) สำหรับการออกแบบการทดลองของฉัน แต่ฉันไม่แน่ใจว่าฉันทำถูกต้องหรือไม่ การออกแบบ: โดยทั่วไปฉันวัดพารามิเตอร์การตอบสนองในพืช ฉันมีการรักษา 4 ระดับและระดับการชลประทาน 2 ระดับ พืชถูกจัดกลุ่มใน 16 แปลงภายในแต่ละแปลงฉันสุ่ม 4 แปลงย่อย ในแต่ละพล็อตย่อยฉันใช้เวลาสังเกตระหว่าง 15 ถึง 30 (ขึ้นอยู่กับจำนวนพืชที่พบ) นั่นคือมีทั้งหมด 1,500 แถว ตอนแรกระดับย่อยเป็นเพียงที่นี่เพื่อจุดประสงค์ในการสุ่มตัวอย่าง แต่ฉันคิดว่าฉันต้องการนำมาพิจารณาในรูปแบบ (เป็นตัวแปรระดับ 64) เพราะฉันเห็นว่ามีความแปรปรวนจำนวนมากจากพล็อตย่อยหนึ่งไปอีก แม้ในพล็อตเดียวกัน (มากกว่าความแปรปรวนระหว่างแปลงทั้งหมด) ความคิดแรกของฉันคือการเขียน: library(lme4) fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata) หรือ fit <- lmer(y ~ treatment*irrigation + (1|subplot) + …

2
ประมาณอัตราที่เครื่องชั่งเบี่ยงเบนมาตรฐานที่มีตัวแปรอิสระ
ฉันมีการทดลองในที่ที่ฉันกำลังการวัดของการกระจายตามปกติตัวแปรYYY , Y∼ N( μ , σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) อย่างไรก็ตามการทดลองก่อนหน้านี้ได้มีหลักฐานบางอย่างที่เบี่ยงเบนมาตรฐานσσ\sigmaเป็นฟังก์ชั่นเลียนแบบของตัวแปรอิสระคือXXX σ= a | X| +bσ=a|X|+b\sigma = a|X| + b Y∼ N( μ , a | X| +b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) ฉันต้องการที่จะประเมินค่าพารามิเตอร์และBโดยการสุ่มตัวอย่างYที่หลายค่าของX นอกจากนี้เนื่องจากข้อ จำกัด ในการทดสอบฉันสามารถใช้ตัวอย่างYจำนวน จำกัด (ประมาณ 30-40) เท่านั้นและต้องการสุ่มตัวอย่างที่ค่าXหลาย ๆ ค่าด้วยเหตุผลการทดลองที่ไม่เกี่ยวข้อง ได้รับข้อ จำกัด เหล่านี้สิ่งที่วิธีการที่มีอยู่ในการประมาณการและข ?aaaขbbYYYXXXYYYXXXaaaขbb คำอธิบายการทดลอง นี่เป็นข้อมูลเพิ่มเติมถ้าคุณสนใจว่าทำไมฉันถึงถามคำถามข้างต้น การทดลองของฉันวัดการรับรู้ทางสายตาและภาพ ฉันมีตั้งค่าการทดสอบที่ฉันสามารถนำเสนอทั้งการได้ยินหรือการมองเห็นเป้าหมายจากสถานที่ที่แตกต่างกัน, , …

1
อะไรคือความแตกต่างระหว่างการควบคุมตัวแปรในตัวแบบการถดถอยกับการควบคุมตัวแปรในการออกแบบการศึกษาของคุณ?
ฉันคิดว่าการควบคุมตัวแปรในการออกแบบการศึกษาของคุณนั้นมีประสิทธิภาพมากขึ้นในการลดข้อผิดพลาดได้มากกว่าการควบคุมมันในแบบจำลองการถดถอยของคุณ ใครบางคนจะอธิบายอย่างเป็นทางการว่า "การควบคุม" สองอย่างนี้มีความแตกต่างกันอย่างไร มีประสิทธิภาพอย่างไรเมื่อเปรียบเทียบกับการลดข้อผิดพลาดและให้การคาดการณ์ที่แม่นยำยิ่งขึ้น

3
หลักสูตรการออกแบบการทดลองสำหรับนักขุดข้อมูล
ฉันเป็นนักวิทยาศาสตร์คอมพิวเตอร์ที่ทำงานด้านการขุดข้อมูล ไม่มีความลับที่จะบอกว่านักวิทยาศาสตร์คอมพิวเตอร์ค่อนข้างยากจนในการออกแบบและประเมินผลการทดลองอย่างเป็นระบบ - การใช้ค่า p-value และการประเมินความเชื่อมั่นถือว่าเป็นขั้นสูง :) สิ่งที่ฉันอยากรู้ถ้ามีหลักสูตร / วัสดุที่ดีในการสอนนักวิทยาศาสตร์คอมพิวเตอร์เกี่ยวกับการออกแบบการทดลองที่ดี เพื่อทำให้ข้อมูลเฉพาะเจาะจงมากขึ้นฉันจะเพิ่มข้อมูลต่อไปนี้: หลักสูตรนี้ควรมุ่งเน้นไปที่นักศึกษาระดับบัณฑิตศึกษาที่สามารถเข้าใจความเป็นไปได้อย่างสมเหตุสมผล แต่มีพื้นฐานทางสถิติที่ จำกัด หลักสูตรควรเน้นการออกแบบการทดลองใน "การตั้งค่าที่ไม่เป็นธรรมชาติ": กล่าวอีกนัยหนึ่งไม่มีความจริงพื้นฐานทางกายภาพหรือวิธีการควบคุมกระบวนการรวบรวมข้อมูล (เช่นเดียวกับวิชามนุษย์) แน่นอนว่าหลักสูตรที่ดีจะมุ่งเน้นไปที่พื้นฐาน แต่ควรจัดการกับสถานการณ์นี้อย่างมีนัยสำคัญ องค์ประกอบการคำนวณจะเป็นโบนัส แต่ไม่บังคับ เราจัดการกับข้อมูลจำนวนมาก แต่สามารถค้นหาปัญหาการคำนวณด้วยตัวเองหากจำเป็น

2
การออกแบบการทดสอบสำหรับจิตใจที่บอกว่าเขาสามารถมีอิทธิพลต่อลูกเต๋า
สมมติว่าฉันมีเพื่อน (เรียกเขาว่า "จอร์จ") ที่บอกว่าเขาสามารถควบคุมการหมุนของลูกเต๋าโดยใช้ความคิดของเขา (เช่นทำให้ลูกเต๋ามีแนวโน้มที่จะลดลงตามจำนวนที่เขากำลังคิด) ฉันจะออกแบบการทดสอบอย่างเข้มงวดทางวิทยาศาสตร์เพื่อตัดสินว่าเขาสามารถทำสิ่งนี้ได้จริงหรือไม่? (ฉันไม่คิดว่าจริง ๆ แล้วเขาสามารถทำได้ แต่ฉันต้องการให้เขาเห็นด้วยกับรายละเอียดของการทดสอบ Amazing Randi-style ก่อนการทดสอบจะเริ่มต้น) ฉันต้องการลดข้อแก้ตัวหลังการทดสอบ (น่าจะเป็นมาก) ว่าเขาจะมาด้วย นี่คือสิ่งที่ฉันมี: กำหนดเทคนิคการทอยลูกเต๋า (ซึ่งลูกเต๋าถ้วยเชคเกอร์พื้นผิวจอด ฯลฯ ) กำหนด "เซสชั่นการทดสอบ" ประกอบด้วยXม้วนลูกเต๋า สิ่งนี้จะต้องมีขนาดเล็กพอที่จะทำในการนั่ง แต่มีขนาดใหญ่พอที่จะตรวจสอบ (หลังจากการวิเคราะห์) ภายใน 95% -99% ความมั่นใจไม่ว่าลูกเต๋าตกลงยุติธรรมหรือได้รับการสนับสนุนด้านใดด้านหนึ่ง รันเซสชันYบนลูกเต๋าที่เลือก (โดยไม่มีอิทธิพลจากจอร์จ) ในฐานะ "การควบคุม" เพื่อให้แน่ใจว่าลูกเต๋าแสดงผลลัพธ์ "ยุติธรรม" ด้วยตนเอง รันเซสชันZกับ George ก่อนที่แต่ละตัวให้หมุนตายแยกต่างหากเพื่อกำหนดว่า George จะ "จดจ่อกับ" หมายเลขใดในระหว่างเซสชันทั้งหมด รวบรวมและวิเคราะห์ผลลัพธ์ จอร์จทำข้อแก้ตัวบางอย่างสำหรับการทำงานที่น่าหดหู่ของเขา ดังนั้นคำถามของฉันสำหรับคุณ: ข้อบกพร่องหรือปัญหาเกี่ยวกับวิธีการโดยรวมของฉันได้อย่างไร สิ่งที่จอร์จมีแนวโน้มที่จะคัดค้าน? …

5
การอ้างอิงสำหรับวิธีการวางแผนการศึกษา
ในการสนทนาโดยเฉลี่ย (ค่ามัธยฐาน) เกี่ยวกับสถิติคุณมักจะพบว่าตัวเองพูดถึงเรื่องนี้หรือวิธีการวิเคราะห์ข้อมูลนี้หรือข้อมูลประเภทนั้น จากประสบการณ์ของฉันการออกแบบการศึกษาอย่างรอบคอบด้วยความคิดพิเศษเกี่ยวกับการวิเคราะห์ทางสถิติมักจะถูกมองข้าม (การทำงานในชีววิทยา / นิเวศวิทยา นักสถิติมักพบว่าตัวเองอยู่ใน gridlock ที่มีข้อมูลที่รวบรวมได้ไม่เพียงพอ (หรือผิดพลาด) ในการถอดความโรนัลด์ฟิชเชอร์พวกเขาถูกบังคับให้ทำการโพสต์ชันสูตรข้อมูลซึ่งมักจะนำไปสู่ข้อสรุปที่อ่อนแอกว่าถ้าหากทั้งหมด ฉันต้องการทราบว่าการอ้างอิงใดที่คุณใช้เพื่อสร้างการออกแบบการศึกษาที่ประสบความสำเร็จโดยเฉพาะอย่างยิ่งสำหรับวิธีการที่หลากหลาย (เช่นt -test, GLM, GAM, เทคนิคการบวช ... ) ที่ช่วยให้คุณหลีกเลี่ยงข้อผิดพลาดดังกล่าวข้างต้น

3
การเลือกคุณสมบัติควรทำกับข้อมูลการฝึกอบรมเท่านั้น (หรือข้อมูลทั้งหมด)?
ควรเลือกคุณลักษณะที่ทำกับข้อมูลการฝึกอบรมเท่านั้น (หรือข้อมูลทั้งหมด)? ฉันผ่านการสนทนาและเอกสารเช่นGuyon (2003)และSinghi และ Liu (2006)แต่ก็ยังไม่แน่ใจเกี่ยวกับคำตอบที่ถูก การตั้งค่าการทดสอบของฉันเป็นดังนี้: ชุดข้อมูล: การควบคุมที่ดีต่อสุขภาพ 50 คนและผู้ป่วยโรค 50 คน (คุณสมบัติ cca 200 ที่สามารถเกี่ยวข้องกับการทำนายโรค) ภารกิจคือการวินิจฉัยโรคตามคุณสมบัติที่มีอยู่ สิ่งที่ฉันทำคือ ใช้ชุดข้อมูลทั้งหมดและทำการเลือกคุณสมบัติ (FS) ฉันเก็บเฉพาะคุณสมบัติที่เลือกไว้เพื่อการประมวลผลต่อไป แยกเพื่อทดสอบและฝึกอบรมตัวจําแนกรถไฟโดยใช้ข้อมูลรถไฟและคุณสมบัติที่เลือก จากนั้นใช้ตัวจําแนกเพื่อทดสอบข้อมูล (อีกครั้งโดยใช้เฉพาะคุณสมบัติที่เลือก) ใช้การตรวจสอบความถูกต้องแบบลาก่อน รับความถูกต้องจำแนก ค่าเฉลี่ย: ทำซ้ำ 1) -3) N ครั้ง (100)ยังไม่มีข้อความ= 50ยังไม่มีข้อความ=50N=50 ฉันจะยอมรับว่าการทำ FS กับชุดข้อมูลทั้งหมดสามารถแนะนำอคติบางอย่าง แต่ความเห็นของฉันคือ "เฉลี่ยโดยเฉลี่ย" ในระหว่างการหาค่าเฉลี่ย (ขั้นตอนที่ 4) ถูกต้องหรือไม่ (ความแปรปรวนความแม่นยำคือ&lt; 2 %&lt;2%<2\% ) 1 …

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE &lt;- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
การเชื่อมโยงระหว่างวิธีเช่นการจับคู่และการควบคุมสถิติสำหรับตัวแปรคืออะไร?
บ่อยครั้งในบทความวิจัยที่คุณอ่านนักวิจัยได้ควบคุมตัวแปรบางอย่าง สิ่งนี้สามารถทำได้โดยวิธีการต่าง ๆ เช่นการจับคู่การบล็อก ฯลฯ แต่ฉันคิดเสมอว่าการควบคุมตัวแปรนั้นเป็นสิ่งที่ทำในเชิงสถิติโดยการวัดตัวแปรหลายอย่างที่อาจมีอิทธิพลและทำการวิเคราะห์เชิงสถิติเกี่ยวกับตัวแปรเหล่านั้นซึ่งสามารถทำได้ทั้งในการทดลองจริงและเสมือนจริง ตัวอย่างเช่นคุณจะมีแบบสำรวจหรือแบบทดสอบอื่นที่คุณวัดตัวแปรอิสระและตัวแปรที่อาจทำให้สับสนและทำการวิเคราะห์บางอย่าง เป็นไปได้ที่จะควบคุมตัวแปรในการทดลองเสมือนหรือไม่? การเชื่อมโยงระหว่างวิธีเช่นการจับคู่และการควบคุมสถิติสำหรับตัวแปรคืออะไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.