คำถามติดแท็ก references

คำถามที่ค้นหาแหล่งอ้างอิงภายนอก (หนังสือเอกสาร ฯลฯ ) เกี่ยวกับเรื่องเฉพาะ ใช้แท็กเฉพาะเจาะจงเพิ่มเติมทุกครั้ง


3
ทดสอบความไม่เชิงเส้นในการถดถอยโลจิสติกส์ (หรือการถดถอยแบบอื่น ๆ )
หนึ่งในข้อสันนิษฐานของการถดถอยโลจิสติกคือความเป็นเส้นตรงใน logit ดังนั้นเมื่อฉันสร้างแบบจำลองและเรียกใช้แล้วฉันจะทดสอบความไม่เชิงเส้นโดยใช้การทดสอบ Box-Tidwell หนึ่งในเครื่องมือทำนายต่อเนื่อง (X) ของฉันได้ทดสอบค่าบวกสำหรับความไม่เชิงเส้น ฉันควรทำอย่างไรต่อไป เนื่องจากนี่เป็นการละเมิดสมมติฐานที่ฉันจะกำจัดตัวทำนาย (X) หรือรวมถึงการแปลงแบบไม่เชิงเส้น (X * X) หรือแปลงตัวแปรเป็นหมวดหมู่? หากคุณมีการอ้างอิงคุณช่วยชี้ให้ฉันเห็นด้วยได้ไหม?

3
หนังสือแนะนำสำหรับผู้เริ่มต้นเกี่ยวกับการแจกแจงความน่าจะเป็น
ฉันกำลังเรียนรู้การเรียนรู้ของเครื่องและหนังสือทุกเล่มที่ฉันเปิดฉันชนกับการแจกแจงแบบไคสแควร์, ฟังก์ชันแกมม่า, การแจกแจงแบบ t, เกาส์เซียนและอื่น ๆ หนังสือทุกเล่มที่ฉันได้เปิดจนถึงเพียงกำหนดสิ่งที่การกระจายคือพวกเขาไม่ได้อธิบายหรือให้สัญชาตญาณว่าสูตรเฉพาะสำหรับฟังก์ชั่นมาจากไหน ตัวอย่างเช่นทำไมการกระจายแบบไคสแควร์ถึงเป็นแบบนั้น การแจกแจงแบบ t คืออะไร? สัญชาตญาณของการกระจายคืออะไร พิสูจน์? เป็นต้น ฉันต้องการที่จะมีความเข้าใจที่ชัดเจนและพื้นฐานของการแจกแจงที่ใช้กันมากที่สุดเพื่อให้ทุกครั้งในภายหลังเมื่อฉันเห็นพวกเขาฉันเข้าใจอย่างแท้จริงว่าการกระจายตัวทีคืออะไรการกระจายแบบเกาส์และที่สำคัญที่สุดคือทำไม พวกเขาคือ. มันจะดีถ้าหนังสือ / บทช่วยสอนสามารถอธิบายแนวคิดของคนธรรมดาเพื่อที่จะเข้าใจพวกเขาคุณไม่จำเป็นต้องเข้าใจพวกเขา x) หนังสือหลายเล่มเป็นเช่นนี้พวกเขาไม่เหมาะสำหรับผู้เริ่มต้น :(

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
ฐานคณิตศาสตร์สำหรับการขุดข้อมูลและอัลกอริทึมปัญญาประดิษฐ์
คุณช่วยอธิบายเกี่ยวกับการขุดข้อมูลและอัลกอริทึมปัญญาประดิษฐ์ให้ฉันได้ไหม พวกเขาใช้คณิตศาสตร์อะไร คุณช่วยบอกจุดเริ่มต้นในคณิตศาสตร์ให้ฉันเข้าใจอัลกอริธึมเหล่านี้ได้ไหม

2
ปัญหา Behrens - Fisher
มีบัญชี expository ที่ดีเผยแพร่ด้วยรายละเอียดทางคณิตศาสตร์ของวิธีการต่าง ๆ ที่นำไปสู่ปัญหา Behrens - Fisher?

5
Bayesians เคยโต้แย้งว่ามีกรณีที่วิธีการของพวกเขาสรุป / ทับซ้อนกับวิธีการที่ใช้บ่อยหรือไม่?
Bayesians เคยยืนยันว่าวิธีการของพวกเขาทำให้วิธีการทั่วไปเป็นปกติหรือไม่เพราะเราสามารถใช้นักบวชที่ไม่ให้ข้อมูลได้และดังนั้นจึงสามารถกู้คืนโครงสร้างแบบจำลองของนักสะสมทั่วไปได้หรือไม่? ใครช่วยแนะนำฉันไปยังสถานที่ที่ฉันสามารถอ่านเกี่ยวกับเรื่องนี้ถ้ามันถูกใช้จริง? แก้ไข: คำถามนี้อาจจะเป็นประโยคที่ไม่ตรงกับที่ฉันตั้งใจจะพูด คำถามคือ: "มีการอ้างอิงใด ๆ เกี่ยวกับการอภิปรายของกรณีที่วิธีการแบบเบย์และวิธีการที่พบบ่อยซ้อนทับกัน / ตัด / มีบางสิ่งที่เหมือนกันผ่านการใช้บางอย่างมาก่อนหรือไม่" ตัวอย่างหนึ่งจะใช้ที่ไม่เหมาะสมก่อนนี้ แต่ฉันค่อนข้างแน่ใจว่านี่เป็นเพียงส่วนปลายสุดของภูเขาน้ำแข็งp(θ)=1p(θ)=1p(\theta) = 1

2
RFM และการสร้างแบบจำลองมูลค่าตลอดชีวิตของลูกค้าใน R
ใครช่วยบอกวิธีการสร้างแบบจำลองความใหม่ความถี่และค่าเงิน (RFM) และการสร้างแบบจำลองมูลค่าลูกค้าใน R นอกจากนี้มีใครบางคนสามารถอ้างอิงวรรณกรรมบางอย่างกับฉันได้หรือไม่

4
การอ้างอิงสำหรับนักสถิติให้คำปรึกษาเพื่อเสนอลูกค้าของพวกเขา
คำถามนี้แสดงให้เห็นถึงความยากลำบากของบุคคลที่มีความเชี่ยวชาญด้านสถิติและความน่าจะเป็นด้วยตนเองเมื่อเผชิญกับทรัพยากรที่มีการพัฒนาน้อยเช่นวิกิพีเดีย มันเกิดขึ้นกับฉันว่านักสถิติให้คำปรึกษาและมีบางอย่างที่นี่เป็นประจำอาจเผชิญกับความท้าทายในการอธิบายแนวคิดและวิธีการบางอย่างให้กับลูกค้า นี่คือด้านพลิกของเหรียญการสอน เมื่อมีความเชี่ยวชาญในแนวความคิดมันอาจทำให้รู้สึกถึงวิธีการวิเคราะห์โดยเฉพาะ แต่การอ้างอิงของบุคคลนั้นอาจไม่เหมาะสมหรือยากที่จะแบ่งปันกับลูกค้า ดังนั้นมีแหล่งข้อมูลทั่วไปที่ให้คำปรึกษานักสถิติชอบที่จะแนะนำให้กับลูกค้าของพวกเขา? (ดูอัปเดต # 1 เกี่ยวกับหัวข้อขั้นสูงหรือหัวข้อพิเศษเพิ่มเติม) ฉันนึกถึงหนังสือสองสามเล่มที่อาจมีประโยชน์ แต่ฉันสงสัยว่าลูกค้าจำนวนมากจะไปค้นหาเว็บอย่างที่นักพัฒนาทำและจะเจอกับเนื้อหาที่ไม่มีสาระในวิกิพีเดีย ในคำตอบของฉันสำหรับผู้พัฒนาฉันแนะนำNIST Handbookเป็นข้อมูลอ้างอิงหนึ่งที่สามารถใช้ได้ มีอะไรอีกบ้าง? อัปเดต 1: ตามที่Peter Flom ได้ชี้ให้เห็นสำหรับวัสดุขั้นสูงหรือการแสวงหาที่แคบกว่ามันอาจไม่ใช่เรื่องง่ายที่จะเสนอจุดอ้างอิงเดียว นี้ถูกต้องและฉันควรจะถามคำถามที่แตกต่างกันสำหรับกรณีเหล่านั้น ในกรณีเช่นนี้ที่ปรึกษาจะค้นหาและแบ่งปันการอ้างอิงที่เข้าถึงได้อย่างไร ฉันเชื่อว่าที่ปรึกษาจำนวนมากจะใช้เวลาเขียนสิ่งใหม่เพื่ออธิบายสิ่งต่าง ๆ กับลูกค้าของพวกเขา แต่นั่นไม่ใช่การอ้างอิงที่ถูกค้นพบและแบ่งปัน ความคิดบางอย่าง: แบบฝึกหัดที่เขียนโดยที่ปรึกษาหรือคนอื่น ๆ กรณีศึกษาหรือการวิเคราะห์จากโครงการที่แสดงแนวคิดเดียวกัน ข้อความที่ตัดตอนมาจากหนังสือ (ตามที่ฉันแนะนำในคำตอบของฉันสำหรับ Developer) ซึ่งอธิบายแนวคิด มีอะไรอีกบ้างที่อาจเป็นแหล่งข้อมูลหรือคุณจะไปหาแหล่งอ้างอิงดังกล่าวอีกครั้งอย่างไร ฉันรู้ว่านี่เป็นคำถามปลายเปิด แต่คำตอบของฉันสำหรับผู้พัฒนาแสดงให้เห็นถึงวิธีการที่ฉันจัดการกับปัญหานี้ ฉันไม่ได้ตั้งใจจะถามถึงวิธีการทั้งหมดที่เราสามารถแก้ไขปัญหานี้ได้ แต่จากประสบการณ์ของตัวเองคุณมักจะให้แหล่งข้อมูลที่อธิบายได้อย่างไร

9
หนังสือสำหรับภาพรวมทั่วไปและแนวคิดของวิธีการทางสถิติ
ฉันสนใจเกี่ยวกับศักยภาพของการวิเคราะห์ทางสถิติสำหรับการจำลอง / การพยากรณ์ / การประเมินฟังก์ชั่น ฯลฯ อย่างไรก็ตามฉันไม่รู้อะไรมากเกี่ยวกับเรื่องนี้และความรู้ทางคณิตศาสตร์ของฉันยังค่อนข้าง จำกัด - ฉันเป็นนักศึกษาระดับปริญญาตรีด้านวิศวกรรมซอฟต์แวร์ ฉันกำลังมองหาหนังสือที่จะให้ฉันเริ่มต้นกับบางสิ่งที่ฉันอ่านต่อไป: การถดถอยเชิงเส้นและการถดถอยแบบอื่น ๆ วิธีการแบบเบส์วิธีการมอนเต้คาร์โลการเรียนรู้ของเครื่อง ฯลฯ ฉันก็ต้องการเริ่มต้นด้วย R เช่นกัน มีหนังสือเล่มหนึ่งที่รวมทั้งสองอย่างนี้เข้าด้วยกัน โดยเฉพาะอย่างยิ่งฉันต้องการให้หนังสืออธิบายสิ่งต่าง ๆ ในเชิงแนวคิดและไม่ได้อยู่ในรายละเอียดทางเทคนิคมากเกินไป - ฉันต้องการให้สถิติใช้งานได้ง่ายสำหรับฉันเพราะฉันเข้าใจว่ามีสถิติความเสี่ยงที่ผิดพลาดจำนวนมาก ฉันอยู่นอกหลักสูตรยินดีที่จะอ่านหนังสือมากขึ้นเพื่อปรับปรุงความเข้าใจในหัวข้อที่ฉันเห็นว่ามีค่า

3
เปลี่ยนจากการใช้ซอฟต์แวร์ทางสถิติเพื่อทำความเข้าใจสมการทางคณิตศาสตร์หรือไม่
บริบท: ฉันเป็นนักศึกษาปริญญาเอกด้านจิตวิทยา เช่นเดียวกับนักศึกษาปริญญาเอกจิตวิทยาหลายคนฉันรู้วิธีการวิเคราะห์ทางสถิติต่าง ๆ โดยใช้ซอฟต์แวร์ทางสถิติจนถึงเทคนิคต่าง ๆ เช่น PCA การจำแนกต้นไม้และการวิเคราะห์กลุ่ม แต่ก็ไม่เป็นที่น่าพอใจเพราะแม้ว่าฉันสามารถอธิบายได้ว่าทำไมฉันถึงวิเคราะห์และตัวบ่งชี้ความหมายฉันไม่สามารถอธิบายได้ว่าเทคนิคทำงานอย่างไร ปัญหาที่แท้จริงคือซอฟต์แวร์ทางสถิติที่เข้าใจง่าย แต่มีข้อ จำกัด ในการเรียนรู้เทคนิคใหม่ในบทความนั้นฉันต้องเข้าใจวิธีการอ่านสมการทางคณิตศาสตร์ ในปัจจุบันฉันไม่สามารถคำนวณค่าลักษณะเฉพาะหรือค่า K สมการเป็นเหมือนภาษาต่างประเทศสำหรับฉัน คำถาม: มีคำแนะนำที่ครอบคลุมที่ช่วยในการทำความเข้าใจสมการในบทความวารสารหรือไม่? แก้ไข: ฉันคิดว่าคำถามนั้นจะอธิบายได้ด้วยตนเองมากกว่า: เหนือความซับซ้อนบางอย่างสัญกรณ์ทางสถิติกลายเป็นคำพูดพล่อยๆสำหรับฉัน; สมมติว่าฉันต้องการโค้ดฟังก์ชั่นของตัวเองใน R หรือ C ++ เพื่อทำความเข้าใจกับเทคนิค แต่มีสิ่งกีดขวาง ฉันไม่สามารถแปลงสมการเป็นโปรแกรม และจริง ๆ : ฉันไม่รู้สถานการณ์ในโรงเรียนปริญญาเอกของสหรัฐอเมริกา แต่ในเหมือง (ฝรั่งเศส) หลักสูตรเดียวที่ฉันสามารถติดตามได้คือการเคลื่อนไหวเกี่ยวกับครอกศตวรรษที่ 16 ...

1
ออนไลน์วิธีการทางสถิติที่ปรับขนาดได้
นี่คือแรงบันดาลใจจากการถดถอยเชิงเส้นออนไลน์ที่มีประสิทธิภาพซึ่งฉันพบว่าน่าสนใจมาก มีข้อความหรือแหล่งข้อมูลใดบ้างที่อุทิศให้กับการคำนวณทางสถิติขนาดใหญ่โดยการคำนวณด้วยชุดข้อมูลที่ใหญ่เกินไปที่จะพอดีกับหน่วยความจำหลัก ตัวอย่างเช่นเป็นไปได้หรือไม่ที่จะใส่โมเดลเอฟเฟกต์แบบผสมเข้ากับแฟชั่นออนไลน์ มีใครบ้างไหมที่มองหาผลกระทบของการแทนที่เทคนิคการเพิ่มประสิทธิภาพลำดับที่ 2 มาตรฐานสำหรับ MLE ด้วยลำดับที่ 1 เทคนิคประเภท SGD

2
พิกัดโคตรสำหรับ lasso หรือ elastic net
มีเอกสารหรือหนังสือที่ดีเกี่ยวกับการใช้โคตรประสานงานสำหรับ L1 (lasso) และ / หรือการทำให้เป็นระเบียบสุทธิแบบยืดหยุ่นสำหรับปัญหาการถดถอยเชิงเส้นหรือไม่?

5
การอ้างอิงมาตรฐานสำหรับสถิติทางคณิตศาสตร์แบบดั้งเดิม?
ใครบ้างที่สามารถแนะนำหนังสือบางเล่มที่ถือเป็นการอ้างอิงมาตรฐานสำหรับสถิติแบบคลาสสิก IE ค่อนข้างครอบคลุมและอยู่ในช่วงระยะเวลาหนึ่งเพื่อให้การพิมพ์ผิดและผิดพลาดในสูตรมีโอกาสตรวจสอบและแก้ไข

6
หนังสือหรือบทความที่แนะนำเกี่ยวกับการวิเคราะห์กลุ่ม?
ฉันกำลังทำงานกับคลังข้อความขนาดเล็ก (200M) ซึ่งฉันต้องการสำรวจด้วยการวิเคราะห์กลุ่ม คุณจะแนะนำหนังสือหรือบทความใดในเรื่องนั้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.