คำถามติดแท็ก references

คำถามที่ค้นหาแหล่งอ้างอิงภายนอก (หนังสือเอกสาร ฯลฯ ) เกี่ยวกับเรื่องเฉพาะ ใช้แท็กเฉพาะเจาะจงเพิ่มเติมทุกครั้ง

1
จากการระบุถึงการประมาณ
ฉันกำลังอ่านชิ้นส่วนของ Pearl (Pearl, 2009, 2nd edition) เกี่ยวกับสาเหตุและการดิ้นรนเพื่อสร้างการเชื่อมโยงระหว่างการระบุแบบไม่มีพารามิเตอร์ของแบบจำลองและการประมาณค่าจริง น่าเสียดายที่ Pearl ตัวเองเงียบมากในหัวข้อนี้ เพื่อให้ตัวอย่างผมมีรูปแบบที่เรียบง่ายในใจมีเส้นทางสาเหตุ,และปัจจัยรบกวนที่มีผลต่อตัวแปรทั้งหมด ,และY นอกจากนี้และเกี่ยวข้องกันโดยไม่มีใครสังเกตอิทธิพล,Y ตามกฎของการคำนวณแคลคูลัสตอนนี้ฉันรู้ว่าการแจกแจงความน่าจะเป็นหลังการแทรกแซง (ไม่ต่อเนื่อง) มอบให้โดย:x→z→yx→z→yx \rightarrow z \rightarrow yw→xw→xw \rightarrow xw→zw→zw \rightarrow zw→yw→yw \rightarrow yxxxyyyx←→yx←→yx \leftarrow \rightarrow y P(y∣do(x))=∑w,z[P(z∣w,x)P(w)∑x[P(y∣w,x,z)P(x∣w)]].P(y∣do(x))=∑w,z[P(z∣w,x)P(w)∑x[P(y∣w,x,z)P(x∣w)]]. P(y \mid do(x)) = \sum_{w,z}\bigl[P(z\mid w,x)P(w)\sum_{x}\bigl[P(y\mid w,x,z)P(x\mid w)\bigr]\bigr]. ฉันรู้ว่าฉันสามารถประเมินปริมาณนี้ได้อย่างไร (ไม่ใช่แบบพารามิเตอร์หรือโดยการแนะนำสมมติฐานแบบพารามิเตอร์) โดยเฉพาะอย่างยิ่งในกรณีที่wwwเป็นชุดของตัวแปรที่รบกวนหลายตัวและปริมาณของดอกเบี้ยจะต่อเนื่อง เพื่อประเมินการกระจายการแทรกแซงล่วงหน้าของข้อมูลที่ดูเหมือนจะเป็นไปไม่ได้ในกรณีนี้ มีใครรู้บ้างว่ามีแอปพลิเคชันของวิธีการของ Pearl ที่จัดการกับปัญหาเหล่านี้หรือไม่? ฉันจะมีความสุขมากสำหรับตัวชี้

2
การถดถอยโลจิสติกและตัวแปรอิสระอันดับ
ฉันได้พบโพสต์นี้: ใช่. สัมประสิทธิ์สะท้อนการเปลี่ยนแปลงของอัตราต่อรองสำหรับการเพิ่มขึ้นของการเปลี่ยนแปลงในตัวทำนายลำดับ ข้อมูลจำเพาะรุ่น (ทั่วไปมาก) นี้จะถือว่าผู้ทำนายมีผลกระทบเชิงเส้นในส่วนที่เพิ่มขึ้น ในการทดสอบสมมติฐานคุณสามารถเปรียบเทียบแบบจำลองที่คุณใช้ตัวแปรลำดับเป็นตัวทำนายเดียวกับแบบที่คุณไม่เห็นการตอบสนองและปฏิบัติต่อพวกมันเป็นตัวทำนายหลาย ๆ ตัว หากโมเดลหลังไม่ส่งผลให้มีขนาดพอดีดีขึ้นอย่างมีนัยสำคัญจากนั้นดำเนินการเพิ่มขึ้นแต่ละครั้งเนื่องจากการมีเอฟเฟกต์แบบเชิงเส้นนั้นสมเหตุสมผล - @ dmk38 12 ธ.ค. 53 ที่ 5:21 คุณช่วยบอกฉันได้ไหมว่าจะหาสิ่งที่เผยแพร่ที่สนับสนุนการอ้างสิทธิ์นี้ได้ที่ไหน ฉันทำงานกับข้อมูลและฉันต้องการใช้ตัวแปรอิสระตามลำดับในการถดถอยโลจิสติก

3
วิธีการที่ไม่อิงพารามิเตอร์ต่างกันสำหรับการประเมินการแจกแจงความน่าจะเป็นของข้อมูล
ฉันมีข้อมูลบางส่วนและพยายามที่จะทำให้เส้นโค้งเรียบพอดี อย่างไรก็ตามฉันไม่ต้องการบังคับใช้ความเชื่อก่อนหน้านี้มากเกินไปหรือมีแนวคิดรวบยอดที่แข็งแกร่งเกินไป (ยกเว้นสิ่งที่อยู่ในคำถามที่เหลือของฉัน) หรือสิ่งใด ๆ ที่เฉพาะเจาะจง ฉันแค่ต้องการให้มันพอดีกับเส้นโค้งที่เรียบ (หรือมีการกระจายความน่าจะเป็นที่ดีซึ่งมันอาจมาจาก) วิธีเดียวที่ฉันรู้ในการทำเช่นนี้คือการประมาณความหนาแน่นของเคอร์เนล (KDE) ฉันสงสัยว่าถ้าคนรู้วิธีการอื่นในการประเมินสิ่งนั้น ฉันแค่ต้องการรายชื่อของพวกเขาและจากนั้นฉันสามารถทำวิจัยของตัวเองเพื่อค้นหาสิ่งที่ฉันต้องการใช้ ให้การเชื่อมโยงหรือการอ้างอิงที่ดี (หรือสัญชาตญาณที่ดี) ยินดีต้อนรับเสมอ (และได้รับการสนับสนุน)!

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
ทรัพยากรที่ดีสำหรับการวิเคราะห์อนุกรมเวลามีอะไรบ้าง
ฉันได้ตรวจสอบคำตอบสำหรับคำถามนี้ใน stats.stackexchange: แหล่งข้อมูลที่ดีที่ให้ประวัติของสถิติคืออะไร แน่นอนหนังสือ Stigler "Statistics on the Table" ดูยอดเยี่ยมและฉันรอคอยที่จะอ่านมัน แต่ฉันสนใจที่จะพัฒนาโมเดล ARIMA ที่ทันสมัยมากขึ้น ฉันคิดว่าฉันจำได้ว่าได้ยินว่ามีความคืบหน้ามากมายในการพยายามทำนายความไม่ถูกต้องแบบสุ่มด้วยปืนใหญ่รอบสงครามโลกครั้งที่สอง และแน่นอนว่านักดาราศาสตร์ในช่วงครึ่งปีหลังของสหัสวรรษได้ใช้อนุกรมเวลาเพื่อทำความเข้าใจการเคลื่อนที่ของวัตถุสวรรค์ อย่างไรก็ตามฉันไม่สามารถจำได้ว่าฉันได้ยินเกี่ยวกับการใช้ปืนใหญ่ของอนุกรมเวลาและฉันมีพื้นหลังในวิชาฟิสิกส์และฉันไม่รู้จริง ๆ ว่าวิธีการทางสถิติใดที่นักดาราศาสตร์ทำงานด้วย ดังนั้นฉันชอบที่จะได้ยินสิ่งที่คุณคิดว่าเป็นอิทธิพลทางประวัติศาสตร์ที่เกี่ยวข้องมากที่สุดในการพัฒนาวิธีการอนุกรมเวลาเช่นพวกเขาถูกกระตุ้นโดยการเงินการป้องกันธรณีวิทยา / ธรณีฟิสิกส์หรือการรวมกันของสิ่งเหล่านี้และอื่น ๆ ? มีหนังสือหรือเว็บไซต์ที่ให้ข้อมูลเกี่ยวกับประวัติของ ARIMA หรือไม่?

2
หนังสือสำหรับสถิติที่ไม่ใช่พารามิเตอร์
สิ่งที่จะเป็นหนังสือที่ดีสำหรับสถิติที่ไม่ใช่พารามิเตอร์ ไม่เพียงแค่การแนะนำ แต่ระดับสูง นอกจากนี้ฉันกำลังมองหาสิ่งที่ฉันสามารถใช้สำหรับการเรียนรู้และไม่ได้สำหรับการอ้างอิง โดยเฉพาะฉันกำลังมองหาหนังสือที่มีพื้นฐานอยู่เบื้องหลังวิธีการที่ไม่ใช้พารามิเตอร์, การอนุมานที่ไม่ใช่พารามิเตอร์, วิธีการประเมิน parametrics ที่ไม่ใช่เช่นการทดสอบ KS, การทดสอบ , ฯลฯ , bootstrapping ....เสื้อtt


4
หนังสือที่ดีเกี่ยวกับวิธีการเชิงสถิติสถิติ
เมื่อฉันเรียนหลักสูตรสถิติเชิงทฤษฎีในระดับปริญญาตรีเมื่อ 10 ปีก่อนเราใช้สถิติคณิตศาสตร์สมัยใหม่โดย Dudewicz และ Mishra ฉันพบว่าฉันอ้างถึงหนังสือเล่มนี้แล้วและฉันนึกถึงตัวอย่างรหัสบางส่วนที่อยู่ในชุดประกอบสำหรับ IBM 370 ในขณะที่แปลกตาฉันไม่สามารถช่วยได้ แต่รู้สึกว่าวันนี้ค่อนข้างเก่า หนังสือคุณภาพสูงเล่มใดที่มีอยู่ในเหล้าองุ่นเมื่อเร็ว ๆ นี้?
10 references 

2
อะไรคือผลลัพธ์ที่ทรงพลังที่สุดเกี่ยวกับ iid Gaussians สูงสุด? ใช้มากที่สุดในการฝึก?
รับ iid, พิจารณาตัวแปรสุ่มX1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) Zn: =สูงสุด1 ≤ ฉัน≤ nXผม.Zn=สูงสุด1≤ผม≤nXผม. Z_n := \max_{1 \le i \le n} X_i\,. คำถาม:ผลลัพธ์ที่ "สำคัญ" ที่สุดเกี่ยวกับตัวแปรสุ่มเหล่านี้คืออะไร เพื่อชี้แจง "ความสำคัญ" ซึ่งผลลัพธ์ใดที่มีผลลัพธ์เช่นอื่น ๆ มากที่สุดซึ่งเป็นผลลัพธ์เชิงตรรกะ? ผลลัพธ์ใดที่ใช้บ่อยที่สุดในทางปฏิบัติ โดยเฉพาะอย่างยิ่งดูเหมือนว่าจะเป็นชาวบ้านมีความรู้ในทางสถิติ (ทางทฤษฎี) ว่านั้น "โดยทั่วไปเหมือนกับ" \ sqrt {2 \ log n}อย่างน้อยที่สุด (ดูคำถามที่เกี่ยวข้องนี้)ZnZnZ_n2 บันทึกn-----√2เข้าสู่ระบบ⁡n\sqrt{2 \log n} อย่างไรก็ตามมีผลลัพธ์ที่เกี่ยวข้องมากมายในประเภทนี้และดูเหมือนว่าเป็นกรณีที่ส่วนใหญ่ไม่เท่ากันหรือบ่งบอกถึงกันและกัน ตัวอย่างเช่น* * * ** * …

1
เราสามารถสรุปได้จากที่เป็นอิสระหรือไม่?
เราไม่สามารถดูตัวอย่างhttps://en.wikipedia.org/wiki/Subindependence สำหรับตัวอย่างที่น่าสนใจ แต่คำถามที่แท้จริงคือ: มีวิธีที่จะเสริมสร้างสภาพเพื่อให้ความเป็นอิสระดังต่อไปนี้? ตัวอย่างเช่นมีชุดของฟังก์ชั่นดังนั้นถ้าสำหรับทั้งหมดจึงเป็นอิสระต่อไปนี้? และชุดฟังก์ชั่นดังกล่าวต้องใหญ่ขนาดไหนไม่มีที่สิ้นสุด?g1,…,gng1,…,gng_1, \dotsc, g_nEgi(X)gj(Y)=Egi(X)Egj(Y)E⁡gi(X)gj(Y)=E⁡gi(X)E⁡gj(Y)\E g_i(X) g_j(Y) =\E g_i(X) \E g_j(Y)i,ji,ji,j และนอกจากนี้มีการอ้างอิงที่ดีที่ปฏิบัติต่อคำถามนี้หรือไม่?

6
ฉันต้องการเรียนรู้เกี่ยวกับทฤษฎีความน่าจะเป็นทฤษฎีการวัดและการเรียนรู้ของเครื่องจักรในที่สุด ฉันจะเริ่มที่ไหน [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน3 ปีที่ผ่านมา ฉันต้องการเรียนรู้เกี่ยวกับทฤษฎีความน่าจะเป็นทฤษฎีการวัดและการเรียนรู้ของเครื่องจักรในที่สุด เป้าหมายสูงสุดของฉันคือการใช้การเรียนรู้ของเครื่องในซอฟต์แวร์ ฉันศึกษาแคลคูลัสและความน่าจะเป็นพื้นฐานในวิทยาลัย แต่มันก็สวยมาก คุณรู้หลักสูตรออนไลน์หรือหนังสือบางเล่มที่ฉันสามารถใช้เพื่อเรียนรู้เกี่ยวกับวิชาเหล่านี้ ฉันพบแหล่งข้อมูลมากมายบนเว็บ แต่พวกเขาดูเหมือนจะกำหนดเป้าหมายไปยังผู้ชมที่มีความเชี่ยวชาญ ฉันรู้ว่ามันต้องใช้เวลาพอสมควร แต่ฉันจะเริ่มได้ที่ไหนถ้าฉันต้องการเรียนรู้ตั้งแต่ต้น?

1
หนังสือ / แหล่งข้อมูลเกี่ยวกับการทดลองขั้นสูงคืออะไรดี?
ฉันกำลังมองหาแหล่งข้อมูล (ไม่จำเป็นต้องเป็นหนังสือเล่มเดียว) ที่จะครอบคลุมกรณีที่ท้าทายมากขึ้นของการออกแบบการทดลองและการวิเคราะห์เชิงสถิติ บางกรณีที่ฉันต้องการได้รับความคุ้มครอง: 1. กรณีที่หน่วยของการสุ่มแตกต่างจากหน่วยการวิเคราะห์ ตัวอย่าง: ฉันเรียกใช้แพลตฟอร์มอีคอมเมิร์ซกับผู้ขาย M และผู้ซื้อ N ฉันต้องการแนะนำการรักษาในระดับผู้ขาย แต่สนใจในความน่าจะเป็นของผู้ซื้อที่ทำการซื้อ ผู้ซื้อทั่วไปจะไปที่ร้านค้าหลายแห่งในเซสชัน 2. ตัวแปรผลลัพธ์มีความเบ้สูง ตัวอย่าง: ฉันเรียกใช้ศูนย์บริการและฉันต้องการลองแจ้งให้ลูกค้าป้อนรหัสลูกค้าก่อนถึงตัวแทน ฉันหวังว่าจะลดระยะเวลาเฉลี่ยของการโทรศัพท์ การกระจายสายโทรศัพท์เบ้อย่างมาก 3. กลุ่มการรักษามีการกระจายรูปร่างแตกต่างกัน ตัวอย่าง: ศูนย์บริการเดียวกัน แต่ตอนนี้การรักษาของฉันทำงานได้ดีขึ้นมากสำหรับการโทรสั้นและแย่กว่าเล็กน้อยสำหรับการโทรนาน วิธีที่ถูกต้องในการวิเคราะห์นี้คืออะไร? 4. การรักษาทำให้กลุ่มของฉันไม่สมดุล ตัวอย่าง: แพลตฟอร์มอีคอมเมิร์ซเดียวกับใน1แต่ตอนนี้ฉันต้องการทดสอบด้วยกลไกการจัดอันดับที่แตกต่างกัน โดยได้รับมอบหมายให้อยู่ในอันดับที่น่าพอใจมากขึ้นผู้ขายอาจต้องการขึ้นราคาเพิ่มสินค้าคงคลังเปลี่ยนกลยุทธ์ทางการตลาด ฯลฯ ในลักษณะที่จะทำให้ตัวแปรเหล่านั้นแตกต่างกันอย่างเป็นระบบสำหรับการรักษาที่แตกต่างกัน

1
ลักษณนามเกี่ยวกับพีชคณิตข้อมูลเพิ่มเติมหรือไม่
ฉันได้อ่านลักษณนามพีชคณิต: วิธีการทั่วไปในการตรวจสอบข้ามอย่างรวดเร็วการฝึกอบรมออนไลน์และการฝึกอบรมแบบขนานและรู้สึกทึ่งกับประสิทธิภาพของอัลกอริทึมที่ได้รับ อย่างไรก็ตามดูเหมือนว่าเกินกว่า Naive Bayes (และ GBM) มีอัลกอริธึมไม่มากที่ปรับให้เข้ากับกรอบงาน มีเอกสารอื่น ๆ ที่ใช้ตัวแยกประเภทที่แตกต่างกันหรือไม่ (SVMs ป่าสุ่ม)

1
หลักสูตรระดับบัณฑิตศึกษาในการออกแบบการทดลองควรครอบคลุมอะไรบ้าง
ฉันถูกขอให้เสนอหลักสูตรในการออกแบบการทดลองสำหรับนักศึกษาระดับบัณฑิตศึกษาขั้นสูงด้านพืชไร่และนิเวศวิทยา ฉันไม่เคยเรียนหลักสูตรนี้มาก่อนและรู้สึกประหลาดใจที่พบว่าหลักสูตรนี้อาจมีชื่อว่า "Beyond one-way ANOVA" มากกว่าและมันครอบคลุมเนื้อหาที่ฉันได้เรียนในหลักสูตรระดับบัณฑิตศึกษาขั้นสูงเกี่ยวกับสถิติสำหรับการทดลองทางการเกษตร (เช่น RCBD, ละตินสแควร์, ความคมชัด, การวัดซ้ำและ covariates) บางทีฉันอาจสับสนด้วยชื่อ "การออกแบบการทดลอง" มากกว่า "การวิเคราะห์ผลลัพธ์การทดลอง" ฉันมีความคิดบางอย่างเกี่ยวกับสิ่งที่หลักสูตรดังกล่าวควรมีและขอขอบคุณข้อเสนอแนะเกี่ยวกับวิธีการนี้อาจรวมเข้ากับหลักสูตรสถิติที่ตรงกับความต้องการของนักเรียนในขณะที่นำเสนอทางเลือกที่ทันสมัย ตัวอย่างเช่นฉันไม่สามารถจินตนาการการสอนให้นักเรียนใช้ความแตกต่างเชิงเส้นและสมการกำลังสองกับ ANOVA ที่บังคับให้จัดประเภทของตัวแปรต่อเนื่องเมื่อฉันสามารถสอนพวกเขาเพื่อเปรียบเทียบแบบจำลองการถดถอยกับฟังก์ชันเชิงเส้นและกำลังสอง ในกรณีที่สองพวกเขาจะได้เรียนรู้วิธีจัดการกับปัจจัยที่ไม่ได้กำหนดค่าโดยสิ้นเชิงแบบทดลอง ถ้ามีอะไรฉันอาจเปรียบเทียบทั้งสองแนวทาง ถ้าฉันจะสอนหลักสูตรใน "การออกแบบการทดลอง" ฉันอยากจะเน้นแนวคิดพื้นฐานที่เป็นอิสระจากแบบจำลองทางสถิติที่นำไปใช้และนั่นจะแปลปัญหาอื่น ๆ ให้กว้างขึ้น สิ่งนี้จะช่วยให้นักเรียนมีความยืดหยุ่นในการใช้วิธีการทางสถิติที่ทันสมัย แนวคิดที่เกี่ยวข้องบางอย่างที่ไม่ปรากฏในหลักสูตรที่มีอยู่ ได้แก่ : แบบลำดับชั้นและแบบผสม (ซึ่งฉันเข้าใจ ANOVA และญาติเป็นตัวอย่าง) การเปรียบเทียบแบบจำลอง (เช่นเพื่อแทนที่ความแตกต่าง) ใช้โมเดลเชิงพื้นที่แทนบล็อกเป็น 'ปัจจัย' การจำลองแบบการสุ่มและ IID ความแตกต่างระหว่างการทดสอบสมมติฐานการแฮ็ก p และการจดจำรูปแบบ การวิเคราะห์พลังงานผ่านการจำลอง (เช่นการกู้คืนพารามิเตอร์จากชุดข้อมูลจำลอง) ลงทะเบียนล่วงหน้า การใช้ความรู้เดิมจากการศึกษาที่ตีพิมพ์และหลักการทางวิทยาศาสตร์ มีหลักสูตรที่ใช้แนวทางดังกล่าวหรือไม่? ตำราตำราเล่มใดที่มีจุดสนใจเช่นนี้?

1
โมเดลเชิงเส้นที่ไม่เหมาะสมเมื่อใดจะสวยงามอย่างสมบูรณ์?
คำถาม: มีการใช้โมเดลเชิงเส้นที่ไม่เหมาะสมในทางปฏิบัติหรือมีความอยากรู้อยากเห็นบางครั้งอธิบายไว้ในวารสารวิทยาศาสตร์หรือไม่? ถ้าเป็นเช่นนั้นพวกเขาจะใช้ในด้านใด? มีตัวอย่างอื่น ๆ ของโมเดลดังกล่าวอีกไหม? ในที่สุดข้อผิดพลาดมาตรฐาน value,ฯลฯ ที่นำมาจาก OLS สำหรับรุ่นดังกล่าวจะถูกต้องหรือไม่หรือควรได้รับการแก้ไขอย่างใดpppR2R2R^2 ความเป็นมา:แบบจำลองเชิงเส้นที่ไม่เหมาะสมมีการอธิบายเป็นครั้งคราวในวรรณคดี โดยทั่วไปโมเดลดังกล่าวสามารถอธิบายได้ดังนี้ y=a+b∑iwixi+εy=a+b∑iwixi+ε y = a + b \sum_i w_i x_i + \varepsilon สิ่งที่ทำให้พวกเขาแตกต่างจากการถดถอยก็คือค่าสัมประสิทธิ์ของไม่ได้ประมาณไว้ในแบบจำลอง แต่เป็นน้ำหนักที่wjwjw_j เท่ากับตัวแปรแต่ละตัว ( การถดถอยแบบถ่วงน้ำหนักหน่วย )wi=1wi=1w_i = 1 ขึ้นอยู่กับสหสัมพันธ์ (Dana และ Dawes, 2004)wi=ρ(y,xi)wi=ρ(y,xi)w_i = \rho(y, x_i) เลือกแบบสุ่ม (Dawes, 1979) −1−1-1สำหรับตัวแปรที่เกี่ยวข้องกับ ,สำหรับตัวแปรที่เกี่ยวข้องกับ (Wainer, 1976)yyy111yyy นอกจากนี้มันเป็นเรื่องธรรมดาที่จะใช้ชนิดของการปรับคุณลักษณะบางอย่างเช่นการแปลงตัวแปรเข้า -scores ดังนั้นแบบจำลองชนิดนี้สามารถทำให้ง่ายขึ้นในการถดถอยเชิงเส้นแบบไม่รวมตัวแปรZZZ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.