คำถามติดแท็ก logistic

โดยทั่วไปหมายถึงกระบวนการทางสถิติที่ใช้ฟังก์ชันลอจิสติกซึ่งเป็นรูปแบบต่าง ๆ ส่วนใหญ่ของการถดถอยโลจิสติก

2
เหตุใดการถดถอยโลจิสติกจึงสร้างแบบจำลองที่ได้รับการสอบเทียบอย่างดี
ฉันเข้าใจว่าเหตุผลหนึ่งที่การถดถอยโลจิสติกส์ใช้บ่อยในการทำนายอัตราการคลิกผ่านบนเว็บคือมันสร้างแบบจำลองที่ได้รับการสอบเทียบอย่างดี มีคำอธิบายทางคณิตศาสตร์ที่ดีสำหรับเรื่องนี้หรือไม่?

1
วิธีการแก้ไขการไม่ลู่เข้าใน LogisticRegressionCV
ฉันใช้ Scikit เรียนรู้เพื่อดำเนินการถดถอยโลจิสติกด้วย crossvalidation ในชุดของข้อมูล (ประมาณ 14 พารามิเตอร์ด้วย> 7000 การสังเกตปกติ) ฉันยังมีตัวจําแนกเป้าหมายที่มีค่าเป็น 1 หรือ 0 ปัญหาที่ฉันมีคือไม่ว่าจะใช้ตัวแก้ปัญหาแบบใดฉันก็จะได้รับคำเตือนการลู่เข้า ... model1 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='newton-cg',penalty='l2') /home/b/anaconda/lib/python2.7/site-packages/scipy/optimize/linesearch.py:285: LineSearchWarning: The line search algorithm did not converge warn('The line search algorithm did not converge', LineSearchWarning) /home/b/anaconda/lib/python2.7/site-packages/sklearn/utils/optimize.py:193: UserWarning: Line Search failed model2 = linear_model.LogisticRegressionCV(cv=10,verbose=1,n_jobs=-1,scoring='roc_auc',solver='sag',penalty='l2') max_iter reached after 2 seconds max_iter …

4
ฉันควรตรวจสอบสมมติฐานของ linearity กับ logit สำหรับตัวแปรอิสระอย่างต่อเนื่องในการวิเคราะห์การถดถอยโลจิสติกอย่างไร
ฉันสับสนกับข้อสมมติของความเป็นเชิงเส้นต่อ logit สำหรับตัวแปรทำนายอย่างต่อเนื่องในการวิเคราะห์การถดถอยโลจิสติก เราจำเป็นต้องตรวจสอบความสัมพันธ์เชิงเส้นในขณะที่คัดกรองผู้ทำนายที่มีศักยภาพโดยใช้การวิเคราะห์การถดถอยโลจิสติกที่ไม่เปลี่ยนแปลงหรือไม่? ในกรณีของฉันฉันใช้การวิเคราะห์การถดถอยโลจิสติกหลายครั้งเพื่อระบุปัจจัยที่เกี่ยวข้องกับภาวะโภชนาการ (ผลแบบคู่) ของผู้เข้าร่วม ตัวแปรอย่างต่อเนื่องรวมถึงอายุ, คะแนนการดูดซับของชาร์ลสัน, ดัชนีบาร์เทล, ความแข็งแรงของมือ, คะแนน GDS, ค่าดัชนีมวลกายเป็นต้นขั้นตอนแรกของฉันคือการคัดกรองตัวแปรที่สำคัญโดยใช้การถดถอยโลจิสติกอย่างง่าย ฉันต้องตรวจสอบสมมติฐานเชิงเส้นตรงในระหว่างการวิเคราะห์การถดถอยโลจิสติกอย่างง่ายสำหรับตัวแปรต่อเนื่องแต่ละตัวหรือไม่ หรือฉันควรตรวจสอบในรูปแบบการถดถอยโลจิสติกหลายขั้นสุดท้าย? นอกจากนี้เพื่อความเข้าใจของฉันเราต้องเปลี่ยนตัวแปรต่อเนื่องที่ไม่ใช่เชิงเส้นก่อนที่จะใส่ลงในโมเดล ฉันสามารถจัดหมวดหมู่ตัวแปรต่อเนื่องแบบไม่เชิงเส้นแทนการแปลงได้หรือไม่?

3
ขนาดตัวอย่างที่จำเป็นในการประมาณความน่าจะเป็นของ“ ความสำเร็จ” ในการทดลองใช้ Bernoulli
สมมติว่าเกมเสนอเหตุการณ์ที่เมื่อดำเนินการเสร็จแล้วอาจให้รางวัลหรือไม่ทำอะไรเลย กลไกที่แน่ชัดในการพิจารณาว่าการให้รางวัลนั้นไม่เป็นที่รู้จักหรือไม่ แต่ฉันคิดว่าจะใช้ตัวสร้างตัวเลขแบบสุ่มและหากผลลัพธ์นั้นมีค่ามากกว่าค่าฮาร์ดโค้ดบางตัวคุณจะได้รับรางวัล ถ้าฉันต้องการวิศวกรรมย้อนกลับโดยทั่วไปแล้วโปรแกรมเมอร์ใช้ค่าอะไรในการพิจารณาความถี่ที่ได้รับรางวัล (ประมาณ 15-30%) ฉันจะคำนวณจำนวนตัวอย่างที่ฉันต้องการได้อย่างไร ฉันเริ่มต้นด้วยส่วน "เครื่องมือประมาณความน่าจะเป็นจริง" ที่นี่: Checking_whether_a_coin_is_fairแต่ฉันไม่แน่ใจว่าฉันกำลังมุ่งหน้าไปทางที่ถูกต้อง ฉันได้รับผลลัพธ์จาก ~ 1,000 ตัวอย่างที่จำเป็นสำหรับข้อผิดพลาดสูงสุด 3% ที่ความมั่นใจ 95% ท้ายที่สุดนี่คือสิ่งที่ฉันพยายามแก้ไข: กิจกรรม # 1 ให้รางวัล 1.0R, X% ของเวลา กิจกรรม # 2 ให้รางวัล 1.4R กับ Y% ของเวลา ฉันต้องการประเมิน X & Y อย่างแม่นยำพอที่จะตัดสินว่ากิจกรรมใดมีประสิทธิภาพมากกว่า ขนาดตัวอย่างที่มีขนาดใหญ่เป็นปัญหาเนื่องจากฉันสามารถได้รับ 1 ตัวอย่างทุก ๆ 20 นาทีเท่านั้น

1
การวิเคราะห์อภิมานของอัตราส่วนราคาต่อรองเป็นสิ่งที่สิ้นหวังหรือไม่?
ในบทความล่าสุดของNorton และคณะ (2018)ระบุว่า[1][1]^{[1]} อัตราส่วนของอัตราต่อรองที่แตกต่างจากการศึกษาเดียวกันไม่สามารถเปรียบเทียบได้เมื่อแบบจำลองทางสถิติที่ส่งผลให้การประมาณอัตราต่อรองมีตัวแปรอธิบายที่แตกต่างกัน และขนาดของอัตราต่อรองจากการศึกษาหนึ่งสามารถเปรียบเทียบกับขนาดของอัตราต่อรองได้จากการศึกษาอื่นเพราะตัวอย่างที่แตกต่างกันและข้อกำหนดของแบบจำลองที่แตกต่างกันจะมีปัจจัยการปรับขนาดโดยพลการแตกต่างกัน อีกนัยหนึ่งคือขนาดของอัตราต่อรองของการเชื่อมโยงที่กำหนดในการศึกษาหลาย ๆ ครั้งไม่สามารถสังเคราะห์ได้ในการวิเคราะห์อภิมาน การจำลองขนาดเล็กแสดงให้เห็นถึงนี้ (รหัส R อยู่ที่ด้านล่างของคำถาม) สมมติว่ารูปแบบที่แท้จริงคือ: ลองจินตนาการอีกว่าข้อมูลเดียวกันที่สร้างขึ้นโดยตัวแบบข้างต้นถูกวิเคราะห์โดยนักวิจัยสี่คนโดยใช้การถดถอยโลจิสติกส์ นักวิจัย 1 รวมเป็น covariate เท่านั้นนักวิจัย 2 รวมทั้งและและอื่น ๆ การประมาณการแบบจำลองโดยเฉลี่ยของอัตราต่อรองสำหรับของสี่นักวิจัยคือ:logit(yi)=1+log(2)x1i+log(2.5)x2i+log(3)x3i+0x4ilogit(yi)=1+log⁡(2)x1i+log⁡(2.5)x2i+log⁡(3)x3i+0x4i \mathrm{logit}(y_{i})=1 + \log(2)x_{1i} + \log(2.5)x_{2i} + \log(3)x_{3i} + 0x_{4i} x1x1x_{1}x1x1x_{1}x2x2x_{2}x1x1x_{1} res_1 res_2 res_3 res_4 1.679768 1.776200 2.002157 2.004077 เห็นได้ชัดว่ามีเพียงนักวิจัย 3 และ 4 เท่านั้นที่ได้รับอัตราต่อรองที่ถูกต้องประมาณในขณะที่นักวิจัย 1 และ 2 ไม่ได้ …

2
ทำความเข้าใจเกี่ยวกับการถดถอยโลจิสติกและความน่าจะเป็น
การประมาณค่าพารามิเตอร์ / การฝึกอบรมการถดถอยโลจิสติกทำงานอย่างไร ฉันจะพยายามใส่สิ่งที่ฉันได้รับจนถึง เอาต์พุตคือ y เอาต์พุตของฟังก์ชันลอจิสติกในรูปแบบของความน่าจะเป็นขึ้นอยู่กับค่าของ x: P( y= 1 | x ) = 11 + e- ωTx≡ σ( ωTx )P(y=1|x)=11+e−ωTx≡σ(ωTx)P(y=1|x)={1\over1+e^{-\omega^Tx}}\equiv\sigma(\omega^Tx) P( y= 0 | x ) = 1 - P( y= 1 | x ) = 1 - 11 + e- ωTxP(y=0|x)=1−P(y=1|x)=1−11+e−ωTxP(y=0|x)=1-P(y=1|x)=1-{1\over1+e^{-\omega^Tx}} สำหรับหนึ่งมิติ Odds ที่เรียกว่าถูกกำหนดดังนี้: p ( y= …

2
ข้อดีข้อเสียของการเชื่อมโยงเข้าสู่ระบบและการเชื่อมโยงข้อมูลประจำตัวสำหรับการถดถอยปัวซอง
ฉันกำลังดำเนินการถดถอยปัวซองกับเป้าหมายสุดท้ายของการเปรียบเทียบ (และการแตกต่างของ) ในขณะที่ถือตัวแปรรุ่นอื่น ๆ (ซึ่งเป็นไบนารีทั้งหมด ) คงที่ ฉันสงสัยว่าถ้าใครสามารถให้คำแนะนำที่เป็นประโยชน์เกี่ยวกับเวลาที่จะใช้ลิงค์บันทึกกับลิงก์ประจำตัว อะไรคือข้อดีข้อเสียของฟังก์ชั่นลิงค์สองแบบนี้ในการถดถอยแบบปัวซองโดยมีเป้าหมายในการเปรียบเทียบความแตกต่างμ^1−μ^2μ^1−μ^2\hat{\mu}_1-\hat{\mu}_2 ฉันมีเป้าหมายเดียวกันในใจสำหรับการถดถอยโลจิสติกส์ / ทวินาม (เพื่อใช้ลิงค์ logit หรือลิงค์ตัวตน) เพื่อเปรียบเทียบความแตกต่างของสัดส่วนระหว่างสองระดับปัจจัยและต้องการคำแนะนำที่คล้ายกัน ฉันได้อ่านบางส่วนของโพสต์ที่สัมผัสกับปัญหานี้ แต่ดูเหมือนจะไม่มีใครอธิบายว่าทำไมหรือเมื่อมีใครอาจเลือกลิงค์หนึ่งมากกว่าอีกลิงค์และข้อดี / ข้อเสียอาจจะ ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ! UPDATE: ฉันยังตระหนักว่าจุดประสงค์หลักของการใช้ฟังก์ชั่นลิงก์บางอย่างคือเพื่อ จำกัด ช่วงของค่าทำนายที่เป็นไปได้ที่จะอยู่ในช่วงของการตอบสนองเฉลี่ย (เช่นสำหรับโลจิสติกส์ช่วงถูก จำกัด ให้อยู่ระหว่าง 0 ถึง 1 และล็อก ลิงก์การคาดคะเนถูก จำกัด ให้เป็นจำนวนบวก) ดังนั้นฉันเดาว่าสิ่งที่ฉันถามคือถ้าฉันใช้ลิงค์ประจำตัวเพื่อพูดการถดถอยโลจิสติก / ทวินามและผลลัพธ์ของฉันอยู่ในช่วง (0,1) มีความต้องการใช้ฟังก์ชั่นการเชื่อมโยงโลจิสติกหรือ ฉันจะทำให้การใช้ลิงก์การระบุตัวตนทำได้ง่ายขึ้นหรือไม่

2
การถดถอยโลจิสติกส์เหมาะสมเมื่อใด
ขณะนี้ฉันกำลังสอนตัวเองเกี่ยวกับการจำแนกประเภทและโดยเฉพาะฉันกำลังดูวิธีการสามวิธี: การสนับสนุนเครื่องเวกเตอร์เครือข่ายประสาทและการถดถอยโลจิสติก สิ่งที่ฉันพยายามเข้าใจคือเหตุที่การถดถอยโลจิสติกจะทำงานได้ดีกว่าอีกสอง จากความเข้าใจของฉันในการถดถอยโลจิสติกความคิดคือการปรับฟังก์ชั่นโลจิสติกให้พอดีกับข้อมูลทั้งหมด ดังนั้นถ้าข้อมูลของฉันเป็นเลขฐานสองข้อมูลทั้งหมดที่มีป้ายกำกับ 0 ควรถูกแมปกับค่า 0 (หรือใกล้เคียง) และข้อมูลทั้งหมดที่มีค่า 1 ควรถูกแมปกับค่า 1 (หรือใกล้เคียง) ตอนนี้เนื่องจากฟังก์ชันโลจิสติกส์นั้นต่อเนื่องและราบรื่นการดำเนินการถดถอยนี้จึงต้องการข้อมูลทั้งหมดของฉันเพื่อให้พอดีกับเส้นโค้ง ไม่มีความสำคัญมากขึ้นนำไปใช้กับจุดข้อมูลที่อยู่ใกล้กับขอบเขตการตัดสินใจและจุดข้อมูลทั้งหมดมีส่วนทำให้เกิดการสูญเสียตามจำนวนที่แตกต่างกัน อย่างไรก็ตามด้วยการสนับสนุนเวกเตอร์แมชชีนและเครือข่ายนิวรัลเฉพาะจุดข้อมูลเหล่านั้นที่อยู่ใกล้กับขอบเขตการตัดสินใจมีความสำคัญ ตราบใดที่จุดข้อมูลยังคงอยู่ในขอบเขตเดียวกันของขอบเขตการตัดสินใจมันจะมีส่วนทำให้เกิดการสูญเสียเท่ากัน ดังนั้นเหตุใดการถดถอยของโลจิสติกจึงมีประสิทธิภาพสูงกว่าเครื่องเวกเตอร์หรือโครงข่ายประสาทเนื่องจากว่า "เสียทรัพยากร" ในการพยายามที่จะปรับเส้นโค้งให้เข้ากับข้อมูลที่ไม่สำคัญ (จำแนกได้ง่าย ๆ ) ขอบเขต?

1
การทดสอบความเหมาะสมในการถดถอยโลจิสติก เราต้องการทดสอบแบบใด
ฉันหมายถึงคำถามและคำตอบ: วิธีการเปรียบเทียบ (ความน่าจะเป็น) ความสามารถในการทำนายของแบบจำลองที่พัฒนาจากการถดถอยโลจิสติก? โดย @Clark Chong และคำตอบ / ความคิดเห็นโดย @Frank Harrell และคำถามองศาความเป็นอิสระของในการทดสอบ Hosmer-Lemeshowχ2χ2\chi^2และความคิดเห็น ฉันได้อ่านเอกสารDW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "การเปรียบเทียบการทดสอบความดีพอดีสำหรับรูปแบบการถดถอยโลจิสติก", สถิติการแพทย์, ฉบับที่ 16, 965-980 (1997) หลังจากอ่านฉันสับสนเพราะคำถามที่ฉันอ้างถึงขอให้ชัดเจนสำหรับ "(ความน่าจะเป็น) ความสามารถในการทำนาย" ซึ่งในความคิดของฉันไม่เหมือนกับสิ่งที่ดี - ของ - พอดี - แบบทดสอบในกระดาษ supra มุ่ง: ดังที่พวกเราส่วนใหญ่ทราบกันว่าการถดถอยแบบลอจิสติกถือว่าการเชื่อมโยงรูปตัว S ระหว่างตัวแปรอธิบายและความน่าจะเป็นของความสำเร็จรูปแบบการทำงานของรูปตัว S คือ P(y=1|xi)=11+e−(β0+∑iβixi)P(y=1|xi)=11+e−(β0+∑iβixi)P(y=1|_{x_i})=\frac{1}{1+e^{-(\beta_0+\sum_i \beta_i x_i)}} โดยไม่ต้องแสร้งว่าไม่มีข้อบกพร่องในการทดสอบ …

3
วิธีต่างๆในการสร้างช่วงความมั่นใจสำหรับอัตราต่อรองจากการถดถอยโลจิสติก
ฉันกำลังศึกษาวิธีสร้างช่วงความมั่นใจ 95% สำหรับอัตราส่วนอัตราต่อรองจากค่าสัมประสิทธิ์ที่ได้จากการถดถอยโลจิสติก ดังนั้นเมื่อพิจารณาถึงรูปแบบการถดถอยโลจิสติก log(p1−p)=α+βxlog⁡(p1−p)=α+βx \log\left(\frac{p}{1 - p}\right) = \alpha + \beta x \newcommand{\var}{\rm Var} \newcommand{\se}{\rm SE} เช่นนั้นx=0x=0x = 0สำหรับกลุ่มควบคุมและx=1x=1x = 1สำหรับกลุ่มเคส ฉันได้อ่านแล้วว่าวิธีที่ง่ายที่สุดคือการสร้าง 95% CI สำหรับββ\betaจากนั้นเราก็ใช้ฟังก์ชั่นเลขชี้กำลังนั่นคือ β^±1.96×SE(β^)→exp{β^±1.96×SE(β^)}β^±1.96×SE(β^)→exp⁡{β^±1.96×SE(β^)} \hat{\beta} \pm 1.96\times \se(\hat{\beta}) \rightarrow \exp\{\hat{\beta} \pm 1.96\times \se(\hat{\beta})\} คำถามของฉันคือ: อะไรคือเหตุผลทางทฤษฎีที่แสดงให้เห็นถึงขั้นตอนนี้? ฉันรู้ว่าodds ratio=exp{β}odds ratio=exp⁡{β}\mbox{odds ratio} = \exp\{\beta\}และตัวประมาณความน่าจะเป็นสูงสุดไม่เปลี่ยนแปลง อย่างไรก็ตามฉันไม่รู้จักการเชื่อมต่อระหว่างองค์ประกอบเหล่านี้ วิธีการเดลต้าควรสร้างช่วงความมั่นใจ 95% เช่นเดียวกับขั้นตอนก่อนหน้านี้หรือไม่ ใช้วิธีการเดลต้า exp{β^}∼˙N(β, …

2
ริดจ์ลงโทษ GLM โดยใช้การเพิ่มแถว?
ฉันได้อ่านว่าการถดถอยของสันสามารถทำได้โดยการเพิ่มแถวของข้อมูลลงในเมทริกซ์ข้อมูลดั้งเดิมซึ่งแต่ละแถวถูกสร้างขึ้นโดยใช้ 0 สำหรับตัวแปรตามและรากที่สองของหรือศูนย์สำหรับตัวแปรอิสระ เพิ่มแถวพิเศษหนึ่งแถวสำหรับแต่ละตัวแปรอิสระkkk ฉันสงสัยว่ามันเป็นไปได้ที่จะได้รับการพิสูจน์ในทุกกรณีรวมถึงการถดถอยโลจิสติกหรือ GLM อื่น ๆ

1
ความแตกต่างระหว่างการถดถอยโลจิสติกแบบสุ่มและการถดถอยโลจิสติกธรรมดาวานิลลา
ฉันต้องการทราบความแตกต่างระหว่างRandomized Logistic Regression (RLR) และPlain Logistic Regression (LR) ดังนั้นฉันกำลังอ่านบทความ"Stability Selection"โดยMeinshausen, et al ; อย่างไรก็ตามฉันไม่เข้าใจว่า RLR คืออะไรและความแตกต่างระหว่าง RLR และ LR คืออะไร ใครช่วยชี้ให้เห็นสิ่งที่ฉันควรอ่านเพื่อทำความเข้าใจ RLR? หรือมีตัวอย่างง่ายๆในการเริ่มต้นด้วย?

1
การถดถอยแบบลอจิสติกพร้อมเส้นโค้งการถดถอยใน R
ฉันพัฒนารูปแบบการถดถอยโลจิสติกส์โดยใช้ข้อมูลย้อนหลังจากฐานข้อมูลการบาดเจ็บระดับชาติของการบาดเจ็บที่ศีรษะในสหราชอาณาจักร ผลลัพธ์ที่สำคัญคืออัตราการเสียชีวิต 30 วัน (แสดงเป็นมาตรการ "เอาตัวรอด") มาตรการอื่น ๆ ที่มีหลักฐานที่ตีพิมพ์ว่ามีผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์ในการศึกษาก่อนหน้า ได้แก่ Year - Year of procedure = 1994-2013 Age - Age of patient = 16.0-101.5 ISS - Injury Severity Score = 0-75 Sex - Gender of patient = Male or Female inctoCran - Time from head injury to craniotomy in minutes …

3
ทดสอบสัมประสิทธิ์การถดถอยโลจิสติกโดยใช้
เรื่องย่อ:มีทฤษฎีทางสถิติใดบ้างที่สนับสนุนการใช้การแจกแจงแบบ (มีองศาอิสระตามส่วนเบี่ยงเบนส่วนที่เหลือ) สำหรับการทดสอบสัมประสิทธิ์การถดถอยโลจิสติกมากกว่าการแจกแจงแบบปกติมาตรฐานหรือไม่?ttt บางเวลาที่ผ่านมาฉันค้นพบว่าเมื่อปรับโมเดลการถดถอยโลจิสติกใน SAS PROC GLIMMIX ภายใต้การตั้งค่าเริ่มต้นสัมประสิทธิ์การถดถอยโลจิสติกจะถูกทดสอบโดยใช้การแจกแจงแบบแทนการแจกแจงแบบปกติมาตรฐาน 1นั่นคือ GLIMMIX รายงานคอลัมน์ที่มีอัตราส่วนβ 1 / √ttt11^1 (ซึ่งผมจะเรียกZในส่วนที่เหลือของคำถามนี้) แต่ยังมีรายงานว่า "องศาความเป็นอิสระ" คอลัมน์เช่นเดียวกับP-value ขึ้นอยู่กับสมมติฐานทีจัดจำหน่ายสำหรับZกับองศาอิสระ ขึ้นอยู่กับการเบี่ยงเบนที่เหลือ - นั่นคือองศาอิสระ = จำนวนการสังเกตทั้งหมดลบด้วยจำนวนพารามิเตอร์ ที่ด้านล่างของคำถามนี้ฉันให้รหัสและผลลัพธ์ใน R และ SAS สำหรับการสาธิตและการเปรียบเทียบ 2β^1/var(β^1)−−−−−−√β^1/var(β^1)\hat{\beta}_1/\sqrt{\text{var}(\hat{\beta}_1)}zzzppptttzzz22^2 สิ่งนี้ทำให้ฉันสับสนเนื่องจากฉันคิดว่าสำหรับโมเดลเชิงเส้นแบบทั่วไปเช่นการถดถอยโลจิสติกไม่มีทฤษฎีทางสถิติที่จะสนับสนุนการใช้ -distribution ในกรณีนี้ แต่ฉันคิดว่าสิ่งที่เรารู้เกี่ยวกับกรณีนี้คือttt คือ "ปกติ" กระจายโดยปกติ;zzz การประมาณนี้อาจไม่ดีสำหรับตัวอย่างขนาดเล็ก อย่างไรก็ตามมันไม่สามารถสันนิษฐานได้ว่ามีการแจกแจงแบบtเราสามารถสมมติในกรณีของการถดถอยปกติzzzttt zzzttttttttt zzzttt ttt โดยทั่วไปมีการสนับสนุนจริง ๆ สำหรับสิ่งที่ GLIMMIX กำลังทำที่นี่นอกเหนือจากสัญชาตญาณที่อาจสมเหตุสมผลโดยทั่วไปหรือไม่ รหัส R: summary(glm(y …

1
เบอร์รี่ผกผัน
ฉันมีข้อมูลตลาดรวมขนาดใหญ่ที่กำหนดจากการขายไวน์ในสหรัฐอเมริกาและฉันต้องการประเมินความต้องการไวน์คุณภาพสูงบางตัว หุ้นในตลาดเหล่านี้ได้มาโดยทั่วไปจากแบบอรรถประโยชน์สุ่มของรูปแบบ ที่Xรวมถึงการตั้งข้อสังเกต ลักษณะของผลิตภัณฑ์, Pหมายถึงราคาสินค้าξUijt=X′jtβ−αpjt+ξjt+ϵijt≡δjt+ϵjtUijt=Xjt′β−αpjt+ξjt+ϵijt≡δjt+ϵjtU_{ijt} = X’_{jt}\beta - \alpha p_{jt} + \xi_{jt} + \epsilon_{ijt} \equiv \delta_{jt} + \epsilon_{jt}XXXpppξξ\xiเป็นลักษณะของผลิตภัณฑ์ที่ไม่มีการตรวจสอบซึ่งมีผลต่ออุปสงค์และที่มีความสัมพันธ์กับราคาและคือคำผิดพลาด, iดัชนีบุคคล, ดัชนีผลิตภัณฑ์jและดัชนีดัชนีตลาดt (เมืองในกรณีนี้)ϵϵ\epsiloniiijjjttt ฉันไม่สามารถใช้ปกติรุ่น logit เงื่อนไขเพราะระยะที่มีคุณภาพสังเกตและฉันไม่ได้มีเครื่องมือที่ดี อย่างไรก็ตาม Berry (1994) ได้พัฒนากลยุทธ์สำหรับการปรับระบบเชิงเส้นไม่เชิงเส้นของสมการตลาดในกรอบการทำงานแบบมัลติโนเมียลโลจิคัล แต่ฉันไม่สามารถหาวิธีที่เขาทำขั้นตอนการผกผันได้ξξ\xi ที่ค่าพารามิเตอร์ที่จริงเขาบอกว่าส่วนแบ่งการตลาดประมาณควรจะเท่ากับ“true” ซึ่งเขาก็แนะนำให้กลับหุ้นตลาด ทั้งจาก S J T = sเจที ( δ , α , β ) เพื่อ δ = s - 1 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.