คำถามติดแท็ก references

คำถามที่ค้นหาแหล่งอ้างอิงภายนอก (หนังสือเอกสาร ฯลฯ ) เกี่ยวกับเรื่องเฉพาะ ใช้แท็กเฉพาะเจาะจงเพิ่มเติมทุกครั้ง

3
หนังสือที่ดีครอบคลุมกระบวนการเตรียมข้อมูลและเทคนิคการตรวจหาค่าผิดปกติ
ใคร ๆ ก็รู้ว่าหนังสือทันสมัยที่ครอบคลุมข้อมูลก่อนการประมวลผลโดยทั่วไปและโดยเฉพาะอย่างยิ่งเทคนิคการตรวจหาค่าผิดปกติหรือไม่ หนังสือเล่มนี้ไม่จำเป็นต้องให้ความสำคัญกับเรื่องนั้นเป็นพิเศษ แต่ควรจัดการกับหัวข้อดังกล่าวอย่างละเอียดถี่ถ้วน - ฉันจะไม่พอใจกับสิ่งที่เป็นจุดเริ่มต้นและเสนอราคารายการเอกสารคำอธิบายเกี่ยวกับเทคนิคต่าง ๆ จะต้องปรากฏใน หนังสือตัวเอง เทคนิคในการจัดการกับข้อมูลที่หายไปที่ต้องการ แต่ไม่จำเป็น ...

4
แหล่งข้อมูลที่ดีที่ให้ประวัติของสถิติคืออะไร
อะไรคือแหล่งข้อมูลออนไลน์หรือออฟไลน์ที่ดีที่ให้ภาพรวมของประวัติของสถิติและการพัฒนาที่สำคัญในสถิติจนถึงปัจจุบัน ฉันได้อ่านหน้าประวัติความเป็นมาของสถิติใน Wikipediaแล้ว

4
แหล่งข้อมูลออนไลน์สำหรับปรัชญาของสาเหตุเพื่อการอนุมานสาเหตุ
คุณสามารถแนะนำหนังสือบทความเรียงความบทเรียน / หลักสูตรออนไลน์และอื่น ๆ ที่น่าสนใจและมีประโยชน์สำหรับนักระบาดวิทยา / นักชีวสถิติเพื่อเรียนรู้เกี่ยวกับปรัชญาของการอนุมานสาเหตุ / สาเหตุ ฉันรู้ค่อนข้างน้อยเกี่ยวกับการใช้การอนุมานเชิงสาเหตุจากกรอบ epi และ biostats แต่ฉันต้องการเรียนรู้บางอย่างเกี่ยวกับปรัชญาที่สนับสนุนและกระตุ้นงานนี้ ตัวอย่างเช่นมันเป็นความเข้าใจของฉันที่ฮูมพูดถึงความคิดแรกที่สามารถตีความได้ว่าเป็นของต่อต้าน โดยทั่วไปฉันไม่มีการฝึกอบรมหรือมีประสบการณ์เกี่ยวกับปรัชญาดังนั้นฉันต้องการสิ่งที่ค่อนข้างเกริ่นนำเพื่อเริ่มต้นด้วย แต่ฉันจะสนใจคำแนะนำสำหรับข้อความ / ผู้เขียนที่ซับซ้อน แต่สำคัญ / พื้นฐาน / ผู้เขียน (แต่โปรดระบุว่าพวกเขาไม่ได้เกริ่นนำ) ฉันหวังว่านี่จะไม่ใช่หัวข้อที่เกินไปสำหรับการตรวจสอบข้าม แต่ฉันหวังว่าคุณบางคนจะอยู่ในเรือลำเดียวกันกับฉันก่อนหน้านี้และสามารถแบ่งปันทรัพยากรที่คุณโปรดปราน

2
เหตุผลสำหรับรูปแบบผลกระทบคงที่และแบบสุ่มผลกระทบในการวิเคราะห์เมตา
ฉันได้อ่านสิ่งพิมพ์หลายฉบับที่พยายามแสดงให้เห็นถึงการใช้โมเดลเอฟเฟกต์คงที่พร้อมกับข้อความตามบรรทัดของ อย่างไรก็ตามฉันกังวลว่ามันอาจเป็นวิธีการวิเคราะห์ข้อมูลที่ไม่เหมาะสม มีเหตุผลหรือสิ่งตีพิมพ์ที่จะพูดถึงว่าเหตุใดจึงเป็นความผิดพลาดหรือไม่?

1
การพิสูจน์ระดับปริญญาตรีของทฤษฎีบท Pitman – Koopman – Darmois
ทฤษฎีบทพิตแมน –Koopman – Darmois กล่าวว่าหากตัวอย่าง iid จากตระกูลการแจกแจงความน่าจะเป็นที่ยอมรับยอมรับสถิติที่เพียงพอซึ่งจำนวนองค์ประกอบสเกลาร์ไม่เติบโตขึ้นกับขนาดของตัวอย่างมันก็เป็นตระกูลเลขชี้กำลัง ตำราหรือเอกสารอธิบายเบื้องต้นให้การพิสูจน์ไหม? ทำไมถึงตั้งชื่อตามคนสามคนนี้?

2
อะไรคือ“ เอกสารเร็ว” ที่สำคัญที่สุดเกี่ยวกับวิธีการทำให้เป็นมาตรฐาน
ในหลายคำตอบที่ฉันได้เห็นผู้ใช้ CrossValidated แนะนำ OP ค้นหาเอกสารต้นใน Lasso, Ridge และ Elastic Net สำหรับลูกหลานแล้วน้ำเชื้อทำงานอย่างไรกับ Lasso, Ridge และ Elastic Net

2
คำขออ้างอิง: สถิติคลาสสิคสำหรับนักวิทยาศาสตร์ด้านข้อมูลการทำงาน
ฉันเป็นนักวิทยาศาสตร์ข้อมูลที่ทำงานด้วยประสบการณ์ที่แข็งแกร่งในการถดถอยอัลกอริธึมชนิดการเรียนรู้ของเครื่องอื่น ๆ และการเขียนโปรแกรม (ทั้งสำหรับการวิเคราะห์ข้อมูลและการพัฒนาซอฟต์แวร์ทั่วไป) ชีวิตการทำงานส่วนใหญ่ของฉันมุ่งเน้นไปที่การสร้างแบบจำลองเพื่อความแม่นยำในการคาดการณ์ (ทำงานภายใต้ข้อ จำกัด ทางธุรกิจต่าง ๆ ) และการสร้างท่อส่งข้อมูลเพื่อสนับสนุนงานของฉันเอง ฉันไม่มีสถิติการฝึกอบรมอย่างเป็นทางการการศึกษาในมหาวิทยาลัยของฉันเน้นที่คณิตศาสตร์บริสุทธิ์ เช่นนี้ทำให้พลาดการเรียนรู้หัวข้อคลาสสิกจำนวนมากโดยเฉพาะการทดสอบสมมติฐานยอดนิยมต่างๆและเทคนิคการอนุมาน มีการอ้างอิงใด ๆ สำหรับหัวข้อเหล่านี้ที่เหมาะสำหรับใครบางคนที่มีพื้นฐานและระดับประสบการณ์หรือไม่? ฉันสามารถจัดการ (และชื่นชม) ความแม่นยำทางคณิตศาสตร์และเพลิดเพลินไปกับมุมมองอัลกอริทึม ฉันมักจะชอบอ้างอิงที่เสนอแบบฝึกหัดที่มีผู้อ่านซึ่งมีทั้งแบบ (หรืออย่างใดอย่างหนึ่ง) โฟกัสการเขียนโปรแกรมทางคณิตศาสตร์และ (หรือ)

2
การวิเคราะห์องค์ประกอบหลักสามารถนำมาใช้กับราคาหุ้น / ข้อมูลที่ไม่คงที่ได้หรือไม่?
ฉันอ่านตัวอย่างที่กำหนดในหนังสือเครื่องเรียนรู้สำหรับแฮกเกอร์ ฉันจะทำอย่างละเอียดในตัวอย่างก่อนแล้วพูดคุยเกี่ยวกับคำถามของฉัน ตัวอย่าง : ใช้ชุดข้อมูลเป็นเวลา 10 ปีของราคาหุ้น 25 ใช้ PCA ในราคาหุ้น 25 เปรียบเทียบองค์ประกอบหลักกับดัชนี Dow Jones สังเกตความคล้ายคลึงกันที่แข็งแกร่งระหว่าง PC และ DJI! จากสิ่งที่ฉันเข้าใจตัวอย่างเป็นเหมือนของเล่นที่ช่วยให้มือใหม่อย่างฉันเข้าใจว่าเครื่องมือ PCA นั้นมีประสิทธิภาพเพียงใด! อย่างไรก็ตามการอ่านจากแหล่งข้อมูลอื่นฉันเห็นว่าราคาหุ้นไม่คงที่และใช้ PCA ในราคาหุ้นนั้นเป็นเรื่องไร้สาระ แหล่งที่มาจากที่ฉันอ่านเยาะเย้ยความคิดทั้งหมดของการคำนวณความแปรปรวนร่วมและ PCA สำหรับราคาหุ้น คำถาม : ตัวอย่างทำงานได้ดีอย่างไร PCA ของราคาหุ้นและ DJI นั้นใกล้กันมาก และข้อมูลนั้นเป็นข้อมูลจริงจากราคาหุ้น 2545-2554 ใครบางคนสามารถบอกให้ฉันทราบถึงแหล่งข้อมูลที่ดีสำหรับการอ่านข้อมูลที่อยู่กับที่ / ไม่อยู่นิ่ง ฉันเป็นโปรแกรมเมอร์ ฉันมีพื้นฐานคณิตศาสตร์ที่ดี แต่ฉันไม่ได้ทำคณิตศาสตร์อย่างจริงจังเป็นเวลา 3 ปี ฉันเริ่มอ่านอีกครั้งเกี่ยวกับสิ่งต่าง ๆ เช่นการเดินแบบสุ่ม ฯลฯ

2
เราจะพูดอะไรเกี่ยวกับแบบจำลองของข้อมูลเชิงสังเกตในกรณีที่ไม่มีเครื่องมือ?
ฉันเคยถามคำถามเกี่ยวกับเอกสารที่ตีพิมพ์มาแล้วในหลายพื้นที่ที่ใช้การถดถอย (และแบบจำลองที่เกี่ยวข้องเช่นแบบจำลองแบบพาเนลหรือ GLMs) ในข้อมูลเชิงสังเกต (เช่นข้อมูลที่ไม่ได้ผลิตโดยการทดลองที่ควบคุม ในหลายกรณี - แต่ไม่เสมอไป - ข้อมูลถูกตรวจพบตลอดเวลา) แต่เมื่อไม่มีความพยายามในการแนะนำตัวแปรเครื่องมือ ฉันได้ทำการวิพากษ์วิจารณ์จำนวนมากในการตอบสนอง (เช่นการอธิบายปัญหาเกี่ยวกับอคติเมื่อตัวแปรสำคัญอาจหายไป) แต่เนื่องจากคนอื่น ๆ ที่นี่จะไม่สงสัยเลยว่ามีความรู้มากกว่าฉันในหัวข้อนี้ฉันคิดว่าฉันถาม: อะไรคือประเด็นสำคัญ / ผลที่ตามมาของการพยายามหาข้อสรุปเกี่ยวกับความสัมพันธ์ (โดยเฉพาะ แต่ไม่ จำกัด เฉพาะการสรุปเชิงสาเหตุ) ในสถานการณ์เช่นนี้? มีประโยชน์อะไรกับการศึกษาที่เหมาะกับแบบจำลองดังกล่าวในกรณีที่ไม่มีเครื่องมือหรือไม่? มีการอ้างอิงที่ดีอะไรบ้าง (หนังสือหรือเอกสาร) เกี่ยวกับปัญหาของการสร้างแบบจำลอง (โดยเฉพาะอย่างยิ่งที่มีแรงจูงใจทางด้านเทคนิคที่ไม่ชัดเจนของผลที่ตามมาเนื่องจากโดยทั่วไปแล้วคนที่ถามมีภูมิหลังที่หลากหลาย กระดาษ? การอภิปรายเกี่ยวกับข้อควรระวัง / ปัญหาเกี่ยวกับเครื่องมือจะเป็นประโยชน์เช่นกัน (การอ้างอิงพื้นฐานเกี่ยวกับตัวแปรเครื่องมืออยู่ที่นี่แม้ว่าคุณจะต้องเพิ่มสิ่งใดสิ่งหนึ่งก็จะเป็นประโยชน์เช่นกัน) ตัวชี้ไปยังตัวอย่างที่ใช้งานได้ดีของการค้นหาและการใช้เครื่องมือจะเป็นโบนัส แต่ไม่ใช่ประเด็นสำคัญสำหรับคำถามนี้ [ฉันจะชี้คนอื่นให้คำตอบที่ดีที่นี่เช่นคำถามมาหาฉัน ฉันอาจเพิ่มตัวอย่างหนึ่งหรือสองตัวอย่างเมื่อได้รับ]

1
การอ้างอิง: ส่วนท้ายของ c ผกผัน
ฉันเกือบจะแน่ใจว่าฉันได้เห็นผลลัพธ์ต่อไปนี้ในสถิติ แต่ฉันจำไม่ได้ว่าอยู่ที่ไหน ถ้าเป็นตัวแปรสุ่มแบบบวกและดังนั้นเมื่อโดยที่คือ CDF ของXE ( X ) &lt; ∞ ε F - 1 ( 1 - ε ) → 0 ε → 0 + F XXXXE(X)&lt;∞E(X)&lt;∞\mathbb{E}(X)<\inftyεF−1(1−ε)→0εF−1(1−ε)→0\varepsilon F^{-1}(1-\varepsilon) \to 0ε→0+ε→0+\varepsilon\to 0^+FFFXXX นี้เป็นเรื่องง่ายที่จะเห็นทางเรขาคณิตโดยใช้ความเสมอภาคและโดยพิจารณาตัดแนวนอนที่ของพื้นที่ใต้เส้นโค้งของ integrand 1-Fε 1 - FE(X)=∫1−FE(X)=∫1−F\mathbb{E}(X)=\int 1-Fεε\varepsilon1−F1−F1-F คุณรู้จักการอ้างอิงสำหรับผลลัพธ์นี้และมีชื่อหรือไม่

1
มี "มาตรฐาน" สำหรับสัญลักษณ์แบบจำลองทางสถิติหรือไม่
ตัวอย่างเช่นในคู่มือ BUGSหรือหนังสือที่กำลังจะมาถึงโดย Lee และ Wagenmakers ( pdf ) และในสถานที่อื่น ๆ มีการใช้สัญกรณ์ประเภทหนึ่งซึ่งดูเหมือนว่าฉันจะมีความยืดหยุ่นมากในการอธิบายรูปแบบทางสถิติส่วนใหญ่ ตัวอย่างของสัญกรณ์นี้มีดังต่อไปนี้: yi∼Binomial(pi,ni)log(pi1−pi)=bibi∼Normal(μp,σp)yi∼Binomial(pi,ni)log⁡(pi1−pi)=bibi∼Normal(μp,σp) y_i \sim \text{Binomial}(p_i,n_i) \\ \log(\frac{p_i}{1 - p_i}) = b_i \\ b_i \sim \text{Normal}(\mu_p,\sigma_p) ซึ่งจะอธิบายถึงรูปแบบการโลจิสติกลำดับชั้นโดยไม่มีการพยากรณ์ แต่ด้วยกลุ่ม วิธีการอธิบายแบบจำลองนี้ดูเหมือนจะทำงานอย่างเท่าเทียมกันทั้งสำหรับการอธิบายและรูปแบบ frequentist คชกรรมตัวอย่างเช่นการให้คำอธิบายรูปแบบนี้อย่างเต็มที่คชกรรมคุณก็จะต้องเพิ่มไพรเออร์ในและ\i=1…ni=1…ni = 1\dots n μpμp\mu_pσpσp\sigma_p รูปแบบของสัญกรณ์รุ่นนี้มีการอธิบายไว้โดยละเอียดในบทความหรือหนังสือบางเล่มหรือไม่? หากคุณต้องการใช้สัญกรณ์นี้เพื่อเขียนแบบจำลองมีหลายวิธีในการทำสิ่งต่าง ๆ และมันจะมีประโยชน์มากกับคู่มือที่ครอบคลุมทั้งในการติดตามและอ้างอิงผู้อื่น ความแตกต่างบางประการที่ฉันพบในวิธีที่คนใช้สัญกรณ์ประเภทนี้: สิ่งใดที่คุณเรียกการแจกแจง เช่นฉันเคยเห็นฯลฯN,N,Norm,NormalN,N,Norm,Normal\mathcal{N},\text{N},\text{Norm},\text{Normal} คุณจัดการกับดัชนีอย่างไร เช่นฉันเห็น , ,ฯลฯyijyijy_{ij}yi[j]yi[j]y_{i[j]}yj|iyj|iy_{j|i} สัญลักษณ์พารามิเตอร์ใดที่มักใช้สำหรับพารามิเตอร์ ตัวอย่างเช่นเป็นเรื่องปกติที่จะใช้เป็นค่าเฉลี่ยสำหรับการแจกแจงแบบปกติ แต่จะมีการแจกแจงแบบอื่นอย่างไร (สำหรับเรื่องนี้ฉันมักจะตรวจสอบการกระจายของ …

1
ทฤษฎีทั่วไปเกี่ยวกับความมั่นคงและความเป็นไปได้เชิงเส้นกำกับของความเป็นไปได้สูงสุด
ฉันสนใจในการอ้างอิงที่ดีสำหรับผลลัพธ์ที่เกี่ยวข้องกับคุณสมบัติเชิงเส้นกำกับของตัวประมาณความน่าจะเป็นสูงสุด พิจารณารูปแบบที่ฉn ( x | θ )เป็นnหนาแน่นมิติและθ nเป็น MLE ตามกลุ่มตัวอย่างX 1 , ... , X nจากf n ( ⋅ ∣ θ{fn(⋅∣θ):θ∈Θ,n∈N}{fn(⋅∣θ):θ∈Θ,n∈N}\{f_n(\cdot \mid \theta): \theta \in \Theta, n \in \mathbb N\}fn(x∣θ)fn(x∣θ)f_n(\mathbf x \mid \theta)nnnθ^nθ^n\hat \theta_nX1,…,XnX1,…,XnX_1, \ldots, X_nfn(⋅∣θ0)fn(⋅∣θ0)f_n(\cdot \mid \theta_0) where θ0θ0\theta_0 is the "true" value of θθ\theta. There are two irregularities …

1
การตรวจสอบความทนทานของการถดถอยโลจิสติกกับการละเมิดความเป็นเชิงเส้นของ logit
ฉันกำลังทำการถดถอยโลจิสติกด้วยผลลัพธ์ไบนารี (เริ่มต้นและไม่เริ่ม) การผสมผสานของผู้ทำนายของฉันนั้นล้วน แต่เป็นตัวแปรแบบต่อเนื่องหรือแบบแบ่งขั้ว การใช้วิธี Box-Tidwell หนึ่งในเครื่องมือทำนายอย่างต่อเนื่องของฉันอาจละเมิดสมมติฐานของความเป็นเชิงเส้นของ logit ไม่มีข้อบ่งชี้จากสถิติความดีพอดีว่าเป็นปัญหา ฉันได้เรียกใช้โมเดลการถดถอยอีกครั้งโดยแทนที่ตัวแปรต่อเนื่องดั้งเดิมด้วย: ประการแรกการแปลงรากที่สองและที่สองคือตัวแปรที่มีการแบ่งขั้ว ในการตรวจสอบผลลัพธ์ดูเหมือนว่าความดีของพอดีช่วยปรับปรุงเล็กน้อย แต่เศษเหลือเป็นปัญหา การประมาณพารามิเตอร์, ข้อผิดพลาดมาตรฐานและยังคงคล้ายกัน การตีความข้อมูลไม่เปลี่ยนแปลงตามสมมติฐานของฉันทั้ง 3 แบบประสบการณ์( β)ประสบการณ์⁡(β)\exp(\beta) ดังนั้นในแง่ของประโยชน์ของผลลัพธ์และความหมายในการตีความข้อมูลของฉันมันดูเหมือนว่าจะเหมาะสมที่จะรายงานตัวแบบการถดถอยโดยใช้ตัวแปรต่อเนื่องดั้งเดิม ฉันสงสัยว่านี้: การถดถอยโลจิสติกส์แข็งแกร่งเมื่อใดเมื่อเปรียบเทียบกับการละเมิดความเป็นเส้นตรงของข้อสมมติฐาน logit จากตัวอย่างข้างต้นของฉันดูเหมือนจะยอมรับได้หรือไม่ที่จะรวมตัวแปรต่อเนื่องดั้งเดิมไว้ในโมเดล มีการอ้างอิงหรือคำแนะนำสำหรับการแนะนำเมื่อเป็นที่พอใจหรือไม่ที่จะยอมรับว่าแบบจำลองนั้นมีความทนทานต่อการละเมิดความเป็นเส้นตรงของ logit หรือไม่?

3
วิธีรับช่วงความมั่นใจในการเปลี่ยนแปลงประชากร r-square
ตัวอย่างง่ายๆสมมติว่ามีตัวแบบถดถอยเชิงเส้นสองแบบ รุ่นที่ 1 มีสามทำนาย, x1a, x2bและx2c แบบจำลอง 2 มีตัวทำนายสามตัวจากแบบจำลอง 1 และสองตัวทำนายเพิ่มเติมx2aและx2b มีสมการถดถอยที่ประชากรประชากรแปรปรวนอธิบายคือเป็น สำหรับรุ่นที่ 1 และρ 2 ( 2 )สำหรับรุ่น 2. แปรปรวนเพิ่มขึ้นอธิบายโดยรุ่น 2 ในประชากรที่อยู่Δ ρ 2 = ρ 2 ( 2 ) - ρ 2 ( 1 )ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δρ2=ρ2(2)−ρ2(1)Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} ฉันสนใจในการได้รับข้อผิดพลาดมาตรฐานและช่วงความเชื่อมั่นสำหรับประมาณการของ 2 ในขณะที่ตัวอย่างเกี่ยวข้องกับตัวทำนาย 3 และ 2 ตามลำดับความสนใจงานวิจัยของฉันเกี่ยวข้องกับตัวทำนายจำนวนต่าง ๆ (เช่น …

4
บทแนะนำที่ดีสำหรับเครื่อง Boltzmann ที่ จำกัด (RBM)
ฉันกำลังศึกษาเครื่อง Boltzmann ที่ จำกัด (RBM) และกำลังมีปัญหาบางอย่างในการทำความเข้าใจการคำนวณความน่าจะเป็นของบันทึกเกี่ยวกับพารามิเตอร์ของ RBM แม้ว่าจะมีการตีพิมพ์รายงานวิจัยจำนวนมากเกี่ยวกับ RBM แต่ก็ไม่มีขั้นตอนโดยละเอียดของตราสารอนุพันธ์ หลังจากค้นหาออนไลน์ฉันสามารถค้นหาพวกเขาในเอกสารนี้: Fischer, A. , &amp; Igel, C. (2012) บทนำของเครื่องจักร Boltzmann ที่ถูก จำกัด ใน L. Alvarez et al. (บรรณาธิการ): CIARP, LNCS 7441, pp. 14–36, Springer-Verlag: Berlin-Heidelberg ( pdf ) อย่างไรก็ตามรายละเอียดของเอกสารนี้ก้าวหน้าเกินไปสำหรับฉัน ใครช่วยชี้ให้ฉันดูบทสอน / ชุดการบรรยายที่ดีเกี่ยวกับ RBM ได้หรือไม่? แก้ไข: @David ส่วนที่สับสนแสดงอยู่ด้านล่าง (สมการที่ 29 ในหน้า …
10 references  rbm 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.