สถิติและข้อมูลขนาดใหญ่

ถามตอบสำหรับผู้ที่สนใจในสถิติการเรียนรู้ของเครื่องจักรการวิเคราะห์ข้อมูลการขุดข้อมูล

7
เหตุใดเมทริกซ์เชิงบวกแน่นอนที่แน่นอน (SPD) จึงมีความสำคัญมาก
ฉันรู้ว่าคำจำกัดความของเมทริกซ์ definite positive (SPD) positive symmetric แต่ต้องการเข้าใจมากกว่านี้ ทำไมพวกเขาถึงมีความสำคัญอย่างสังหรณ์ใจ? นี่คือสิ่งที่ฉันรู้ มีอะไรอีกบ้าง? สำหรับข้อมูลที่กำหนดเมทริกซ์ความแปรปรวนร่วมคือ SPD เมทริกซ์ความแปรปรวนร่วมเป็นตัวชี้วัดที่สำคัญให้ดูโพสต์ที่ยอดเยี่ยมนี้สำหรับคำอธิบายที่เข้าใจง่าย รูปแบบสมการกำลังสองนูนออกหากคือ SPD Convexity เป็นคุณสมบัติที่ดีสำหรับฟังก์ชั่นที่สามารถตรวจสอบให้แน่ใจว่าโซลูชันในพื้นที่นั้นเป็นโซลูชันระดับโลก สำหรับปัญหานูนมีวิธีการแก้ปัญหาที่ดีมากมาย แต่ไม่ใช่สำหรับปัญหาที่ไม่ใช่ covex12x⊤Ax−b⊤x+c12x⊤Ax−b⊤x+c\frac 1 2 x^\top Ax-b^\top x +cAAA เมื่อคือ SPD โซลูชันเพิ่มประสิทธิภาพสำหรับรูปแบบสมการกำลังสองและโซลูชันสำหรับระบบเชิงเส้นเหมือนกัน ดังนั้นเราจึงสามารถทำการแปลงระหว่างสองปัญหาคลาสสิค สิ่งนี้มีความสำคัญเพราะช่วยให้เราสามารถใช้เทคนิคที่ค้นพบในโดเมนหนึ่งในอีกโดเมนหนึ่ง ตัวอย่างเช่นเราสามารถใช้วิธีการไล่ระดับสีแบบคอนจูเกตเพื่อแก้ปัญหาระบบเชิงเส้นAAAminimize 12x⊤Ax−b⊤x+cminimize 12x⊤Ax−b⊤x+c\text{minimize}~~~ \frac 1 2 x^\top Ax-b^\top x +cAx=bAx=bAx=b มีอัลกอริธึมที่ดีมากมาย (เร็วและเสถียรเป็นตัวเลข) ที่ทำงานได้ดีกว่าสำหรับเมทริกซ์ SPD เช่นการสลายตัวของ Cholesky แก้ไข: ฉันไม่ได้พยายามถามตัวตนของเมทริกซ์ SPD …

5
เหตุใดเราจึงใช้สูตรเบี่ยงเบนมาตรฐานแบบเอนเอียงและทำให้เข้าใจผิดสำหรับ
มันค่อนข้างน่าตกใจสำหรับฉันในครั้งแรกที่ฉันทำการจำลองแบบมอนติคาร์โลและพบว่าค่าเฉลี่ยของส่วนเบี่ยงเบนมาตรฐาน100100100ค่าจาก100100100ตัวอย่างทั้งหมดมีขนาดตัวอย่างเพียงn=2n=2n=2ซึ่งพิสูจน์ได้ว่าน้อยกว่ามาก กว่าคือค่าเฉลี่ย2π−−√2π \sqrt{\frac{2}{\pi }} ,σσ\sigmaใช้สำหรับสร้างประชากร อย่างไรก็ตามนี่เป็นที่รู้จักกันดีหากไม่ค่อยมีใครจำได้และฉันก็ไม่รู้เหมือนกันหรือฉันจะไม่ทำแบบจำลอง นี่คือการจำลอง นี่คือตัวอย่างสำหรับการทำนายช่วงความเชื่อมั่น 95% ของN(0,1)N(0,1)N(0,1)โดยใช้ 100, n=2n=2n=2 , ค่าประมาณของSDSD\text{SD} , และE(sn=2)=π2−−√SDE(sn=2)=π2SD\text{E}(s_{n=2})=\sqrt\frac{\pi}{2}\text{SD} SD RAND() RAND() Calc Calc N(0,1) N(0,1) SD E(s) -1.1171 -0.0627 0.7455 0.9344 1.7278 -0.8016 1.7886 2.2417 1.3705 -1.3710 1.9385 2.4295 1.5648 -0.7156 1.6125 2.0209 1.2379 0.4896 0.5291 0.6632 -1.8354 1.0531 2.0425 2.5599 1.0320 …

1
เส้นโค้งสามารถใช้ในการทำนายได้หรือไม่?
ฉันไม่สามารถระบุลักษณะของข้อมูลตามที่เป็นกรรมสิทธิ์ได้ แต่สมมติว่าเรามีข้อมูลเช่นนี้: ในแต่ละเดือนบางคนสมัครใช้บริการ จากนั้นในแต่ละเดือนถัดมาผู้คนเหล่านั้นอาจอัปเกรดบริการหยุดบริการหรือถูกปฏิเสธการบริการ (เช่นการไม่ชำระเงิน) สำหรับกลุ่มแรกสุดในข้อมูลของเราเรามีข้อมูลประมาณ 2 ปี (24 เดือน) จำนวนคนที่เข้าร่วมในแต่ละเดือนนั้นมีมาก (ในช่วง 100,000) และจำนวนที่ทำในสามสิ่งนั้นอยู่ในหลักพัน อย่างไรก็ตามเราไม่ได้ใช้ข้อมูลระดับบุคคล (ซึ่งจะเป็นล้านแถว) แต่ข้อมูลจะถูกรวบรวมตามเดือนและรุ่น (สัดส่วนของกลุ่มแต่ละรุ่นจะทำในแต่ละเดือน) เราได้รับการสร้างแบบจำลองข้อมูลที่มีอยู่โดยใช้เส้นโค้งการถดถอยแบบปรับตัวหลายตัวแปร (MARS) และค้นหาผลลัพธ์ที่น่าสนใจ อย่างไรก็ตามฉันกังวลเกี่ยวกับการใช้สิ่งเหล่านี้เพื่อคาดการณ์หรือทำนายอนาคต ความกังวลของฉันเป็นเพราะการคาดการณ์ในอนาคตจำเป็นต้องอยู่นอกพื้นที่ตัวอย่าง (ในแง่ของเวลา) และเส้นโค้งอาจไม่เสถียรสำหรับการคาดการณ์ นี่เป็นวิธีที่ถูกต้องหรือไม่? มีข้อกังวลอะไรบ้างและพวกเขาจะได้รับการจัดการอย่างไร

1
ถ้า LASSO เทียบเท่ากับการถดถอยเชิงเส้นแบบ Laplace ก่อนจะมีมวลในเซตที่มีส่วนประกอบเป็นศูนย์ได้อย่างไร?
เราทุกคนต่างคุ้นเคยกับความคิดเอกสารที่เขียนไว้ในเอกสารว่าการเพิ่มประสิทธิภาพ LASSO (เพื่อความเรียบง่าย จำกัด ความสนใจที่นี่ในกรณีของการถดถอยเชิงเส้น) เทียบเท่ากับโมเดลเชิงเส้นที่มีข้อผิดพลาดแบบเกาส์ซึ่งพารามิเตอร์จะได้รับ Laplace ก่อนหน้า เราทราบด้วยเช่นกันว่าค่าที่สูงกว่าจะตั้งค่าพารามิเตอร์การปรับ\ lambdaยิ่งพารามิเตอร์ส่วนใหญ่ถูกกำหนดเป็นศูนย์ สิ่งนี้ถูกกล่าวว่าฉันมีคำถามความคิดต่อไปนี้:loss=∥y−Xβ∥22+λ∥β∥1loss=‖y−Xβ‖22+λ‖β‖1 {\rm loss} = \| y - X \beta \|_2^2 + \lambda \| \beta \|_1 exp(−λ∥β∥1)exp⁡(−λ‖β‖1) \exp(-\lambda \| \beta \|_1 ) λλ\lambda พิจารณาจากมุมมองแบบเบส์เราสามารถคำนวณความน่าจะเป็นด้านหลังที่กล่าวว่าการประมาณค่าพารามิเตอร์ที่ไม่เป็นศูนย์อยู่ในการรวบรวมช่วงเวลาใด ๆและพารามิเตอร์ที่กำหนดเป็นศูนย์โดย LASSO เท่ากับศูนย์ สิ่งที่ฉันสับสนคือเมื่อ Laplace ก่อนหน้านี้ต่อเนื่อง (ในความเป็นจริงอย่างต่อเนื่อง) จากนั้นจะมีมวลในเซตใด ๆ ที่เป็นผลคูณของระยะและ singletons ที่อย่างไร?{0}{0}\{0\}

3
ในการเรียนรู้ของเครื่องทำไมตัวยกส่วนเกินจึงใช้แทนตัวห้อย?
ฉันสละแน่นอนแอนดรูอึ้งบนเครื่องการเรียนรู้ผ่าน Coursera สำหรับสมการตัวยกจะถูกใช้แทนตัวห้อย ตัวอย่างเช่นในสมการต่อไปนี้ใช้แทน : x ix( i )x(ผม)x^{(i)}xผมxผมx_i J( θ0, θ1) = 12 มΣi = 1ม.( ชมθ( x( i )) - y( i ))2J(θ0,θ1)=12ม.Σผม=1ม.(ชั่วโมงθ(x(ผม))-Y(ผม))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)})^2} เห็นได้ชัดว่านี่เป็นเรื่องธรรมดา คำถามของฉันคือเหตุใดจึงใช้ตัวยกแทนตัวห้อย? Superscripts ถูกใช้แล้วสำหรับการยกกำลัง จริงอยู่ที่ฉันดูเหมือนจะสามารถแยกแยะความแตกต่างระหว่างกรณียกและยกกำลังใช้กรณีโดยให้ความสนใจกับวงเล็บอยู่หรือไม่ แต่มันก็ดูเหมือนจะทำให้เกิดความสับสน


1
ไม่สไตน์ Paradox ยังคงถือเมื่อใช้
สไตน์ของ Paradoxแสดงให้เห็นว่าเมื่อมีการประมาณสามพารามิเตอร์หรือมากกว่าพร้อมกันมีตัวประมาณรวมที่แม่นยำกว่าโดยเฉลี่ย (นั่นคือการมีข้อผิดพลาดกำลังสองเฉลี่ยต่ำกว่าที่คาดไว้) กว่าวิธีการใด ๆ ที่จัดการพารามิเตอร์แยกกัน นี่เป็นผลลัพธ์ที่ขัดจังหวะอย่างมาก ผลลัพธ์เดียวกันนี้มีไว้หรือไม่หากแทนที่จะใช้บรรทัดฐาน (ข้อผิดพลาดกำลังสองเฉลี่ยที่คาดหวัง) เราจะใช้บรรทัดฐานl 1 (คาดว่าจะเป็นข้อผิดพลาดแบบสัมบูรณ์) หรือไม่l2l2l_2l1l1l_1

4
ตำราเกี่ยวกับเมทริกซ์แคลคูลัส?
ดูคำถามนี้ที่ Math SE เรื่องสั้น: ฉันอ่านองค์ประกอบของการเรียนรู้ทางสถิติและรู้สึกหงุดหงิดเมื่อฉันพยายามตรวจสอบผลลัพธ์บางอย่างเช่นกำหนด จากนั้น I กำลังมองหาหนังสือแคลคูลัสเมทริกซ์ซึ่งเขียนเหมือนหนังสือแคลคูลัสแบบดั้งเดิมของคุณ (เช่นหลักฐานของทฤษฎีบทตัวอย่างแบบฝึกหัดในการคำนวณ ฯลฯ ) ฉันได้เห็นคำถามนี้แล้วRSS ( β) = ( y - X β)T( y - X β) ,RSS(β)=(Y-Xβ)T(Y-Xβ),\text{RSS}(\beta) = \left(\mathbf{y}-\mathbf{X}\beta\right)^{T}\left(\mathbf{y}-\mathbf{X}\beta\right)\text{,}∂RSS∂β= - 2 XT( y - X β)∂2RSS∂β ∂βT= 2 XTX∂RSS∂β=-2XT(Y-Xβ)∂2RSS∂β ∂βT=2XTX.\begin{align}&\dfrac{\partial\text{RSS}}{\partial \beta} = -2\mathbf{X}^{T}\left(\mathbf{y}-\mathbf{X}\beta\right) \\ &\dfrac{\partial^2\text{RSS}}{\partial \beta\text{ }\partial \beta^{T}} = 2\mathbf{X}^{T}\mathbf{X}\text{.} \end{align}และรู้สึกว่าข้อความโดย Magnus …

1
ข้อผิดพลาดมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างคืออะไร
ผมอ่านจากที่นั่นว่าข้อผิดพลาดมาตรฐานความแปรปรวนของกลุ่มตัวอย่างคือ SEs2=2σ4N−1−−−−−−√SEs2=2σ4N−1SE_{s^2} = \sqrt{\frac{2 \sigma^4}{N-1}} ข้อผิดพลาดมาตรฐานของค่าเบี่ยงเบนมาตรฐานตัวอย่างคืออะไร ฉันจะถูกล่อลวงให้เดาและพูดว่าแต่ผมไม่แน่ใจว่าSEs=SEs2−−−−√SEs=SEs2SE_{s} = \sqrt{SE_{s^2}}

1
ตัวอย่างชีวิตจริงของกระบวนการตัดสินใจของมาร์คอฟ
ฉันได้ดูวิดีโอการสอนมากมายและพวกเขาดูเหมือนกัน ตัวอย่างนี้สำหรับ: https://www.youtube.com/watch?v=ip4iSMRW5X4 พวกเขาอธิบายถึงรัฐการกระทำและความน่าจะเป็นที่ดี บุคคลนั้นอธิบายว่าใช้ได้ แต่ฉันก็ดูเหมือนจะไม่เข้าใจว่ามันจะใช้อะไรในชีวิตจริง ฉันยังไม่พบรายการใด ๆ ในตอนนี้ สิ่งที่ฉันเห็นบ่อยที่สุดคือหมากรุก สามารถใช้ทำนายสิ่งต่างๆได้หรือไม่? ถ้าเป็นประเภทอะไร มันสามารถหารูปแบบในจำนวนข้อมูลที่ไม่ จำกัด ได้หรือไม่? อัลกอริทึมนี้สามารถทำอะไรให้ฉันได้บ้าง โบนัส: มันรู้สึกเหมือนว่า MDP เกี่ยวข้องกับการได้รับจากรัฐหนึ่งไปอีกรัฐหนึ่งจริงหรือไม่?

1
วิธีการตั้งค่าเครือข่ายประสาทเพื่อส่งออกข้อมูลลำดับ
ฉันมีโครงข่ายใยประสาทเทียมที่ตั้งค่าเพื่อคาดเดาบางสิ่งที่ตัวแปรเอาต์พุตเป็นลำดับ ฉันจะอธิบายด้านล่างโดยใช้สามเอาต์พุตที่เป็นไปได้ A <B <C มันค่อนข้างชัดเจนว่าจะใช้โครงข่ายประสาทเทียมเพื่อส่งออกข้อมูลที่เป็นหมวดหมู่ได้อย่างไร: เอาต์พุตเป็นเลเยอร์ softmax ของเลเยอร์สุดท้าย (โดยปกติจะเชื่อมต่อเต็มที่) หนึ่งต่อหมวดหมู่และหมวดที่คาดการณ์ไว้คือหนึ่งที่มีค่าเอาต์พุตที่ใหญ่ที่สุด ค่าเริ่มต้นในรุ่นยอดนิยมจำนวนมาก) ฉันใช้การตั้งค่าเดียวกันสำหรับค่าลำดับ อย่างไรก็ตามในกรณีนี้ผลลัพธ์มักจะไม่สมเหตุสมผลตัวอย่างเช่นเอาท์พุทเครือข่ายสำหรับ A และ C สูง แต่ B ต่ำ: นี่ไม่น่าเชื่อถือสำหรับค่าลำดับ ฉันมีความคิดหนึ่งสำหรับสิ่งนี้ซึ่งเป็นการคำนวณการสูญเสียจากการเปรียบเทียบผลลัพธ์กับ 1 0 0 สำหรับ A, 1 1 0 สำหรับ B และ 1 1 1 สำหรับ C เกณฑ์ที่แน่นอนสามารถปรับได้ภายหลังโดยใช้ตัวแยกประเภทอื่น (Bayesian Bayesian) ) แต่นี่ดูเหมือนจะจับความคิดที่สำคัญของการสั่งซื้ออินพุตโดยไม่ต้องกำหนดช่วงเวลาเฉพาะใด ๆ วิธีมาตรฐานในการแก้ไขปัญหานี้คืออะไร มีการวิจัยหรือการอ้างอิงใด ๆ ที่อธิบายข้อดีข้อเสียของวิธีการต่าง ๆ …

1
“ เอฟเฟ็กต์เกือกม้า” และ / หรือ“ เอฟเฟ็กต์โค้ง” ในการวิเคราะห์ PCA / การโต้ตอบคืออะไร
มีเทคนิคมากมายในสถิติทางนิเวศวิทยาสำหรับการวิเคราะห์ข้อมูลเชิงสำรวจของข้อมูลหลายมิติ สิ่งเหล่านี้เรียกว่าเทคนิค 'การบวช' หลายคนเหมือนหรือใกล้เคียงกับเทคนิคทั่วไปในที่อื่น ๆ ในสถิติ บางทีตัวอย่างต้นแบบอาจเป็นการวิเคราะห์ส่วนประกอบหลัก (PCA) นักนิเวศวิทยาอาจใช้ PCA และเทคนิคที่เกี่ยวข้องเพื่อสำรวจ 'การไล่ระดับสี' (ฉันไม่ชัดเจนเลยว่าการไล่ระดับสีคืออะไร แต่ฉันอ่านเรื่องนี้มาเล็กน้อย) ในหน้านี้รายการสุดท้ายภายใต้การวิเคราะห์ส่วนประกอบหลัก (PCA)อ่าน: PCA มีปัญหาร้ายแรงสำหรับข้อมูลพืช: ผลของเกือกม้า เรื่องนี้เกิดจากความโค้งของการกระจายพันธุ์ตามการไล่สี เนื่องจากสปีชีส์การตอบสนองของสปีชีส์นั้นโดยทั่วไปจะมีรูปแบบเดียว เพิ่มเติมหน้าลงไปภายใต้การวิเคราะห์สารบรรณหรือค่าเฉลี่ยซึ่งกันและกัน (RA)มันหมายถึง "ผลกระทบอาร์ค": RA มีปัญหา: เอฟเฟกต์ส่วนโค้ง มันเกิดจากความไม่เชิงเส้นของการแจกแจงตามการไล่ระดับสี ส่วนโค้งนั้นไม่รุนแรงเท่าผลเกือกม้าของ PCA เนื่องจากปลายของการไล่ระดับสีไม่ได้ซับซ้อน มีคนอธิบายเรื่องนี้ได้ไหม ฉันเพิ่งเห็นปรากฏการณ์นี้ในแปลงที่เป็นตัวแทนของข้อมูลในพื้นที่มิติที่ต่ำกว่า (ได้แก่ การวิเคราะห์การติดต่อและการวิเคราะห์ปัจจัย) "การไล่ระดับสี" จะตรงกับอะไรมากกว่าปกติ (เช่นในบริบทที่ไม่ใช่เชิงนิเวศน์)? หากสิ่งนี้เกิดขึ้นกับข้อมูลของคุณมันเป็น "ปัญหา" ("ปัญหาร้ายแรง") หรือไม่ เพื่ออะไร? เราควรตีความเอาต์พุตที่เกือกม้า / โค้งแสดงขึ้นได้อย่างไร? ต้องใช้วิธีการรักษาหรือไม่? อะไร? การแปลงข้อมูลดั้งเดิมจะช่วยได้หรือไม่? จะเป็นอย่างไรถ้าข้อมูลนั้นเป็นอันดับเรตติ้ง …

5
เรายังต้องเลือกคุณสมบัติในขณะใช้อัลกอริทึม
ฉันมีคำถามหนึ่งข้อที่ต้องใช้วิธีการเลือกคุณลักษณะ (สุ่มป่าคุณลักษณะค่าความสำคัญหรือวิธีการเลือกคุณสมบัติแบบไม่รวมตัวแปร) ก่อนใช้อัลกอริทึมการเรียนรู้เชิงสถิติ เรารู้ว่าเพื่อหลีกเลี่ยงการ overfitting เราสามารถแนะนำการปรับความสม่ำเสมอในเวกเตอร์น้ำหนัก ดังนั้นถ้าฉันต้องการทำการถดถอยเชิงเส้นจากนั้นฉันสามารถแนะนำ L2 หรือ L1 หรือแม้แต่พารามิเตอร์การทำให้เป็นมาตรฐานสุทธิยืดหยุ่น ในการรับโซลูชันที่กระจัดกระจายการลงโทษ L1 จะช่วยในการเลือกคุณลักษณะ ถ้าอย่างนั้นก็ยังต้องเลือกคุณสมบัติก่อนใช้การถดถอยปกติของ L1 เช่น Lasso? ในทางเทคนิค Lasso ช่วยฉันลดฟีเจอร์ด้วยการลงโทษ L1 แล้วทำไมต้องเลือกฟีเจอร์ก่อนใช้งาน algo? ฉันอ่านบทความวิจัยที่บอกว่าการทำ Anova จากนั้น SVM ให้ประสิทธิภาพที่ดีกว่าการใช้ SVM เพียงอย่างเดียว ตอนนี้คำถามคือ: SVM ทำการทำให้เป็นมาตรฐานโดยใช้ L2 เป็นประจำ เพื่อให้ได้มาร์จิ้นที่มากที่สุดก็คือการลดขนาดของเวกเตอร์น้ำหนัก ดังนั้นมันจึงทำให้เป็นมาตรฐานในฟังก์ชันวัตถุประสงค์ ถ้าเช่นนั้นอัลกอริทึมทางเทคนิคเช่น SVM ไม่ควรกังวลเกี่ยวกับวิธีการเลือกคุณสมบัติหรือไม่ แต่รายงานยังคงกล่าวว่าการเลือกคุณลักษณะ Univariate ก่อน SVM ปกติจะมีประสิทธิภาพมากกว่า ใครที่มีความคิด

1
รายงานประสิทธิภาพการทำงานที่ทันสมัยของการใช้เวกเตอร์ย่อหน้าสำหรับการวิเคราะห์ความเชื่อมั่นได้รับการทำซ้ำหรือไม่?
ฉันประทับใจกับผลลัพธ์ใน ICML 2014 กระดาษ "การแจกจ่ายการเป็นตัวแทนของประโยคและเอกสาร " โดย Le และ Mikolov เทคนิคที่พวกเขาอธิบายเรียกว่า "พาหะของย่อหน้า" เรียนรู้การแสดงที่ไม่มีผู้ดูแลของย่อหน้า / เอกสารที่ไม่มีกฎเกณฑ์โดยมีพื้นฐานอยู่บนส่วนขยายของรุ่น word2vec บทความนี้รายงานถึงประสิทธิภาพการวิเคราะห์ความเชื่อมั่นโดยใช้เทคนิคนี้ ฉันหวังว่าจะประเมินเทคนิคนี้กับปัญหาการจำแนกข้อความอื่น ๆ ซึ่งเป็นทางเลือกแทนการแสดงคำแบบถุง อย่างไรก็ตามฉันวิ่งข้ามโพสต์โดยผู้เขียนที่สองในหัวข้อในกลุ่ม word2vec Google ที่ให้ฉันหยุดชั่วคราว: ฉันพยายามทำซ้ำผลลัพธ์ของ Quoc ในช่วงฤดูร้อน ฉันสามารถได้รับอัตราความผิดพลาดในชุดข้อมูล IMDB ประมาณ 9.4% - 10% (ขึ้นอยู่กับว่าการจัดรูปแบบข้อความปกติดีแค่ไหน) อย่างไรก็ตามฉันไม่สามารถเข้าใกล้ทุกสิ่งที่ Quoc รายงานไว้ในกระดาษ (ข้อผิดพลาด 7.4% นั่นเป็นความแตกต่างใหญ่หลวง) ... แน่นอนเรายังถาม Quoc เกี่ยวกับรหัสด้วย เขาสัญญาว่าจะเผยแพร่ แต่ก็ยังไม่มีอะไรเกิดขึ้น ... ฉันเริ่มคิดว่าผลลัพธ์ของ Quoc นั้นไม่สามารถทำซ้ำได้จริง …

2
วิธีตีความแปลง acf และ pacf เหล่านี้
ต่อไปนี้เป็นพล็อต acf และ pacf ของชุดข้อมูลรายเดือน เนื้อเรื่องที่สองคือ acf with ci.type = 'ma': การคงอยู่ของค่าสูงในพล็อต acf อาจแสดงแนวโน้มเชิงบวกระยะยาว คำถามคือถ้าสิ่งนี้แสดงถึงความผันแปรตามฤดูกาลหรือไม่ ฉันพยายามดูไซต์ต่าง ๆ ในหัวข้อนี้ แต่ฉันไม่แน่ใจว่าแผนการเหล่านี้แสดงฤดูกาลหรือไม่ การวิเคราะห์พล็อต ACF และ PACF ช่วยตีความ ACF- และ PACF-plots ช่วยทำความเข้าใจภาพต่อไปนี้ของ ACF Autocorrelation และการตีความ autocorrelation บางส่วน แก้ไข: ต่อไปนี้เป็นกราฟสำหรับความล่าช้าสูงสุด 60: ต่อไปนี้เป็นแผนของ diff (my_series): และไม่เกิน 60: แก้ไข: ข้อมูลนี้มาจาก: นี่เป็นวิธีที่เหมาะสมในการทดสอบผลกระทบตามฤดูกาลในข้อมูลการนับการฆ่าตัวตายหรือไม่ ที่นี่ผู้ให้ข้อมูลไม่ได้พิจารณาพล็อต acf และ pacf ของซีรีย์ดั้งเดิมหรือต่างกันที่ควรค่าแก่การกล่าวถึง (ดังนั้นจะต้องไม่สำคัญ) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.