สถิติและข้อมูลขนาดใหญ่

2

ในบทความสองฉบับในปี 1986และ1988คอนเนอร์และ Korajczyk เสนอวิธีการสร้างแบบจำลองผลตอบแทนของสินทรัพย์ เนื่องจากอนุกรมเวลาเหล่านี้มักจะมีสินทรัพย์มากกว่าการสังเกตระยะเวลาพวกเขาเสนอให้ดำเนินการ PCA เกี่ยวกับความแปรปรวนร่วมแบบตัดขวางของผลตอบแทนสินทรัพย์ พวกเขาเรียกวิธีนี้ว่า Asymptotic Principal Component Analysis (APCA ซึ่งค่อนข้างสับสนเนื่องจากผู้ชมคิดทันทีถึงคุณสมบัติของ asymptotic ของ PCA) ฉันได้ผลสมการมาแล้วและวิธีการทั้งสองนั้นดูเหมือนจะเป็นตัวเลข asymptotics ของหลักสูตรที่แตกต่างกันตั้งแต่บรรจบพิสูจน์สำหรับมากกว่าT →การ ∞ คำถามของฉันคือ: มีใครใช้ APCA และเปรียบเทียบกับ PCA หรือไม่ มีความแตกต่างที่เป็นรูปธรรมหรือไม่ ถ้าเป็นเช่นนั้นN→∞N→∞N \rightarrow \inftyT→∞T→∞T \rightarrow \infty

23 pca econometrics

2

สถิติทางนิติเวช: Benford และอื่น ๆ

มีวิธีการอะไรในการตรวจจับการฉ้อโกงความผิดปกติความผิดพลาด ฯลฯ ในงานทางวิทยาศาสตร์ที่ผลิตโดยบุคคลที่สาม (ฉันถูกกระตุ้นให้ถามเรื่องนี้จากเรื่องMarc Hauserเมื่อเร็วๆนี้) โดยปกติแล้วสำหรับการเลือกตั้งและการฉ้อโกงทางบัญชีกฎหมายของ Benford ได้ถูกอ้างถึง ผมไม่แน่ใจว่าวิธีการนี้สามารถนำไปใช้เช่นกรณีมาร์คฮาวเซอร์เพราะกฎหมายของ Benford ต้องใช้หมายเลขที่จะเข้าสู่ระบบประมาณเครื่องแบบ ตัวอย่างที่เป็นรูปธรรมสมมุติว่ากระดาษอ้างถึงค่า p สำหรับการทดสอบทางสถิติจำนวนมาก ใครคนหนึ่งสามารถเปลี่ยนสิ่งเหล่านี้ให้มีความสม่ำเสมอจากนั้นจึงใช้กฎของ Benford? ดูเหมือนว่าจะมีปัญหาทุกอย่างเกี่ยวกับวิธีการนี้ ( เช่นสมมติฐานว่างบางอย่างอาจผิดกฎหมายรหัสสถิติอาจให้ค่า p ซึ่งมีค่าประมาณที่ถูกต้องเท่านั้นการทดสอบอาจให้ค่า p-uniform ภายใต้ null asymptotically, ฯลฯ )

23 meta-analysis fraud

2

การจัดกลุ่มตัวแปรตามความสัมพันธ์ระหว่างกัน

คำถาม: ฉันมีเมทริกซ์สหสัมพันธ์ขนาดใหญ่ แทนที่จะจัดกลุ่มความสัมพันธ์แต่ละตัวฉันต้องการจัดกลุ่มตัวแปรตามความสัมพันธ์ซึ่งกันและกันเช่นถ้าตัวแปร A และตัวแปร B มีความสัมพันธ์แบบเดียวกันกับตัวแปร C ถึง Z ดังนั้น A และ B ควรเป็นส่วนหนึ่งของคลัสเตอร์เดียวกัน ตัวอย่างชีวิตจริงที่ดีของเรื่องนี้คือประเภทสินทรัพย์ที่แตกต่างกัน - ความสัมพันธ์ภายในระดับสินทรัพย์จะสูงกว่าความสัมพันธ์ระหว่างระดับสินทรัพย์ ฉันยังพิจารณาถึงการจัดกลุ่มตัวแปรในแง่ความสัมพันธ์ระหว่างพวกเขาเช่นเมื่อความสัมพันธ์ระหว่างตัวแปร A และ B ใกล้เคียงกับ 0 พวกเขาทำหน้าที่อิสระมากหรือน้อย หากจู่ๆมีการเปลี่ยนแปลงเงื่อนไขพื้นฐานและความสัมพันธ์ที่แข็งแกร่งเกิดขึ้น (บวกหรือลบ) เราสามารถคิดว่าตัวแปรทั้งสองนี้เป็นของคลัสเตอร์เดียวกัน ดังนั้นแทนที่จะมองหาความสัมพันธ์เชิงบวกเราจะมองหาความสัมพันธ์กับความสัมพันธ์ ฉันเดาว่าการเปรียบเทียบอาจเป็นกลุ่มของอนุภาคที่มีประจุบวกและลบ หากประจุลดลงเหลือ 0 อนุภาคจะลอยออกจากกระจุก อย่างไรก็ตามประจุทั้งบวกและลบดึงดูดอนุภาคให้อยู่ในกระจุกดาว ฉันขอโทษถ้าบางอย่างไม่ชัดเจน กรุณาแจ้งให้เราทราบฉันจะชี้แจงรายละเอียดเฉพาะ

23 correlation clustering correlation-matrix

5

เกิดอะไรขึ้นกับอัลกอริธึมการสลับ "ไร้เดียงสา"

นี่คือการติดตามผลไปยัง Stackoverflow คำถามเกี่ยวกับการสับอาร์เรย์แบบสุ่ม มีอัลกอริธึมที่กำหนดไว้แล้ว (เช่นKnuth-Fisher-Yates Shuffle ) ที่เราควรใช้เพื่อสับเปลี่ยนอาเรย์แทนที่จะใช้การปรับใช้ Ad-hoc แบบ "ไร้เดียงสา" ตอนนี้ฉันสนใจที่จะพิสูจน์ (หรือหักล้าง) ว่าอัลกอริทึมไร้เดียงสาของฉันเสีย (เหมือนใน: ไม่ได้สร้างการเรียงสับเปลี่ยนที่เป็นไปได้ทั้งหมดด้วยความน่าจะเป็นที่เท่ากัน) นี่คืออัลกอริทึม: วนรอบสองสามครั้ง (ควรทำความยาวของอาเรย์) และในการวนซ้ำทุกครั้งรับดัชนีอาเรย์แบบสุ่มสองอันและสลับองค์ประกอบทั้งสองที่นั่น เห็นได้ชัดว่าสิ่งนี้ต้องการตัวเลขสุ่มมากกว่า KFY (มากเป็นสองเท่า) แต่นอกเหนือจากนั้นมันทำงานได้อย่างถูกต้องหรือไม่ และจำนวนการวนซ้ำที่เหมาะสม (คือ "ความยาวของอาเรย์" เพียงพอ)?

23 combinatorics randomness

9

อนุกรมเวลาสำหรับข้อมูลการนับด้วยการนับ <20

ฉันเพิ่งเริ่มทำงานกับคลินิกวัณโรค เราพบกันเป็นระยะเพื่อพูดคุยเกี่ยวกับจำนวนของผู้ป่วยวัณโรคที่เรากำลังรักษาจำนวนการทดสอบที่ดำเนินการ ฯลฯ ฉันต้องการเริ่มการสร้างแบบจำลองการนับเหล่านี้เพื่อที่เราจะไม่เพียงแค่เดาว่ามีบางอย่างผิดปกติหรือไม่ น่าเสียดายที่ฉันมีการฝึกอบรมน้อยมากในอนุกรมเวลาและการเปิดเผยส่วนใหญ่ของฉันคือการสร้างแบบจำลองสำหรับข้อมูลที่ต่อเนื่องมาก (ราคาหุ้น) หรือการนับจำนวนมาก (ไข้หวัดใหญ่) แต่เราจัดการกับ 0-18 กรณีต่อเดือน (เฉลี่ย 6.68, ค่ามัธยฐาน 7, ค่า 12.3) ซึ่งกระจายอยู่เช่นนี้: [ภาพหายไปจากหมอกแห่งกาลเวลา] [ภาพที่กินโดย Grue] ฉันได้พบบทความเล็ก ๆ น้อย ๆ ที่กล่าวถึงแบบจำลองนี้ แต่ฉันก็ยินดีอย่างยิ่งที่จะได้ยินคำแนะนำจากคุณ - ทั้งแนวทางและแพคเกจ R ที่ฉันสามารถใช้เพื่อใช้แนวทางเหล่านั้น แก้ไข: คำตอบของ mbq ทำให้ฉันต้องคิดอย่างรอบคอบมากขึ้นเกี่ยวกับสิ่งที่ฉันถามที่นี่ ฉันแขวนสายเกินไปเมื่อนับรายเดือนและไม่ได้โฟกัสที่แท้จริงของคำถาม สิ่งที่ฉันอยากรู้คือ: ลดลง (มองเห็นได้ค่อนข้าง) จาก, 2008 เป็นต้นไปสะท้อนให้เห็นถึงแนวโน้มลดลงในจำนวนรวมของคดี? ฉันดูเหมือนว่าจำนวนผู้ป่วยรายเดือนระหว่างปี 2544-2550 สะท้อนให้เห็นถึงกระบวนการที่มีเสถียรภาพ อาจมีบางฤดูกาล แต่โดยรวมมีเสถียรภาพ จากปี 2008 จนถึงปัจจุบันดูเหมือนว่ากระบวนการนั้นกำลังเปลี่ยนแปลงไป: …

23 r time-series poisson-distribution count-data epidemiology

4

ปัญหา Monty Hall กับ Monty ที่ตกลงมาได้

มอนตี้มีความรู้ที่สมบูรณ์แบบว่าประตูมีแพะอยู่ข้างหลัง (หรือว่างเปล่า) ข้อเท็จจริงนี้ช่วยให้ผู้เล่นเพิ่มอัตราความสำเร็จเป็นสองเท่าเมื่อเวลาผ่านไปโดยสลับ“ เดา” ไปที่ประตูอื่น จะเป็นอย่างไรถ้าความรู้ของมอนตี้น้อยกว่าสมบูรณ์ เกิดอะไรขึ้นถ้าบางครั้งรางวัลอย่างแท้จริงอยู่ในประตูเดียวกับแพะ? แต่คุณไม่สามารถมองเห็นมันจนกว่าคุณจะเลือกและเปิดประตูของคุณ? คุณช่วยฉันในการทำความเข้าใจวิธีคำนวณ IF และเพิ่มขึ้นได้อย่างไร - ผู้เล่นสามารถปรับปรุงความสำเร็จของเขาได้เมื่ออัตราความแม่นยำของ Monty น้อยกว่า 100%? ตัวอย่างเช่น: เกิดอะไรขึ้นถ้า Monty ผิด - โดยเฉลี่ย 50% ของเวลา? ผู้เล่นยังคงได้ประโยชน์จากการเปลี่ยน Guess / Door ของเขาหรือไม่? ฉันคิดว่าถ้ามอนตี้มีโอกาสน้อยกว่า 33.3% ที่จะแก้ไขว่ารางวัลไม่ได้อยู่หลังประตูตัวเลือกที่ดีที่สุดของผู้เล่นคือการไม่เปลี่ยนทางเลือกของเขา คุณช่วยบอกวิธีคำนวณผลประโยชน์ที่อาจเกิดขึ้นจากการสลับโดยการแทรกความน่าจะเป็นต่าง ๆ ของ Monty ที่ถูกต้องเกี่ยวกับรางวัลที่ไม่ได้อยู่หลังประตูหรือไม่? ฉันไม่มีอะไรนอกเหนือจากคณิตศาสตร์ของโรงเรียนมัธยมและอายุ 69 ปีดังนั้นโปรดอ่อนโยน ขอบคุณสำหรับข้อมูลเชิงลึกและสูตรที่มีให้ ดูเหมือนว่าหาก "Fallible Monty" มีความถูกต้อง 66% เท่านั้นในการทำนายการไม่มีรางวัล / รถยนต์ว่ามีประโยชน์เป็นศูนย์ที่จะเปลี่ยนจากทางเลือกเดิมของประตู .... …

23 conditional-probability

1

คำอธิบายของ min_child_weight ในอัลกอริทึม xgboost

นิยามของพารามิเตอร์ใน min_child_weight xgboost จะได้รับเป็น: ผลรวมขั้นต่ำของน้ำหนักอินสแตนซ์ (รัฐ) ที่จำเป็นในเด็ก หากขั้นตอนการแบ่งพาร์ติชันเป็นผลให้โหนดใบมีผลรวมของน้ำหนักอินสแตนซ์น้อยกว่า min_child_weight กระบวนการสร้างจะทำให้การแบ่งพาร์ติชันเพิ่มเติม ในโหมดการถดถอยเชิงเส้นสิ่งนี้จะสอดคล้องกับจำนวนอินสแตนซ์ขั้นต่ำที่จำเป็นในแต่ละโหนด ยิ่งอัลกอริธึมมีขนาดใหญ่ขึ้นเท่าใด ฉันได้อ่านสิ่งเล็ก ๆ น้อย ๆ บน xgboost รวมถึงกระดาษต้นฉบับ (ดูสูตร 8 และหนึ่งหลังจากสมการที่ 9) คำถามนี้และสิ่งต่าง ๆ ที่เกี่ยวข้องกับ xgboost ที่ปรากฏในหน้าแรก ๆ ของการค้นหา google ;) โดยพื้นฐานแล้วฉันยังไม่มีความสุขว่าทำไมเราถึงกำหนดข้อ จำกัด เกี่ยวกับผลรวมของรัฐ? ผมไม่คิดว่าเพียงนาทีจากกระดาษเดิมก็คือว่ามันเกี่ยวข้องกับการถ่วงน้ำหนัก quantile ส่วนร่าง (และ reformulation เป็นของสมการการสูญเสีย 3 Squared ถ่วงน้ำหนัก) ซึ่งมีชั่วโมงผมชั่วโมงผมh_iเป็นน้ำหนัก 'ของแต่ละกรณี คำถามเพิ่มเติมเกี่ยวข้องกับสาเหตุที่มันเป็นเพียงจำนวนอินสแตนซ์ในโหมดการถดถอยเชิงเส้น? ฉันเดาว่านี่เกี่ยวข้องกับอนุพันธ์อันดับสองของผลรวมของสมการกำลังสองหรือไม่?

23 machine-learning xgboost hessian

1

กลไกความสนใจคืออะไรกันแน่?

มีการใช้กลไกการเรียนรู้ในเอกสารการเรียนรู้ลึกต่างๆในช่วงไม่กี่ปีที่ผ่านมา Ilya Sutskever หัวหน้าฝ่ายวิจัยของ Open AI ได้ชื่นชมพวกเขาอย่างกระตือรือร้น: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Eugenio Culurciello ที่ Purdue University ได้อ้างว่า RNNs และ LSTMs ควรถูกทอดทิ้งเนื่องจากเป็นเครือข่ายประสาทที่เน้นความสนใจอย่างหมดจด: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 ดูเหมือนว่าจะเป็นการพูดเกินจริง แต่ก็ปฏิเสธไม่ได้ว่าแบบจำลองความสนใจล้วนๆทำหน้าที่ในการสร้างแบบจำลองได้ค่อนข้างดี: เราทุกคนรู้เกี่ยวกับกระดาษที่มีชื่อเหมาะสมจาก Google ความสนใจคือสิ่งที่คุณต้องการ แต่สิ่งที่ว่ามีรูปแบบความสนใจตาม? ฉันยังไม่พบคำอธิบายที่ชัดเจนของโมเดลดังกล่าว สมมติว่าฉันต้องการคาดการณ์ค่าใหม่ของอนุกรมเวลาหลายตัวแปรตามค่าที่ผ่านมา มันค่อนข้างชัดเจนว่าจะทำอย่างไรกับ RNN ที่มีเซลล์ LSTM ฉันจะทำเช่นเดียวกันกับแบบจำลองตามความสนใจได้อย่างไร

23 time-series deep-learning lstm rnn attention

1

Hamiltonian Monte Carlo กับ Sequential Monte Carlo

ฉันพยายามเข้าใจถึงข้อดีและข้อเสียรวมถึงโดเมนแอปพลิเคชันที่แตกต่างกันของโครงร่าง MCMC ทั้งสองนี้ คุณจะใช้อันไหนและทำไม? เมื่อใดที่หนึ่งอาจล้มเหลว แต่อีกอันไม่ใช่ (เช่น HMC บังคับใช้ได้ แต่ SMC ไม่และในทางกลับกัน) วิธีการหนึ่งที่ได้รับอย่างไร้เดียงสาสามารถวัดยูทิลิตี้ในวิธีหนึ่งเมื่อเทียบกับวิธีอื่น (เช่นคือโดยทั่วไปดีกว่า ) ฉันกำลังอ่านหนังสือพิมพ์ที่ยอดเยี่ยม Betancourt ใน HMC

23 mcmc random-walk particle-filter probabilistic-programming hmc

2

เหตุใดจึงมีการกำหนด / การสูญเสียข้อมูลสองรายการที่แตกต่างกันในโลจิสติกส์

ฉันได้เห็นสูตรการสูญเสียโลจิสติกสองประเภท เราสามารถแสดงให้พวกเขามีความเหมือนที่แตกต่างเพียงอย่างเดียวคือความหมายของฉลากYyyy สูตร / สัญกรณ์ 1, :y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) โดยที่โดยที่ฟังก์ชันโลจิสติกแมปจำนวนจริงเป็น 0,1 ช่วงเวลาp=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x สูตร / สัญกรณ์ 2, :y∈{−1,+1}y∈{−1,+1}y \in \{-1, +1\} L(y,βTx)=log(1+exp(−y⋅βTx))L(y,βTx)=log⁡(1+exp⁡(−y⋅βTx)) L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) การเลือกสัญกรณ์ก็เหมือนกับการเลือกภาษามีข้อดีข้อเสียที่จะใช้อย่างใดอย่างหนึ่ง ข้อดีและข้อเสียของเครื่องหมายทั้งสองนี้คืออะไร ความพยายามของฉันที่จะตอบคำถามนี้คือดูเหมือนว่าชุมชนสถิติชอบสัญกรณ์แรกและชุมชนวิทยาศาสตร์คอมพิวเตอร์ชอบสัญกรณ์ที่สอง สัญกรณ์แรกสามารถอธิบายได้ด้วยคำว่า "ความน่าจะเป็น" เนื่องจากฟังก์ชันโลจิสติกจะแปลงจำนวนจริงเป็นช่วงเวลา 0,1βTxβTx\beta^Tx และสัญกรณ์ที่สองนั้นรัดกุมกว่าและง่ายกว่าที่จะเปรียบเทียบกับการสูญเสียบานพับหรือการสูญเสีย 0-1 ฉันถูกไหม? ข้อมูลเชิงลึกอื่น ๆ

23 logistic generalized-linear-model notation loss-functions

3

ค่าสูงหรือเปล่าประโยชน์?

คำถามนี้ถูกโยกย้ายจาก Stack Overflow เพราะสามารถตอบได้ในการตรวจสอบข้าม อพยพ 3 ปีที่แล้ว ในสถิติเราทำการถดถอยเชิงเส้นซึ่งเป็นจุดเริ่มต้นของมัน โดยทั่วไปแล้วเรารู้ว่ายิ่งยิ่งสูง แต่ยิ่งมีสถานการณ์ที่สูงจะเป็นตัวอย่างที่ไร้ประโยชน์หรือไม่?R 2R2R2R^2R2R2R^2

23 regression r-squared

2

พื้นที่ความหนาแน่นสูงสุด (HDR) คืออะไร

ในการอนุมานเชิงสถิติปัญหา 9.6b กล่าวถึง "ภูมิภาคที่มีความหนาแน่นสูงสุด (HDR)" อย่างไรก็ตามฉันไม่พบคำจำกัดความของคำนี้ในหนังสือ หนึ่งคำที่คล้ายกันคือความหนาแน่นหลังสูงสุด (HPD) แต่มันไม่เหมาะสมในบริบทนี้เนื่องจาก 9.6b ไม่ได้พูดถึงเรื่องก่อนหน้า และในการแก้ปัญหาที่แนะนำมันบอกว่า "เห็นได้ชัดว่าc(y)c(y)c(y)คือ HDR" หรือ HDR เป็นภูมิภาคที่มีโหมดไฟล์ PDF อยู่หรือไม่? พื้นที่ความหนาแน่นสูงสุด (HDR) คืออะไร

23 confidence-interval estimation definition credible-interval highest-density-region

3

พิกัดเทียบกับการไล่ระดับสี

ฉันถูกสงสัยว่ากรณีการใช้งานที่แตกต่างกันสำหรับสองขั้นตอนวิธีการประสานงานโคตรและการไล่โทนสีโคตร ฉันรู้ว่าโคตรพิกัดมีปัญหากับฟังก์ชั่นที่ไม่ราบรื่น แต่ใช้ในอัลกอริทึมยอดนิยมเช่น SVM และ LASSO อย่างไรก็ตามฉันคิดว่าใช้การไล่ระดับสีอย่างแพร่หลายมากขึ้นโดยเฉพาะกับการฟื้นตัวของ ANNs และสำหรับงานการเรียนรู้ของเครื่องอื่น ๆ อีกมากมาย คำถามของฉันคือ: ปัญหาประเภทใดที่เหมาะกับปัญหาหนึ่ง แต่ไม่ใช่ปัญหาอื่นและในแง่นั้นอะไรที่ทำให้โคตรประสานงานที่เหมาะสมสำหรับ SVM และ LASSO แต่การสืบเชื้อสายที่เหมาะสมสำหรับ ANNs หนึ่งควรเลือกระหว่างทั้งสองเมื่อเลือกอัลกอริทึมการเพิ่มประสิทธิภาพได้อย่างไร

23 optimization gradient-descent

3

AIC กับการตรวจสอบความถูกต้องข้ามในอนุกรมเวลา: กรณีตัวอย่างขนาดเล็ก

ฉันสนใจในการเลือกรูปแบบในการตั้งค่าอนุกรมเวลา เพื่อความเป็นรูปธรรมสมมติว่าฉันต้องการเลือกรุ่น ARMA จากกลุ่มของรุ่น ARMA ที่มีคำสั่งซื้อล่าช้าต่างกัน สุดยอดความตั้งใจคือการคาดการณ์ การเลือกรุ่นสามารถทำได้โดย การตรวจสอบข้าม การใช้เกณฑ์ข้อมูล (AIC, BIC) ท่ามกลางวิธีอื่น ๆ ร็อบเจ Hyndman มีวิธีการทำการตรวจสอบข้ามอนุกรมเวลา สำหรับตัวอย่างที่มีขนาดค่อนข้างเล็กขนาดของตัวอย่างที่ใช้ในการตรวจสอบความถูกต้องไขว้อาจมีคุณภาพแตกต่างจากขนาดตัวอย่างดั้งเดิม ตัวอย่างเช่นหากขนาดตัวอย่างดั้งเดิมคือ 200 การสังเกตดังนั้นใครจะคิดว่าจะเริ่มการตรวจสอบข้ามโดยการสังเกต 101 ครั้งแรกและขยายหน้าต่างเป็น 102, 103, ... , 200 การสังเกตเพื่อให้ได้ 100 ผลการตรวจสอบข้าม เห็นได้ชัดว่าแบบจำลองที่มีเหตุผลพอสมควรสำหรับการสังเกต 200 ครั้งอาจใหญ่เกินไปสำหรับการสังเกต 100 ครั้งดังนั้นข้อผิดพลาดในการตรวจสอบจะมีขนาดใหญ่ ดังนั้นการตรวจสอบข้ามจึงมีแนวโน้มที่จะสนับสนุนรูปแบบที่ไม่สุภาพ นี่คือผลกระทบที่ไม่พึงประสงค์เกิดจากการไม่ตรงกันในขนาดตัวอย่าง ทางเลือกอื่นในการตรวจสอบข้ามคือการใช้เกณฑ์ข้อมูลสำหรับการเลือกแบบจำลอง เนื่องจากฉันสนใจเกี่ยวกับการคาดการณ์ฉันจะใช้ AIC ถึงแม้ว่า AIC นั้นจะเทียบเท่ากับ asymptotically ในการลดการคาดการณ์ MSE แบบขั้นตอนเดียวให้น้อยที่สุดสำหรับแบบจำลองอนุกรมเวลา (อ้างอิงจาก Rob …

23 time-series forecasting cross-validation model-selection aic

4

จะทราบได้อย่างไรว่าการกระจายข้อมูลของฉันสมมาตร

ฉันรู้ว่าถ้าค่ามัธยฐานและค่าเฉลี่ยเท่ากันโดยประมาณนี่หมายความว่ามีการกระจายแบบสมมาตร แต่ในกรณีนี้ฉันไม่แน่ใจ ค่าเฉลี่ยและค่ามัธยฐานค่อนข้างใกล้เคียง (เพียง 0.487m / ความแตกต่างของถุงน้ำดี) ซึ่งจะทำให้ฉันบอกว่ามีการกระจายแบบสมมาตร แต่เมื่อมองที่กล่องสี่เหลี่ยมดูเหมือนว่ามันจะเป็นเชิงบวกเล็กน้อย (ค่ามัธยฐานนั้นใกล้เคียงกับไตรมาสที่ 1 โดยค่า) (ฉันใช้ Minitab หากคุณมีคำแนะนำเฉพาะสำหรับซอฟต์แวร์ชิ้นนี้)

23 distributions mean skewness median qq-plot