สถิติและข้อมูลขนาดใหญ่

ถามตอบสำหรับผู้ที่สนใจในสถิติการเรียนรู้ของเครื่องจักรการวิเคราะห์ข้อมูลการขุดข้อมูล

1
ป่าสุ่มของ Breiman ใช้ข้อมูลที่ได้รับหรือดัชนี Gini หรือไม่
ฉันต้องการทราบว่าป่าสุ่มของ Breiman (ป่าสุ่มในแพคเกจ R สุ่มป่า) ใช้เป็นเกณฑ์แยก (เกณฑ์สำหรับการเลือกคุณลักษณะ) ได้รับข้อมูลหรือดัชนี Gini หรือไม่ ฉันพยายามค้นหามันในhttp://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htmและในเอกสารสำหรับแพ็คเกจ randomForest ใน R แต่สิ่งเดียวที่ฉันพบคือดัชนี Gini สามารถใช้สำหรับ การคำนวณความสำคัญของตัวแปร

2
ทฤษฎีการเรียนรู้ PAC หมายถึงอะไร?
ฉันใหม่ในการเรียนรู้ของเครื่อง ฉันกำลังเรียนหลักสูตรการเรียนรู้ของเครื่องจักร (มหาวิทยาลัยสแตนฟอร์ด) และฉันไม่เข้าใจความหมายของทฤษฎีนี้และประโยชน์ของมัน ฉันสงสัยว่าถ้าใครสามารถอธิบายทฤษฎีนี้ให้ฉันได้ ทฤษฎีนี้มีพื้นฐานอยู่บนสมการนี้

1
ชี้แจงเกี่ยวกับกฎ Perceptron เทียบกับการไล่สีไล่ระดับและการไล่สีแบบไล่ระดับ Stochastic
ฉันทดลองใช้งาน Perceptron ต่างกันเล็กน้อยและต้องการตรวจสอบให้แน่ใจว่าฉันเข้าใจ "การทำซ้ำ" อย่างถูกต้องหรือไม่ กฎ perceptron ดั้งเดิมของ Rosenblatt เท่าที่ฉันเข้าใจในอัลกอริทึม Perceptron แบบคลาสสิกของ Rosenblatt น้ำหนักถูกปรับปรุงพร้อมกันหลังจากทุกตัวอย่างการฝึกอบรมผ่าน Δw(t+1)=Δw(t)+η(target−actual)xiΔw(t+1)=Δw(t)+η(target−actual)xi\Delta{w}^{(t+1)} = \Delta{w}^{(t)} + \eta(target - actual)x_i ที่etaetaetaคือกฎการเรียนรู้ที่นี่ และเป้าหมายและที่เกิดขึ้นจริงมีทั้งเกณฑ์ (-1 หรือ 1) ฉันใช้มันเป็น 1 ซ้ำ = 1 ผ่านตัวอย่างการฝึกอบรม แต่เวกเตอร์น้ำหนักถูกปรับปรุงหลังจากแต่ละตัวอย่างการฝึกอบรม และฉันคำนวณค่า "จริง" เป็น sign(wwTxx)=sign(w0+w1x1+...+wdxd)sign(wwTxx)=sign(w0+w1x1+...+wdxd) sign ({\pmb{w}^T\pmb{x}}) = sign( w_0 + w_1 x_1 + ... + w_d x_d) …

2
ผู้ที่ใช้บ่อยในเรื่องโวลต์มิเตอร์คืออะไร?
ผู้ที่ใช้บ่อยในเรื่องราวของโวลต์มิเตอร์คืออะไร แนวคิดที่อยู่เบื้องหลังคือการวิเคราะห์ทางสถิติที่ดึงดูดความสนใจไปสู่เหตุการณ์สมมุติจะต้องได้รับการแก้ไขหากมีการเรียนรู้ในภายหลังว่าเหตุการณ์สมมุติเหล่านั้นไม่สามารถเกิดขึ้นได้ตามที่คาดการณ์ไว้ รุ่นของเรื่องราวเกี่ยวกับวิกิพีเดียได้ที่ด้านล่าง วิศวกรทำการสุ่มตัวอย่างหลอดอิเล็กตรอนและวัดแรงดันไฟฟ้า ช่วงการวัดจาก 75 ถึง 99 โวลต์ นักสถิติคำนวณค่าเฉลี่ยตัวอย่างและช่วงความมั่นใจสำหรับค่าเฉลี่ยที่แท้จริง ต่อมานักสถิติค้นพบว่าโวลต์มิเตอร์อ่านได้ไกลถึง 100 เท่านั้นดังนั้นประชากรดูเหมือนจะถูกเซ็นเซอร์ สิ่งนี้จำเป็นต้องมีการวิเคราะห์ใหม่หากนักสถิติเป็นออร์โธดอกซ์ อย่างไรก็ตามวิศวกรบอกว่าเขาอ่านมิเตอร์อีก 1,000 โวลต์ซึ่งเขาจะใช้ถ้าแรงดันไฟฟ้าใด ๆ มีมากกว่า 100 นี่เป็นความโล่งใจต่อนักสถิติเพราะมันหมายความว่าประชากรไม่ถูกตรวจสอบอย่างมีประสิทธิภาพ แต่ในวันถัดไปวิศวกรแจ้งนักสถิติว่าเครื่องวัดที่สองนี้ไม่ทำงานในเวลาที่ทำการวัด นักสถิติยืนยันว่าวิศวกรจะไม่ได้ทำการตรวจวัดจนกระทั่งเครื่องวัดได้รับการแก้ไขแล้วและแจ้งให้เขาทราบว่าจำเป็นต้องมีการตรวจวัดใหม่ วิศวกรประหลาดใจ "ต่อไปคุณจะถามเกี่ยวกับสโคปของฉัน" เห็นได้ชัดว่าเป็นเรื่องที่โง่ แต่ก็ไม่ชัดเจนสำหรับฉันว่าการใช้เสรีภาพด้วยวิธีการที่สนุก ฉันแน่ใจว่าในกรณีนี้นักสถิติสมัครเล่นที่ยุ่งจะไม่ต้องกังวลเกี่ยวกับเรื่องนี้ แต่สิ่งที่เกี่ยวกับนักวิชาการไม่ยอมใครง่ายๆนัก? ด้วยวิธีการที่ใช้วิธีปฏิบัติบ่อยๆเราจะต้องทำการทดสอบซ้ำอีกครั้งหรือไม่? เราสามารถดึงข้อสรุปจากข้อมูลที่มีอยู่แล้วได้หรือไม่? หากต้องการใช้ประโยชน์จากข้อมูลที่เรามีอยู่แล้วการแก้ไขผลลัพธ์สมมุติฐานที่จำเป็นสามารถทำได้เพื่อให้สอดคล้องกับกรอบบ่อย ๆ หรือไม่?

2
ค่าเบี่ยงเบนสัมบูรณ์กลาง (MAD) และ SD ของการแจกแจงที่แตกต่างกัน
สำหรับข้อมูลที่กระจายตามปกติค่าเบี่ยงเบนมาตรฐานและค่าเบี่ยงเบนสัมบูรณ์แบบมัธยฐานMADสัมพันธ์กันโดย:σσ\sigmaMADMAD\text{MAD} σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,\sigma=\Phi^{-1}(3/4)\cdot \text{MAD}\approx1.4826\cdot\text{MAD}, โดยที่เป็นฟังก์ชันการแจกแจงสะสมสำหรับการแจกแจงแบบปกติมาตรฐานΦ()Φ()\Phi() มีความสัมพันธ์แบบเดียวกันสำหรับการแจกแจงแบบอื่นหรือไม่?

2
การสร้างดัชนีเดียวจากองค์ประกอบหลักหรือปัจจัยหลายประการที่เก็บรักษาไว้จาก PCA / FA
ฉันใช้การวิเคราะห์ส่วนประกอบหลัก (PCA) เพื่อสร้างดัชนีที่จำเป็นสำหรับการวิจัยของฉัน คำถามของฉันคือวิธีที่ฉันควรสร้างดัชนีเดียวโดยใช้ส่วนประกอบหลักที่คงไว้ซึ่งคำนวณผ่าน PCA ตัวอย่างเช่นฉันตัดสินใจที่จะเก็บส่วนประกอบหลัก 3 ชิ้นหลังจากใช้ PCA และฉันคำนวณคะแนนสำหรับส่วนประกอบหลักทั้งสามนี้ วิธีที่เหมาะสมในการสร้างดัชนีเดียวจากคะแนนทั้งสามนี้คืออะไร? การเพิ่ม 3 คะแนนที่คำนวณนั้นมีค่าคอมโพสิตหรือไม่ หรือโดยเฉลี่ย 3 คะแนนเพื่อให้มีค่าเช่นนี้? หรือฉันควรจะรักษาองค์ประกอบหลักแรก (ที่แข็งแกร่งที่สุด) เท่านั้นและใช้คะแนนเป็นดัชนี? อีกวิธีหนึ่งสามารถใช้การวิเคราะห์ปัจจัย (FA) แต่คำถามเดียวกันยังคงอยู่: วิธีการสร้างดัชนีเดียวตามคะแนนหลายปัจจัย?

1
ข้อได้เปรียบของ Box-Muller ผ่านวิธี CDF สำหรับการจำลองการแจกแจงแบบปกติ?
เพื่อจำลองการแจกแจงแบบปกติจากชุดของตัวแปรเครื่องแบบมีหลายเทคนิค: อัลกอริธึม Box-Mullerซึ่งหนึ่งตัวอย่างสองชุดอิสระที่เป็นอิสระแตกต่างกันใน(0,1)(0,1)(0,1)และแปลงพวกเขาเป็นสองแจกแจงปกติมาตรฐานอิสระผ่าน: Z0=−2lnU1−−−−−−√cos(2πU0)Z1=−2lnU1−−−−−−√sin(2πU0)Z0=−2lnU1cos(2πU0)Z1=−2lnU1sin(2πU0) Z_0 = \sqrt{-2\text{ln}U_1}\text{cos}(2\pi U_0)\\ Z_1 = \sqrt{-2\text{ln}U_1}\text{sin}(2\pi U_0) วิธีการ CDFซึ่งหนึ่งสามารถถือเอา cdfให้เท่ากับชุดรูปแบบ: และสืบทอด F ( Z ) = U Z = F - 1 ( U )(F(Z))(F(Z))(F(Z))F(Z)=UF(Z)=U F(Z) = U Z=F−1(U)Z=F−1(U)Z = F^{-1}(U) คำถามของฉันคือ: ซึ่งคำนวณได้มีประสิทธิภาพมากขึ้น? ฉันคิดว่ามันเป็นวิธีหลัง - แต่เอกสารส่วนใหญ่ที่ฉันอ่านใช้ Box-Muller - ทำไม ข้อมูลเพิ่มเติม: การผกผันของ CDF ปกติรู้และได้รับจาก: F−1(Z)=2–√erf−1(2Z−1),Z∈(0,1).F−1(Z)=2erf−1⁡(2Z−1),Z∈(0,1).F^{-1}(Z)\; =\; …

1
2SLS แต่ Probit ขั้นที่สอง
ฉันพยายามใช้การวิเคราะห์ตัวแปรเครื่องมือเพื่ออนุมานสาเหตุของข้อมูลเชิงสังเกต ฉันได้เจอการถดถอยสองขั้นตอนสองขั้น (2SLS) ซึ่งมีแนวโน้มที่จะแก้ไขปัญหา endogeneity ในการวิจัยของฉัน อย่างไรก็ตามฉันอยากจะเป็นด่านแรกที่จะเป็น OLS และด่านที่สองเพื่อเป็นผู้ที่อยู่ภายใน 2SLS จากการอ่านและการค้นหาของฉันฉันได้เห็นนักวิจัยใช้ 2SLS หรือ prost ขั้นตอนแรกและขั้นตอนที่สอง OLS แต่ไม่ใช่รอบอื่น ๆ ซึ่งเป็นสิ่งที่ฉันพยายามบรรลุ ฉันกำลังใช้คำสั่งStata และivregใน Stata สำหรับ 2SLS แบบตรง

6
ปัญหาในการทดสอบหลังจบคืออะไร?
ศาสตราจารย์สถิติของฉันกล่าวว่าดังนั้นหนังสือทั้งหมดที่ฉันมองไปที่รัฐมันโพสต์-hoc ทดสอบเป็นตามหลักวิทยาศาสตร์ คุณต้องได้รับสมมติฐานจากทฤษฎีก่อนแล้วจึงรวบรวมข้อมูลและวิเคราะห์ แต่ฉันไม่เข้าใจจริงๆว่าปัญหาคืออะไร สมมติว่าฉันเห็นตัวเลขยอดขายสำหรับสีรถยนต์ที่แตกต่างกันและตั้งสมมติฐานว่าจากตัวเลขของรถยนต์สีต่างๆขายกลุ่มรถยนต์ที่ใหญ่ที่สุดบนท้องถนนเป็นสีขาว ดังนั้นฉันนั่งที่ถนนวันหนึ่งและสังเกตสีทั้งหมดของรถยนต์ทุกคันที่ผ่านฉัน จากนั้นฉันทำการทดสอบและค้นหาสิ่งใด ทีนี้สมมติว่าฉันเบื่อและนั่งอยู่ที่ถนนวันหนึ่งและสังเกตสีรถทุกคันที่ผ่านฉันไป เมื่อฉันรักกราฟฉันพล็อตฮิสโตแกรมสวยและพบว่ารถยนต์สีขาวเป็นกลุ่มที่ใหญ่ที่สุด ดังนั้นฉันคิดว่ารถยนต์ส่วนใหญ่บนถนนอาจเป็นสีขาวและทำการทดสอบบางอย่าง ผลลัพธ์หรือการตีความผลลัพธ์ของการทดสอบหลังเหตุการณ์แตกต่างจากการทดสอบสมมติฐานตามทฤษฎีอย่างไร * ชื่อตรงข้ามของการทดสอบหลังการทดสอบคืออะไร? ฉันต้องการจะเพิ่มความรู้ส่วนใหญ่ของเราเกี่ยวกับจักรวาล (โลกเคลื่อนที่รอบดวงอาทิตย์) ได้รับการสรุปจากการสังเกต สำหรับฉันแล้วดูเหมือนว่าในทางฟิสิกส์มันก็โอเคอย่างสมบูรณ์แบบที่จะคิดว่ามันไม่ใช่เรื่องบังเอิญที่ดวงอาทิตย์ขึ้นทางทิศตะวันออกในช่วงพันปีที่ผ่านมา
15 post-hoc 

2
“ ตัวแปรดัมมี่” กับ“ ตัวแปรตัวบ่งชี้” สำหรับข้อมูลเล็กน้อย / หมวดหมู่
"ตัวแปร Dummy" และ "ตัวแปรตัวบ่งชี้"เป็นคำที่ใช้บ่อยในการติดป้ายกำกับเพื่ออธิบายความเป็นสมาชิกในหมวดหมู่ที่มีการเข้ารหัส 0/1; โดยปกติ 0: ไม่ใช่สมาชิกของหมวดหมู่ 1: สมาชิกของหมวดหมู่ เมื่อวันที่ 11/26/2014 การค้นหาอย่างรวดเร็วบน scholar.google.com (พร้อมเครื่องหมายคำพูด) จะแสดง "ตัวแปรจำลอง" ในบทความประมาณ 318,000 รายการและใช้ "ตัวแปรตัวบ่งชี้" ในบทความประมาณ 112,000 รายการ คำว่า "ตัวแปรดัมมี่" มีความหมายในคณิตศาสตร์ที่ไม่ใช่เชิงสถิติของ " ตัวแปรที่ผูกมัด " ซึ่งมีแนวโน้มที่จะเอื้อต่อการใช้ "ตัวแปรจำลอง" ในบทความที่จัดทำดัชนีมากขึ้น คำถามที่เชื่อมโยงตามหัวข้อของฉัน: คำเหล่านี้มีความหมายเหมือนกันเสมอหรือไม่ (ภายในสถิติ) คำใดคำหนึ่งเหล่านี้เคยใช้กับการเข้ารหัสเด็ดขาดในรูปแบบอื่น ๆ (เช่นเอฟเฟ็กต์โค้ด , การเข้ารหัสเฮลเมอร์ ฯลฯ ) หรือไม่? เหตุผลทางสถิติหรือทางวินัยมีอะไรที่จะชอบหนึ่งคำมากกว่าที่อื่น?

3
การทดสอบสมมติฐานแบบเบส์หมายความว่าอย่างไรในกรอบการอนุมานและทฤษฎีการตัดสินใจ
พื้นหลังของฉันส่วนใหญ่อยู่ในการเรียนรู้ของเครื่องและฉันพยายามที่จะเรียนรู้ว่าการทดสอบสมมติฐานแบบเบย์หมายถึงอะไร ฉันโอเคกับการตีความความน่าจะเป็นแบบเบย์และฉันคุ้นเคยกับมันในบริบทของตัวแบบกราฟิกที่น่าจะเป็น อย่างไรก็ตามสิ่งที่ทำให้ฉันสับสนคือความหมายของคำว่า "สมมติฐาน" ในบริบทของการอนุมานเชิงสถิติ ฉันคิดว่าฉันส่วนใหญ่สับสนเกี่ยวกับคำศัพท์ที่ฉันคุ้นเคยกับการเรียนรู้ของเครื่องเทียบกับสิ่งที่ใช้ในสถิติและการอนุมาน ในบริบทของการเรียนรู้ภายใต้การดูแลผมตามปกติคิดว่าสมมติฐานที่เป็นฟังก์ชั่นการคาดการณ์ที่แมตัวอย่างป้ายชื่อของมันคือ{Y} อย่างไรก็ตามสำหรับฉันแล้วคำว่าสมมติฐานในการอ่านที่ฉันทำไม่มีความหมายเหมือนกัน ให้ฉันวางแยกอ่านที่ฉันกำลังอ่าน:ชั่วโมง : X→ Yชั่วโมง:X→Yh:\mathcal{X} \rightarrow \mathcal{Y} ถ้าคุณอ่านอย่างระมัดระวังมันก็บอกว่า: มีรูปแบบที่แตกต่างกันสำหรับข้อมูลที่สังเกตได้ ... พวกเขาใช้คำว่า model สำหรับฉันรูปแบบคำทำให้ฉันคิดว่าชุดของฟังก์ชั่นคือเราเลือกฟังก์ชั่นการทำนายที่เฉพาะเจาะจง เช่นคลาสสมมุติฐานของฟังก์ชัน ตัวอย่างเช่นอาจเป็นคลาสสมมุติฐานของฟังก์ชันกำลังสอง (พหุนามของระดับ 2) อย่างไรก็ตามสำหรับฉันแล้วพวกเขาใช้แบบจำลองคำและสมมติฐานเป็นคำพ้องในสารสกัดนี้ (สำหรับฉันพวกเขาเป็นคำที่แตกต่างอย่างสิ้นเชิง)Hd2Hd2\mathcal{H_{d2}} จากนั้นจะกล่าวถึงว่าเราสามารถทำให้นักบวชเป็นสมมติฐาน (สิ่งที่สมเหตุสมผลอย่างสมบูรณ์ในการตั้งค่าแบบเบย์): พีH( Hม.) , ม. = { 0 , 1 , . . , M- 1 }พีH(Hม.), ม.={0,1,...,M-1}p_H(H_m), \ \ \ \ \ …

1
จำนวนสีที่คาดหวังที่แตกต่างกันเมื่อวาดโดยไม่ต้องเปลี่ยน
พิจารณาโกศที่มีลูกสีต่างกันโดยที่ เป็นสัดส่วนของลูกบอลสีในบรรดาลูกบอล ( ) ฉันวาดลูกบอลจากโกศโดยไม่ต้องเปลี่ยนและดูที่หมายเลขของสีที่ต่างกันระหว่างลูกบอลที่ถูกวาด ความคาดหวังของในฐานะฟังก์ชันของขึ้นอยู่กับคุณสมบัติที่เหมาะสมของการแจกแจงคืออะไร?NNNPPPpipip_iiiiNNN∑ipi=1∑ipi=1\sum_i p_i = 1n≤Nn≤Nn \leq Nγγ\gammaγγ\gamman/Nn/Nn/Npp\mathbf{p} เพื่อให้เข้าใจมากขึ้นถ้าและสำหรับแล้วฉันมักจะเห็นว่าสี, ที่อยู่,N) มิฉะนั้นก็สามารถแสดงให้เห็นว่าความคาดหวังของมีN) สำหรับและคงที่มันจะดูเหมือนว่าปัจจัยที่จะคูณจะสูงสุดเมื่อเหมือนกัน; จำนวนที่คาดหวังของสีที่ต่างกันที่เห็นถูก จำกัด ขอบเขตด้วยฟังก์ชันของและเช่น, เอนโทรปีของ ?N=PN=PN = Ppi=1/Ppi=1/Pp_i = 1/Piiinnnγ=P(n/N)γ=P(n/N)\gamma = P (n/N)γγ\gamma>P(n/N)>P(n/N)>P(n/N)PPPNNNn/Nn/Nn/Npp\mathbf{p}n/Nn/Nn/Npp\mathbf{p} ดูเหมือนว่าจะเกี่ยวข้องกับปัญหาของตัวสะสมคูปองยกเว้นการสุ่มตัวอย่างจะดำเนินการโดยไม่มีการแทนที่และการแจกคูปองไม่สม่ำเสมอ

3
ในการปรับให้เรียบของ Kneser-Ney มีการจัดการคำที่มองไม่เห็นอย่างไร
จากสิ่งที่ฉันได้เห็นสูตรการปรับให้เรียบของ Kneser-Ney (ลำดับที่สอง) ไม่ทางใดก็ทางหนึ่ง P2KN(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn)PKN2(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn) \begin{align} P^2_{KN}(w_n|w_{n-1}) &= \frac{\max \left\{ C\left(w_{n-1}, w_n\right) - D, 0\right\}}{\sum_{w'} C\left(w_{n-1}, w'\right)} + \lambda(w_{n-1}) \times P_{cont}(w_n) \end{align} กับ normalizing factorให้เป็นλ(wn−1)λ(wn−1)\lambda(w_{n-1}) λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙)λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙) \begin{align} \lambda(w_{n-1}) &= \frac{D}{\sum_{w'} C\left(w_{n-1}, w'\right)} \times N_{1+}\left(w_{n-1}\bullet\right) \end{align} และความน่าจะเป็นอย่างต่อเนื่องPc o n t( ด้วยn)Pคโอnเสื้อ(Wn)P_{cont}(w_n)ของคำwnWnw_n Pcont(wn)=N1+(∙wn)∑w′N1+(∙w′)Pcont(wn)=N1+(∙wn)∑w′N1+(∙w′) \begin{align} P_{cont}(w_n) &= \frac{N_{1+}\left(\bullet w_{n}\right)}{\sum_{w'} N_{1+}\left(\bullet w'\right)} \end{align} ที่N1+(∙w)N1+(∙w)N_{1+}\left(\bullet …

4
เอฟเฟกต์คงที่และเอฟเฟกต์แบบสุ่มเมื่อความเป็นไปได้ทั้งหมดรวมอยู่ในรูปแบบเอฟเฟกต์แบบผสม
ในรูปแบบเอฟเฟ็กต์แบบผสมคำแนะนำคือการใช้เอฟเฟกต์แบบคงที่เพื่อประเมินพารามิเตอร์หากรวมระดับที่เป็นไปได้ทั้งหมด (เช่นทั้งชายและหญิง) ขอแนะนำให้ใช้เอฟเฟกต์แบบสุ่มเพื่ออธิบายตัวแปรหากระดับที่รวมอยู่เป็นเพียงตัวอย่างแบบสุ่มจากประชากร (ผู้ป่วยที่ลงทะเบียนจากจักรวาลของผู้ป่วยที่เป็นไปได้) และคุณต้องการประเมินค่าเฉลี่ยและความแปรปรวนของประชากรแทนวิธีการ ของระดับปัจจัยบุคคล ฉันสงสัยว่าคุณจำเป็นต้องใช้เหตุผลแบบคงที่ในลักษณะนี้หรือไม่ พิจารณาการศึกษาว่าขนาดเท้า / รองเท้าเปลี่ยนแปลงอย่างไรผ่านการพัฒนาและมีความสัมพันธ์กับการพูดความสูงน้ำหนักและอายุ SideSide{\rm Side}ชัดเจนจะต้องรวมอยู่ในรูปแบบใดบัญชีสำหรับความจริงที่ว่าการวัดในช่วงหลายปีที่ซ้อนกันอยู่ในเท้าที่กำหนดและไม่เป็นอิสระ ยิ่งกว่านั้นทางขวาและซ้ายเป็นไปได้ทั้งหมดที่มีอยู่ นอกจากนี้อาจเป็นความจริงที่ว่าสำหรับผู้เข้าร่วมที่ได้รับเท้าขวาของพวกเขามีขนาดใหญ่กว่า (หรือเล็กกว่า) จากซ้ายของพวกเขา อย่างไรก็ตามถึงแม้ว่าขนาดเท้าจะแตกต่างกันบ้างระหว่างเท้าสำหรับทุกคน แต่ก็ไม่มีเหตุผลที่จะเชื่อว่าเท้าขวาโดยเฉลี่ยจะมีขนาดใหญ่กว่าเท้าซ้าย หากพวกเขาอยู่ในตัวอย่างของคุณนี่อาจเป็นเพราะบางอย่างเกี่ยวกับพันธุศาสตร์ของคนในตัวอย่างของคุณแทนที่จะเป็นสิ่งที่อยู่ภายในถึงเท้าขวา ในที่สุดดูเหมือนว่าเป็นพารามิเตอร์ที่สร้างความรำคาญไม่ใช่สิ่งที่คุณสนใจจริงๆ sideside{\rm side} ให้ฉันสังเกตว่าฉันทำตัวอย่างนี้ขึ้น มันอาจจะไม่ดีเลย มันเป็นเพียงการทำความเข้าใจ สำหรับสิ่งที่ฉันรู้การมีเท้าขวาขนาดใหญ่และเท้าซ้ายขนาดเล็กเป็นสิ่งจำเป็นเพื่อความอยู่รอดในยุคหิน ในกรณีเช่นนี้มันจะสมเหตุสมผลหรือไม่ที่จะรวมในโมเดลเป็นเอฟเฟกต์แบบสุ่ม? อะไรคือข้อดีและข้อเสียของการใช้เอฟเฟกต์คงที่และแบบสุ่มที่นี่ sideside{\rm side}

11
การแสดงข้อมูลสามชิ้นบนกราฟ
หมายเหตุ: แนบข้อมูลดิบ 50 คะแนนแล้ว ฉันต้องการแสดงจำนวนการศึกษาที่ฉันได้ทำและจำนวนหน้าที่ฉันได้เสร็จสิ้นไปตลอดทั้งสัปดาห์เลิกกันตามวันและฉันได้ทำตามที่แสดงด้านล่าง: ฉันมีคนบอกฉันว่าพวกเขาไม่สามารถเข้าใจกราฟ แต่ฉันไม่รู้ว่าจะแสดงมันได้อย่างไร เนื่องจากฉันต้องการสามมิติเป็นหลักโดยไม่มีการอธิบายแบบสะสม ฉันต้องการหลีกเลี่ยงการใช้กราฟเส้นจำนวนมากเนื่องจากหลังจากนั้นสองสามสัปดาห์กราฟจะกลายเป็นอ่านไม่ออก ฉันจะทำอะไรไม่ได้เหรอ? ฉันจะแสดงสิ่งเหล่านี้ได้ชัดเจนยิ่งขึ้นได้อย่างไร Date Total Total pages 21/11/2014 2.4166 0 22/11/2014 0 0 23/11/2014 1.5833 4 24/11/2014 3.0166 13 25/11/2014 2.4999 6 26/11/2014 1.4833 3 27/11/2014 3.0499 6 28/11/2014 0 0 29/11/2014 2.4499 5 30/11/2014 2.8833 2 1/12/2014 0 0 2/12/2014 4.1166 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.