คำถามติดแท็ก intuition

คำถามที่แสวงหาความเข้าใจในแนวคิดหรือไม่ใช่คณิตศาสตร์ของสถิติ

1
ความเข้าใจทางเรขาคณิตของ PCA ในพื้นที่ (เรื่องคู่)
ฉันพยายามที่จะได้รับความเข้าใจที่ง่ายของการวิเคราะห์องค์ประกอบวิธีการหลัก (PCA) ทำงานในเรื่อง (คู่) พื้นที่ พิจารณาชุดข้อมูล 2D ที่มีตัวแปรสองตัวคือและและจุดข้อมูล (เมทริกซ์ข้อมูลคือคูณและถือว่าอยู่กึ่งกลาง) การนำเสนอตามปกติของ PCA คือเราพิจารณาคะแนนในเขียนเมทริกซ์ความแปรปรวนร่วมและหาค่าลักษณะเฉพาะของมัน สอดคล้องเครื่องแรกกับทิศทางของความแปรปรวนสูงสุด ฯลฯ นี่คือตัวอย่างที่มีความแปรปรวนเดอะเมทริกซ์ขวา) เส้นสีแดงแสดงค่าไอเกนผู้ประเมินโดยสแควร์รูทของค่าลักษณะเฉพาะนั้น ๆx 2 n X n × 2 n R 2 2 × 2 C = ( 4 2 2 2 )x1x1x_1x2x2x_2nnnXX\mathbf Xn×2n×2n\times 2nnnR2R2\mathbb R^22×22×22\times 2C=(4222)C=(4222)\mathbf C = \left(\begin{array}{cc}4&2\\2&2\end{array}\right) \hskip 1in ตอนนี้ให้พิจารณาสิ่งที่เกิดขึ้นในพื้นที่หัวเรื่อง (ฉันเรียนรู้คำศัพท์นี้จาก @ttnphns) หรือที่เรียกว่าช่องว่างคู่ …

5
สัญชาตญาณ (เรขาคณิตหรืออื่น ๆ ) ของ
พิจารณาตัวตนเบื้องต้นของความแปรปรวน: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} มันเป็นการจัดการเชิงพีชคณิตอย่างง่าย ๆ ของการนิยามของโมเมนต์ศูนย์กลางในช่วงเวลาที่ไม่เกี่ยวข้อง ช่วยให้การจัดการในบริบทอื่น ๆ สะดวกขึ้น นอกจากนี้ยังช่วยให้การคำนวณความแปรปรวนผ่านการส่งผ่านข้อมูลครั้งเดียวมากกว่าการส่งผ่านสองครั้งแรกเพื่อคำนวณค่าเฉลี่ยแล้วทำการคำนวณความแปรปรวนVar(X)Var(X)Var(X) แต่มันหมายความว่าอะไร? สำหรับฉันไม่มีสัญชาตญาณทางเรขาคณิตทันทีที่เกี่ยวข้องกับการแพร่กระจายเกี่ยวกับค่าเฉลี่ยในการแพร่กระจายประมาณ 0 เป็นเป็นชุดในมิติเดียวคุณจะดูการแพร่กระจายรอบค่าเฉลี่ยเป็นความแตกต่างระหว่างการแพร่กระจายรอบต้นกำเนิดและสี่เหลี่ยมจัตุรัส หมายความว่าอย่างไรXXX มีการตีความพีชคณิตเชิงเส้นที่ดีหรือการตีความทางกายภาพหรืออื่น ๆ ที่จะให้ข้อมูลเชิงลึกเกี่ยวกับตัวตนนี้หรือไม่?

2
ทำให้รู้สึกของการวิเคราะห์องค์ประกอบอิสระ
ฉันเคยเห็นและมีความสุขกับคำถามการทำความเข้าใจการวิเคราะห์องค์ประกอบหลักและตอนนี้ฉันมีคำถามเดียวกันสำหรับการวิเคราะห์องค์ประกอบอิสระ ฉันหมายถึงฉันต้องการคำถามที่ครอบคลุมเกี่ยวกับวิธีการที่เข้าใจง่ายในการทำความเข้าใจ ICA หรือไม่ ฉันต้องการที่จะเข้าใจมัน ฉันต้องการได้รับวัตถุประสงค์ของมัน ฉันต้องการรับความรู้สึกของมัน ฉันเชื่ออย่างยิ่งว่า: คุณไม่เข้าใจอะไรจริงๆเว้นแต่คุณจะอธิบายให้คุณยายฟัง -- Albert Einstein ฉันไม่สามารถอธิบายแนวคิดนี้กับคนธรรมดาหรือยายได้ ทำไมต้องเป็น ICA แนวคิดนี้จำเป็นสำหรับอะไร? คุณจะอธิบายเรื่องนี้กับคนธรรมดาได้อย่างไร
18 intuition  ica 

2
การทำคลัสเตอร์ - สัญชาตญาณเบื้องหลังทฤษฎีบทความเป็นไปไม่ได้ของไคลน์เบิร์ก
ฉันกำลังคิดเกี่ยวกับการเขียนโพสต์บล็อกในการวิเคราะห์ที่น่าสนใจนี้โดยKleinberg (2002)ที่สำรวจความยากลำบากในการจัดกลุ่ม Kleinberg แสดงตัวอธิบายลักษณะสามเดเดอราตาที่ใช้งานง่ายสำหรับฟังก์ชั่นการจัดกลุ่มแล้วพิสูจน์ว่าไม่มีฟังก์ชันดังกล่าวอยู่ มีอัลกอริทึมการจัดกลุ่มจำนวนมากที่ satify เกณฑ์สองในสาม อย่างไรก็ตามไม่มีฟังก์ชั่นที่สามารถตอบสนองทั้งสามพร้อมกันได้ โดยสังเขปและอย่างไม่เป็นทางการทั้งสามผู้อธิบายที่เขาสรุปคือ: มาตราส่วน - ค่าคงที่ : ถ้าเราแปลงข้อมูลเพื่อให้ทุกอย่างยืดออกไปในทุกทิศทางผลการจัดกลุ่มไม่ควรเปลี่ยนแปลง ความสอดคล้อง : ถ้าเรายืดข้อมูลเพื่อให้ระยะห่างระหว่างกลุ่มเพิ่มขึ้นและ / หรือระยะทางภายในกลุ่มลดลงดังนั้นผลการจัดกลุ่มไม่ควรเปลี่ยนแปลง ความสมบูรณ์ : ฟังก์ชันการจัดกลุ่มในทางทฤษฎีควรสามารถสร้างพาร์ติชัน / การจัดกลุ่มข้อมูลได้ตามอำเภอใจ (โดยไม่ทราบระยะห่างระหว่างสองจุด) คำถาม: (1)มีสัญชาตญาณภาพเรขาคณิตที่ดีที่สามารถแสดงความไม่สอดคล้องระหว่างเกณฑ์ทั้งสามนี้หรือไม่? (2)นี่หมายถึงรายละเอียดทางเทคนิคของกระดาษ คุณจะต้องอ่านลิงก์ด้านบนเพื่อทำความเข้าใจในส่วนนี้ของคำถาม ในกระดาษการพิสูจน์ทฤษฎีบท 3.1 เป็นเรื่องยากสำหรับฉันที่จะตามไปที่จุด ฉันติดอยู่ที่: "Let fff . จะเป็นฟังก์ชั่นการจัดกลุ่มที่ตอบสนองความสอดคล้องเราอ้างว่าสำหรับการใด ๆ พาร์ทิชันΓ∈Range(f)Γ∈Range(f)\Gamma \in \text{Range}(f)ที่มีอยู่จำนวนจริงบวก&lt; ขดังกล่าวว่าคู่( , ข)เป็นΓ - บังคับให้."a&lt;ba&lt;ba < b(a,b)(a,b)(a, b)ΓΓ\Gamma ฉันไม่เห็นว่าสิ่งนี้จะเกิดขึ้นได้อย่างไร …

2
เหตุใด CDF ของตัวอย่างกระจายอย่างสม่ำเสมอ
ฉันอ่านที่นี่ที่ได้รับตัวอย่างจากการกระจายอย่างต่อเนื่องกับ cdfตัวอย่างที่สอดคล้องกับเป็นไปตามการแจกแจงแบบมาตรฐานF X U ฉัน = F X ( X i )X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) ฉันตรวจสอบสิ่งนี้โดยใช้แบบจำลองเชิงคุณภาพใน Python และฉันสามารถตรวจสอบความสัมพันธ์ได้อย่างง่ายดาย import matplotlib.pyplot as plt import scipy.stats xs = scipy.stats.norm.rvs(5, 2, 10000) fig, axes = plt.subplots(1, 2, figsize=(9, 3)) axes[0].hist(xs, bins=50) axes[0].set_title("Samples") axes[1].hist( scipy.stats.norm.cdf(xs, 5, 2), bins=50 ) axes[1].set_title("CDF(samples)") …
17 pdf  uniform  cdf  intuition 

2
สำหรับการแจกแจงแบบสมมาตรคือตัวอย่างใดหมายถึงตัวประมาณที่มีประสิทธิภาพมากกว่ามัธยฐานตัวอย่าง
ฉันทำงานหนักภายใต้ความเชื่อที่ว่าค่ามัธยฐานตัวอย่างเป็นตัวชี้วัดแนวโน้มกลางที่แข็งแกร่งกว่าค่าเฉลี่ยตัวอย่างเนื่องจากมันไม่สนใจค่าผิดปกติ ฉันจึงประหลาดใจที่ได้เรียนรู้ (ในคำตอบของคำถามอื่น ) ว่าสำหรับตัวอย่างที่ดึงมาจากการแจกแจงแบบปกติความแปรปรวนของค่าเฉลี่ยตัวอย่างจะน้อยกว่าความแปรปรวนของค่ามัธยฐานตัวอย่าง (อย่างน้อยสำหรับขนาดใหญ่nnn ) ฉันเข้าใจทางคณิตศาสตร์ว่าทำไมสิ่งนี้ถึงเป็นจริง มีวิธี "ปรัชญา" ในการมองสิ่งนี้หรือไม่ที่จะช่วยให้มีสัญชาตญาณว่าจะใช้มัธยฐานแทนที่จะใช้ค่าเฉลี่ยสำหรับการแจกแจงแบบอื่นหรือไม่? มีเครื่องมือทางคณิตศาสตร์ที่ช่วยตอบคำถามสำหรับการแจกแจงแบบเจาะจงหรือไม่?

3
แนวคิดและสัญชาตญาณที่อยู่เบื้องหลังการประมาณค่าความน่าจะเป็นสูงสุด (QMLE)
คำถาม (s):อะไรคือความคิดและสัญชาตญาณที่อยู่เบื้องหลังการประมาณความเป็นไปได้สูงสุดเสมือน (QMLE; หรือที่เรียกว่าการประมาณความน่าจะเป็นหลอกหลอกแบบ PMLE) อะไรทำให้ตัวประมาณทำงานได้เมื่อการแจกแจงข้อผิดพลาดจริงไม่ตรงกับการแจกแจงผิดพลาด เว็บไซต์วิกิพีเดียสำหรับ QMLE ดี (สั้น ๆ ที่ใช้งานง่ายเพื่อจุด) แต่ฉันสามารถใช้บางปรีชาเพิ่มเติมและรายละเอียดอาจจะยังมีภาพประกอบ การอ้างอิงอื่น ๆ ยินดีต้อนรับมากที่สุด (ฉันจำได้ว่ามีหนังสือตำราเศรษฐศาสตร์จำนวนน้อยที่กำลังมองหาเนื้อหาเกี่ยวกับ QMLE และทำให้ฉันประหลาดใจ QMLE ถูกครอบคลุมเพียงหนึ่งหรือสองเล่มเช่น Wooldridge "การวิเคราะห์ทางเศรษฐมิติของข้อมูลส่วนและข้อมูลพาเนล" (2010) บทที่ 13 ส่วนที่ 11, หน้า 502-517)

3
สัญชาตญาณเบื้องหลังอัตราอันตราย
ฉันสับสนเกี่ยวกับสมการที่ทำหน้าที่เป็นคำจำกัดความของอัตราอันตราย ฉันเข้าใจว่าอัตราอันตรายนั้นเป็นอย่างไร แต่ฉันไม่เห็นว่าสมการแสดงความรู้สึกนั้น ถ้าxxxเป็นตัวแปรสุ่มซึ่งหมายถึงจุดของเวลาของการตายของคนในช่วงเวลา[ 0 , T][0,T][0,T] ] ดังนั้นอัตราความเสี่ยงคือ: h ( x ) = f( x )1 - ฟ( x )ชั่วโมง(x)=ฉ(x)1-F(x)h(x)=\frac{f(x)}{1-F(x)} ที่ไหนF( x )F(x)F(x)แสดงให้เห็นถึงความน่าจะเป็นของการเสียชีวิตจนถึงจุดเวลาx ∈ [ 0 , T]x∈[0,T]x\in[0,T] , 1 - ฟ( x )1-F(x)1-F(x)แสดงให้เห็นถึงความน่าจะเป็นของการมีชีวิตรอดจนถึงจุดเวลาx ∈ [ 0 , T]x∈[0,T]x\in[0,T] , และฉ( x )ฉ(x)f(x)ความน่าจะเป็นของการเสียชีวิตที่จุดxxxx วิธีการที่ไม่หารโดยอัตราการรอดตายอธิบายสัญชาตญาณของความน่าจะเป็นของการเสียชีวิตทันทีในที่อยู่ถัดΔ ที ? ไม่ควรเป็นแค่f ( x …

2
ทำไมค่าเบี่ยงเบนมาตรฐานถูกกำหนดเป็น sqrt ของความแปรปรวนและไม่เป็น sqrt ของผลรวมของกำลังสองเหนือ N
วันนี้ฉันสอนชั้นสถิติเบื้องต้นและมีนักเรียนคนหนึ่งถามคำถามซึ่งฉันได้เรียบเรียงใหม่ที่นี่: "ทำไมค่าเบี่ยงเบนมาตรฐานที่กำหนดเป็น sqrt ของความแปรปรวนและไม่ใช่ผลรวมของสี่เหลี่ยมจัตุรัสเหนือ N" เรากำหนดความแปรปรวนประชากร: σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} และค่าเบี่ยงเบนมาตรฐาน: σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 2 ในความหมายที่เราจะได้มอบให้σσ\sigmaคือว่ามันจะช่วยให้ค่าเบี่ยงเบนเฉลี่ยของหน่วยในประชากรจากค่าเฉลี่ยของประชากรXXXX อย่างไรก็ตามในคำจำกัดความของ sd เราหาร sqrt ของผลรวมของกำลังสองผ่านN−−√N\sqrt{N} . คำถามที่นักเรียนยกคือทำไมเราไม่หาร sqrt ของ sume of squares โดยNNNแทน ดังนั้นเรามาถึงสูตรการแข่งขัน: σnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.นักเรียนให้เหตุผลว่าสูตรนี้ดูเหมือนว่าส่วนเบี่ยงเบน "เฉลี่ย" มากกว่าค่าเฉลี่ยเมื่อหารด้วยN−−√N\sqrt{N}ในขณะที่σσσ\sigma ฉันคิดว่าคำถามนี้ไม่ได้โง่ ฉันต้องการที่จะให้คำตอบกับนักเรียนที่ไปไกลกว่าที่บอกว่า sd หมายถึง sqrt ของความแปรปรวนซึ่งเป็นค่าเบี่ยงเบนมาตรฐานกำลังสอง ทำไมนักเรียนถึงใช้สูตรที่ถูกต้องและไม่ทำตามความคิดของเธอ? คำถามนี้เกี่ยวข้องกับด้ายเก่าและคำตอบที่ให้ไว้ที่นี่ คำตอบมีสามทิศทาง: σσ\sigmaคือค่าเบี่ยงเบน root-Mean-squared (RMS) ไม่ใช่ส่วนเบี่ยงเบน "ทั่วไป" จากค่าเฉลี่ย (เช่นσnewσnew\sigma_{new} ) ดังนั้นจึงถูกกำหนดแตกต่างกัน มันมีคุณสมบัติทางคณิตศาสตร์ที่ดี นอกจากนี้ sqrt จะนำ …

1
EM มีคำอธิบายที่เข้าใจง่ายไหม?
ขั้นตอน EM จะปรากฏขึ้นต่อผู้ที่ไม่ได้ฝึกหัดเป็นเวทย์มนตร์ดำมากหรือน้อย ประมาณการพารามิเตอร์ของ HMM (ตัวอย่าง) โดยใช้ข้อมูลที่มีการตรวจสอบ จากนั้นถอดรหัสข้อมูลที่ไม่ได้ติดแท็กโดยใช้การย้อนกลับไปข้างหน้าเพื่อเหตุการณ์ 'นับ' ราวกับว่าข้อมูลถูกแท็กมากหรือน้อย ทำไมสิ่งนี้ถึงทำให้โมเดลดีขึ้น? ฉันรู้อะไรบางอย่างเกี่ยวกับคณิตศาสตร์ แต่ฉันอยากให้ภาพจิตของมัน

2
ปรีชาญาณเกี่ยวกับการประมาณค่าพารามิเตอร์ในตัวแบบผสม (พารามิเตอร์ความแปรปรวนกับโหมดเงื่อนไข)
ฉันได้อ่านหลายครั้งแล้วว่าเอฟเฟกต์แบบสุ่ม (BLUPs / โหมดเงื่อนไขสำหรับ, พูด, ตัวแบบ) ไม่ใช่พารามิเตอร์ของโมเดลเอฟเฟกต์แบบเชิงเส้น แต่สามารถได้มาจากค่าความแปรปรวน / ตัวแปรความแปรปรวนร่วมโดยประมาณ เช่นReinhold Kliegl และคณะ รัฐ(2011) : เอฟเฟกต์แบบสุ่มคือการเบี่ยงเบนของอาสาสมัครจาก RT เฉลี่ยที่ยิ่งใหญ่และการเบี่ยงเบนของอาสาสมัครจากพารามิเตอร์เอฟเฟกต์คงที่ พวกเขาจะถือว่าเป็นอิสระและกระจายตามปกติด้วยค่าเฉลี่ยของ 0 มันเป็นสิ่งสำคัญที่จะต้องตระหนักว่าผลกระทบแบบสุ่มเหล่านี้ไม่ได้เป็น พารามิเตอร์ของ LMM - เพียงผลต่างและความแปรปรวนร่วมของพวกเขาคือ [... ] พารามิเตอร์ LMM ร่วมกับข้อมูลของอาสาสมัครสามารถใช้เพื่อสร้าง“ การคาดการณ์” (โหมดตามเงื่อนไข) ของเอฟเฟกต์แบบสุ่มสำหรับแต่ละเรื่อง ใครสามารถให้คำอธิบายที่เข้าใจง่ายว่าพารามิเตอร์ความแปรปรวน (ร่วม) ของเอฟเฟกต์แบบสุ่มสามารถประมาณได้โดยไม่ต้องใช้ / ประเมินผลของการสุ่ม

4
จะพัฒนาสัญชาตญาณความน่าจะเป็นแบบมีเงื่อนไขได้อย่างไร
ในวิดีโอบรรยายจากสถิติของ Harvard 110: ความน่าจะเป็นที่พบได้ใน iTunes และ YouTube ฉันพบปัญหานี้ ฉันพยายามสรุปที่นี่: สมมติว่าเราได้ไพ่สองใบสุ่มจากเด็คมาตรฐาน ความน่าจะเป็นที่ไพ่ทั้งคู่เป็นเอซเนื่องจากเรามีอย่างน้อยหนึ่งเอซคืออะไร P(both aces|have ace)=P(both aces,have ace)P(have ace)P(both aces|have ace)=P(both aces,have ace)P(have ace) P(both\ aces | have\ ace) = \frac{P(both\ aces, have\ ace)}{P(have\ ace)} เนื่องจากมีอย่างน้อยหนึ่งเอซจะถูกบอกเป็นนัย ๆ ถ้าคุณมีเอซทั้งคู่การตัดกันสามารถลดลงเหลือเพียงแค่P(both aces)P(both aces)P(both\ aces) P(both aces|have ace)=P(both aces)P(have ace)P(both aces|have ace)=P(both aces)P(have ace) P(both\ aces …

4
แนวคิดชุดทั่วไป
ฉันคิดว่าแนวคิดของเซตทั่วไปนั้นค่อนข้างง่าย: ลำดับความยาวจะเป็นของเซตทั่วไปถ้าความน่าจะเป็นของลำดับออกมาสูง ดังนั้นลำดับใด ๆ ที่มีแนวโน้มที่จะอยู่ใน{(n)} (ฉันกำลังหลีกเลี่ยงการนิยามอย่างเป็นทางการที่เกี่ยวข้องกับเอนโทรปีเพราะฉันพยายามที่จะเข้าใจในเชิงคุณภาพ)A ( n ) ϵ A ( n ) ϵnnnA(n)ϵAϵ(n)A_\epsilon ^{(n)}A(n)ϵAϵ(n)A_\epsilon ^{(n)} อย่างไรก็ตามฉันได้อ่านโดยทั่วไปแล้วลำดับที่เป็นไปได้มากที่สุดไม่ได้อยู่ในชุดทั่วไป นี่ทำให้ฉันสับสนครั้งใหญ่ มีคำจำกัดความที่เข้าใจง่ายของชุดทั่วไปหรือไม่ หรือเป็นเพียงเครื่องมือทางคณิตศาสตร์ที่ไม่เกี่ยวกับสามัญสำนึกมากนัก?

2
ทำความเข้าใจเกี่ยวกับการคำนวณความสัมพันธ์ระยะทาง
เท่าที่ฉันเข้าใจความสัมพันธ์ของระยะทางเป็นวิธีที่มีประสิทธิภาพและเป็นสากลในการตรวจสอบว่ามีความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัวหรือไม่ ตัวอย่างเช่นหากเรามีชุดจำนวนคู่: (x1, y1) (x2, y2) ... (xn, yn) เราสามารถใช้ความสัมพันธ์ของระยะทางเพื่อตรวจสอบว่ามีความสัมพันธ์ใด ๆ (ไม่จำเป็นต้องเป็นเชิงเส้น) ระหว่างตัวแปรสองตัว ( xและy) ยิ่งกว่านั้นxและyสามารถเป็นเวกเตอร์ที่มีขนาดต่างกัน มันค่อนข้างง่ายในการคำนวณความสัมพันธ์ของระยะทาง ก่อนอื่นเราใช้xixผมx_iในการคำนวณระยะทางเมทริกซ์ จากนั้นเราจะคำนวณเมทริกซ์ระยะทางโดยใช้yผมyผมy_iฉัน เมทริกซ์ระยะทางทั้งสองจะมีขนาดเท่ากันเนื่องจากจำนวนxผมxผมx_iและYผมyผมy_iเท่ากัน (เพราะมาเป็นคู่) ตอนนี้เรามีระยะทางมากมายที่สามารถจับคู่ได้ ตัวอย่างเช่นองค์ประกอบ(2,3)จากเมทริกซ์ระยะทางแรกถูกจับคู่กับองค์ประกอบ(2,3)จากเมทริกซ์ระยะทางที่สอง ดังนั้นเรามีชุดของระยะทางคู่หนึ่งและเราสามารถใช้มันเพื่อคำนวณความสัมพันธ์ (ความสัมพันธ์ระหว่างระยะทาง) หากระยะทางสองประเภทนั้นมีความสัมพันธ์กันมากกว่าที่หมายความว่า close Xs มักจะหมายถึง close Ys ตัวอย่างเช่นถ้าใกล้เคียงกับx 13มากกว่านั่นหมายความว่าy 7น่าจะใกล้เคียงกับy 13x7x7x_7x13x13x_{13}Y7Y7y_7Y13Y13y_{13} 13ดังนั้นเราสามารถสรุปได้ว่า Xs และ Ys ขึ้นอยู่กับ ฟังดูสมเหตุสมผล แต่มีสองด้านที่ผมไม่เข้าใจ อันดับแรกเพื่อคำนวณความสัมพันธ์ของระยะทางเราไม่ได้ใช้เมทริกซ์ระยะทางสองตัวโดยตรง เราใช้กับพวกเขาสองขั้นตอนกลาง (เพื่อให้ผลรวมขององค์ประกอบทั้งหมดในแถวใด ๆ (หรือคอลัมน์) เท่ากับศูนย์) ฉันไม่เข้าใจว่าทำไมเราต้องทำ ตรรกะ …

4
การดำเนินงานของโอกาสในโลกที่กำหนดขึ้น
ในหนังสือของสตีเว่นพิ้งเกอร์Better Angels of Our Natureเขาบันทึกไว้ว่า ความน่าจะเป็นเป็นเรื่องของมุมมอง เมื่อมองในระยะใกล้พอแต่ละเหตุการณ์มีสาเหตุที่แน่ชัด แม้แต่การพลิกเหรียญก็สามารถทำนายได้จากเงื่อนไขเริ่มต้นและกฎของฟิสิกส์และนักมายากลที่มีทักษะสามารถใช้ประโยชน์จากกฎหมายเหล่านั้นเพื่อโยนหัวทุกครั้ง แต่เมื่อเราซูมออกเพื่อดูภาพมุมกว้างของเหตุการณ์เหล่านี้จำนวนมากเราจะเห็นผลรวมของสาเหตุมากมายที่บางครั้งก็ยกเลิกซึ่งกันและกันและบางครั้งก็จัดเรียงในทิศทางเดียวกัน นักฟิสิกส์และนักปรัชญาอองรีโปนแคร์อธิบายว่าเราเห็นการดำเนินการของโอกาสในโลกที่กำหนดขึ้นไม่ว่าจะเป็นสาเหตุของความอ่อนแอจำนวนมากเพิ่มขึ้นเป็นผลที่น่ากลัวหรือเมื่อสาเหตุเล็ก ๆ .ในกรณีที่มีการใช้ความรุนแรงบางคนอาจต้องการเริ่มสงคราม เขารอช่วงเวลาที่เหมาะสมซึ่งอาจจะมีหรือไม่มีก็ได้ ศัตรูของเขาตัดสินใจที่จะมีส่วนร่วมหรือถอย; กระสุนบิน; ระเบิดระเบิด คนตาย ทุกเหตุการณ์อาจถูกกำหนดโดยกฎหมายของระบบประสาทและฟิสิกส์และสรีรวิทยา แต่ในภาพรวมสาเหตุหลายประการที่เข้าสู่เมทริกซ์นี้บางครั้งสามารถสับเป็นชุดค่าผสมที่รุนแรงได้ (หน้า 209) ฉันสนใจประโยคที่เป็นตัวหนา แต่ฉันให้ส่วนที่เหลือตามบริบท คำถามของฉัน: มีวิธีทางสถิติในการอธิบายสองกระบวนการที่ Poincare อธิบายหรือไม่ นี่คือการคาดเดาของฉัน: 1) "สาเหตุการลงโทษจำนวนมากเพิ่มขึ้นถึงเอฟเฟกต์ที่น่ากลัว" "การจำนวนมากสาเหตุ" และ "เพิ่มขึ้น" เสียงกับผมเช่นทฤษฎีบทขีด จำกัด กลาง แต่ใน (ความหมายดั้งเดิมของ) CLT สาเหตุจำเป็นต้องเป็นตัวแปรสุ่มไม่ใช่ผลกระทบที่กำหนดไว้ เป็นวิธีมาตรฐานที่นี่เพื่อประมาณผลกระทบที่กำหนดเหล่านี้เป็นตัวแปรสุ่มบางชนิด? 2) "สาเหตุเล็ก ๆ น้อย ๆ ที่ทำให้การแจ้งเตือนของเราเป็นตัวกำหนดผลกระทบขนาดใหญ่ที่เราไม่ควรพลาด" มันดูเหมือนว่าผมชอบคุณอาจจะคิดว่านี้เป็นจัดเรียงของบางรูปแบบมาร์คอฟซ่อน แต่ความน่าจะเป็นในการเปลี่ยนสถานะ (ไม่สามารถสังเกตเห็นได้) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.