คำถามติดแท็ก approximation

การประมาณค่าการแจกแจงฟังก์ชันหรือวัตถุทางคณิตศาสตร์อื่น ๆ การประมาณค่าบางอย่างหมายถึงการหาตัวแทนของมันซึ่งง่ายกว่าในบางแง่ แต่ไม่แน่นอน

4
สถิติการสั่งซื้อโดยประมาณสำหรับตัวแปรสุ่มปกติ
มีสูตรที่รู้จักกันดีสำหรับสถิติการสั่งซื้อของการแจกแจงแบบสุ่มบางอย่างหรือไม่? โดยเฉพาะอย่างยิ่งสถิติลำดับแรกและสุดท้ายของตัวแปรสุ่มปกติ แต่คำตอบทั่วไปก็น่าจะได้รับการชื่นชมเช่นกัน แก้ไข:เพื่อชี้แจงฉันกำลังมองหาสูตรการประมาณที่สามารถประเมินมากขึ้นหรือน้อยลงอย่างชัดเจนไม่ใช่นิพจน์รวมที่แน่นอน ตัวอย่างเช่นฉันได้เห็นการประมาณสองค่าต่อไปนี้สำหรับสถิติลำดับแรก (เช่นค่าต่ำสุด) ของ rv ปกติ: e1:n≥μ−n−12n−1√σe1:n≥μ−n−12n−1σe_{1:n} \geq \mu - \frac{n-1}{\sqrt{2n-1}}\sigma และ e1:n≈μ+Φ−1(1n+1)σe1:n≈μ+Φ−1(1n+1)σe_{1:n} \approx \mu + \Phi^{-1} \left( \frac{1}{n+1} \right)\sigma ครั้งแรกของเหล่าสำหรับn=200n=200n=200ให้ประมาณe1:200≥μ−10σe1:200≥μ−10σe_{1:200} \geq \mu - 10\sigmaซึ่งดูเหมือนว่าลำพองผูกไว้หลวม ประการที่สองให้e1:200≈μ−2.58σe1:200≈μ−2.58σe_{1:200} \approx \mu - 2.58\sigmaขณะที่รวดเร็ว Monte Carlo ให้e1:200≈μ−2.75σe1:200≈μ−2.75σe_{1:200} \approx \mu - 2.75\sigmaดังนั้นมันจึงไม่ได้เป็นประมาณไม่ดี แต่ไม่ดีอย่างใดอย่างหนึ่งและที่สำคัญผมไม่ได้มีสัญชาติญาณใด ๆ เกี่ยวกับ มันมาจากไหน ความช่วยเหลือใด ๆ

4
อะไรคือปัจจัยที่ทำให้การแจกแจงหลังเป็นเรื่องยาก
ในสถิติแบบเบย์มักถูกกล่าวถึงว่าการกระจายหลังนั้นเป็นไปไม่ได้ดังนั้นจึงต้องใช้การอนุมานโดยประมาณ อะไรคือปัจจัยที่ทำให้เกิดความไม่สะดวกนี้

2
ความแตกต่างของตัวแปรสุ่ม iid lognormal สองตัว
Let X1X1X_1และX2X2X_2 2 iidrv ของที่log(X1),log(X2)∼N(μ,σ)log⁡(X1),log⁡(X2)∼N(μ,σ)\log(X_1),\log(X_2) \sim N(\mu,\sigma) ) ผมอยากจะรู้ว่าการกระจายสำหรับX1- X2X1-X2X_1 - X_2 2 สิ่งที่ดีที่สุดที่ฉันสามารถทำได้คือนำซีรีย์ของทั้งสอง Taylor และได้รับความแตกต่างคือผลรวมของความแตกต่างระหว่างสอง rv ปกติและสอง chi-squared rv นอกเหนือจากความแตกต่างที่เหลือระหว่างเงื่อนไขที่เหลือ มีวิธีที่ตรงไปตรงมามากขึ้นที่จะได้รับการกระจายความแตกต่างระหว่าง 2 iid log-normal rv หรือไม่?

2
เทคนิคการเรียนรู้ของเครื่อง“ อัลกอริธึมการประมาณค่า” หรือไม่?
เมื่อเร็ว ๆ นี้มีคำถามที่คล้าย ML มากกว่าใน cstheory stackexchange และฉันโพสต์คำตอบแนะนำวิธีการของ Powell, การไล่ระดับสี, ขั้นตอนวิธีพันธุกรรมหรืออื่น ๆ"ขั้นตอนวิธีการประมาณ" ในความคิดเห็นมีคนบอกฉันว่าวิธีการเหล่านี้คือ "การวิเคราะห์พฤติกรรม" และไม่ใช่ "อัลกอริทึมการประมาณ" และบ่อยครั้งไม่ได้เข้าใกล้ทฤษฎีที่เหมาะสมที่สุด (เพราะพวกเขา "มักติดอยู่ในท้องถิ่นน้อยที่สุด") คนอื่นเห็นด้วยไหม นอกจากนี้ดูเหมือนว่าสำหรับฉันแล้วมีความรู้สึกว่าอัลกอริธึมฮิวริสติกสามารถรับประกันได้ว่าจะใกล้เคียงกับทฤษฎีที่เหมาะสมที่สุดหากตั้งค่าให้สำรวจพื้นที่ส่วนใหญ่ในการค้นหา (เช่นการตั้งค่าพารามิเตอร์ / ขนาดขั้นตอนเล็ก) จะเห็นว่าในกระดาษ ไม่มีใครรู้ว่าสิ่งนี้ได้รับการแสดงหรือพิสูจน์ในกระดาษ (ถ้าไม่ใช่สำหรับอัลกอริธึมขนาดใหญ่อาจเป็นคลาสเล็ก ๆ ที่พูดว่า NNs เป็นต้น)

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

1
ข้อผิดพลาดในการประมาณการกระจายผลรวมสม่ำเสมอ
วิธีการที่ไร้เดียงสาวิธีหนึ่งสำหรับการประมาณการแจกแจงแบบปกติคือการเพิ่มตัวแปรสุ่ม IID จำนวน IID ที่กระจายกันอย่างสม่ำเสมอใน[ 0 , 1 ]จากนั้นกลับมาอีกครั้งและดำเนินการใหม่โดยอาศัยทฤษฎีบทขีด จำกัด กลาง ( หมายเหตุด้านข้าง : มีวิธีการที่แม่นยำมากขึ้นเช่นการแปลง Box – Muller ) ผลรวมของ IID100100100[0,1][0,1][0,1]U(0,1)U(0,1)U(0,1)ตัวแปรสุ่มเป็นที่รู้จักกันกระจายชุดรวมหรือกระจายเออร์วินฮอลล์ ข้อผิดพลาดมีขนาดใหญ่เพียงใดในการประมาณการกระจายตัวแบบสม่ำเสมอโดยการแจกแจงแบบปกติ เมื่อใดก็ตามที่คำถามประเภทนี้เกิดขึ้นเพื่อประมาณผลรวมของตัวแปรสุ่มของ IID ผู้คน (รวมถึงฉัน) จะนำทฤษฎีบท Berry - Esseenมาใช้ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพของทฤษฎีขีด จำกัด กลางเนื่องจากช่วงเวลาที่สามมีอยู่: |Fn(x)−Φ(x)|≤Cρσ3n−−√|Fn(x)−Φ(x)|≤Cρσ3n|F_n(x) - \Phi(x)| \le \frac{C \rho}{\sigma^3 \sqrt n} ที่เป็นฟังก์ชันการแจกแจงสะสมสำหรับผลรวมของ rescaled IID ตัวแปรสุ่มเป็นสามช่วงเวลาที่แน่นอนกลาง,เป็นส่วนเบี่ยงเบนมาตรฐานและเป็นค่าคงที่แน่นอนซึ่งสามารถนำไปเป็นหรือแม้กระทั่ง1/2FnFnF_nnnnρρ\rhoE|(X−EX)3|E|(X−EX)3|E|(X-EX)^3|σσ\sigmaCCC1111/21/21/2 สิ่งนี้ไม่น่าพอใจ สำหรับผมแล้วการประมาณ Berry - Esseen นั้นใกล้เคียงที่สุดกับการแจกแจงทวินามที่ไม่ต่อเนื่องโดยมีข้อผิดพลาดที่ใหญ่ที่สุดคือสำหรับการแจกแจงทวินามแบบสมมาตร …

5
ทำไมต้องกังวลกับการจัดอันดับต่ำ?
หากคุณมีเมทริกซ์ที่มีคอลัมน์ n แถวและ m คุณสามารถใช้ SVD หรือวิธีอื่น ๆ ในการคำนวณการประมาณค่าต่ำของเมทริกซ์ที่กำหนด อย่างไรก็ตามการประมาณอันดับต่ำจะยังคงมี n แถวและคอลัมน์ m การประมาณอันดับต่ำจะมีประโยชน์สำหรับการเรียนรู้ของเครื่องและการประมวลผลภาษาธรรมชาติอย่างไรเนื่องจากคุณมีคุณสมบัติจำนวนเท่าเดิม

3
ประเมินช่วงเวลาที่แน่นอนของการแจกแจงแบบปกติ
ฉันรู้ว่าสูตรที่ง่ายต่อการจัดการสำหรับ CDF ของการแจกแจงแบบปกติค่อนข้างขาดหายไปเนื่องจากฟังก์ชันข้อผิดพลาดที่ซับซ้อนอยู่ในนั้น แต่ผมสงสัยว่ามี AA สูตรที่ดีสำหรับยังไม่มีข้อความ( c-≤ x &lt; c+| μ, σ2)ยังไม่มีข้อความ(ค-≤x&lt;ค+|μ,σ2)N(c_{-} \leq x < c_{+}| \mu, \sigma^2) ) หรือการประมาณ "ทันสมัย" สำหรับปัญหานี้อาจเป็น

1
อ่างครัวแบบสุ่มทำงานอย่างไร
เมื่อปีที่แล้วที่ NIPS 2017 Ali Rahimi และ Ben Recht ได้รับรางวัลการทดสอบเวลาสำหรับกระดาษของพวกเขา"คุณสมบัติการสุ่มสำหรับเคอร์เนลขนาดใหญ่"ที่พวกเขาแนะนำคุณสมบัติแบบสุ่มประมวลผลในภายหลังเป็นอัลกอริทึม sinks ครัวแบบสุ่ม ในฐานะที่เป็นส่วนหนึ่งของการเผยแพร่รายงานของพวกเขาพวกเขาแสดงให้เห็นว่าแบบจำลองของพวกเขาสามารถนำไปใช้ใน 5 บรรทัดของ matlab % Approximates Gaussian Process regression % with Gaussian kernel of variance gamma^2 % lambda: regularization parameter % dataset: X is dxN, y is 1xN % test: xtest is dx1 % D: dimensionality of random feature …

1
การค้นหารากสำหรับฟังก์ชันสโตแคสติก
สมมติว่าเรามีฟังก์ชั่นที่เราสามารถสังเกตได้จากสัญญาณรบกวนบางอย่างเท่านั้น เราไม่สามารถคำนวณf ( x )ได้โดยตรงเพียงแค่f ( x ) + ηโดยที่ηมีเสียงรบกวนแบบสุ่ม (ในทางปฏิบัติ: ฉันคำนวณf ( x )โดยใช้วิธีมอนติคาร์โลบางวิธี)f(x)f(x)f(x)f(x)f(x)f(x)f(x)+ηf(x)+ηf(x) + \etaηη\etaf(x)f(x)f(x) วิธีการอะไรที่ใช้ได้สำหรับการหารากของเช่นการคำนวณxเพื่อให้F ( x ) = 0 ?fffxxxf(x)=0f(x)=0f(x) = 0 ฉันกำลังมองหาวิธีที่ลดจำนวนการประเมินที่จำเป็นสำหรับเนื่องจากมีราคาแพงในการคำนวณf(x)+ηf(x)+ηf(x)+\eta ฉันสนใจวิธีการทั่วไปที่ใช้หลายมิติ (เช่นแก้ )f(x,y)=0,g(x,y)=0f(x,y)=0,g(x,y)=0f(x,y) = 0, g(x,y) = 0 ฉันสนใจวิธีการที่สามารถใช้ประโยชน์จากข้อมูลบางอย่างเกี่ยวกับความแปรปรวนของเนื่องจากการประมาณนี้อาจมีให้เมื่อคำนวณf ( x )โดยใช้ MCMCηη\etaf(x)f(x)f(x)

5
ข้อผิดพลาดโดยประมาณของช่วงความมั่นใจสำหรับค่าเฉลี่ยเมื่อ
Let {Xi}ni=1{Xi}i=1n\{X_i\}_{i=1}^nจะเป็นครอบครัวของตัวแปรสุ่ม IID สละค่าใน[0,1][0,1][0,1]มีค่าเฉลี่ยμμ\muและแปรปรวนσ2σ2\sigma^2 2 ช่วงความเชื่อมั่นที่ง่ายสำหรับค่าเฉลี่ยโดยใช้σσ\sigmaเมื่อใดก็ตามที่เป็นที่รู้จักกันจะได้รับจาก P(|X¯−μ|&gt;ε)≤σ2nε2≤1nε2(1).P(|X¯−μ|&gt;ε)≤σ2nε2≤1nε2(1). P( | \bar X - \mu| > \varepsilon) \le \frac{\sigma^2}{n\varepsilon^2} \le\frac{1}{n \varepsilon^2} \qquad (1). นอกจากนี้เนื่องจากX¯−μσ/n√X¯−μσ/n\frac{\bar X- \mu}{\sigma/\sqrt{n}}ถูกกระจายแบบ asymptotically เป็นตัวแปรสุ่มมาตรฐานแบบปกติการแจกแจงแบบปกติบางครั้งใช้เพื่อ "สร้าง" ช่วงความมั่นใจโดยประมาณ ในหลายทางเลือกสอบสถิติคำตอบที่ผมได้มีการใช้ประมาณแทนนี้(1)(1)(1)เมื่อใดก็ตามที่n≥30n≥30n \geq 30 30 ฉันมักจะรู้สึกไม่สบายใจกับสิ่งนี้มาก (เกินกว่าที่คุณจะจินตนาการได้) เนื่องจากข้อผิดพลาดการประมาณนั้นไม่ได้ถูกคำนวณปริมาณ ใช้ประมาณปกติมากกว่าทำไม(1)(1)(1) ? ฉันไม่ต้องการใช้กฎกับคนตาบอดอีกเลย มีการอ้างอิงที่ดีที่สามารถสนับสนุนฉันในการปฏิเสธที่จะทำเช่นนั้นและให้ทางเลือกที่เหมาะสมหรือไม่? ( ( 1 )เป็นตัวอย่างของสิ่งที่ฉันพิจารณาทางเลือกที่เหมาะสม)n≥30n≥30n \geq 30(1)(1)(1) ที่นี่ในขณะที่และE [ | X | …

3
จะคำนวณความน่าจะเป็นที่เกี่ยวข้องกับคะแนน Z ขนาดใหญ่อย่างไร้เหตุผลได้อย่างไร
แพคเกจซอฟต์แวร์สำหรับการตรวจจับแรงจูงใจเครือข่ายสามารถให้คะแนน Z สูงมาก (สูงสุดที่ฉันเคยเห็นคือ 600,000+ แต่คะแนน Z มากกว่า 100 นั้นเป็นเรื่องธรรมดา) ฉันวางแผนที่จะแสดงว่าคะแนน Z เหล่านี้เป็นของปลอม คะแนน Z ขนาดใหญ่สอดคล้องกับความน่าจะเป็นที่ต่ำมาก ค่าของความน่าจะเป็นที่เกี่ยวข้องจะได้รับเช่นหน้าแจกวิกิพีเดียตามปกติ (และอาจเป็นตำราสถิติทุกเล่ม) สำหรับคะแนน Z ถึง 6 ดังนั้น ... คำถาม : เราคำนวณฟังก์ชันข้อผิดพลาดได้อย่างไรสำหรับ n มากถึง 1,000,000 พูด?1−erf(n/2–√)1−erf(n/2)1-\mathrm{erf}(n/\sqrt{2}) ฉันโดยเฉพาะอย่างยิ่งหลังจากแพคเกจที่ใช้งานแล้วสำหรับนี้ (ถ้าเป็นไปได้) สิ่งที่ดีที่สุดที่ฉันเคยพบคือ WolframAlpha ซึ่งสามารถคำนวณได้สำหรับ n = 150 ( ที่นี่ )

3
ทฤษฎีการประมาณค่าแบบสากลสำหรับเครือข่ายแบบ Convolutional
ทฤษฎีบทการประมาณแบบสากลเป็นผลลัพธ์ที่มีชื่อเสียงสำหรับเครือข่ายประสาทโดยทั่วไประบุว่าภายใต้สมมติฐานบางฟังก์ชั่นสามารถประมาณได้อย่างสม่ำเสมอโดยเครือข่ายประสาทในความแม่นยำ มีผลลัพธ์ที่คล้ายคลึงกันที่ใช้กับเครือข่ายประสาทเทียมหรือไม่?

1
การประเมินผลของ“ ประมาณปกติ” สำหรับการทดสอบที
ฉันกำลังทดสอบวิธีการที่เท่าเทียมกันโดยใช้การทดสอบ t ของ Welch การแจกแจงพื้นฐานอยู่ไกลจากปกติ (บิดเบือนมากกว่าตัวอย่างในการสนทนาที่เกี่ยวข้องที่นี่ ) ฉันสามารถรับข้อมูลเพิ่มเติมได้ แต่ต้องการวิธีที่มีหลักการในการพิจารณาว่าจะทำเช่นไร มีฮิวริสติกที่ดีสำหรับการประเมินว่าการแจกตัวอย่างเป็นที่ยอมรับหรือไม่? การเบี่ยงเบนใด ๆ จากภาวะปกติที่เกี่ยวข้องกับอะไรมากที่สุด มีวิธีการอื่น ๆ - เช่นอาศัยช่วงความเชื่อมั่นบูตสำหรับสถิติตัวอย่าง - ซึ่งจะทำให้รู้สึกมากขึ้น?

1
การกระจายผลิตภัณฑ์โดยประมาณของ N iid ปกติ? กรณีพิเศษμ≈0
รับ iid X n ≈ N ( μ X , σ 2 X ) , และμ X ≈ 0 , ค้นหา:ยังไม่มีข้อความ≥ 30N≥30N\geq30Xn≈ N( μX, σ2X)Xn≈N(μX,σX2)X_n\approx\mathcal{N}(\mu_X,\sigma_X^2)μX≈ 0μX≈0\mu_X \approx 0 การประมาณการแจกแจงแบบฟอร์มปิดที่แม่นยำของ Yยังไม่มีข้อความ= ∏1ยังไม่มีข้อความXnYN=∏1NXnY_N=\prod\limits_{1}^{N}{X_n} asymptotic ( exponential ?) การประมาณของผลิตภัณฑ์เดียวกัน นี้เป็นกรณีพิเศษของขึ้นคำถามทั่วไปμX≈ 0μX≈0\mu_X \approx 0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.