คำถามติดแท็ก function

2
Logistic Regression จะสร้างเส้นโค้งที่ไม่ใช่หน้าที่ดั้งเดิมได้อย่างไร
ฉันคิดว่าฉันมีความสับสนขั้นพื้นฐานเกี่ยวกับวิธีการทำงานของ Logistic ถดถอย (หรืออาจจะเป็นแค่ฟังก์ชั่นโดยรวม) ฟังก์ชั่น h (x) สร้างเส้นโค้งที่เห็นทางด้านซ้ายของภาพอย่างไร ฉันเห็นว่านี่เป็นพล็อตของสองตัวแปร แต่แล้วทั้งสองตัวแปร (x1 & x2) ก็เป็นอาร์กิวเมนต์ของฟังก์ชันเอง ฉันรู้ว่าฟังก์ชั่นมาตรฐานของแผนที่หนึ่งตัวแปรไปยังหนึ่งเอาท์พุท แต่ฟังก์ชั่นนี้ชัดเจนไม่ได้ทำอย่างนั้น - และฉันไม่แน่ใจว่าทำไม สัญชาตญาณของฉันคือเส้นโค้งสีน้ำเงิน / ชมพูไม่ได้พล็อตบนกราฟนี้จริงๆ แต่เป็นการแสดง (วงกลมและ X) ที่ได้รับการแมปกับค่าในมิติถัดไป (3) ของกราฟ นี่คือเหตุผลที่ผิดพลาดและฉันเพิ่งจะพลาดบางสิ่งบางอย่าง? ขอบคุณสำหรับความเข้าใจ / ปรีชาญาณ

3
จะหาโหมดของฟังก์ชันความหนาแน่นของความน่าจะเป็นได้อย่างไร
ได้รับแรงบันดาลใจจากคำถามอื่น ๆ ของฉันฉันอยากถามว่าโหมดค้นหาฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) ของฟังก์ชันอย่างไรฉ( x )f(x)f(x) มีขั้นตอน "ตำราทำอาหาร" สำหรับสิ่งนี้หรือไม่? เห็นได้ชัดว่างานนี้เป็นเรื่องยากกว่าที่ดูเหมือนในตอนแรก

1
พิสูจน์ว่าถ้าช่วงเวลาที่สูงกว่ามีอยู่ช่วงเวลาที่ต่ำกว่าก็มีอยู่
rrrขณะ -th ของตัวแปรสุ่มXXXคือแน่นอนถ้า E(|Xr|)&lt;∞E(|Xr|)&lt;∞ \mathbb E(|X^r|)< \infty ฉันพยายามที่จะแสดงให้เห็นว่าสำหรับจำนวนเต็มบวกs&lt;rs&lt;rs<rแล้ว ช่วงเวลาsss -th E[|Xs|]E[|Xs|]\mathbb E[|X^s|]มีขอบเขต จำกัด

3
เครือข่ายประสาทสามารถเรียนรู้การทำงานและการทำงานของมันได้หรือไม่
ฉันเข้าใจว่าเครือข่ายนิวรัล (NNs) สามารถพิจารณาได้ว่าเป็นผู้ประมาณสากลสำหรับฟังก์ชั่นและอนุพันธ์ภายใต้สมมติฐานบางประการ (ทั้งเครือข่ายและฟังก์ชั่นโดยประมาณ) ในความเป็นจริงฉันได้ทำการทดสอบจำนวนมากเกี่ยวกับฟังก์ชั่นที่เรียบง่าย แต่ไม่สำคัญ (เช่นพหุนาม) และดูเหมือนว่าฉันสามารถประมาณพวกเขาและอนุพันธ์อันดับแรกได้เป็นอย่างดี (ตัวอย่างแสดงไว้ด้านล่าง) อย่างไรก็ตามสิ่งที่ไม่ชัดเจนสำหรับฉันคือว่าทฤษฎีบทที่นำไปสู่การขยาย (หรืออาจจะขยาย) ไปยัง functionals และอนุพันธ์การทำงานของพวกเขา ลองพิจารณาตัวอย่างเช่นการใช้งาน: F[f(x)]=∫badx f(x)g(x)F[f(x)]=∫abdx f(x)g(x)\begin{equation} F[f(x)] = \int_a^b dx ~ f(x) g(x) \end{equation} ด้วยการใช้งานอนุพันธ์: δF[f(x)]δf(x)=g(x)δF[f(x)]δf(x)=g(x)\begin{equation} \frac{\delta F[f(x)]}{\delta f(x)} = g(x) \end{equation} ที่f(x)f(x)f(x)ขึ้นอยู่ทั้งหมดและไม่ใช่นิดบนg(x)g(x)g(x)) NN สามารถเรียนรู้การทำแผนที่ด้านบนและอนุพันธ์ของหน้าที่ได้หรือไม่ โดยเฉพาะอย่างยิ่งหากมีใครแยกโดเมนxxxมากกว่า[a,b][a,b][a,b]และให้f(x)f(x)f(x)(ที่จุดที่ไม่น่าสนใจ) เป็นอินพุตและF[f(x)]F[f(x)]F[f(x)]ในฐานะที่เป็นเอาท์พุท NN สามารถเรียนรู้การทำแผนที่นี้อย่างถูกต้อง (อย่างน้อยในทางทฤษฎี)? ถ้าเป็นเช่นนั้นมันสามารถเรียนรู้อนุพันธ์ของการทำแผนที่ได้หรือไม่ ฉันได้ทำการทดสอบหลายครั้งและดูเหมือนว่า NN อาจเรียนรู้การแมปF[f(x)]F[f(x)]F[f(x)]ได้ในระดับหนึ่ง อย่างไรก็ตามในขณะที่ความถูกต้องของการทำแผนที่นี้ก็โอเค แต่ก็ไม่ได้ยอดเยี่ยม และที่น่าเป็นห่วงก็คืออนุพันธ์ของฟังก์ชันที่คำนวณได้นั้นเป็นขยะที่สมบูรณ์ (ทั้งสองอย่างนี้อาจเกี่ยวข้องกับปัญหาในการฝึกอบรมและอื่น …

2
จะประมาณความแม่นยำของอินทิกรัลได้อย่างไร?
สถานการณ์ที่พบบ่อยมากในคอมพิวเตอร์กราฟฟิคคือสีของบางพิกเซลเท่ากับส่วนที่สำคัญของฟังก์ชั่นที่มีมูลค่าจริง บ่อยครั้งที่ฟังก์ชั่นนั้นซับซ้อนเกินกว่าที่จะแก้ปัญหาเชิงวิเคราะห์ดังนั้นเราจึงเหลือการประมาณเชิงตัวเลข แต่ฟังก์ชั่นมักจะมีราคาแพงมากในการคำนวณดังนั้นเราจึงถูก จำกัด อย่างมากในจำนวนตัวอย่างที่เราสามารถคำนวณได้ (เช่นคุณไม่สามารถตัดสินใจที่จะรับตัวอย่างหนึ่งล้านตัวอย่างและทิ้งไว้ที่นี่) โดยทั่วไปแล้วสิ่งที่คุณต้องการทำคือประเมินฟังก์ชันที่จุดที่เลือกแบบสุ่มจนกระทั่งอินทิกรัลประมาณกลายเป็น "แม่นยำเพียงพอ" ซึ่งนำมาสู่คำถามจริงของฉัน: คุณประเมิน "ความถูกต้อง" ของอินทิกรัลอย่างไร? โดยเฉพาะอย่างยิ่งเรามีซึ่งดำเนินการโดยอัลกอริทึมคอมพิวเตอร์ที่ซับซ้อนและช้า เราต้องการประเมินf:R→Rf:R→Rf : \mathbb{R} \rightarrow \mathbb{R} k=∫baf(x) dxk=∫abf(x) dxk = \int_a^b f(x) \ dx เราสามารถคำนวณสำหรับเราปรารถนาได้ แต่มันมีราคาแพง ดังนั้นเราต้องการเลือกค่าหลายค่าแบบสุ่มและหยุดเมื่อค่าประมาณของกลายเป็นที่ยอมรับได้อย่างแม่นยำ แน่นอนว่าในการทำเช่นนี้เราจำเป็นต้องทราบว่าการประมาณการในปัจจุบันนั้นแม่นยำเพียงใดx x kf(x)f(x)f(x)xxxxxxkkk ฉันไม่แน่ใจด้วยซ้ำว่าเครื่องมือทางสถิติใดที่เหมาะสำหรับปัญหาประเภทนี้ แต่สำหรับฉันแล้วดูเหมือนว่าถ้าเราไม่รู้อะไรเกี่ยวกับอย่างแน่นอนปัญหาก็แก้ไม่ได้ ตัวอย่างเช่นถ้าคุณคำนวณหนึ่งพันครั้งและมันก็เป็นศูนย์เสมออินทิกรัลที่ประมาณไว้ของคุณจะเป็นศูนย์ แต่ไม่รู้อะไรเลยเกี่ยวกับf ( x ) fffff(x)f(x)f(x)fffมันยังคงเป็นไปได้ที่ทุกที่ยกเว้นจุดที่คุณสุ่มตัวอย่างดังนั้นการประเมินของคุณจึงผิดอย่างมาก!f(x)=1,000,000f(x)=1,000,000f(x) = 1,000,000 บางทีคำถามของฉันควรเริ่มด้วย"เราต้องรู้อะไรเกี่ยวกับเพื่อให้สามารถประเมินความถูกต้องของอินทิกรัลของเราได้fff ?" ตัวอย่างเช่นเรามักรู้ว่าเป็นไปไม่ได้ที่จะเป็นลบซึ่งดูเหมือนจะเป็นข้อเท็จจริงที่เกี่ยวข้อง ...fff แก้ไข:ตกลงดังนั้นสิ่งนี้ดูเหมือนจะสร้างคำตอบมากมายซึ่งเป็นสิ่งที่ดี แทนที่จะตอบกลับเป็นรายบุคคลฉันจะพยายามเติมภูมิหลังเพิ่มเติมที่นี่ เมื่อฉันบอกว่าเรารู้ "ไม่มีอะไร" …

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
การพิสูจน์ลำดับลดลง (สนับสนุนโดยการพล็อตเป็นจำนวนมาก)
คำถามมากมายที่ฉันโพสต์ใน SE ในเดือนที่ผ่านมามีเป้าหมายเพื่อช่วยฉันแก้ปัญหานี้โดยเฉพาะ ตอบคำถามทุกข้อแล้ว แต่ฉันก็ยังหาวิธีแก้ไม่ได้ ดังนั้นฉันคิดว่าฉันควรถามปัญหาที่ฉันพยายามแก้ไขโดยตรง ให้โดยที่ , , (จำนวนเต็ม) และทุกตัวเป็น cdf ส่วนเกิน 1)Xn∼FnXn∼FnX_n \sim F_nFn=(1−(1−Fn−1)c)cFn=(1−(1−Fn−1)c)cF_n = (1-(1-F_{n-1})^c)^cF0=xF0=xF_0 = xc≥2c≥2c\geq 2FnFnF_n(0,1)(0,1)(0,1) ฉันต้องการพิสูจน์ว่าลดลงด้วยสำหรับทุกc (หรือแม้กระทั่งสำหรับcใด ๆ)! ฉันสามารถแสดงให้เห็นว่าF_nแปรสภาพเป็นมวล Dirac ที่ทางออกที่ไม่ซ้ำกับ x_c = (1- (1-x) ^ c) ^ c) สำหรับc = 2 , x_2 = (3- \ sqrt {5}) / 2 \ ประมาณ 0.38 …

2
ข้อดีของการเข้าถึงปัญหาโดยกำหนดฟังก์ชันต้นทุนที่ปรับให้เหมาะสมทั่วโลก
นี่เป็นคำถามที่ค่อนข้างทั่วไป (นั่นคือไม่เฉพาะเจาะจงกับสถิติ) แต่ฉันได้สังเกตเห็นแนวโน้มในการเรียนรู้ของเครื่องและวรรณกรรมทางสถิติที่ผู้เขียนต้องการทำตามวิธีการต่อไปนี้: วิธีที่ 1 : หาวิธีแก้ไขปัญหาที่เกิดขึ้นจริงโดยกำหนดฟังก์ชันต้นทุนที่เป็นไปได้ (เช่นจากจุดยืนการคำนวณ) เพื่อค้นหาโซลูชันที่เหมาะสมที่สุดทั่วโลก (เช่นโดยกำหนดฟังก์ชันต้นทุนนูน) ค่อนข้างมากกว่า: วิธีที่ 2 : หาวิธีแก้ไขปัญหาเดียวกันโดยกำหนดฟังก์ชั่นต้นทุนที่เราอาจไม่สามารถหาทางออกที่ดีที่สุดทั่วโลก (เช่นเราจะได้รับทางออกที่ดีที่สุดในท้องถิ่นเท่านั้น) โปรดทราบว่าการพูดอย่างจริงจังถึงปัญหาทั้งสองนั้นแตกต่างกัน สมมติฐานคือเราสามารถหาทางออกที่ดีที่สุดทั่วโลกสำหรับคนแรก แต่ไม่ใช่สำหรับคนที่สอง ข้อควรพิจารณาอื่น ๆ นอกเหนือจาก (เช่นความเร็วความง่ายในการใช้งาน ฯลฯ ) ฉันกำลังมองหา: คำอธิบายของแนวโน้มนี้ (เช่นข้อโต้แย้งทางคณิตศาสตร์หรือประวัติศาสตร์) ประโยชน์ที่ได้รับ (ในทางปฏิบัติและ / หรือเชิงทฤษฎี) สำหรับการปฏิบัติตามแนวทางที่ 1 แทน 2 เมื่อแก้ปัญหาในทางปฏิบัติ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.