คำถามติดแท็ก pdf

ฟังก์ชันความหนาแน่นน่าจะเป็น (PDF) ของตัวแปรสุ่มแบบต่อเนื่องให้ความน่าจะเป็นสัมพัทธ์สำหรับแต่ละค่าที่เป็นไปได้ ใช้แท็กนี้สำหรับฟังก์ชันมวลความน่าจะเป็นแบบแยก (PMF) เช่นกัน

1
การหาฟังก์ชั่นความหนาแน่นในท้องถิ่นโดยใช้เส้นโค้ง
ฉันพยายามหาค่าสูงสุดในพื้นที่สำหรับฟังก์ชันความหนาแน่นของความน่าจะเป็น (พบได้โดยใช้densityวิธีของ R ) ฉันไม่สามารถใช้วิธี "ดูรอบ ๆ เพื่อนบ้าน" แบบง่าย ๆ (ที่จุดหนึ่งมองไปรอบ ๆ เพื่อดูว่าเป็นระดับสูงสุดในพื้นที่ที่เกี่ยวกับเพื่อนบ้าน) หรือไม่เนื่องจากมีข้อมูลจำนวนมาก นอกจากนี้ดูเหมือนว่ามีประสิทธิภาพและทั่วไปมากกว่าที่จะใช้การแก้ไข Spline แล้วค้นหารากของอนุพันธ์อันดับ 1 เมื่อเทียบกับการสร้าง "มองไปรอบ ๆ เพื่อนบ้าน" ด้วยการยอมรับข้อบกพร่องและพารามิเตอร์อื่น ๆ ดังนั้นคำถามของฉัน: เมื่อพิจารณาจากฟังก์ชันsplinefunจะหาค่าสูงสุดในท้องถิ่นได้อย่างไร มีวิธีง่าย ๆ / เป็นมาตรฐานในการค้นหาอนุพันธ์ของฟังก์ชันที่ส่งคืนโดยใช้ splinefunหรือไม่? มีวิธีที่ดีกว่า / มาตรฐานในการหาค่าสูงสุดในท้องถิ่นของฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่? สำหรับการอ้างอิงด้านล่างเป็นพล็อตของฟังก์ชั่นความหนาแน่นของฉัน ฟังก์ชั่นความหนาแน่นอื่น ๆ ที่ฉันทำงานด้วยนั้นคล้ายกันในรูปแบบ ฉันควรจะบอกว่าฉันใหม่กับ R แต่ไม่ใช่เรื่องใหม่สำหรับการเขียนโปรแกรมดังนั้นอาจมีไลบรารีหรือแพ็คเกจมาตรฐานสำหรับการบรรลุสิ่งที่ฉันต้องการ ขอบคุณสำหรับความช่วยเหลือของคุณ!!
15 r  pdf  splines  maximum 

2
Wolfram Mathworld ทำผิดที่อธิบายการแจกแจงความน่าจะเป็นแบบแยกโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่?
โดยปกติการแจกแจงความน่าจะเป็นเหนือตัวแปรที่ไม่ต่อเนื่องนั้นถูกอธิบายโดยใช้ฟังก์ชันความน่าจะเป็นมวล (PMF): เมื่อทำงานกับตัวแปรสุ่มต่อเนื่องเราจะอธิบายการแจกแจงความน่าจะเป็นโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) แทนที่จะเป็นฟังก์ชันมวลความน่าจะเป็น - การเรียนรู้อย่างลึกซึ้งโดย Goodfellow, Bengio และ Courville อย่างไรก็ตามWolfram Mathworldใช้ PDF เพื่ออธิบายการแจกแจงความน่าจะเป็นผ่านตัวแปรที่ไม่ต่อเนื่อง: นี่เป็นความผิดพลาดหรือไม่? หรือมันไม่สำคัญอะไร

3
วิธีการคำนวณการทับซ้อนระหว่างความหนาแน่นของความน่าจะเป็นเชิงประจักษ์
ฉันกำลังมองหาวิธีการคำนวณพื้นที่ทับซ้อนระหว่างการประมาณความหนาแน่นเคอร์เนลสองตัวใน R เป็นการวัดความคล้ายคลึงกันระหว่างสองตัวอย่าง เพื่อชี้แจงในตัวอย่างต่อไปนี้ฉันจะต้องหาปริมาณของพื้นที่ที่ทับซ้อนกันของสีม่วง: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) + geom_density(alpha=.4, color=NA) มีการอภิปรายคำถามที่คล้ายกันที่นี่ความแตกต่างที่ฉันต้องทำสำหรับข้อมูลเชิงประจักษ์โดยพลการมากกว่าการแจกแจงปกติที่กำหนดไว้ล่วงหน้า overlapแพคเกจที่อยู่คำถามนี้ แต่เห็นได้ชัดเฉพาะข้อมูลการประทับเวลาซึ่งไม่ทำงานสำหรับฉัน ดัชนี Bray-Curtis (ตามการนำไปใช้ในฟังก์ชั่นveganของบรรจุภัณฑ์vegdist(method="bray")) ก็มีความเกี่ยวข้องเช่นกัน แต่สำหรับข้อมูลที่แตกต่างกันบ้าง ฉันสนใจทั้งวิธีการทางทฤษฎีและฟังก์ชัน R ที่ฉันอาจใช้เพื่อนำไปใช้

1
มีแบนด์วิดธ์ที่เหมาะสมที่สุดสำหรับการประมาณความหนาแน่นเคอร์เนลของอนุพันธ์หรือไม่?
ฉันต้องการประเมินฟังก์ชันความหนาแน่นตามชุดการสังเกตโดยใช้ตัวประมาณความหนาแน่นของเคอร์เนล จากการสังเกตเดียวกันฉันต้องประเมินอนุพันธ์อันดับหนึ่งและสองของความหนาแน่นโดยใช้อนุพันธ์ของเครื่องประมาณความหนาแน่นเคอร์เนล แบนด์วิดท์จะมีผลอย่างมากจากผลลัพธ์สุดท้าย ก่อนอื่นฉันรู้ว่ามีฟังก์ชั่น R สองตัวที่ให้แบนด์วิดท์ของ KDE ฉันไม่แน่ใจว่าจะเลือกอันไหนมากกว่า ใครช่วยแนะนำหนึ่งในฟังก์ชั่น R เหล่านี้สำหรับแบนด์วิดธ์ของ KDE ได้หรือไม่? ประการที่สองสำหรับอนุพันธ์ของ KDE ฉันควรเลือกแบนด์วิดธ์เดียวกันหรือไม่

3
วิธีที่ดีที่สุดในการใส่ฮิสโตแกรมสองตัวในระดับเดียวกัน?
สมมติว่าฉันมีการแจกแจงสองแบบที่ฉันต้องการเปรียบเทียบในรายละเอียดนั่นคือในวิธีที่ทำให้รูปร่างขนาดและการเปลี่ยนแปลงมองเห็นได้ง่าย วิธีหนึ่งที่ดีในการทำเช่นนี้คือการพล็อตฮิสโตแกรมสำหรับการแจกแจงแต่ละครั้งวางไว้ในระดับ X ที่เหมือนกัน เมื่อทำเช่นนี้จะต้องทำอย่างไรให้เกิดความผิดพลาด? ฮิสโทแกรมทั้งสองควรใช้ขอบเขตของช่องเก็บเดียวกันแม้ว่าการกระจายครั้งเดียวจะกระจายมากกว่าที่อื่น ๆ อย่างเช่นในภาพที่ 1 ด้านล่าง? ควรทำการแยกกันอย่างอิสระสำหรับฮิสโตแกรมแต่ละชิ้นก่อนซูมเช่นเดียวกับในภาพที่ 2 ด้านล่าง? เรื่องนี้มีกฎง่ายๆหรือไม่?

3
จะหาโหมดของฟังก์ชันความหนาแน่นของความน่าจะเป็นได้อย่างไร
ได้รับแรงบันดาลใจจากคำถามอื่น ๆ ของฉันฉันอยากถามว่าโหมดค้นหาฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) ของฟังก์ชันอย่างไรฉ( x )f(x)f(x) มีขั้นตอน "ตำราทำอาหาร" สำหรับสิ่งนี้หรือไม่? เห็นได้ชัดว่างานนี้เป็นเรื่องยากกว่าที่ดูเหมือนในตอนแรก

3
การประมาณความหนาแน่นมีประโยชน์ที่ไหน?
หลังจากผ่านการทดสอบทางคณิตศาสตร์สั้น ๆ เล็กน้อยฉันคิดว่าฉันมีสัญชาตญาณเล็กน้อยในการประมาณความหนาแน่นของเคอร์เนล แต่ฉันก็ทราบด้วยว่าการประมาณความหนาแน่นหลายตัวแปรสำหรับตัวแปรมากกว่าสามตัวอาจไม่ใช่ความคิดที่ดีในแง่ของคุณสมบัติทางสถิติของตัวประมาณค่า ดังนั้นในสถานการณ์ประเภทใดที่ฉันควรจะประเมินพูดความหนาแน่นของตัวแปรที่แยกจากกันโดยใช้วิธีการที่ไม่ใช้พารามิเตอร์? มันมีค่าพอที่จะเริ่มกังวลเกี่ยวกับการประมาณค่าสำหรับตัวแปรมากกว่าสองตัวหรือไม่? หากคุณสามารถชี้ไปที่ลิงค์ที่มีประโยชน์เกี่ยวกับการประยุกต์ใช้การประมาณค่าความหนาแน่นหลายตัวแปรนั้นจะดีมาก

1
เหตุใด MLE จึงสมเหตุสมผลเนื่องจากความน่าจะเป็นของตัวอย่างแต่ละรายการคือ 0
นี่เป็นความคิดแปลก ๆ ที่ฉันมีในขณะที่ตรวจสอบสถิติเก่า ๆ และด้วยเหตุผลบางอย่างที่ฉันไม่สามารถนึกถึงคำตอบได้ PDF แบบต่อเนื่องบอกความหนาแน่นของการสังเกตค่าในช่วงที่กำหนด กล่าวคือถ้ายกตัวอย่างเช่นความน่าจะเป็นที่เกิดขึ้นระหว่างและคือโดยที่คือ ความหนาแน่นของมาตรฐานปกติX∼ N( μ , σ2)X∼N(μ,σ2)X \sim N(\mu,\sigma^2)aaaขbb∫ขaϕ ( x ) dx∫abϕ(x)dx\int_a^{b}\phi(x)dxφϕ\phi เมื่อเราคิดถึงการประมาณค่าพารามิเตอร์ของ MLE ให้พูดถึงเราเขียนความหนาแน่นร่วมของ, พูดว่า , ตัวแปรสุ่มและแยกความแตกต่างของ log-likelihood wrt เป็น , ตั้งค่าเท่ากับ 0 และแก้ สำหรับ\การตีความมักจะได้รับคือ "ให้ข้อมูลซึ่งพารามิเตอร์ที่ทำให้ฟังก์ชั่นความหนาแน่นนี้เป็นไปได้มากที่สุด"μμ\muยังไม่มีข้อความNNX1. . Xยังไม่มีข้อความX1..XNX_1 .. X_Nμμ\muμμ\mu ส่วนที่กำลังดักฟังฉันคือ: เรามีความหนาแน่นของ rv และความน่าจะเป็นที่เราได้รับการกล่าวโดยเฉพาะตัวอย่างของเราคือ 0 อย่างแน่นอนทำไมมันถึงสมเหตุสมผลที่จะเพิ่มความหนาแน่นของข้อต่อให้สูงสุด ตั้งแต่นั้นมาความน่าจะเป็นที่จะสังเกตตัวอย่างจริงของเราคือ 0)?ยังไม่มีข้อความNN การหาเหตุผลเข้าข้างตนเองเดียวที่ฉันสามารถทำได้คือเราต้องการทำให้ PDF เป็นจุดสูงสุดเท่าที่เป็นไปได้รอบตัวอย่างที่เราสังเกตเพื่อให้อินทิกรัลในภูมิภาค (และความน่าจะเป็นของการสังเกตสิ่งในภูมิภาคนี้) …

3
ดังนั้นการกระจายเบต้า
เนื่องจากฉันแน่ใจว่าทุกคนที่นี่รู้อยู่แล้ว PDF ของการแจกแจงเบต้าX∼B(a,b)X∼B(a,b)X \sim B(a,b)มอบให้โดย f(x)=1B(a,b)xa−1(1−x)b−1f(x)=1B(a,b)xa−1(1−x)b−1f(x) = \frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1} ฉันตามล่าหาสถานที่เพื่ออธิบายต้นกำเนิดของสูตรนี้ แต่ฉันหามันไม่เจอ ทุกบทความที่ฉันพบในการแจกแจงเบต้าดูเหมือนว่าจะให้สูตรนี้แสดงให้เห็นถึงรูปร่างบางส่วนของมันแล้วตรงไปยังการอภิปรายช่วงเวลาและต่อจากที่นั่น ฉันไม่ชอบใช้สูตรทางคณิตศาสตร์ที่ไม่สามารถหามาอธิบายได้ สำหรับดิสทริบิวชันอื่น ๆ (เช่นแกมม่าหรือทวินาม) มีการได้มาอย่างชัดเจนที่ฉันสามารถเรียนรู้และใช้งานได้ แต่ฉันไม่พบอะไรแบบนั้นสำหรับการแจกแจงแบบเบต้า ดังนั้นคำถามของฉันคือ: ต้นกำเนิดของสูตรนี้คืออะไร? มันจะมาจากหลักการแรกในบริบทใดก็ตามที่ถูกพัฒนามาตั้งแต่แรก? [เพื่อความกระจ่างแจ้งฉันไม่ได้ถามเกี่ยวกับวิธีการใช้การแจกแจงแบบเบต้าในสถิติแบบเบย์หรือความหมายในทางปฏิบัติในทางปฏิบัติ (ฉันได้อ่านตัวอย่างเบสบอล) ฉันแค่อยากรู้วิธีการหา PDF มีคำถามก่อนหน้านี้ที่ถามสิ่งที่คล้ายกัน แต่มันถูกทำเครื่องหมาย (ฉันคิดว่าไม่ถูกต้อง) เป็นคำถามซ้ำที่ไม่ได้แก้ปัญหาดังนั้นฉันจึงไม่สามารถค้นหาความช่วยเหลือได้ที่นี่] แก้ไข 2017-05-06: ขอบคุณทุกคนสำหรับคำถาม ฉันคิดว่าคำอธิบายที่ดีของสิ่งที่ฉันต้องการมาจากคำตอบอย่างใดอย่างหนึ่งที่ฉันได้รับเมื่อฉันถามอาจารย์ผู้สอนหลักสูตรนี้: "ฉันเดาว่าผู้คนจะได้รับความหนาแน่นปกติเป็นขีด จำกัด ของผลรวมของ n สิ่งหารด้วย sqrt (n) และคุณสามารถหาความหนาแน่นของปัวซองได้จากแนวคิดของเหตุการณ์ที่เกิดขึ้นในอัตราคงที่เช่นเดียวกันเพื่อให้ได้ ความหนาแน่นของเบต้าคุณจะต้องมีความคิดบางอย่างเกี่ยวกับสิ่งที่ทำให้การกระจายตัวของเบต้าเป็นอิสระจากและมีเหตุผลก่อนที่จะมีความหนาแน่น " ดังนั้นความคิด "ab initio" ในความคิดเห็นน่าจะใกล้เคียงกับสิ่งที่ฉันกำลังมองหา ฉันไม่ใช่นักคณิตศาสตร์ แต่ฉันรู้สึกสะดวกสบายที่สุดเมื่อใช้คณิตศาสตร์ที่ฉันสามารถหามาได้ หากต้นกำเนิดนั้นสูงเกินกว่าที่ฉันจะจัดการได้ดังนั้นไม่ว่าจะเป็น แต่ถ้าไม่ใช่ฉันก็อยากจะเข้าใจพวกเขา

3
ผลรวมของตัวแปรสุ่มแกมมาอิสระสองตัว
จากบทความของ Wikipedia เกี่ยวกับการกระจาย Gamma : ถ้าและโดยที่และเป็นตัวแปรสุ่มอิสระแล้วtheta)Y ∼ G a m m a ( b , θ )X∼Gamma(a,θ)X∼Gamma(a,θ)X\sim\mathrm{Gamma}(a,\theta)Y∼Gamma(b,θ)Y∼Gamma(b,θ)Y\sim\mathrm{Gamma}(b,\theta)Y X + Y ∼ G a m m a ( a + b , θ )XXXYYYX+ Y∼ G a m m a ( a + b , θ )X+Y∼Gamma(a+b,θ)X+Y\sim \mathrm{Gamma}(a+b, \theta) แต่ฉันไม่เห็นข้อพิสูจน์ใด ๆ …

1
การได้รับ Negentropy ติดขัด
ดังนั้นคำถามนี้มีส่วนเกี่ยวข้องบ้าง แต่ฉันพยายามอย่างพยายามทำให้ตรงไปตรงมาที่สุด เป้าหมาย:เรื่องสั้นสั้น ๆ มีการกำเนิดของการปฏิเสธที่ไม่เกี่ยวข้องกับการสั่งซื้อที่สูงขึ้นและฉันพยายามที่จะเข้าใจว่ามันได้รับมาอย่างไร พื้นหลัง: (ฉันเข้าใจทั้งหมดนี้) ฉันศึกษาด้วยตนเองหนังสือ'การวิเคราะห์องค์ประกอบอิสระ'พบได้ที่นี่ (คำถามนี้มาจากหัวข้อ 5.6 ในกรณีที่คุณมีหนังสือ - 'การประมาณค่าเอนโทรปีของฟังก์ชันที่ไม่ใช่พหุนาม') เรามีซึ่งเป็นตัวแปรสุ่มและเราต้องการประมาณค่าลบจากการสังเกตบางอย่างที่เรามี รูปแบบไฟล์ PDF ของจะได้รับโดยซีตา) Negentropy เป็นเพียงความแตกต่างระหว่างเอนโทรปีค่าของตัวแปรสุ่มมาตรฐานเสียนและเอนโทรปีค่าของxเอนโทรปีของดิฟเฟอเรนเชียลได้รับจากเช่นนั้น:xxxxxxpx(ζ)px(ζ)p_x(\zeta)xxxHHH H(x)=−∫∞−∞px(ζ)log(px(ζ))dζH(x)=−∫−∞∞px(ζ)log(px(ζ))dζ H(x) = -\int_{-\infty}^{\infty} p_x(\zeta) \: log(p_x(\zeta)) \: d\zeta และดังนั้นการได้รับการปฏิเสธคือ J(x)=H(v)−H(x)J(x)=H(v)−H(x)J(x) = H(v) - H(x) ที่เป็นมาตรฐาน RV เสียนกับรูปแบบไฟล์ PDF ได้รับจากซีตา)vvvϕ(ζ)ϕ(ζ)\phi(\zeta) ตอนนี้ซึ่งเป็นส่วนหนึ่งของวิธีการใหม่นี้หนังสือของฉันได้รับการประมาณ PDF ของซึ่งได้รับจาก:xxx px(ζ)=ϕ(ζ)[1+∑iciFi(ζ)]px(ζ)=ϕ(ζ)[1+∑iciFi(ζ)] p_x(\zeta) = \phi(\zeta) [1 + \sum_{i} c_i …

1
Pdf ของกำลังสองของตัวแปรสุ่มปกติมาตรฐาน [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน4 ปีที่แล้ว ฉันมีปัญหานี้ที่ฉันจะต้องพบกับรูปแบบไฟล์ PDF ของ 2 ทั้งหมดที่ผมรู้ก็คือว่ามีการกระจาย(0,1) สิ่งที่ชนิดของการกระจายคือ ? เช่นเดียวกับ ? ฉันจะหา pdf ได้อย่างไร X N ( 0 , 1 ) Y = X 2 XY=X2Y=X2Y = X^2XXXN(0,1)N(0,1)N(0,1)Y=X2Y=X2Y = X^2XXX

3
สูตรฟอร์มปิดสำหรับฟังก์ชั่นการกระจายรวมถึงความเบ้และความโด่ง
มีสูตรเช่นนี้หรือไม่? มีชุดของข้อมูลที่ทราบค่าเฉลี่ยความแปรปรวนความเบ้และความโด่งหรือสามารถวัดได้มีสูตรเดียวที่สามารถใช้ในการคำนวณความหนาแน่นของความน่าจะเป็นของค่าที่สันนิษฐานว่ามาจากข้อมูลข้างต้นหรือไม่

5
วิธีรับขอบเขตของวงรีจากข้อมูลที่กระจายแบบปกติ bivariate
ฉันมีข้อมูลที่ดูเหมือนว่า: ฉันพยายามที่จะใช้การแจกแจงแบบปกติ (การประมาณความหนาแน่นของเคอร์เนลทำงานได้ดีขึ้น แต่ฉันไม่ต้องการความแม่นยำที่ยอดเยี่ยมเช่นนี้) และใช้งานได้ค่อนข้างดี พล็อตความหนาแน่นทำให้วงรี ฉันต้องใช้ฟังก์ชันวงรีนั้นเพื่อตัดสินใจว่าจุดหนึ่งอยู่ในขอบเขตของวงรีหรือไม่ ทำอย่างไร ยินดีต้อนรับรหัส R หรือ Mathematica
13 r  regression  pdf  bivariate 

1
วิธีการตีความความสูงของพล็อตความหนาแน่น
ฉันจะตีความความสูงของแปลงความหนาแน่นได้อย่างไร: ตัวอย่างเช่นในพล็อตข้างต้นจุดสูงสุดอยู่ที่ประมาณ 0.07 ที่ x = 18 ฉันสามารถสรุปได้ว่าประมาณ 7% ของค่าประมาณ 18? ฉันจะเจาะจงมากกว่านี้ได้ไหม? นอกจากนี้ยังมีจุดสูงสุดที่สองที่ x = 30 ที่มีความสูง 0.02 นั่นหมายความว่าประมาณ 2% ของค่าประมาณ 30? แก้ไข: คำถามเกี่ยวกับค่าการแจกแจงความน่าจะเป็นที่เกิน 1 นั้นเป็นไปได้ไหมกล่าวถึงค่าความน่าจะเป็น> 1 ซึ่งไม่ใช่ปัญหาเลย นอกจากนี้ยังกล่าวถึงความสัมพันธ์ที่ไร้เดียงสากับ Bayes classfier ซึ่งไม่ใช่จุดที่นี่ ฉันต้องการมีการอนุมานเชิงตัวเลขที่เราสามารถวาดจากเส้นโค้งความหนาแน่นเช่นในภาษาที่เรียบง่าย มีการกล่าวถึงบทบาทของพื้นที่ภายใต้เส้นโค้ง แต่คำถามของฉันคือสิ่งที่เราสามารถอนุมานได้โดยเฉพาะเกี่ยวกับชุดค่าผสม x และ y เฉพาะที่มีอยู่บนเส้นโค้ง ตัวอย่างเช่นเราจะเชื่อมโยง x = 30 และ y = 0.02 บนกราฟนี้ได้อย่างไร เราสามารถเขียนข้อความอะไรเกี่ยวกับความสัมพันธ์ระหว่าง 30 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.