คำถามติดแท็ก decision-theory

27
เจ้าหญิงนิทรา Beauty Paradox
สถานการณ์ นักวิจัยบางคนต้องการให้คุณนอนหลับ ขึ้นอยู่กับการโยนเหรียญที่เป็นความลับพวกเขาจะปลุกคุณชั่วครู่หนึ่ง (หัว) หรือสองครั้ง (ก้อย) หลังจากตื่นแต่ละครั้งพวกเขาจะนำคุณกลับไปนอนกับยาที่ทำให้คุณลืมการตื่น เมื่อคุณตื่นขึ้นมาคุณควรเชื่อว่าผลลัพธ์ของการโยนเหรียญเป็นระดับใด (โอเคบางทีคุณอาจไม่ต้องการเป็นหัวข้อของการทดลองนี้สมมติว่าเจ้าหญิงนิทรา (SB) เห็นด้วย (โดยได้รับการอนุมัติอย่างเต็มที่จากคณะกรรมการพิจารณาสถาบันของ Magic Kingdom) เธอกำลังจะไปที่ นอนหลับเป็นเวลาหนึ่งร้อยปีแล้วอีกหนึ่งหรือสองวันจะเป็นอย่างไร?) [รายละเอียดภาพประกอบของMaxfield Parrish ] คุณเป็น Halfer หรือ Thirder หรือไม่? ตำแหน่ง Halfer Simple! เหรียญนั้นยุติธรรม - และ SB รู้ดี - ดังนั้นเธอควรเชื่อว่ามีโอกาสครึ่งหัว ตำแหน่ง Thirder การทดลองนี้ถูกทำซ้ำหลายครั้งจากนั้นเหรียญจะเป็นหัวเพียงหนึ่งในสามของเวลาที่ SB ถูกปลุกขึ้นมา ความน่าจะเป็นของเธอสำหรับหัวจะเป็นหนึ่งในสาม Thirders มีปัญหา ส่วนใหญ่ แต่ไม่ใช่ทั้งหมดคนที่เขียนเกี่ยวกับเรื่องนี้เป็นเรื่องที่สิบสาม แต่: ในเย็นวันอาทิตย์ก่อนที่ SB จะหลับเธอจะต้องเชื่อว่าโอกาสของการเป็นหัวหน้านั้นเป็นครึ่งเดียวนั่นคือความหมายของการเป็นเหรียญที่ยุติธรรม เมื่อใดก็ตามที่ SB …

7
ต้องจ่ายเท่าไหร่ ปัญหาในทางปฏิบัติ
นี่ไม่ใช่คำถามทำงานที่บ้าน แต่ปัญหาที่แท้จริงของ บริษัท ของเรา เมื่อเร็ว ๆ นี้ (2 วันที่ผ่านมา) เราสั่งให้ผลิตฉลากผลิตภัณฑ์ 10,000 รายการให้กับตัวแทนจำหน่าย ตัวแทนจำหน่ายเป็นบุคคลที่เป็นอิสระ เขาได้รับฉลากที่ผลิตจากภายนอกและ บริษัท ชำระเงินให้กับตัวแทนจำหน่าย ป้ายกำกับแต่ละรายการมีราคาเท่ากับ $ 1 ถึง บริษัท เมื่อวานนี้ดีลเลอร์มาพร้อมกับฉลาก แต่มีการรวมฉลากในแพ็คเก็ตละ 100 ป้าย ด้วยวิธีนี้มี 100 แพ็กเก็ตและแต่ละแพ็คเก็ตมี 100 ป้ายดังนั้นรวม 10,000 ป้าย ก่อนที่จะชำระเงินให้กับตัวแทนจำหน่ายของ $ 10,000 เราตัดสินใจที่จะนับแพ็คเก็ตน้อยเพื่อให้แน่ใจว่าแต่ละแพ็คเก็ตมี 100 ป้าย เมื่อเรานับฉลากเราพบว่าแพ็คเก็ตสั้น 100 ป้าย (เราพบ 97 ป้าย) เพื่อให้แน่ใจว่านี่ไม่ใช่โดยบังเอิญ แต่ได้ทำไปโดยเจตนาเราได้นับ 5 แพ็กเก็ตเพิ่มเติมและพบจำนวนป้ายกำกับต่อไปนี้ในแต่ละแพ็คเก็ต (รวมถึงแพ็กเก็ตแรก): Packet …

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
อะไรคือความแตกต่างระหว่างฟังก์ชั่นการสูญเสียและฟังก์ชั่นการตัดสินใจ?
ฉันเห็นว่าทั้งสองฟังก์ชั่นเป็นส่วนหนึ่งของวิธีการขุดข้อมูลเช่นตัวเร่งการเลื่อนสีไล่ระดับสี ฉันเห็นว่ามันเป็นวัตถุแยกกันเช่นกัน ความสัมพันธ์ระหว่างทั้งสองเป็นอย่างไร

2
อะไรคือเหตุผลในการตัดสินใจเชิงทฤษฎีสำหรับขั้นตอนช่วงเวลาที่น่าเชื่อถือแบบเบย์?
(เพื่อดูว่าทำไมฉันถึงเขียนสิ่งนี้ให้ตรวจสอบความคิดเห็นด้านล่างคำตอบของคำถามนี้ ) ข้อผิดพลาดประเภท III และทฤษฎีการตัดสินใจเชิงสถิติ การให้คำตอบที่ถูกต้องกับคำถามที่ผิดนั้นบางครั้งเรียกว่าข้อผิดพลาด Type III ทฤษฎีการตัดสินใจเชิงสถิติเป็นรูปแบบของการตัดสินใจภายใต้ความไม่แน่นอน มันมีกรอบแนวคิดที่สามารถช่วยหนึ่งหลีกเลี่ยงข้อผิดพลาดประเภทที่สาม องค์ประกอบสำคัญของกรอบที่เรียกว่าฟังก์ชั่นการสูญเสีย มันต้องใช้สองข้อโต้แย้ง: ครั้งแรกคือ (ส่วนย่อยที่เกี่ยวข้องของ) สถานะที่แท้จริงของโลก (เช่นในปัญหาการประมาณค่าพารามิเตอร์ค่าพารามิเตอร์จริง ); ที่สองคือองค์ประกอบในชุดของการกระทำที่เป็นไปได้ (เช่นในปัญหาการประมาณค่าพารามิเตอร์การประมาณθ )θθ\thetaθ^)θ^)\hat{\theta}). เอาท์พุทแบบจำลองการสูญเสียที่เกี่ยวข้องกับทุกการกระทำที่เป็นไปได้เกี่ยวกับทุกสถานะที่แท้จริงที่เป็นไปได้ของโลก ตัวอย่างเช่นในปัญหาการประมาณค่าพารามิเตอร์ฟังก์ชันการสูญเสียที่รู้จักกันดีคือ: การสูญเสียข้อผิดพลาดแบบสัมบูรณ์L(θ,θ^)=|θ−θ^|L(θ,θ^)=|θ−θ^|L(\theta, \hat{\theta}) = |\theta - \hat{\theta}| การสูญเสียข้อผิดพลาดกำลังสองL(θ,θ^)=(θ−θ^)2L(θ,θ^)=(θ−θ^)2L(\theta, \hat{\theta}) = (\theta - \hat{\theta})^2 การสูญเสีย LINEX ของHal VarianL(θ,θ^;k)=exp(k(θ−θ^))−k(θ−θ^)−1, k≠0L(θ,θ^;k)=exp⁡(k(θ−θ^))−k(θ−θ^)−1, k≠0L(\theta, \hat{\theta}; k) = \exp(k(\theta - \hat{\theta})) - k(\theta - \hat{\theta}) …

4
Bayesian และผู้ประเมินจุดประจำใช้เงื่อนไขอะไรได้บ้าง?
เมื่อพิจารณาก่อนหน้านี้ค่า ML (ความถี่ - ความเป็นไปได้สูงสุด) และ MAP (Bayesian - ค่าสูงสุดด้านหลัง) จะตรงกัน อย่างไรก็ตามโดยทั่วไปแล้วฉันกำลังพูดถึงตัวประมาณค่าที่ได้จากการเพิ่มประสิทธิภาพของฟังก์ชันการสูญเสีย กล่าวคือ x^(.)=argminE(L(X−x^(y))|y) (Bayesian) x^(.)=argminE(L(X−x^(y))|y) (Bayesian) \hat x(\,. ) = \text{argmin} \; \mathbb{E} \left( L(X-\hat x(y)) \; | \; y \right) \qquad \; \,\text{ (Bayesian) } x^(.)=argminE(L(x−x^(Y))|x)(Frequentist)x^(.)=argminE(L(x−x^(Y))|x)(Frequentist) \hat x(\,. ) = \text{argmin} \; \mathbb{E} \left( L(x-\hat x(Y)) \; | …

2
การโยนเหรียญกระบวนการตัดสินใจและคุณค่าของข้อมูล
ลองนึกภาพการตั้งค่าต่อไปนี้: คุณมี 2 เหรียญ, เหรียญ A ซึ่งรับประกันว่าจะยุติธรรมและเหรียญ B ซึ่งอาจหรืออาจไม่ยุติธรรม คุณจะถูกขอให้โยนเหรียญ 100 ครั้งและเป้าหมายของคุณคือเพิ่มจำนวนหัวให้มากที่สุด ข้อมูลก่อนหน้าของคุณเกี่ยวกับเหรียญ B คือพลิก 3 ครั้งและให้ 1 หัว หากกฎการตัดสินใจของคุณขึ้นอยู่กับการเปรียบเทียบความน่าจะเป็นที่คาดหวังของหัวของเหรียญ 2 เหรียญคุณจะพลิกเหรียญ 100 ครั้งและทำตามนั้น สิ่งนี้เป็นจริงแม้ว่าจะใช้การประมาณแบบเบย์ที่สมเหตุสมผล (ความหมายด้านหลัง) ของความน่าจะเป็นเนื่องจากคุณไม่มีเหตุผลที่จะเชื่อว่าเหรียญ B ให้ผลตอบแทนที่มากกว่า อย่างไรก็ตามจะเกิดอะไรขึ้นถ้าเหรียญ B มีความเอนเอียงในความเป็นจริง แน่นอนว่า "หัวหน้าที่มีศักยภาพ" ที่คุณยอมแพ้โดยการโยนเหรียญ B สองครั้ง (และการได้รับข้อมูลเกี่ยวกับคุณสมบัติทางสถิติของมัน) จะมีค่าในบางแง่มุมดังนั้นจึงเป็นปัจจัยในการตัดสินใจของคุณ "คุณค่าของข้อมูล" นี้จะอธิบายทางคณิตศาสตร์ได้อย่างไร? คำถาม:คุณสร้างกฎการตัดสินใจที่ดีที่สุดทางคณิตศาสตร์ในสถานการณ์นี้ได้อย่างไร

1
ตัวอย่างความไม่เท่าเทียมที่เข้มงวดของฟอนนอยมันน์
ให้แสดงถึงความเสี่ยงของ Bayes ของตัวประมาณด้วยความเคารพก่อนหน้านี้ , ให้แสดงถึงชุดของนักบวชทั้งหมดในพื้นที่พารามิเตอร์และให้แสดงถึงชุดของ กฎการตัดสินใจทั้งหมด (อาจจะสุ่ม)r(π,δ)r(π,δ)r(\pi, \delta)δδ\deltaππ\piΠΠ\PiΘΘ\ThetaΔΔ\Delta การตีความทางสถิติของความไม่เท่าเทียมกันของ minimax ของ John von Neumann ระบุไว้ว่า supπ∈Πinfδ∈Δr(π,δ)≤infδ∈Δsupπ∈Πr(π,δ),supπ∈Πinfδ∈Δr(π,δ)≤infδ∈Δsupπ∈Πr(π,δ), \sup_{\pi\in\Pi} \inf_{\delta\in\Delta} r(\pi, \delta) \leq \inf_{\delta\in\Delta}\sup_{\pi\in\Pi} r(\pi, \delta), รับประกันความเสมอภาคอย่างเข้มงวดสำหรับδ′δ′\delta'และπ′π′\pi'เมื่อΘΘ\ThetaและΔΔ\Deltaทั้งสองมี จำกัด บางคนสามารถให้ตัวอย่างที่เป็นรูปธรรมที่ความไม่เท่าเทียมนั้นเข้มงวดได้หรือไม่?

2
สถิติที่สมบูรณ์เพียงพอคืออะไร
ฉันมีปัญหาในการทำความเข้าใจสถิติที่เพียงพอหรือไม่ ให้เป็นสถิติที่เพียงพอT=ΣxiT=ΣxiT=\Sigma x_i ถ้ามีความน่าจะเป็น 1 สำหรับฟังก์ชันgบางตัวแสดงว่าเป็นสถิติที่สมบูรณ์เพียงพอE[g(T)]=0E[g(T)]=0E[g(T)]=0ggg แต่สิ่งนี้หมายความว่าอย่างไร ฉันเคยเห็นตัวอย่างเครื่องแบบและ Bernoulli (หน้า 6 http://amath.colorado.edu/courses/4520/2011fall/HandOuts/umvue.pdf ) แต่มันไม่ง่ายเลยฉันสับสนมากขึ้นเมื่อเห็นการรวมกลุ่ม ใครช่วยอธิบายด้วยวิธีที่ง่ายและใช้งานง่าย?

1
ปริศนาของช่างผม
ช่างทำผมของฉัน Stacey มักจะมีใบหน้าที่มีความสุข แต่มักจะเน้นเรื่องการจัดการเวลาของเธอ วันนี้ Stacey เกินกำหนดสำหรับการนัดหมายของฉันและขอโทษมาก ในขณะที่ได้รับการตัดผมของฉันฉันสงสัยว่า: นัดหมายมาตรฐานของเธอจะนานแค่ไหน? (หากลูกค้าไม่สนใจค่าหมายเลขรอบที่สะอาดก็สามารถทำได้ในขณะนี้) สิ่งที่ควรพิจารณาคือ 'เอฟเฟ็กต์ระลอกคลื่น' ซึ่งลูกค้าที่มาช้ามากคนหนึ่งสามารถนำไปสู่การนัดหมายที่ล่าช้า ในความเป็นจริงช่างทำผมได้เรียนรู้ที่จะนัดหมายในอวกาศนานขึ้นเรื่อย ๆ เพราะกลัววันเครียดเหล่านี้ แต่วิธีการแก้ปัญหาที่เหมาะสมและสง่างามจะต้องสามารถทำได้โดยอัจฉริยะทางสถิติบางอย่างที่นั่น .. (ถ้าเราลดความเป็นจริงลงเล็กน้อย) สมมติว่า a) เวลาในการตัดผมนั้นมีการกระจายตามปกติและ b) มีช่างทำผมเพียงคนเดียว ค่าใช้จ่ายในการตั้งค่าการนัดหมายนานเกินไปจะเห็นได้ชัดว่าช่างทำผมเสียเวลารอการนัดหมายครั้งต่อไป เรามาเสียเวลานี้ $ 1 ต่อนาที แต่หากการนัดหมายไม่เพียงพอลูกค้ารายต่อไปจะถูกรอคอยซึ่งเป็นค่าใช้จ่ายที่หนักกว่า $ 3 ต่อนาทีสำหรับ Stacey ผู้เป็นที่รักของลูกค้า Stacey ทำงานได้มากถึง 8 ชั่วโมงต่อวันและมีความต้องการมากพอที่จะเติมเต็มการนัดหมายให้มากที่สุดเท่าที่จะทำได้ การตัดผมเฉลี่ยนั้นใช้เวลา 30 นาทีโดยมี std dev จาก 10 นาที (สมมติว่าการตัดชายและการตัดผู้หญิงเป็นเหมือนกัน!) แก้ไข - …

2
พล็อตขอบเขตการตัดสินใจสำหรับ perceptron
ฉันพยายามพล็อตขอบเขตการตัดสินใจของอัลกอริทึม Perceptron และฉันสับสนมากเกี่ยวกับบางสิ่ง อินสแตนซ์อินพุตของฉันอยู่ในรูปแบบโดยทั่วไปอินสแตนซ์อินพุต 2D ( x 1และx 2 ) และค่าเป้าหมายคลาสไบนารี ( y ) [1 หรือ 0][ ( x1, x2) ,y][(x1,x2),Y][(x_{1},x_{2}), y]x1x1x_{1}x2x2x_{2}YYy เวกเตอร์น้ำหนักของฉันจึงอยู่ในรูปแบบ: ][ w1, w2][W1,W2][w_{1}, w_{2}] ตอนนี้ฉันต้องรวมพารามิเตอร์ bias เพิ่มเติมและด้วยเหตุนี้เวกเตอร์น้ำหนักของฉันกลายเป็นเวกเตอร์3 × 1หรือไม่ มันคือ1 × 3เวกเตอร์ ฉันคิดว่าควรเป็น1 × 3เนื่องจากเวกเตอร์มีเพียง 1 แถวและคอลัมน์ nW0W0w_{0}3 × 13×13 \times 11 ×31×31 \times 31 × 31×31 …

3
MAP เป็นวิธีการแก้ปัญหา
ฉันเจอสไลด์เหล่านี้ (สไลด์ # 16 & # 17) ในหนึ่งในหลักสูตรออนไลน์ ผู้สอนพยายามอธิบายถึงวิธีการประมาณค่าสูงสุดหลัง (MAP) เป็นวิธีการแก้ปัญหาL(θ)=I[θ≠θ∗]L(θ)=I[θ≠θ∗]L(\theta) = \mathcal{I}[\theta \ne \theta^{*}]โดยที่θ∗θ∗\theta^{*}เป็นพารามิเตอร์จริง ใครช่วยกรุณาอธิบายวิธีการดังต่อไปนี้? แก้ไข: เพิ่มสไลด์ในกรณีที่ลิงก์เสีย

3
ฉันจะเลือกเมตริกที่ดีที่สุดในการวัดการสอบเทียบได้อย่างไร
ฉันเขียนโปรแกรมและทำการพัฒนาโดยอาศัยการทดสอบ หลังจากที่ฉันทำการเปลี่ยนแปลงรหัสของฉันฉันเรียกใช้การทดสอบของฉัน บางครั้งพวกเขาประสบความสำเร็จและบางครั้งพวกเขาก็ล้มเหลว ก่อนที่ฉันจะทำการทดสอบฉันจะเขียนตัวเลขจาก 0.01 ถึง 0.99 เพื่อให้แน่ใจว่าการทดสอบจะสำเร็จ ฉันต้องการทราบว่าฉันปรับปรุงในการทำนายว่าการทดสอบของฉันจะสำเร็จหรือล้มเหลว มันจะดีถ้าฉันสามารถติดตามว่าฉันดีกว่าที่ทำนายว่าการทดสอบจะประสบความสำเร็จในวันจันทร์หรือวันศุกร์ หากความสามารถในการทำนายความสำเร็จในการทดสอบมีความสัมพันธ์กับตัวชี้วัดอื่นที่ฉันติดตามฉันต้องการทราบ นั่นทำให้ฉันมีหน้าที่เลือกเมตริกที่ถูกต้อง ใน Superforcasting Philip Tetlock เสนอให้ใช้คะแนน Brierในการวัดว่าผู้เชี่ยวชาญสอบเทียบได้ดีเพียงใด ตัวชี้วัดที่ได้รับการเสนอชื่อในวรรณคดีก็คือกฎการให้คะแนนลอการิทึม นอกจากนี้ยังมีผู้สมัครอื่น ๆ ฉันจะตัดสินใจได้อย่างไรว่าจะใช้เมตริกใด มีการโต้เถียงกันหรือไม่ที่จะสนับสนุนกฎการให้คะแนนหนึ่งกฎเหนือกฎอื่น ๆ ?

2
นอกเหนือจาก Durbin-Watson แล้วการทดสอบสมมติฐานใดบ้างที่สามารถสร้างผลลัพธ์ที่สรุปไม่ได้?
สถิติทดสอบ Durbin-Watsonสามารถนอนในภูมิภาคที่สรุปไม่ได้ที่มันเป็นไปไม่ได้อย่างใดอย่างหนึ่งที่จะปฏิเสธหรือล้มเหลวที่จะปฏิเสธสมมติฐาน (ในกรณีนี้ศูนย์อัต) การทดสอบทางสถิติอื่นใดที่สามารถให้ผลลัพธ์ที่ "สรุปไม่ได้"? มีคำอธิบายทั่วไป (การโบกมือเป็นไร) เพราะเหตุใดชุดทดสอบนี้จึงไม่สามารถทำการตัดสินใจไบนารี "ปฏิเสธ" / "ไม่สามารถปฏิเสธ" ได้? มันจะเป็นโบนัสถ้ามีใครสามารถพูดถึงผลกระทบของการตัดสินใจเชิงทฤษฎีซึ่งเป็นส่วนหนึ่งของคำตอบของพวกเขาในแบบสอบถามหลัง - การมีหมวดหมู่เพิ่มเติมของข้อสรุป (ใน) หมายความว่าเราต้องพิจารณาค่าใช้จ่ายของ Type I และ Type II ข้อผิดพลาดในวิธีที่ซับซ้อนมากขึ้น?

1
ตัวประมาณที่ลดผลรวมถ่วงน้ำหนักของอคติกำลังสองและความแปรปรวนเข้ากับทฤษฎีการตัดสินใจได้อย่างไร
ตกลง - ข้อความต้นฉบับของฉันไม่สามารถตอบสนองได้ ขอผมใส่คำถามที่ต่างออกไป ฉันจะเริ่มต้นด้วยการอธิบายความเข้าใจของฉันเกี่ยวกับการประเมินจากมุมมองทางทฤษฎีการตัดสินใจ ฉันไม่มีการฝึกฝนอย่างเป็นทางการและจะไม่ทำให้ฉันประหลาดใจถ้าความคิดของฉันมีข้อบกพร่อง สมมติว่าเรามีบางฟังก์ชั่นการสูญเสีย(x)) การสูญเสียที่คาดหวังคือความเสี่ยง (บ่อยครั้ง):L(θ,θ^(x))L(θ,θ^(x))L(\theta,\hat\theta(x)) R(θ,θ^(x))=∫L(θ,θ^(x))L(θ,θ^(x))dx,R(θ,θ^(x))=∫L(θ,θ^(x))L(θ,θ^(x))dx,R(\theta,\hat\theta(x))=\int L(\theta,\hat\theta(x))\mathcal{L}(\theta,\hat\theta(x))dx, โดยที่คือความเป็นไปได้; และความเสี่ยงของ Bayes คือความเสี่ยงที่พบบ่อย:L(θ,θ^(x))L(θ,θ^(x))\mathcal{L}(\theta,\hat\theta(x)) r(θ,θ^(x))=∫∫R(θ,θ^(x))π(θ)dxdθ,r(θ,θ^(x))=∫∫R(θ,θ^(x))π(θ)dxdθ,r(\theta,\hat\theta(x))=\int\int R(\theta,\hat\theta(x))\pi (\theta)dxd\theta, โดยที่เป็นของเราก่อนหน้าπ(θ)π(θ)\pi (\theta) โดยทั่วไปแล้วเราพบที่ย่อและสิ่งนี้ได้ผลดี; ยิ่งกว่านั้นทฤษฎีบทของ Fubini ก็นำมาใช้และเราสามารถกลับลำดับการรวมเพื่อให้ใด ๆที่ย่อเป็นอิสระจากคนอื่นทั้งหมด วิธีนี้หลักการความน่าจะเป็นไม่ได้ถูกละเมิดและเราสามารถรู้สึกดีเกี่ยวกับการเป็นแบบเบย์เป็นต้นθ^(x)θ^(x)\hat\theta(x)rrrθ^(x)θ^(x)\hat\theta(x)rrr ตัวอย่างเช่นเนื่องจากการสูญเสียข้อผิดพลาดกำลังสองที่คุ้นเคยความเสี่ยงของเราที่พบบ่อยคือความคลาดเคลื่อนกำลังสองเฉลี่ยหรือผลรวม ความเอนเอียงและความแปรปรวนและความเสี่ยงของเบย์คือผลรวมที่คาดหวังของความอคติกำลังสองและความแปรปรวนตามที่เราคาดไว้ก่อนหน้านั่นคือการสูญเสียด้านหลังL(θ,θ^(x))=(θ−θ^(x))2,L(θ,θ^(x))=(θ−θ^(x))2,L(\theta,\hat\theta(x))=(\theta- \hat\theta(x))^2, นี่ดูเหมือนจะสมเหตุสมผลสำหรับฉัน (แม้ว่าฉันอาจจะผิดมาก); แต่ไม่ว่าในกรณีใดสิ่งต่าง ๆ ทำให้ฉันรู้สึกไม่ถึงวัตถุประสงค์อื่น ๆ ตัวอย่างเช่นสมมติว่าแทนที่จะลดผลรวมของอคติและความแปรปรวนที่ถ่วงน้ำหนักเท่า ๆ กันฉันต้องการลดผลรวมน้ำหนักที่ไม่เท่ากันนั่นคือฉันต้องการที่ย่อเล็กสุด:θ^(x)θ^(x)\hat\theta(x) (E[θ^(x)]−θ)2+kE[(θ^(x)−E[θ^(x)])2],(E[θ^(x)]−θ)2+kE[(θ^(x)−E[θ^(x)])2],(\mathbb{E}[\hat\theta(x)]-\theta)^2+k\mathbb{E}[(\hat\theta(x)-\mathbb{E}[\hat\theta(x)])^2], โดยที่คือค่าคงที่จริงที่เป็นบวก (นอกเหนือจาก 1)kkk ฉันมักจะอ้างถึงผลรวมเช่นนี้เป็น "ฟังก์ชันวัตถุประสงค์" แม้ว่ามันอาจเป็นไปได้ว่าฉันกำลังใช้คำนั้นอย่างไม่ถูกต้อง คำถามของฉันไม่เกี่ยวกับวิธีค้นหาวิธีแก้ปัญหา - การค้นหาที่ลดฟังก์ชันวัตถุประสงค์นี้ให้ทำได้เป็นตัวเลข - แต่คำถามของฉันคือสองเท่า:θ^(x)θ^(x)\hat\theta(x) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.