ปัญหาการตกปลา

สมมติว่าคุณต้องการตกปลาที่ทะเลสาบใกล้เคียงตั้งแต่ 8.00 น. - 20.00 น. เนื่องจากการประมงมากเกินไปจึงมีกฎหมายเข้ามากล่าวว่าคุณสามารถจับปลาได้วันละหนึ่งตัวเท่านั้น เมื่อคุณจับปลาคุณสามารถเลือกที่จะเก็บมันไว้ (และกลับบ้านไปกับปลาตัวนั้น) หรือโยนมันกลับเข้าไปในทะเลสาบและทำการตกปลาต่อไป (แต่เสี่ยงต่อการตกปลาในภายหลังด้วยปลาตัวเล็ก ๆ หรือไม่มีปลาเลย) คุณต้องการที่จะจับปลาตัวใหญ่เท่าที่จะทำได้ โดยเฉพาะคุณต้องการเพิ่มจำนวนปลาที่คาดว่าจะนำกลับบ้านให้ได้มากที่สุด

อย่างเป็นทางการเราอาจตั้งค่าปัญหานี้ดังนี้: ปลาถูกจับในอัตราที่แน่นอน (ดังนั้นเวลาที่ใช้ในการจับปลาต่อไปของคุณจะเป็นไปตามการแจกแจงแบบเอ็กซ์โปเนนเชียลที่รู้จัก) และขนาดของปลาที่จับได้ . เราต้องการกระบวนการตัดสินใจที่กำหนดเวลาปัจจุบันและขนาดของปลาที่คุณเพิ่งจับตัดสินใจว่าจะเก็บปลาหรือทิ้งมัน

ดังนั้นคำถามคือการตัดสินใจนี้ควรทำอย่างไร? มีวิธีที่เรียบง่าย (หรือซับซ้อน) ในการตัดสินใจว่าจะหยุดตกปลาเมื่อไหร่? ฉันคิดว่าปัญหานั้นเทียบเท่ากับการพิจารณาในช่วงเวลาที่กำหนด t สิ่งที่คาดว่าจะได้จากการหาปลาที่ดีที่สุดจะกลับบ้านถ้าพวกเขาเริ่มในเวลา t; กระบวนการตัดสินใจที่ดีที่สุดจะทำให้ปลาได้หากว่าหากว่าปลานั้นหนักกว่าที่คาดไว้ แต่ดูเหมือนว่าการอ้างอิงตนเอง; เรากำหนดกลยุทธ์การตกปลาที่ดีที่สุดในแง่ของการตกปลาที่ดีที่สุดและฉันไม่แน่ใจว่าจะดำเนินการต่อไปได้อย่างไร

stochastic-processes optimal-stopping

— b2coutts
แหล่งที่มา

ตรวจสอบปัญหาเลขานุการของวิกิพีเดียโดยเฉพาะในหัวข้อ 1 / e-law ของทางเลือกที่ดีที่สุด

— soakley

ฉันคิดว่าความแตกต่างที่สำคัญตรงนี้คือมันสันนิษฐานว่าเรารู้ว่าทุกอย่างถูกแจกจ่ายอย่างไรในขณะที่กุญแจของการแก้ปัญหาคือมันใช้ผู้สมัคร 1 / e คนแรกเพียงเพื่อให้ได้ความรู้นั้นและกำหนดเกณฑ์ที่ดี ฉันคิดว่าความคิดที่คล้ายกันไม่สามารถทำงานได้ที่นี่ คุณสามารถจินตนาการได้เพียงแค่ได้รับเกณฑ์จากการแจกแจง แต่ฉันไม่คิดว่ามันควรจะได้รับการแก้ไข ฉันคิดว่าเกณฑ์ควรลดลงเมื่อเวลาผ่านไปเนื่องจากคุณมีเวลาน้อยลงในการจับปลาที่ดีขึ้น

— b2coutts

@soakley ดูคำตอบของฉันต่อคำตอบของ olooney; มูลค่าของการรอคอยนั้นไม่เพียง แต่ขึ้นอยู่กับสิ่งที่คุณจะได้รับในอนาคตเท่านั้น ดังนั้นฉันคิดว่ามีแง่มุมอ้างอิงตนเองที่แปลกสำหรับคำถามนี้เช่นกัน

— b2coutts

ฟังก์ชันหรือค่าที่เราพยายามปรับให้เหมาะสมคืออะไร นั่นคือเราจะชั่งความเสี่ยงและกำไรอย่างไร เป็นจุดที่จะเกิดขึ้นกับวิธีการที่เพิ่มค่าความคาดหวังของขนาดปลาที่จับได้หรือไม่? เราแค่ตกปลาวันเดียวหรือหลายวันและในกรณีหลังวันนี้มีความสัมพันธ์กันอย่างไร?

— Sextus Empiricus

เรารู้ว่าการกระจายตัว ... นั้นหมายถึงประเภทของการกระจายตัวหรือว่ารวมถึงพารามิเตอร์การกระจายหรือไม่?

— Sextus Empiricus

ให้ $\lambda$ แทนอัตราของกระบวนการปัวซองและให้ $S(x)=1-F(x)$ โดยที่ $F(x)$ เป็นฟังก์ชันการแจกแจงสะสมของการกระจายขนาดปลา

ให้ $t=0$ แสดงถึงการสิ้นสุดของวันและให้ $g(t)$ , $t\le 0$ , แทน catch ที่คาดไว้ในช่วงเวลา $(t,0)$ เราได้รับหากใช้กลยุทธ์ที่ดีที่สุด เห็นได้ชัด $g(0)=0$ 0นอกจากนี้ถ้าเราจับปลาที่มีขนาด $x$ ในเวลา $t$ เราควรจะเก็บไว้และหยุดตกปลาถ้ามันมีขนาดใหญ่แล้ว $g(t)$ )นี่คือกฎการตัดสินใจของเรา ดังนั้นการตระหนักถึงกระบวนการและการตัดสินใจที่ตระหนัก (จุดสีเขียว) อาจมีลักษณะดังนี้:

ทำงานในเวลาต่อเนื่องโดยใช้ความคิดจากการเขียนโปรแกรมแบบไดนามิกสุ่มการเปลี่ยนแปลงใน $g(t)$ ย้อนหลังในเวลาอธิบายโดยสมการเชิงอนุพันธ์อย่างง่าย พิจารณาช่วงเวลาเล็ก $(t-dt,t)$ )ความน่าจะเป็นว่าเราจับปลาที่มีขนาด $X>g(t)$ ในช่วงเวลานี้มีที่

λ d เสื้อ S (ก. (เสื้อ)),

$\lambda dt S(g(t)),$ มิฉะนั้นจับคาดว่าเราจะเป็น

g (t)

$g(t)$ .

การใช้สูตรสำหรับชีวิตที่เหลือหมายถึงขนาดที่คาดหวังของปลาที่มีขนาดใหญ่กว่า $g(t)$ เป็น

E (X | X > g (t)) = g (t) + \frac{1}{S (g (t))} \int_{g (t)}^{\infty} S (x) d x .

$E(X|X>g(t))=g(t)+\frac1{S(g(t))}\int_{g(t)}^\infty S(x)dx.$

ดังนั้นเมื่อใช้กฎความคาดหวังทั้งหมดการจับที่คาดหวังในช่วงเวลา $(t-dt,0)$ จะกลายเป็น

g (t - d t) = [λ d t S (g (t))] [g (t) + \frac{1}{S (g (t))} \int_{g (t)}^{\infty} S (x) d x] + [1 - λ d t S (g (t)] g (t) .

$g(t-dt) =[\lambda dt S(g(t))][g(t)+\frac1{S(g(t))}\int_{g(t)}^\infty S(x)dx] + [1-\lambda dt S(g(t)] g(t).$

การจัดเรียงใหม่เราพบว่า $g(t)$ สอดคล้องกับ

\begin{matrix} (1) & \frac{d g}{d t} = - λ \int_{g (t)}^{\infty} S (x) d x . \end{matrix}

$\frac{dg}{dt}=-\lambda \int_{g(t)}^\infty S(x) dx. \tag{1}$ หมายเหตุวิธี

g (t)

$g(t)$ ในช่วงสุดท้ายของการลดลงของวันในอัตราที่เท่ากับสินค้าของอัตราปัวส์ซอง

λ

$\lambda$ และขนาดปลาเฉลี่ย

\int_{0}^{\infty} S (x) d x

$\int_0^\infty S(x)dx$ สะท้อนให้เห็นว่าเรามาถึงจุดที่จะเป็นดีที่สุดออกรักษา ปลาใด ๆ ที่เราอาจจับได้

ตัวอย่างที่ 1 : สมมติว่าปลาขนาด $X\sim \exp(\alpha)$ ดังกล่าวว่า $S(x)=e^{-\alpha x}$ xสมการ (1) จากนั้นลดความซับซ้อนเป็น

\frac{d g}{d t} = - \frac{λ}{α} e^{- α g (t)}

$\frac{dg}{dt}=-\frac\lambda\alpha e^{-\alpha g(t)}$ ซึ่งเป็นสมการอนุพันธ์ การใช้เงื่อนไขขอบเขตด้านบนการแก้ปัญหาคือ

g (t) = \frac{1}{α} \ln (1 - λ t),

$g(t) = \frac1\alpha\ln(1-\lambda t),$ สำหรับ

t \leq 0

$t\le 0$ แสดงในรูปที่ดังกล่าวข้างต้นสำหรับ

α = λ = 1

$\alpha=\lambda=1$ 1

รหัสต่อไปนี้เปรียบเทียบจับหมายถึงการใช้กลยุทธ์นี้คำนวณบนพื้นฐานของการจำลองที่มีความหมายในทางทฤษฎี

g (- 12)

$g(-12)$ )

g <- function(t,lambda, rate) {
  1/rate*log(1-lambda*t)
}
catch <- function(daylength=12, lambda=1, rfn=runif, gfn=g, ...) {
  n <- rpois(1,daylength*lambda)
  starttime <- -daylength
  arrivaltimes <- sort(runif(n,starttime,0))
  X <- rfn(n,...)
  j <- match(TRUE, X > gfn(arrivaltimes,lambda,...))
  if (is.na(j))
    0
  else
    X[j]
}
nsim <- 1e+5
catches <- rep(0,nsim)
for (i in 1:nsim)
  catches[i] <- catch(gfn=g,rfn=rexp,rate=1,lambda=1)
> mean(catches)
[1] 2.55802
> g(-12,1,1)
[1] 2.564949

ตัวอย่างที่ 2:ถ้า $X \sim U(0,1)$ การสืบทอดที่คล้ายกันนำไปสู่

g (t) = 1 - \frac{1}{1 - λ t / 2}

$g(t) = 1 - \frac1{1-\lambda t/2}$ เป็นวิธีแก้ปัญหาของ (1) หมายเหตุวิธี

g (t)

$g(t)$ มีแนวโน้มที่จะมีขนาดปลาสูงสุดเป็น

t \to - \infty

$t\rightarrow -\infty$ ∞

— Jarle Tufto
แหล่งที่มา

g (t)

$g(t)$

(t, 0)

$(t,0)$

g (t)

$g(t)$

(t, 0)

$(t,0)$

t

$t$

g (t)

$g(t)$

g^{'} (t) = 1 - \frac{e^{λ t} - 1}{λ t}

$g'(t)=1-\frac{e^{\lambda t}-1}{\lambda t}$

g^{'} (t)

$g'(t)$