ปัญหาการตกปลา


10

สมมติว่าคุณต้องการตกปลาที่ทะเลสาบใกล้เคียงตั้งแต่ 8.00 น. - 20.00 น. เนื่องจากการประมงมากเกินไปจึงมีกฎหมายเข้ามากล่าวว่าคุณสามารถจับปลาได้วันละหนึ่งตัวเท่านั้น เมื่อคุณจับปลาคุณสามารถเลือกที่จะเก็บมันไว้ (และกลับบ้านไปกับปลาตัวนั้น) หรือโยนมันกลับเข้าไปในทะเลสาบและทำการตกปลาต่อไป (แต่เสี่ยงต่อการตกปลาในภายหลังด้วยปลาตัวเล็ก ๆ หรือไม่มีปลาเลย) คุณต้องการที่จะจับปลาตัวใหญ่เท่าที่จะทำได้ โดยเฉพาะคุณต้องการเพิ่มจำนวนปลาที่คาดว่าจะนำกลับบ้านให้ได้มากที่สุด

อย่างเป็นทางการเราอาจตั้งค่าปัญหานี้ดังนี้: ปลาถูกจับในอัตราที่แน่นอน (ดังนั้นเวลาที่ใช้ในการจับปลาต่อไปของคุณจะเป็นไปตามการแจกแจงแบบเอ็กซ์โปเนนเชียลที่รู้จัก) และขนาดของปลาที่จับได้ . เราต้องการกระบวนการตัดสินใจที่กำหนดเวลาปัจจุบันและขนาดของปลาที่คุณเพิ่งจับตัดสินใจว่าจะเก็บปลาหรือทิ้งมัน

ดังนั้นคำถามคือการตัดสินใจนี้ควรทำอย่างไร? มีวิธีที่เรียบง่าย (หรือซับซ้อน) ในการตัดสินใจว่าจะหยุดตกปลาเมื่อไหร่? ฉันคิดว่าปัญหานั้นเทียบเท่ากับการพิจารณาในช่วงเวลาที่กำหนด t สิ่งที่คาดว่าจะได้จากการหาปลาที่ดีที่สุดจะกลับบ้านถ้าพวกเขาเริ่มในเวลา t; กระบวนการตัดสินใจที่ดีที่สุดจะทำให้ปลาได้หากว่าหากว่าปลานั้นหนักกว่าที่คาดไว้ แต่ดูเหมือนว่าการอ้างอิงตนเอง; เรากำหนดกลยุทธ์การตกปลาที่ดีที่สุดในแง่ของการตกปลาที่ดีที่สุดและฉันไม่แน่ใจว่าจะดำเนินการต่อไปได้อย่างไร


5
ตรวจสอบปัญหาเลขานุการของวิกิพีเดียโดยเฉพาะในหัวข้อ 1 / e-law ของทางเลือกที่ดีที่สุด
soakley

2
ฉันคิดว่าความแตกต่างที่สำคัญตรงนี้คือมันสันนิษฐานว่าเรารู้ว่าทุกอย่างถูกแจกจ่ายอย่างไรในขณะที่กุญแจของการแก้ปัญหาคือมันใช้ผู้สมัคร 1 / e คนแรกเพียงเพื่อให้ได้ความรู้นั้นและกำหนดเกณฑ์ที่ดี ฉันคิดว่าความคิดที่คล้ายกันไม่สามารถทำงานได้ที่นี่ คุณสามารถจินตนาการได้เพียงแค่ได้รับเกณฑ์จากการแจกแจง แต่ฉันไม่คิดว่ามันควรจะได้รับการแก้ไข ฉันคิดว่าเกณฑ์ควรลดลงเมื่อเวลาผ่านไปเนื่องจากคุณมีเวลาน้อยลงในการจับปลาที่ดีขึ้น
b2coutts

1
@soakley ดูคำตอบของฉันต่อคำตอบของ olooney; มูลค่าของการรอคอยนั้นไม่เพียง แต่ขึ้นอยู่กับสิ่งที่คุณจะได้รับในอนาคตเท่านั้น ดังนั้นฉันคิดว่ามีแง่มุมอ้างอิงตนเองที่แปลกสำหรับคำถามนี้เช่นกัน
b2coutts

1
ฟังก์ชันหรือค่าที่เราพยายามปรับให้เหมาะสมคืออะไร นั่นคือเราจะชั่งความเสี่ยงและกำไรอย่างไร เป็นจุดที่จะเกิดขึ้นกับวิธีการที่เพิ่มค่าความคาดหวังของขนาดปลาที่จับได้หรือไม่? เราแค่ตกปลาวันเดียวหรือหลายวันและในกรณีหลังวันนี้มีความสัมพันธ์กันอย่างไร?
Sextus Empiricus

1
เรารู้ว่าการกระจายตัว ... นั้นหมายถึงประเภทของการกระจายตัวหรือว่ารวมถึงพารามิเตอร์การกระจายหรือไม่?
Sextus Empiricus

คำตอบ:


4

ให้λแทนอัตราของกระบวนการปัวซองและให้S(x)=1F(x)โดยที่F(x)เป็นฟังก์ชันการแจกแจงสะสมของการกระจายขนาดปลา

ให้t=0แสดงถึงการสิ้นสุดของวันและให้g(t) , t0 , แทน catch ที่คาดไว้ในช่วงเวลา(t,0)เราได้รับหากใช้กลยุทธ์ที่ดีที่สุด เห็นได้ชัดg(0)=0 0 นอกจากนี้ถ้าเราจับปลาที่มีขนาดxในเวลาtเราควรจะเก็บไว้และหยุดตกปลาถ้ามันมีขนาดใหญ่แล้วg(t) ) นี่คือกฎการตัดสินใจของเรา ดังนั้นการตระหนักถึงกระบวนการและการตัดสินใจที่ตระหนัก (จุดสีเขียว) อาจมีลักษณะดังนี้:

ป้อนคำอธิบายรูปภาพที่นี่

ทำงานในเวลาต่อเนื่องโดยใช้ความคิดจากการเขียนโปรแกรมแบบไดนามิกสุ่มการเปลี่ยนแปลงในก.(เสื้อ)ย้อนหลังในเวลาอธิบายโดยสมการเชิงอนุพันธ์อย่างง่าย พิจารณาช่วงเวลาเล็ก(เสื้อ-dเสื้อ,เสื้อ) ) ความน่าจะเป็นว่าเราจับปลาที่มีขนาดX>ก.(เสื้อ)ในช่วงเวลานี้มีที่

λdเสื้อS(ก.(เสื้อ)),
มิฉะนั้นจับคาดว่าเราจะเป็นก.(เสื้อ) .

การใช้สูตรสำหรับชีวิตที่เหลือหมายถึงขนาดที่คาดหวังของปลาที่มีขนาดใหญ่กว่าg(t) เป็น

E(X|X>g(t))=g(t)+1S(g(t))g(t)S(x)dx.

ดังนั้นเมื่อใช้กฎความคาดหวังทั้งหมดการจับที่คาดหวังในช่วงเวลา(tdt,0)จะกลายเป็น

g(tdt)=[λdtS(g(t))][g(t)+1S(g(t))g(t)S(x)dx]+[1λdtS(g(t)]g(t).

การจัดเรียงใหม่เราพบว่าg(t)สอดคล้องกับ

(1)dgdt=λg(t)S(x)dx.
หมายเหตุวิธีg(t)ในช่วงสุดท้ายของการลดลงของวันในอัตราที่เท่ากับสินค้าของอัตราปัวส์ซองλและขนาดปลาเฉลี่ย0S(x)dxสะท้อนให้เห็นว่าเรามาถึงจุดที่จะเป็นดีที่สุดออกรักษา ปลาใด ๆ ที่เราอาจจับได้

ตัวอย่างที่ 1 : สมมติว่าปลาขนาดXexp(α)ดังกล่าวว่าS(x)=eαx x สมการ (1) จากนั้นลดความซับซ้อนเป็น

dgdt=λαeαg(t)
ซึ่งเป็นสมการอนุพันธ์ การใช้เงื่อนไขขอบเขตด้านบนการแก้ปัญหาคือ
g(t)=1αln(1λt),
สำหรับt0แสดงในรูปที่ดังกล่าวข้างต้นสำหรับα=λ=11 รหัสต่อไปนี้เปรียบเทียบจับหมายถึงการใช้กลยุทธ์นี้คำนวณบนพื้นฐานของการจำลองที่มีความหมายในทางทฤษฎีg(12))

g <- function(t,lambda, rate) {
  1/rate*log(1-lambda*t)
}
catch <- function(daylength=12, lambda=1, rfn=runif, gfn=g, ...) {
  n <- rpois(1,daylength*lambda)
  starttime <- -daylength
  arrivaltimes <- sort(runif(n,starttime,0))
  X <- rfn(n,...)
  j <- match(TRUE, X > gfn(arrivaltimes,lambda,...))
  if (is.na(j))
    0
  else
    X[j]
}
nsim <- 1e+5
catches <- rep(0,nsim)
for (i in 1:nsim)
  catches[i] <- catch(gfn=g,rfn=rexp,rate=1,lambda=1)
> mean(catches)
[1] 2.55802
> g(-12,1,1)
[1] 2.564949

ตัวอย่างที่ 2:ถ้าXU(0,1)การสืบทอดที่คล้ายกันนำไปสู่

g(t)=111λt/2
เป็นวิธีแก้ปัญหาของ (1) หมายเหตุวิธีg(t)มีแนวโน้มที่จะมีขนาดปลาสูงสุดเป็นt


3
g(t)(t,0)

1
g(t)(t,0)tg(t)

1
g(t)=1eλt1λt
g(t)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.