สำหรับ บริษัท A/ บริษัท / บริษัท ยักษ์ / "ยาใหญ่" / "THE MAN" กลยุทธ์ไม่เปลี่ยนจากเวอร์ชันสมมาตร:
พิจารณารอบที่ความน่าจะเป็นที่จะเห็นผู้สมัครน้อยลงหลังจากนั้นคือ >.5. หาก บริษัทA ทำให้ผู้สมัครนั้นมีโอกาสชนะ >.5. ถ้าA ไม่ได้รักษาผู้สมัครจากนั้นจึงเป็น บริษัท B สามารถจ้างผู้สมัครและ บริษัท A มีโอกาสชนะ <.5. ดังนั้นแน่นอน บริษัทA จะจ้าง (และ บริษัท B จะพยายามจ้าง) ในสถานการณ์นี้
สำหรับผู้สมัครที่มีอัตราต่อรองที่ชนะแน่นอน .5, A อาจหรือไม่เลือกที่จะจ้าง แต่ B จะเลือกจ้างเพราะ B จะไม่มีทางได้ดีกว่า .5.
หาก บริษัท A จ้างก่อนที่จะเห็นผู้สมัครที่มีโอกาสชนะ >=.5แล้วโอกาสของผู้สมัครที่ดีกว่าที่มีอยู่ในอนาคต (และด้วยเหตุนี้ B ชนะ) จะเป็น >.5. ดังนั้นA จะไม่จ้างจนกว่าจะเห็นผู้สมัครที่มีโอกาสชนะ >=.5.
ดังนั้น, Aกลยุทธ์ของเช่นเดียวกับกรณีสมมาตร: จ้างผู้สมัครคนแรกที่ให้อัตราต่อรองที่ชนะ >.5.
Bกลยุทธ์ของมันจึงถูกสร้างขึ้นด้วย Aกลยุทธ์ในใจ เห็นได้ชัดว่าถ้าA ได้รับการว่าจ้าง (ที่หรือ) ก่อน Bจากนั้น Bกลยุทธ์ของการจ้างผู้สมัครคนต่อไปที่ดีกว่า Aถ้ามี นอกจากนี้หากผู้สมัครมาด้วยการชนะเดิมพัน>.5, B ควรพยายามจ้างแม้ว่า A จะพยายามจ้าง (และบังคับ) B เพื่อให้ดูต่อไป)
คำถามเดียวที่เหลือคือ: มันเคยเป็นประโยชน์สำหรับ B จ้างเมื่ออัตราต่อรองของการชนะคือ <=.5. คำตอบคือ: ใช่
สังหรณ์ใจพูดว่ามีรอบที่โอกาสในการชนะกับผู้สมัครคือ .5−ϵ. นอกจากนี้ยังมี "แนวโน้มที่จะเป็น" (อธิบายในภายหลัง) ผู้สมัครในอนาคตที่มีอัตราต่อรองที่ชนะ>.5+ϵ. แล้วมันจะได้ประโยชน์B เพื่อเลือกผู้สมัครก่อนหน้า
ปล่อย dr เป็นผู้สมัครสัมภาษณ์ในรอบ r เพื่อทุกสิ่ง 1<=r<=N.
อย่างเป็นทางการ Bกลยุทธ์ของ: "จ้าง dr หากทำเช่นนั้นจะให้อัตราต่อรองที่ดีกว่าในการชนะถ้าไม่ใช่ "ต่อไปนี้เป็นวิธีที่เราคำนวณการตัดสินใจดังกล่าว
ปล่อย pr,i เป็นความน่าจะเป็นที่จะชนะหลังจากสัมภาษณ์และจ้างงาน dr รับ dr คือ iผู้สมัครที่ดีที่สุดที่สัมภาษณ์ แล้ว:
pr,i= ความน่าจะเป็นที่ ds<dr สำหรับ s>r
=(1−ir+1)(1−ir+2)×...×(1−iN)
...
=(N−i)!r!(r−i)!N!
Notably, pr,i is easily computable to constant accuracy.
Let PB,r be the probability that B wins given that neither company hired in rounds 1 through r−1.
Then B would hire dr if the probability of winning after hiring dr is better than PB,r+1.
Note that PB,N=0, because if it is the last round, then A is guaranteed to hire and B will not hire anyone and loose.
Then, in round N−1, B is guaranteed to try to hire and will succeed unless A hires as well. So:
PB,N−1=∑i=1N−11N−1{pN−1,i1−pN−1,i::pN−1,i<.5pN−1,i>=.5
Which leads to the recursive function:
PB,r=∑i=1r1r⎧⎩⎨⎪⎪1−pr,ipr,iPB,r+1:::pr,i>=.5PB,r+1<pr,i<.5else
It's pretty obvious that PB,r can be calculated to constant accuracy in polynomial time. The final question is: "what is the probability of B winning?" The answer is PB,1 and varies with N.
As to the question of how often does B win? I have not calculated exactly, but looking at N from 1 to 100, it appears that as N grows, that B's winning rate approaches .4 or so. This result may be off as I just did a quick python script to check and did not pay close attention to rounding errors with floating numbers. It may very well end up that the real hard limit is .5.