อัลกอริทึมสำหรับปรับการตัดสินใจต้นไม้ให้เหมาะสม


16

พื้นหลัง

ต้นไม้ตัดสินใจเลขฐานสองTเป็นต้นไม้ที่ถูกรูตซึ่งแต่ละโหนดภายใน (และรูท) จะมีป้ายกำกับโดยดัชนีซึ่งไม่มีเส้นทางจากรากหนึ่งไปยังอีกใบหนึ่งทำดัชนี จะมีป้ายกำกับโดยเอาท์พุทในและแต่ละขอบจะมีป้ายกำกับสำหรับลูกซ้ายและสำหรับลูกขวา ในการใช้ต้นไม้กับอินพุต :{ A , B } 0 1 xJ{1,...,n}{A,B}01x

  1. เริ่มต้นที่รูท
  2. ถ้าคุณอยู่ที่ลีฟคุณจะส่งเอาท์พุตฉลากหรือBและยุติAB
  3. อ่านเลเบลJของโหนดปัจจุบันของคุณหากxJ=0ให้เลื่อนไปที่ลูกด้านซ้ายและหากxJ=1ให้ย้ายไปที่ลูกที่ถูกต้อง
  4. ข้ามไปที่ขั้นตอน (2)

ต้นไม้ที่ถูกนำมาใช้เป็นวิธีการประเมินผลการทำงานโดยเฉพาะอย่างยิ่งที่เราบอกว่าต้นไม้Tหมายถึงฟังก์ชั่นรวมถ้าสำหรับแต่ละx{0,1}nเรามีT(x)=f(x) ) ความซับซ้อนของแบบสอบถามของต้นไม้คือความลึกของมันและความซับซ้อนของแบบสอบถามของฟังก์ชันคือความลึกของต้นไม้ที่เล็กที่สุดที่แสดงถึงมัน


ปัญหา

รับแผนภูมิการตัดสินใจแบบสองจุด T เอาต์พุตการตัดสินใจแบบไบนารี T ของความลึกน้อยที่สุดซึ่ง T และ T แสดงถึงฟังก์ชันเดียวกัน

คำถาม

อัลกอริทึมที่รู้จักกันดีที่สุดสำหรับสิ่งนี้คืออะไร? ขอบเขตที่ต่ำกว่าเป็นที่รู้จักกัน? เกิดอะไรขึ้นถ้าเรารู้ว่าdepth(T)=O(logdepth(T)) ? แล้วถ้าเราต้องการให้Tมีความลึกเพียงเล็กน้อยเท่านั้น


วิธีการไร้เดียงสา

วิธีการที่ไร้เดียงสาจะได้รับเพื่อระบุต้นไม้การตัดสินใจแบบไบนารีทั้งหมดของความลึกd - 1ในขณะที่ทดสอบว่าพวกเขาประเมินในสิ่งเดียวกันกับTหรือไม่ ดูเหมือนว่าจะต้องใช้O ( d 2 n n !d=depth(T)d1Tขั้นตอน (สมมติว่าใช้ขั้นตอนdเพื่อตรวจสอบสิ่งที่T(x)ประเมินว่าเป็นค่าใด ๆx) มีแนวทางที่ดีกว่านี้ไหม?O(d2nn!(nd)!)dT(x)x

แรงจูงใจ

คำถามนี้เป็นแรงบันดาลใจจากคำถามก่อนหน้านี้ในการค้าออกระหว่างความซับซ้อนแบบสอบถามและความซับซ้อนเวลา โดยเฉพาะเป้าหมายคือการ จำกัด เวลาสำหรับฟังก์ชั่นทั้งหมด เราสามารถสร้าง tree จากอัลกอริธึมที่เหมาะสมที่สุดกับ runtime tและจากนั้นเราต้องการแปลงเป็น tree T สำหรับอัลกอริทึมการค้นหาที่ดีที่สุด แต่ถ้าเสื้อO ( n ! / ( n - d ) ! ) (และมักจะd Θ ( n )TtTtO(n!/(nd)!)dΘ(n)) คอขวดคือการแปลง มันจะดีถ้าเราสามารถแทนที่โดยสิ่งที่ต้องการ2 dn!/(nd)!2d


การค้นหาแผนผังการตัดสินใจที่ดีที่สุดคือ NP-complete ฉันได้รับการสอนว่าในทฤษฎีการตัดสินใจและชั้นเรียนการขุดข้อมูลอย่างไรก็ตามสิ่งเหล่านั้นมีพื้นฐานมาจากบันทึกย่อและฉันไม่ทราบถึงกระดาษต้นฉบับที่นำผลลัพธ์มาใช้
chazisop

@ chazisop สุดยอดขอบคุณ ฉันไม่เห็นชัดเจนว่าการค้นหาแผนภูมิการตัดสินใจที่ดีที่สุดอยู่ใน NP แต่ฉันจะคิดถึง / ค้นหาอีกครั้ง บางครั้งการรู้ว่าข้อความของทฤษฎีบทนั้นพิสูจน์ได้ครึ่งทาง: D.
Artem Kaznatcheev

ฉันคิดว่าการอ้างอิงที่เร็วที่สุดสำหรับสิ่งนี้คือ: ขอบเขตล่างของรายการการตัดสินใจการเรียนรู้และต้นไม้ (Hancock et al. 1994) cs.uwaterloo.ca/~mli/dl.ps
Lev Reyzin

1
ข้อพิสูจน์ว่าการค้นหาต้นไม้ตัดสินใจที่ดีที่สุดเป็นปัญหาที่สมบูรณ์แบบของปัญหาโดย Laurent Hyafil และ Ronald L. Rivest ในการสร้างต้นไม้ตัดสินใจที่ดีที่สุดคือ NP-complete (1976) การอ้างอิง: ที่นี่
ทอน

คำตอบ:


16

ฉันมี 3 คำตอบทั้งหมดให้ผลความแข็งที่แตกต่างกันบ้าง

ให้เป็นฟังก์ชันf:{0,1}n{0,1}

คำตอบ 1

ได้รับต้นไม้ตัดสินใจคำนวณและจำนวนก็เป็น NP-ยากที่จะบอกได้ว่ามีอยู่ต้นไม้ตัดสินใจT 'คอมพิวเตอร์ขนาดที่บ้านเลขที่มากที่สุดที่ TfTf( Zantema and Bodlaender '00 )

คำตอบ 2

เนื่องจากต้นไม้การตัดสินใจ computing fนั้นเป็นเรื่องยากที่ NP จะประมาณค่าต้นไม้การตัดสินใจที่เล็กที่สุดfให้กับปัจจัยคงที่ Tff( Sieling '08 )

คำตอบ 3

Let มีขนาดที่เล็กที่สุดต้นไม้ตัดสินใจคอมพิวเตอร์ฉ ได้รับต้นไม้ตัดสินใจTคำนวณสมมติN P D T ฉันM E ( 2 n ε )สำหรับบางε < 1หนึ่งไม่สามารถหาการตัดสินใจเทียบเท่าต้นไม้T 'ขนาดs kสำหรับการใด ๆk 0sfTfNPDTIME(2nϵ)ϵ<1Tskk0

ฉันคิดว่าคำตอบที่ดีกว่านี้ (ขึ้นอยู่กับข้อสมมติที่อ่อนแอกว่า) สามารถสร้างจากผลลัพธ์ที่ทราบในทฤษฎีการเรียนรู้ของอัลกอริธึม Occamสำหรับต้นไม้ตัดสินใจผ่านทางอาร์กิวเมนต์ต่อไปนี้:

  1. มันเป็นไปได้ที่จะหาต้นไม้การตัดสินใจเกี่ยวกับตัวแปรในเวลา n บันทึกsที่sเป็นต้นไม้ที่มีขนาดเล็กที่สุดการตัดสินใจที่สอดคล้องกับตัวอย่างมาจากการจัดจำหน่าย (PAC รุ่น) ( Blum '92 ) nnlogss
  2. สมมติว่าสำหรับบางε < 1เราไม่สามารถ PAC เรียนรู้ขนาดของต้นไม้ตัดสินใจตามขนาดs kต้นไม้ตัดสินใจใด ๆk 0 ( Alekhnovich et al. '07 )NPDTIME(2nϵ)ϵ<1sskk0

ผลลัพธ์ทั้งสองดูเหมือนจะบ่งบอกถึงความแข็งสำหรับปัญหาของคุณ ในอีกด้านหนึ่ง (1) เราสามารถพบต้นไม้ตัดสินใจขนาดใหญ่ ในมืออื่น ๆ (2) เราไม่ควรจะสามารถลดความมันเพื่อให้ได้เทียบเท่า "เล็ก" หนึ่งขนาดแม้ในขณะที่มีอยู่ขนาดssks


(ฉันพบคำตอบของคุณจากคำตอบนี้ซึ่งโพสต์น้อยกว่าหนึ่งชั่วโมงที่แล้ว)ดูเหมือนว่า " " สามารถแทนที่ด้วย "บวกεตั้งแต่ลดลงεทำให้บรรจุที่ขวามือด้านที่มีขนาดเล็กϵ<1ϵϵ นอกจากนี้ในบทความนั้นมีการแสดงที่ 2?

ดูหัวข้อย่อย # 2 ในบทคัดย่อได้ที่นี่: researcher.watson.ibm.com/researcher/files/us-vitaly/ …
Lev Reyzin

(มาจากคำตอบเดียวกับ Ricky Demer) คุณช่วยเพิ่มรายละเอียดได้อีกเล็กน้อยคุณจะได้ "คำตอบ 3" จากจุดที่ 1 และ 2 ได้อย่างไร? ผมไม่คุ้นเคยกับทฤษฎีการเรียนรู้และมีเวลาที่ยากในการเชื่อมต่อชิ้นส่วน ...
มาร์ค

ปัญหาความมั่นคงและความสามารถในการเรียนรู้มีความสัมพันธ์กันอย่างใกล้ชิดผ่านทางมีดโกนของ Occam แนวคิดคือถ้าคุณสามารถหาฟังก์ชั่นที่สอดคล้องกันจากชุดเล็ก ๆ คุณสามารถประสบความสำเร็จในการเรียนรู้ PAC ดังนั้นความแข็งของผลการเรียนหมายถึงผลลัพธ์ "ความแข็งของความมั่นคง" ฉันไม่แน่ใจว่าฉันจะอธิบายได้มากน้อยเพียงใดในความคิดเห็น ...
เลฟเรซิน

Poly(n,s)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.