ตัวอย่างขนาดตัวอักษร (


9

ปล่อย Σเป็นตัวอักษรเช่นชุดที่ไม่มีข้อ จำกัด สตริงเป็นลำดับที่แน่นอนขององค์ประกอบ (ตัวอักษร) จากΣ. ตัวอย่างเช่น,{0,1} เป็นตัวอักษรไบนารีและ 0110 เป็นสตริงสำหรับตัวอักษรนี้

โดยปกติตราบใดที่ Σ มีองค์ประกอบมากกว่า 1 รายการจำนวนองค์ประกอบที่แน่นอนใน Σไม่สำคัญ: ที่ดีที่สุดเราจบลงด้วยค่าคงที่ที่แตกต่างกันที่ไหนสักแห่ง มันไม่สำคัญว่าถ้าเราใช้ตัวอักษรไบนารีตัวเลขตัวอักษรละตินหรือ Unicode

มีตัวอย่างของสถานการณ์ที่สำคัญขนาดตัวอักษรหรือไม่?

เหตุผลที่ฉันสนใจสิ่งนี้เพราะฉันบังเอิญเจอตัวอย่างเช่น:

สำหรับตัวอักษรใด ๆ Σ เรากำหนด oracle แบบสุ่ม OΣ เป็น oracle ที่ส่งคืนองค์ประกอบแบบสุ่มจาก Σเช่นว่าทุกองค์ประกอบมีโอกาสเท่ากันในการส่งคืน (ดังนั้นโอกาสสำหรับทุกองค์ประกอบคือ 1|Σ|)

สำหรับตัวอักษรบางตัว Σ1 และ Σ2 - อาจมีขนาดแตกต่างกัน - พิจารณาคลาสของ oracle machine ที่สามารถเข้าถึงได้ OΣ1. เราสนใจเครื่องจักร oracle ในคลาสนี้ที่มีพฤติกรรมเหมือนกับOΣ2. กล่าวอีกนัยหนึ่งเราต้องการแปลง oracleOΣ1 เข้าสู่ oracle OΣ2ใช้เครื่องทัวริง เราจะเรียกโปรแกรมแปลงไฟล์ดังกล่าวเป็นเครื่องทัวริง

ปล่อย Σ1={0,1} และ Σ={0,1,2,3}. แปลงOΣ1 เข้าสู่ oracle OΣ2 เป็นเรื่องง่าย: เราค้นหา OΣ1 สองครั้งโดยแปลงผลลัพธ์ดังนี้: 000, 011, 102, 113. เห็นได้ชัดว่าโปรแกรมนี้ทำงานO(1) เวลา.

ตอนนี้ขอ Σ1={0,1} และ Σ={0,1,2}. สำหรับสองภาษานี้โปรแกรมการแปลงทั้งหมดจะทำงานO() เวลาคือไม่มีโปรแกรมการแปลงจาก OΣ1 ถึง OΣ2 ที่ทำงานใน O(1) เวลา.

สิ่งนี้สามารถพิสูจน์ได้จากความขัดแย้ง: สมมติว่ามีโปรแกรมการแปลงอยู่ C จาก OΣ1 ถึง OΣ2 ทำงานใน O(1)เวลา. ซึ่งหมายความว่ามีdN ดังนั้น C ทำให้มากที่สุด d คำค้นหา Σ1.

C อาจทำให้น้อยกว่า dแบบสอบถามในเส้นทางการดำเนินการบางอย่าง เราสามารถสร้างโปรแกรมแปลงไฟล์ได้อย่างง่ายดายC ที่ดำเนินการ Cการติดตามว่ามีการสร้าง oracle query กี่ครั้ง ปล่อยk เป็นจำนวนของแบบสอบถาม Oracle C แล้วทำให้ dk ข้อความค้นหาเพิ่มเติมของ Oracle ยกเลิกผลลัพธ์แล้วส่งคืนอะไร C จะได้กลับมา

ด้วยวิธีนี้มีอย่างแน่นอน |Σ1|d=2d เส้นทางการดำเนินการสำหรับ C. เผง1|Σ2|=13 ของเส้นทางการดำเนินการเหล่านี้จะส่งผลให้ C การคืน 0. อย่างไรก็ตาม2d3ไม่ใช่จำนวนเต็มดังนั้นเราจึงมีข้อขัดแย้ง ดังนั้นจึงไม่มีโปรแกรมดังกล่าวอยู่

โดยทั่วไปถ้าเรามีตัวอักษร Σ1 และ Σ2 กับ |Σ1|=n และ |Σ2|=kจากนั้นมีโปรแกรมการแปลงจาก OΣ1 ถึง OΣ2 ถ้าหากเฉพาะช่วงเวลาทั้งหมดที่ปรากฏในการแยกตัวประกอบเฉพาะของ n ก็ปรากฏตัวในตัวประกอบสำคัญของ k (ดังนั้นเลขชี้กำลังของจำนวนเฉพาะในการแยกตัวประกอบไม่สำคัญ)

ผลที่ตามมาคือว่าถ้าเรามีเครื่องกำเนิดตัวเลขสุ่มสร้างสตริงไบนารีของความยาว lเราไม่สามารถใช้ตัวสร้างตัวเลขสุ่มนั้นเพื่อสร้างตัวเลขได้ {0,1,2} ด้วยความน่าจะเป็นที่เท่าเทียมกัน

ฉันคิดปัญหาข้างต้นเมื่อยืนอยู่ในซุปเปอร์มาร์เก็ตคิดว่าจะกินอะไรดี ฉันสงสัยว่าฉันสามารถใช้การโยนเหรียญเพื่อตัดสินใจเลือกระหว่าง A, B และ C ได้หรือไม่หากเป็นไปไม่ได้


5
การพิสูจน์ทฤษฎีบท PCP ของ Dinur อาศัยการจัดการขนาดตัวอักษรอย่างหนักโดยเฉพาะการเป่าขึ้นแล้วลดขนาดลงผ่านการจัดองค์ประกอบ PCP ซ้ำ ๆ หากไม่มีส่วนที่สองของขั้นตอน (การดึงขนาดตัวอักษรกลับลงมา) หลักฐานจะไม่ทำงาน
Daniel Apon

2
@Daniel Apon: ทำไมไม่โพสต์ใหม่เป็นคำตอบ?
Joshua Grochow

@ โจชัวอ๊ะ แน่ใจ :)
Daniel Apon

คำตอบ:


11

มีตัวอย่างบางส่วนในทฤษฎีภาษาที่เป็นทางการซึ่งตัวอักษร 2 ตัวและ 3 ตัวอักษรให้พฤติกรรมที่แตกต่างในเชิงคุณภาพ Kozen ให้ตัวอย่างที่ดีดังต่อไปนี้(ถอดความ):

ปล่อยให้ตัวอักษรเป็น Σ= {1, .. , k} ด้วยการเรียงลำดับตัวเลขมาตรฐานและกำหนด sort (x) เพื่อให้เรียงลำดับคำว่า x ที่ตัวอักษรของ x ปรากฏในลำดับที่เรียงลำดับ ขยายการเรียงลำดับ (A) = {sort (x) | x A} และพิจารณาการอ้างสิทธิ์ต่อไปนี้:

ถ้า A ไม่มีบริบทดังนั้นการเรียงลำดับ (A) จะไม่มีบริบท

การอ้างสิทธิ์นี้เป็นจริงสำหรับ k = 2 แต่เป็นเท็จสำหรับ k 3


11

การพิสูจน์ทฤษฎีบท PCP ของ Dinurอาศัยการจัดการขนาดตัวอักษรเป็นอย่างมาก

โดยเฉพาะอย่างยิ่งโครงสร้างโดยรวมของการพิสูจน์คือการประยุกต์ซ้ำของเทคนิคการเปิดใช้งานกราฟเป็นลอการิทึมในจำนวนขนาดกราฟครั้ง ในการวนซ้ำแต่ละกราฟจะถูกประมวลผลล่วงหน้าเป็นกราฟขยายตัวปกติขยายด้วยกำลัง (ซึ่งทำให้ขนาดตัวอักษรใหญ่ขึ้น) จากนั้นใช้การจัดองค์ประกอบ PCP (เปลี่ยนข้อ จำกัด แต่ละตัวบนตัวอักษรขนาดใหญ่ให้เป็นระบบข้อ จำกัด ตัวอักษรขนาดเล็ก)

เป้าหมายโดยปริยายของกระบวนการคือการหาวิธีที่จะใช้ขั้นตอนการขยายสัญญาณอีกครั้งจนกระทั่งค่า UNSAT กลายเป็นเศษส่วนคงที่ (พิสูจน์ทฤษฎีบท PCP) จุดสำคัญคือยกเว้นว่ามีการดึงขนาดตัวอักษรกลับมาในแต่ละครั้งกราฟผลลัพธ์จะไม่จำเป็นสำหรับการลดสุดท้าย


9

ข้อกำหนดของตัวอย่างของคุณค่อนข้างเข้มงวด หากคุณผ่อนคลายเพื่อต้องการเพียงการแปลงที่ทำงานO(1)ในความคาดหวัง เป็นไปได้ที่จะสุ่มตัวอย่างอย่างสม่ำเสมอ{0,1,2} ใช้โดยคาดว่าจะโยนเหรียญจำนวนคงที่

ฉันไม่ใช่ผู้เชี่ยวชาญในเรื่องนี้ แต่ตัวอย่างหนึ่งที่ดีคือขนาดของตัวอักษรที่มีความสำคัญคือการเข้ารหัสและโครงสร้างข้อมูลที่กระชับ ลองนึกภาพคุณต้องการแสดงข้อความผ่านตัวอักษร{0,1,2} ในตัวอักษร {0,1}(เช่นเพื่อเก็บไว้ในคอมพิวเตอร์ไบนารีของคุณ) คุณต้องการลดพื้นที่ที่ต้องการ แต่ในเวลาเดียวกันคุณต้องการที่จะสามารถอ่านและเขียนอักขระแต่ละตัวของข้อความได้อย่างรวดเร็ว (สมมุติว่าเป็นO(1)) ปัญหาเช่นนี้ได้รับการศึกษามาระยะหนึ่งแล้ว บทความล่าสุดโดย Dodis, Patrascu และ Thorup บนมันและการอ้างอิงในนั้นควรเป็นจุดเริ่มต้นที่ดี


8

ในการแก้ไขข้อผิดพลาดรหัสเป็นไปได้ว่ามีความแตกต่างพื้นฐานระหว่างรหัสไบนารีและรหัสมากกว่าตัวอักษรขนาดใหญ่ที่ตัวอย่าง Gilbert Varshamov สำหรับรหัสที่แก้ไขเศษส่วนของข้อผิดพลาด (ซึ่งเป็นตัวอย่างโลภหรือสุ่มตัวอย่าง) เชื่อว่า ทำให้แน่นในกรณีไบนารีและเป็นที่รู้จักกันไม่แน่นตัวอักษรขนาดใหญ่ผ่านรหัสพีชคณิตเรขาคณิต สิ่งนี้ทำให้บางคนคาดการณ์ว่าคำนิยามมาตรฐานของรหัสการแก้ไขข้อผิดพลาดสำหรับตัวอักษรขนาดใหญ่ไม่ใช่แบบอะนาล็อกที่ถูกต้องของรหัสการแก้ไขข้อผิดพลาดแบบไบนารี


5

ฉันได้พบกับกรณีที่น่าสนใจในการวิจัยของฉันเองเกี่ยวกับความแตกต่างเล็ก ๆ ในขนาดตัวอักษรซึ่งทำให้เกิดความแตกต่างอย่างมากในทฤษฎีที่เกิดขึ้น คำอธิบายคร่าวๆของปัญหาของการเรียนรู้วงจรน่าจะเป็นต่อไปนี้: ผู้เรียนสามารถแทนที่ประตูของวงจรที่ซ่อนอยู่และสังเกตผลผลิตที่เกิดขึ้นและมีเป้าหมายที่จะผลิต "ทำงานได้เทียบเท่า" วงจร สำหรับวงจรบูลีนเมื่อใดก็ตามที่เกตมี "อิทธิพล" ต่อเอาท์พุทเราสามารถแยกเส้นทางที่มีอิทธิพลออกจากเกทนั้นไปยังเอาต์พุตของวงจรได้ สำหรับวงจรขนาดตัวอักษร3สิ่งนี้จะไม่กลายเป็นกรณีนี้อีกต่อไป - กล่าวคือมีวงจรที่มีประตูที่มีอิทธิพลอย่างมากต่อค่าเอาต์พุต แต่ไม่มีผลต่อเส้นทางใดเส้นทางหนึ่งไปยังเอาต์พุต! เราพบว่าผลลัพธ์นี้น่าประหลาดใจทีเดียว

ผลลัพธ์ค่อนข้างเป็นเรื่องทางเทคนิค แต่ถ้าคุณสนใจคุณสามารถเปรียบเทียบเล็มม่า 8 กับมาตรา 4.1 สำหรับคำสั่งทฤษฎีบทที่เกี่ยวข้องได้


ดูเหมือนว่าน่าสนใจมาก คุณลองปรับเปลี่ยนนิยามของอิทธิพลเพื่อดูว่าคุณจะได้อะไรที่คล้ายกับกรณีบูลีนหรือไม่?
Kaveh

การนิยามอิทธิพลของเรานั้นค่อนข้างเป็นธรรมชาติ - คุณมองไปที่การแจกแจงความน่าจะเป็นของโหนดเอาต์พุตที่ได้รับจากการตั้งค่าเป้าหมายที่แตกต่างกัน หากการตั้งค่าทั้งหมดให้ผลการแจกแจงความน่าจะเป็นที่แน่นอนเหมือนกันเราจะบอกว่าเป้าหมายนั้นไม่มีอิทธิพล ในกรณีที่คุณสนใจโมเดลที่เราทำงานภายใต้เรียกว่าโมเดล VIQ ซึ่งฉันคิดว่าเป็นรูปแบบการเรียนรู้วงจรที่น่าสนใจที่สุด มันถูกกำหนดใน ( cs.yale.edu/homes/aspnes/… ) โดย Angluin et al ใน STOC '06
Lev Reyzin
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.