ค่าเฉลี่ยการบิดเบือนแต่งงาน


11

พิจารณาสองพื้นที่วัดและและการฝังY การวัดพื้นที่แบบดั้งเดิม embeddings วัดคุณภาพของเป็นกรณีที่เลวร้ายที่สุดของต้นฉบับ - ระยะทางอัตราส่วน: (X,d)(Y,f)μ:XYμ

ρ=maxp,qX{d(x,y)f(μ(x),μ(y)),f(μ(x),μ(y))d(x,y)}

มีมาตรการอื่น ๆ ที่มีคุณภาพแม้ว่า: Dhamdhere et alศึกษาการบิดเบือน "เฉลี่ย":

σ=d(x,y)f(μ(x),μ(y)).

อย่างไรก็ตามการวัดที่ฉันสนใจที่นี่คือวิธีการที่ใช้โดยวิธีเหมือน MDS ซึ่งดูที่ข้อผิดพลาดการเติมเฉลี่ย:

ε2=|d(x,y)f(μ(x),μ(y))|2

แม้ว่าจะมีการศึกษาวิธีการที่คล้ายกับ MDS อย่างกว้างขวางนอกทฤษฎีชุมชน CS ฉันก็รู้ว่ามีเพียงบทความเดียว ( โดย Dhamdhere และคณะ ) ที่ตรวจสอบการเพิ่มประสิทธิภาพภายใต้มาตรการนี้และนั่นก็เป็นปัญหาที่ จำกัด ในการฝังลงบนเส้น ( Y=R ) (หมายเหตุด้าน: วิทยานิพนธ์ Tasas Sidiropoulos ' 2005 MSมีความคิดเห็นที่ดีเกี่ยวกับงานก่อนหน้านี้)

มีงานอื่น ๆ อีกบ้างที่ผู้คนรับรู้เกี่ยวกับการวิเคราะห์คุณภาพอย่างเข้มงวดภายใต้แนวคิดเรื่องข้อผิดพลาดนี้หรือไม่? ในขณะที่ปัญหาเหล่านี้มักจะเกิดปัญหา NP-hard แต่สิ่งที่ฉันสนใจคือการประมาณค่าใด ๆ

คำตอบ:


3

นี่เป็นคำถามที่ดี ฉันไม่รู้อัลกอริธึมการประมาณค่า แต่ความแข็งที่ทราบแล้วเป็นผลมาจากการประมาณการบิดเบือนขั้นต่ำ (และปัญหาที่เกี่ยวข้องเช่นการติดฉลากเมตริก) ควรแสดงให้เห็นว่านั้นยากที่จะประมาณϵ2

เหตุผลก็คือพวกเขาให้การลดลงของปัญหา NP-hard เช่นในกรณี YES การบิดเบือนคือและในกรณี NO การบิดเบือนคืออย่างน้อยเศษส่วนคงที่ของขอบ ดังนั้นในกรณี YESจะเป็นปัจจัยเล็กกว่าในกรณี NO สำหรับรายละเอียดดูตัวอย่างกระดาษโดย Khot-Saket: www.cs.cmu.edu/~rsaket/pubs/approx.pdfO(1)Ω(k)ϵ2k

ฉันไม่แน่ใจว่าปัจจัยความแข็งใดที่ตามมาจากกระดาษของพวกเขา แต่มันก็ไม่ควรยากที่จะเข้าใจ (ฉันจะเดาว่าอย่างน้อยที่สุดปัจจัยที่คุณควรได้รับสำหรับการติดฉลากระบบเมตริก)logc(n)


นั่นเป็นคำแนะนำที่ดี ฉันจะดูงานการทำป้ายกำกับเมตริกอย่างแน่นอน เป็นที่ทราบกันว่าแม้การฝังลงบนบรรทัดคือ MAX SNP-hard แต่มันน่าสนใจ (แม้ว่าจะน่าผิดหวัง) เพื่อดูผลลัพธ์ที่ดีขึ้น
Suresh Venkat

2

ฉันอาจจะหายไปบางอย่าง แต่ทำไม ? เราสนใจที่จะประมาณอย่างใกล้ชิดดังนั้นเราจึงไม่สามารถขยายเพื่อสร้างสำหรับใช่ไหม?ϵ2(ρ1)d(x,y)2f(μ(x),μ(y))d(x,y)x,y

ข้อดีอย่างหนึ่งของที่นี่คือเราสามารถทำได้ไม่ดีในระยะสั้นและในที่สุดก็โอเค นอกจากนี้ปัญหาง่าย (โดยประมาณถึงแม้ว่า) หากเราต้องการฝังหรือไม่ (เราสามารถเขียนโปรแกรมคณิตศาสตร์เพื่อจับคำถามได้ไหม)2


จุดดี. ฉันเปลี่ยนคำตอบ
Moritz

มันขึ้นอยู่กับสูตร หากคุณก่อให้เกิดปัญหาในการย่อขนาดสำหรับพื้นที่ย่อยเป้าหมายที่มีมิติคงที่ข้อ จำกัด อันดับจะทำให้เกิดปัญหา หากคุณใช้สูตร "JL-style" (เช่นแก้ไขข้อผิดพลาดและค้นหามิติที่ถูกต้อง) สิ่งนั้นอาจทำได้ ϵ
Suresh Venkat

ปริมาณซึ่งอาจจะเป็นประโยชน์ในการ "แข่งขันกับ" คือ 2 พิจารณาปัญหาของการฝังลงใน (ฉันแนะนำก่อนหน้านี้ แต่มันมี sqrt ที่ยุ่งเหยิง) เราต้องตั้งเป้าหมายที่จะได้รับ embeddings อย่างชัดเจนซึ่งมีเป็น (ในความหมายที่คลุมเครือซึ่งหมายความว่าเราปิดคูณทวีสำหรับส่วนใหญ่เราสามารถได้รับการฝัง สำหรับพูด (ตัวขยายองศา) ตัวขยาย (หรือพิสูจน์ได้ว่าเป็นไปไม่ได้ใช่ไหม)S:=d(x,y)212ϵ2o(S)(1+o(1))x,y
aditya
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.