โคไซน์มีความคล้ายคลึงกันอย่างไรหลังจากการแปลงเชิงเส้น?


9

มีความสัมพันธ์ทางคณิตศาสตร์ระหว่าง:

  • ความคล้ายคลึงกันของโคไซน์ ของเวกเตอร์สองตัวและBและsim(A,B)AB
  • ความคล้ายคลึงกันของโคไซน์sim(MA,MB)ของAและB , การปรับขนาดที่ไม่สม่ำเสมอผ่านเมทริกซ์M ที่กำหนดM? นี่Mคือเมทริกซ์ทแยงมุมที่กำหนดที่มีองค์ประกอบไม่เท่ากันบนเส้นทแยงมุม

ฉันพยายามคำนวณมากกว่า แต่ไม่สามารถไปถึงลิงก์ที่น่าสนใจ / ง่าย (แสดงออก) ฉันสงสัยว่ามีหรือไม่


เช่นมุมที่ไม่ได้รับการเก็บรักษาไว้ในสเกลที่ไม่สม่ำเสมอ แต่ความสัมพันธ์ระหว่างมุมดั้งเดิมกับมุมมองหลังการปรับสเกลไม่เท่ากันคืออะไร อะไรที่สามารถพูดได้เกี่ยวกับการเชื่อมโยงระหว่างชุดของเวกเตอร์ S1 และชุดของเวกเตอร์ S2 อีกชุดหนึ่ง - ที่ซึ่ง S2 จะได้รับจากการปรับขนาด S1 ที่ไม่สม่ำเสมอ?


@whuber ขอบคุณ! ใช่ M เป็นเมทริกซ์ที่กำหนด (เมทริกซ์มาตราส่วน - ดังนั้นเมทริกซ์แนวทแยงจึงไม่มีข้อ จำกัด อื่น ๆ ) ในแง่หนึ่งฉันต้องการที่จะรู้ว่าเกิดอะไรขึ้น (ในแง่ของความคล้ายคลึงโคไซน์สำหรับคู่เวกเตอร์ใด ๆ ) ไปยังพื้นที่เวกเตอร์ซึ่งมีการปรับสเกลเชิงเส้น
turdus-merula

2
มันอาจจะคุ้มค่าที่จะสังเกตว่าหากปัจจัยสเกลทั้งหมดไม่เป็นลบ (อย่างที่ใคร ๆ ก็คิด) จากนั้นเมทริกซ์เชิงบวกแน่นอนที่แน่นอนแบบสมมาตรทั้งหมดสามารถพิจารณาได้ว่าเป็นเมทริกซ์ "สเกล" ความสัมพันธ์ที่คุณแสวงหาถูกนำมาใช้อย่างกว้างขวางอนึ่งในการศึกษาและรายละเอียดของการบิดเบือนในประมาณการแผนที่ ตรงนั้นมีศูนย์กลางความสนใจในมุมสูงสุดและต่ำสุดบนพื้นผิวโลกซึ่งจะเชื่อมโยงกับสองทิศทางตั้งฉากบนแผนที่ มีความสัมพันธ์โดยตรงระหว่างมุมเหล่านี้กับอัตราส่วนของปัจจัยสองระดับ
whuber

คำตอบ:


8

เนื่องจากค่อนข้างทั่วไปและการเปลี่ยนแปลงในความคล้ายคลึงโคไซน์ขึ้นอยู่กับและโดยเฉพาะและความสัมพันธ์ของพวกเขากับจึงไม่มีสูตรที่แน่นอน อย่างไรก็ตามมีข้อ จำกัด ในทางปฏิบัติที่คำนวณได้ว่าค่าความคล้ายคลึงโคไซน์สามารถเปลี่ยนแปลงได้มากแค่ไหน พวกเขาสามารถพบได้โดยการลดมุมระหว่างและเนื่องจากความคล้ายคลึงกันระหว่างและเป็นค่าที่ระบุคือ (โดยที่เป็นมุมระหว่างและ ) คำตอบบอกเราว่ามุมไหนMABMMAMBABcos(2ϕ)2ϕAB2ϕอาจจะสามารถงอได้โดยการเปลี่ยนแปลงMM

การคำนวณขู่ว่าจะยุ่ง ตัวเลือกที่ชาญฉลาดของสัญกรณ์พร้อมกับการทำให้เข้าใจง่ายเบื้องต้นลดความพยายาม ปรากฎว่าการแก้ปัญหาในสองมิติเผยให้เห็นทุกสิ่งที่เราต้องรู้ นี่เป็นปัญหาที่สามารถจัดการได้ขึ้นอยู่กับตัวแปรจริงเพียงตัวเดียวซึ่งแก้ไขได้อย่างง่ายดายโดยใช้เทคนิคแคลคูลัส อาร์กิวเมนต์เรขาคณิตอย่างง่ายขยายการแก้ปัญหานี้ไปยังหมายเลขของมิติใด ๆnθn

รอบคัดเลือกทางคณิตศาสตร์

ตามคำนิยามโคไซน์ของมุมระหว่างสองเวกเตอร์และนั้นได้มาจากการทำให้พวกมันเป็นความยาวของหน่วย ดังนั้น,AB

AB(AA)(BB)=cos(2ϕ)

และเขียน , โคไซน์ของมุมระหว่างรูปภาพของและภายใต้การแปลงคือΣ=MMABM

(1)(MA)(MB)((MA)(MA))((MB)(MB))=AΣB(AΣA)(BΣB).

สังเกตว่ามีเพียงเท่านั้นที่มีความสำคัญในการวิเคราะห์Σไม่ใช่ตัวดังนั้นเราจึงอาจใช้ประโยชน์จากการสลายตัวของเอกพจน์ (SVD)ของเพื่อทำให้ปัญหาง่ายขึ้น จำได้ว่าสิ่งนี้เป็นการแสดงออกว่าเป็นผลิตภัณฑ์ (จากขวาไปซ้าย) ของเมทริกซ์มุมฉากเมทริกซ์ทแยงมุมและเมทริกซ์มุมฉาก :MMMVDU

M=UDV.

กล่าวอีกนัยหนึ่งมีพื้นฐานของเวกเตอร์ที่มีสิทธิพิเศษ (คอลัมน์ของ ) ซึ่งทำหน้าที่โดยการ rescaling แต่ละแยกจากกันโดยรายการเส้นทแยงมุมของ (ซึ่งฉันจะเรียก ) และหลังจากนั้นใช้การหมุน (หรือการหมุน)กับผลลัพธ์ ที่หมุนรอบสุดท้ายจะไม่เปลี่ยนความยาวหรือมุมใด ๆ และดังนั้นจึงไม่ควรมีผลต่อ\คุณสามารถดูสิ่งนี้ได้อย่างเป็นทางการพร้อมการคำนวณe1,,enVMeiithDdiUΣ

Σ=MM=(UDV)(UDV)=VD(UU)DV=VD2V.

ดังนั้นเพื่อศึกษาเราได้อย่างอิสระอาจแทนที่โดยเมทริกซ์อื่น ๆ ที่ก่อให้เกิดค่าเดียวกันใน(1)โดยการสั่งซื้อเพื่อให้ลดขนาดลง (และสมมติว่าไม่ใช่ศูนย์เหมือนกัน) ตัวเลือกที่ดีของคือΣM(1)eidiMM

M=1d1DV.

องค์ประกอบเส้นทแยงมุมของคือ(1/d1)D

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

โดยเฉพาะอย่างยิ่งผลกระทบของ (ไม่ว่าจะอยู่ในรูปแบบดั้งเดิมหรือที่มีการเปลี่ยนแปลง) ในทุกมุมมองถูกกำหนดโดยความจริงที่ว่าM

Mei=λiei.

วิเคราะห์กรณีพิเศษ

ให้ 2 เนื่องจากการเปลี่ยนความยาวของเวกเตอร์ไม่เปลี่ยนมุมระหว่างพวกเขาเราอาจถือว่าและเป็นเวกเตอร์หน่วย ในระนาบเวกเตอร์ทั้งหมดนั้นอาจถูกกำหนดโดยมุมที่พวกเขาทำกับทำให้เราเขียนได้n=2ABe1

A=cos(θϕ)e1+sin(θϕ)e2.

ดังนั้น

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(ดูรูปด้านล่าง)

การประยุกต์ใช้เป็นเรื่องง่าย: การแก้ไขพิกัดแรกของและและคูณพิกัดที่สองของพวกเขาโดย\ดังนั้นมุมจากถึงคือMABλ2MAMB

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

เพราะเป็นฟังก์ชั่นอย่างต่อเนื่อง, ความแตกต่างของมุมนี้เป็นฟังก์ชั่นอย่างต่อเนื่องของ\ในความเป็นจริงมันแตกต่างกัน นี้จะช่วยให้เราสามารถหามุมที่รุนแรงโดยการตรวจสอบศูนย์ของอนุพันธ์theta) อนุพันธ์นั้นตรงไปตรงมาเพื่อคำนวณ: มันเป็นอัตราส่วนของฟังก์ชันตรีโกณมิติ ค่าศูนย์สามารถเกิดขึ้นได้เฉพาะในศูนย์ของตัวเศษดังนั้นอย่ากังวลกับการคำนวณตัวส่วน เราได้รับMθf(θ)

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

กรณีพิเศษของ , , และเป็นที่เข้าใจได้ง่าย: พวกมันสอดคล้องกับสถานการณ์ที่อยู่ในอันดับที่ลดลง (และทำให้สควอชทั้งหมดบนเส้น); โดยที่คือเมทริกซ์เอกลักษณ์หลายตัว และที่และเป็นแบบขนาน (ซึ่งมุมระหว่างพวกเขาไม่สามารถเปลี่ยนแปลงได้โดยไม่คำนึงถึง ) กรณีเป็นจรรยาบรรณโดยสภาพ0λ2=0λ2=1ϕ=0MMABθλ2=1λ20

นอกเหนือจากกรณีพิเศษเหล่านี้ค่าศูนย์เกิดขึ้นเฉพาะที่นั่นคือหรือ 2 ซึ่งหมายความว่าสายที่กำหนดโดย bisects มุมABตอนนี้เรารู้แล้วว่าค่าสุดขีดของมุมระหว่างและต้องอยู่ในค่าของดังนั้นให้คำนวณดังนี้sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)

f(0)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

โคไซน์ที่สอดคล้องกันคือ

(2)cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2

และ

(3)cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.

บ่อยครั้งก็เพียงพอที่จะเข้าใจว่าบิดเบือนมุมฉากอย่างไร ในกรณีนี้นำไปสู่ซึ่งคุณอาจเสียบเข้ากับสูตรก่อนหน้าM2ϕ=π/2tan(ϕ)=cot(ϕ)=1

โปรดสังเกตว่าเล็กลงจะยิ่งมุมเหล่านี้รุนแรงมากขึ้นเท่านั้นและยิ่งบิดเบือนมากขึ้นλ2

รูปที่แสดงการกำหนดค่าสี่แบบ

ตัวเลขนี้แสดงให้เห็นว่าการกำหนดค่าที่สี่ของเวกเตอร์และแยกจากกันโดยมุมของ 3 วงกลมหน่วยและภาพรูปไข่ของตนภายใต้มีสีเทาสำหรับการอ้างอิง (กับการกระทำของสม่ำเสมอให้ปรับแต่งหน้า ) ส่วนหัวของรูปที่แสดงให้เห็นค่าของ , จุดกึ่งกลางของและBและใกล้เคียงที่สุดสามารถเกิดขึ้นได้เมื่อถูกแปลงเป็นรูปแบบที่อยู่ทางซ้ายด้วยAB2ϕ=π/3MMλ1=1θABABMθ=0. ไกลออกจากกันพวกเขาสามารถกำหนดค่าเช่นเดียวที่ถูกต้องกับที่ 2 มีการแสดงความเป็นไปได้สองระดับกลางθ=π/2

ทางออกสำหรับทุกมิติ

เราได้เห็นวิธีการทำหน้าที่โดยการขยายมิติแต่ละโดยปัจจัย\สิ่งนี้จะบิดเบือนหน่วยทรงกลมไปเป็นรูปวงรี ตรวจสอบแกนหลัก มีระยะห่างจากจุดกำเนิดพร้อมแกนเหล่านี้จะทรงรี ดังนั้นที่เล็กที่สุดเป็นระยะทางที่สั้นที่สุด (ในทิศทางใดก็ได้) จากต้นกำเนิดถึงทรงรีและที่ใหญ่ที่สุดเป็นระยะทางไกลที่สุด (ในทิศทางใดก็ได้) จากต้นกำเนิดถึงทรงรีMiλi{A|AA=1}eiλiλnλ1

ในมิติที่สูงขึ้น ,และเป็นส่วนหนึ่งของพื้นที่สองมิติ แผนที่วงกลมหน่วยในสเปซนี้ลงในจุดตัดของทรงรีที่มีเครื่องบินที่มีและMBจุดตัดนี้เป็นการบิดเบี้ยวเชิงเส้นของวงกลมเป็นวงรี เห็นได้ชัดว่าระยะทางไกลเพื่อวงรีนี้คือไม่เกินและระยะทางที่สั้นที่สุดคือไม่น้อยกว่า\n>2ABMMAMBλ1=1λn

เมื่อเราสังเกตที่ส่วนท้ายของหัวข้อก่อนหน้าความเป็นไปได้ที่มากที่สุดคือเมื่อและตั้งอยู่ในระนาบที่ประกอบด้วยสองตัวซึ่งอัตราส่วนของนั้นมีขนาดเล็กที่สุดเท่าที่จะทำได้ สิ่งนี้จะเกิดขึ้นในระนาบ เรามีทางออกสำหรับกรณีนี้แล้วABeiλie1,en

สรุปผลการวิจัย

สุดขั้วของโคไซน์คล้ายคลึงกันสำเร็จโดยใช้สองเวกเตอร์ที่มีความคล้ายคลึงกันโคไซน์จะได้รับจากและ(3)พวกเขาบรรลุโดยตั้งฉากและในมุมที่เท่ากันกับทิศทางที่ยาวที่สุดเวกเตอร์ใด ๆ (เช่นทิศทาง ) และแยกพวกมันไปในทิศทางที่ทำให้เวกเตอร์ใดยาวที่สุดน้อยที่สุด ( เช่นทิศทาง )Mcos(2ϕ)(2)(3)ABΣ=MMe1Σen

สุดขั้วเหล่านี้สามารถคำนวณได้ในแง่ของ SVD ของMM


นี่คือคำตอบที่ยอดเยี่ยม! ขอบคุณมากสำหรับการสนทนาอย่างละเอียด! ฉันเชื่อว่าคุณมีข้อผิดพลาดในการลงชื่อใน eqn (3) ที่คุณควรจะมีเครื่องหมายลบโดยรวม
LFH

ฉันสนใจในกรณีที่มุมใกล้ศูนย์และฉันต้องการที่จะได้รับความไม่เท่าเทียมกันระหว่างและเอฟมันเป็นความจริงหรือการคำนวณของคุณฉันต้องหาสุดขีด (นั่นเล็กที่สุด)และในกรณีนี้ความไม่สมดุลเชิงซีมโทติคได้รับจากเป็น ? 2ϕ2ϕfλn2λnϕf2λn1ϕϕ0
LFH

6

คุณอาจจะสนใจใน:

(MA,MB)=AT(MTM)B,

คุณสามารถทแยงมุม (หรือที่คุณเรียกว่า PCA) ซึ่งจะบอกคุณว่าความคล้ายคลึงกันของภายใต้การแปลงทำหน้าที่โดยการฉายลงบนส่วนประกอบหลักของคุณและต่อมา คำนวณความคล้ายคลึงกันในพื้นที่ใหม่นี้ เนื้อนี้ออกมาอีกเล็กน้อยให้องค์ประกอบหลักเป็นกับค่าลักษณะเฉพาะ\แล้วก็MTM=UΣUTA,BMA,Buiλi

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

ซึ่งให้คุณ:

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

โปรดสังเกตว่ามีการขยายขนาดเกิดขึ้นที่นี่:กำลังยืด / หด เมื่อเป็นพาหะหน่วยและหากทุกแล้วสอดคล้องกับการหมุนและคุณจะได้รับ:ซึ่งเป็น เทียบเท่ากับการบอกว่าผลิตภัณฑ์ภายในนั้นไม่แปรเปลี่ยนภายใต้การหมุน โดยทั่วไปการเข้าพักมุมเดียวกันเมื่อคือการเปลี่ยนแปลงมาตราส่วนซึ่งในกรณีนี้จำเป็นต้องให้เป็นตัวผกผันและสลายขั้วของน่าพอใจกับคือMλiA,Bλi=1Msim(MA,MB)=sim(A,B)MMMM=OPP=aIMTM=a2I


1
คำแถลงเริ่มต้นของปัญหาละเลยการทำเวกเตอร์ , ,และให้เป็นมาตรฐานเพื่อคำนวณความคล้ายคลึงกันของโคไซน์ ไม่ปรากฏว่าการวิเคราะห์ที่ตามมาจะจัดการกับการทำให้เป็นมาตรฐานนี้เช่นกัน หมายเหตุโดยเฉพาะอย่างยิ่งที่คล้ายคลึงกันโคไซน์จะถูกเก็บไว้แม้ในขณะที่ทุกค่าลักษณะเฉพาะมีค่าเท่ากันบาง (บวก) ค่าที่แตกต่างจาก1สิ่งนี้แสดงให้เห็นถึงแม้ในกรณีง่าย ๆ นี้ก็ยังสามารถพูดได้อีกมากมาย ABMAMB1
whuber

@whuber: ความเหมือนโคไซน์จะถูกเก็บรักษาไว้อย่างแน่นอนเมื่อคือการแปลงที่สอดคล้องกันซึ่งในกรณีนี้เทียบเท่ากับกำหนดให้ต้องกลับด้านและซึ่งเป็นตัวตนที่หลากหลาย กล่าวอีกทางหนึ่งสลายขั้วของน่าพอใจที่Pคุณสิทธิเกี่ยวกับการฟื้นฟู แต่ดูเหมือนว่าโง่ที่จะพูดคุยเกี่ยวกับโคไซน์คล้ายคลึงกันกับเวกเตอร์ที่ไม่ปกติ B MMMTM=a2IMM=OPP=aIA,B
Alex R.

2
ไม่โง่เลย! เนื่องจาก "ความคล้ายคลึงกัน" นี้ได้รับจากโคไซน์ของมุมระหว่างเวกเตอร์มันจึงสมเหตุสมผลสำหรับเวกเตอร์ที่ไม่ใช่ศูนย์สองตัว สิ่งที่ฉันหมายโดย "อื่น ๆ อีกมากมายสามารถกล่าวว่า" คือว่าขอบเขตที่มีประสิทธิภาพกับมุมระหว่างภาพของและสามารถรับได้ในแง่ของมุมระหว่างและและค่าลักษณะเฉพาะของMABABM
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.