ทำไมความหลงใหลอย่างฉับพลันกับเทนเซอร์?


171

ฉันได้สังเกตเห็นเมื่อเร็ว ๆ นี้ว่าผู้คนจำนวนมากกำลังพัฒนาเทนเซอร์เทียบเท่าวิธีการหลายอย่าง (การแยกตัวประกอบเทนเซอร์, เมล็ดเทนเซอร์, เทนเซอร์สำหรับการสร้างแบบจำลองหัวข้อ ฯลฯ ) ฉันสงสัยว่าทำไมโลกถึงหลงใหลเทนเซอร์ มีเอกสาร / ผลมาตรฐานล่าสุดที่น่าประหลาดใจเป็นพิเศษหรือไม่ มันคำนวณได้ถูกกว่าที่คาดไว้มากก่อนหน้านี้ไหม?

ฉันไม่ได้เป็นคนที่มีเสน่ห์ฉันมีความสนใจอย่างจริงใจและหากมีคำแนะนำใด ๆ เกี่ยวกับเรื่องนี้ฉันก็อยากอ่าน


25
ดูเหมือนว่าคุณสมบัติการรักษาเดียวที่ "ตัวดึงข้อมูลขนาดใหญ่" ใช้ร่วมกับข้อกำหนดทางคณิตศาสตร์ปกติคือพวกมันเป็นอาร์เรย์หลายมิติ ดังนั้นฉันจึงบอกว่าเทนเซอร์ข้อมูลขนาดใหญ่เป็นวิธีการตลาดในการพูดว่า "อาเรย์หลายมิติ" เพราะฉันสงสัยอย่างมากว่าการเรียนรู้ของเครื่องคนจะสนใจเกี่ยวกับความสมมาตรหรือกฎการแปลงสภาพที่คณิตศาสตร์ของฟิสิกส์และฟิสิกส์ ในการสร้างสมการฟรีพิกัด
Alex R.

2
@AlexR ไม่มีการแปรเปลี่ยนไปสู่การแปลงไม่
มีเทน

2
@ Aksakal ฉันค่อนข้างคุ้นเคยกับการใช้เทนเซอร์ในวิชาฟิสิกส์ ประเด็นของฉันคือความสมมาตรของเทนเซอร์ฟิสิกส์มาจากสมมาตรของฟิสิกส์ไม่ใช่สิ่งที่จำเป็นในการปกป้องเทนเซอร์
aginensky

3
@aginensky ถ้าเมตริกซ์ไม่มีอะไรมากไปกว่าอาเรย์หลายมิติแล้วทำไมคำจำกัดความของเทนเซอร์ที่พบในตำราเรียนคณิตศาสตร์นั้นฟังดูซับซ้อนไหม? จากวิกิพีเดีย: "ตัวเลขในอาเรย์หลายมิติเรียกว่าองค์ประกอบสเกลาร์ของเทนเซอร์ ... เช่นเดียวกับส่วนประกอบของเวกเตอร์ที่เปลี่ยนไปเมื่อเราเปลี่ยนพื้นฐานของสเปซเวกเตอร์องค์ประกอบของเทนเซอร์ก็เปลี่ยนไปเช่น การเปลี่ยนแปลงแต่ละเทนเซอร์มาพร้อมกับกฎหมายการเปลี่ยนแปลงที่มีรายละเอียดว่าส่วนประกอบของเทนเซอร์ตอบสนองต่อการเปลี่ยนแปลงของพื้นฐาน " ในคณิตศาสตร์เมตริกซ์ไม่ได้เป็นเพียงอาร์เรย์
littleO

4
แค่ความคิดทั่วไปเกี่ยวกับการสนทนานี้: ฉันคิดว่าเช่นเดียวกับเวกเตอร์และเมทริกซ์แอปพลิเคชันที่เกิดขึ้นจริงมักจะกลายเป็นอินสแตนซ์ของทฤษฎีที่สมบูรณ์ยิ่งขึ้น ฉันกำลังอ่านบทความนี้ในเชิงลึกยิ่งขึ้น: epubs.siam.org/doi/abs/10.1137/07070111X?journalCode=sireadและสิ่งหนึ่งที่ทำให้ฉันประทับใจจริงๆคือเครื่องมือ "การเป็นตัวแทน" สำหรับเมทริกซ์ (eigenvalue และการสลายตัวของค่าเอกพจน์) มีภาพรวมที่น่าสนใจในคำสั่งซื้อที่สูงขึ้น ฉันแน่ใจว่ามีคุณสมบัติที่สวยงามอีกมากมายเช่นกันนอกเหนือจากที่เก็บที่ดีสำหรับดัชนีเพิ่มเติม :)
YS

คำตอบ:


89

ตัวนับมักเสนอข้อมูลที่เป็นธรรมชาติมากขึ้นเช่นพิจารณาวิดีโอซึ่งประกอบด้วยภาพที่สัมพันธ์กันอย่างชัดเจนตลอดเวลา คุณสามารถเปลี่ยนเป็นเมทริกซ์ได้ แต่มันไม่ได้เป็นธรรมชาติหรือใช้งานง่าย (การแยกตัวประกอบของการแสดงเมทริกซ์ของวิดีโอหมายถึงอะไร)

เทนเซอร์มีแนวโน้มด้วยเหตุผลหลายประการ:

  • ความเข้าใจของเราเกี่ยวกับพีชคณิตแบบหลายเส้นกำลังพัฒนาอย่างรวดเร็วโดยเฉพาะในประเภทต่าง ๆ ของ factorizations ซึ่งจะช่วยให้เราสามารถระบุแอปพลิเคชันใหม่ที่อาจเกิดขึ้น (เช่นการวิเคราะห์องค์ประกอบหลายทาง )
  • เครื่องมือซอฟต์แวร์เกิดขึ้นใหม่ (เช่นTensorlab ) และได้รับการต้อนรับ
  • แอปพลิเคชันบิ๊กดาต้าสามารถแก้ไขได้โดยใช้เทนเซอร์เช่นระบบผู้แนะนำและบิ๊กดาต้านั้นร้อน
  • การเพิ่มขึ้นของพลังการคำนวณเนื่องจากการดำเนินการของเทนเซอร์อาจมีความแข็งแรงมาก (นี่เป็นหนึ่งในเหตุผลสำคัญที่ว่าทำไมการเรียนรู้อย่างลึกซึ้งจึงเป็นที่นิยมในขณะนี้)

9
ในส่วนของพลังการคำนวณ: ฉันคิดว่าสิ่งที่สำคัญที่สุดคือพีชคณิตเชิงเส้นสามารถทำได้รวดเร็วใน GPU และเมื่อเร็ว ๆ นี้พวกเขาได้รับความทรงจำที่ใหญ่กว่าและเร็วกว่านั่นเป็นข้อ จำกัด ที่ใหญ่ที่สุดเมื่อประมวลผลข้อมูลขนาดใหญ่
Davidmh

6
คำตอบของ Marc Claesen เป็นคำตอบที่ดี เดวิด DUNSON ศาสตราจารย์สถิติที่ Duke ได้รับหนึ่งในเลขยกกำลังที่สำคัญของวิธีเมตริกซ์ที่ใช้ในการสร้างแบบจำลองในขณะที่นำเสนอนี้คชกรรม Tensor ถดถอย icerm.brown.edu/materials/Slides/sp-f12-w1/…
Mike Hunter

ตามที่กล่าวไว้โดย David อัลกอริธึม Tensor มักให้ยืมตัวเองได้ดีกับการขนานซึ่งฮาร์ดแวร์ (เช่นตัวเร่ง GPU) นั้นเริ่มดีขึ้นเรื่อย ๆ
โทมัสรัสเซลล์

1
ฉันสันนิษฐานว่าความสามารถของหน่วยความจำ / CPU ที่ดีกว่านั้นมีบทบาทสำคัญ แต่การที่ได้รับความสนใจเมื่อไม่นานมานี้ก็น่าสนใจ ฉันคิดว่ามันต้องเป็นเพราะความสำเร็จที่น่าประหลาดใจเมื่อไม่นานมานี้กับระบบผู้แนะนำและอาจเป็นเมล็ดสำหรับ SVM ได้เช่นกันขอบคุณสำหรับลิงค์! สถานที่ที่ยอดเยี่ยมสำหรับการเริ่มเรียนรู้เกี่ยวกับสิ่งนี้ ...
YS

5
หากคุณเก็บวิดีโอเป็นอาร์เรย์หลายมิติฉันไม่เห็นว่าอาร์เรย์หลายมิตินี้จะมีคุณสมบัติค่าคงที่ใด ๆ ที่เมตริกซ์ควรมี ดูเหมือนว่าคำว่า "เทนเซอร์" นั้นไม่เหมาะสมในตัวอย่างนี้
littleO

73

ฉันคิดว่าคำถามของคุณควรจับคู่กับคำตอบที่ให้อิสระและเปิดกว้างเท่า ๆ กันกับคำถาม ดังนั้นที่นี่พวกเขาเป็นสองอุปมาของฉัน

ก่อนอื่นเว้นแต่ว่าคุณเป็นนักคณิตศาสตร์ที่บริสุทธิ์คุณอาจได้รับการสอนความน่าจะเป็นและสถิติที่ไม่แปรผันก่อน ตัวอย่างเช่นมีแนวโน้มมากที่สุดตัวอย่างOLSแรกของคุณน่าจะเป็นในรูปแบบเช่นนี้: มากที่สุดที่คุณจะได้รับการประมาณการผ่านการลดจำนวนกำลังสองน้อยที่สุดอย่างแท้จริง: จากนั้นคุณเขียนFOC s เพื่อหาพารามิเตอร์และหาคำตอบ:

yi=a+bxi+ei
TSS=i(yia¯b¯xi)2
TTSa¯=0

จากนั้นคุณก็บอกว่ามีวิธีที่ง่ายกว่าในการทำสิ่งนี้ด้วยสัญกรณ์เวกเตอร์ (เมทริกซ์):

y=Xb+e

และ TTS จะกลายเป็น:

TTS=(yXb¯)(yXb¯)

FOCs คือ:

2X(yXb¯)=0

และทางออกคือ

b¯=(XX)1Xy

หากคุณทำได้ดีในพีชคณิตเชิงเส้นคุณจะยึดแนวทางที่สองเมื่อคุณเรียนรู้แล้วเพราะจริง ๆ แล้วง่ายกว่าการเขียนผลรวมทั้งหมดในวิธีแรกโดยเฉพาะอย่างยิ่งเมื่อคุณได้รับสถิติหลายตัวแปร

ดังนั้นการเปรียบเทียบของฉันคือการย้ายไปยังเทนเซอร์จากเมทริกซ์คล้ายกับการย้ายจากเวกเตอร์ไปยังเมทริกซ์: ถ้าคุณรู้ว่าเทนเซอร์บางสิ่งบางอย่างจะดูง่ายขึ้นด้วยวิธีนี้

ประการที่สองเทนเซอร์มาจากไหน ฉันไม่แน่ใจเกี่ยวกับประวัติทั้งหมดของสิ่งนี้ แต่ฉันเรียนรู้พวกเขาในกลศาสตร์เชิงทฤษฎี แน่นอนว่าเรามีหลักสูตรเกี่ยวกับเทนเซอร์ แต่ฉันไม่เข้าใจว่าอะไรคือข้อตกลงกับวิธีแฟนซีเหล่านี้ทั้งหมดในการแลกเปลี่ยนดัชนีในหลักสูตรคณิตศาสตร์นั้น ทุกอย่างเริ่มมีความหมายในบริบทของการศึกษาแรงดึง

ดังนั้นในวิชาฟิสิกส์พวกเขาก็เริ่มต้นด้วยตัวอย่างง่ายๆของความดันที่กำหนดเป็นแรงต่อหน่วยพื้นที่ดังนั้น: นี่หมายความว่าคุณสามารถคำนวณแรงเวกเตอร์โดยการคูณแรงดัน (สเกลาร์) ด้วยหน่วยของพื้นที่ (เวกเตอร์ปกติ) นั่นคือเมื่อเรามีพื้นผิวระนาบไม่สิ้นสุดเพียงอันเดียว ในกรณีนี้มันจะมีแรงตั้งฉากหนึ่งอัน บอลลูนขนาดใหญ่น่าจะเป็นตัวอย่างที่ดี

F=pdS
FpdS

อย่างไรก็ตามหากคุณกำลังศึกษาความตึงเครียดภายในวัสดุคุณกำลังเผชิญกับทิศทางและพื้นผิวที่เป็นไปได้ทั้งหมด ในกรณีนี้คุณมีแรงบนพื้นผิวที่กำหนดให้ดึงหรือดันในทุกทิศทางไม่เพียง แต่ฉากตั้งฉาก พื้นผิวบางส่วนถูกฉีกขาดโดยกองกำลังสัมผัสวง "ไซด์เวย์" ฯลฯ ดังนั้นสมการของคุณจะกลายเป็น: แรงยังคงเป็นเวกเตอร์และพื้นที่ผิวยังคงเป็นตัวแทนของเวกเตอร์ปกติแต่เป็นเมตริกซ์ ตอนนี้ไม่ใช่เซนต์คิตส์และเนวิส

F=PdS
FdSP

โอเคสเกลาร์และเวกเตอร์เป็นเมตริกซ์ด้วย :)

อีกที่ที่เทนเซอร์แสดงขึ้นตามธรรมชาติคือความแปรปรวนร่วมหรือเมทริกซ์สหสัมพันธ์ ลองคิดดูสิ: วิธีการเปลี่ยนเมทริกซ์สหสัมพันธ์เป็นอีกหนึ่งอย่างไร คุณรู้ว่าเราไม่สามารถทำเช่นนี้ได้: ที่เพราะเราต้องเก็บค่าค่ากึ่งบวกแน่นอนทั้งหมดC0C1

Cθ(i,j)=C0(i,j)+θ(C1(i,j)C0(i,j)),
θ[0,1]Cθ

ดังนั้นเราต้องค้นหาเส้นทางเช่นนั้นโดยที่ เป็นการรบกวนเล็กน้อยกับเมทริกซ์ มีเส้นทางที่แตกต่างกันมากมายและเราสามารถค้นหาเส้นทางที่สั้นที่สุดได้ นั่นคือวิธีที่เราเข้าสู่เรขาคณิตของรีมันน์, แมนิโฟลด์และ ... เทนเซอร์δCθC1=C0+θδCθδCθ

อัพเดท: เทนเซอร์คืออะไรกันล่ะ?

@amoeba และคนอื่น ๆ ได้พูดคุยกันอย่างมีชีวิตชีวาเกี่ยวกับความหมายของเทนเซอร์และไม่ว่าจะเป็นอาเรย์ ดังนั้นฉันคิดว่าตัวอย่างอยู่ในลำดับ

บอกว่าเราจะไปตลาดสดเพื่อซื้อร้านขายของชำและมีสอง dudes พ่อค้าและd_2เราสังเกตว่าถ้าเราจ่ายดอลลาร์เป็นและดอลลาร์ให้กับ ดังนั้นขายเราปอนด์ของแอปเปิ้ลและขายเราส้ม ตัวอย่างเช่นหากเราจ่ายทั้ง 1 ดอลลาร์คือเราจะต้องได้รับแอปเปิ้ล 1 ปอนด์และ 1.5 ส้มd1d2x1d1x2d2d1y1=2x1x2d2y2=0.5x1+2x2x1=x2=1

เราสามารถแสดงความสัมพันธ์นี้ในรูปแบบของเมทริกซ์ :P

 2   -1
-0.5  2 

จากนั้นพ่อค้าจะผลิตแอปเปิ้ลและส้มจำนวนมากนี้ถ้าเราจ่ายให้พวกเขาดอลลาร์: x

y=Px

มันทำงานเหมือนกับเมทริกซ์โดยการคูณเวกเตอร์

ตอนนี้สมมติว่าแทนที่จะซื้อสินค้าจากพ่อค้าเหล่านี้แยกกันเราประกาศว่ามีการใช้จ่ายสองกลุ่มที่เราใช้ เราจ่ายทั้งสอง 0.71 ดอลลาร์หรือจ่าย 0.71 ดอลลาร์และเรียกร้อง 0.71 ดอลลาร์จากกลับ เช่นเดียวกับในกรณีแรกเราไปที่ตลาดสดและใช้จ่ายในกลุ่มหนึ่งและในกลุ่ม 2d1d2z1z2

ลองดูตัวอย่างที่เราใช้เพียงแค่ในชุด 1 ในกรณีนี้ผู้ค้ารายแรกได้รับดอลลาร์และผู้ค้ารายที่สองได้รับเหมือนกัน ดังนั้นเราจะต้องได้รับผลผลิตเท่ากันในตัวอย่างข้างต้นใช่ไหม?z1=2x1=1x2=1

อาจจะอาจจะไม่. คุณสังเกตเห็นว่าเมทริกซ์ไม่ใช่เส้นทแยงมุม สิ่งนี้บ่งชี้ว่าด้วยเหตุผลบางอย่างจำนวนหนึ่งที่ผู้ขายเรียกเก็บจากผลงานของเขานั้นขึ้นอยู่กับจำนวนที่เราจ่ายให้ผู้ค้ารายอื่น พวกเขาต้องรู้ว่าจะจ่ายเท่าไรอาจจะมีข่าวลือบ้าง? ในกรณีนี้ถ้าเราเริ่มซื้อเป็นชุดพวกเขาจะรู้แน่ชัดว่าเราจ่ายเท่าไหร่เพราะเราประกาศกลุ่มของพวกเขาไปที่ตลาดสด ในกรณีนี้เราจะรู้ได้อย่างไรว่าเมทริกซ์ควรคงเดิมPP

อาจมีข้อมูลการชำระเงินของเราในตลาดที่สมบูรณ์สูตรการกำหนดราคาก็จะเปลี่ยนแปลงเช่นกัน! นี่จะเปลี่ยนเมทริกซ์ของเราและไม่มีทางที่จะบอกได้อย่างแน่นอนP

นี่คือที่ที่เราเข้าสู่เทนเซอร์ โดยพื้นฐานแล้วด้วยเมตริกซ์เราบอกว่าการคำนวณจะไม่เปลี่ยนแปลงเมื่อเราเริ่มการซื้อขายเป็นชุดแทนที่จะเป็นโดยตรงกับผู้ค้าแต่ละราย นั่นคือข้อ จำกัด ที่จะบังคับใช้กฎการเปลี่ยนแปลงในซึ่งเราจะเรียกเมตริกซ์P

โดยเฉพาะอย่างยิ่งเราอาจสังเกตเห็นว่าเรามีพื้นฐาน orthonormalโดยที่หมายถึงการชำระเงิน 1 ดอลลาร์ให้แก่ผู้ขายและไม่มีอะไรให้อีกเลย นอกจากนี้เรายังอาจสังเกตเห็นว่าการรวมกลุ่มเป็นพื้นฐาน orthonormalซึ่งเป็นการหมุนอย่างง่ายของพื้นฐานแรกโดย 45 องศาทวนเข็มนาฬิกา นอกจากนี้ยังเป็นการย่อยสลายพีซีของพื้นฐานแรก ดังนั้นเรากำลังบอกว่าการสลับไปยังบันเดิลเป็นการเปลี่ยนพิกัดอย่างง่ายและไม่ควรเปลี่ยนการคำนวณ โปรดทราบว่านี่เป็นข้อ จำกัด ภายนอกที่เรากำหนดไว้ในแบบจำลอง มันไม่ได้มาจากคุณสมบัติทางคณิตศาสตร์ล้วนๆของเมทริกซ์d¯1,d¯2diid¯1,d¯2

ตอนนี้ช้อปปิ้งของเราสามารถแสดงเป็นเวกเตอร์d_2 เวกเตอร์ก็เป็นเทนเซอร์เช่นกัน btw เมตริกซ์เป็นที่น่าสนใจ: มันสามารถแสดงเป็นและร้านขายของชำเป็นd_2 กับร้านขายของชำหมายถึงผลผลิตหนึ่งกิโลกรัมจากพ่อค้าไม่ใช่เงินที่จ่ายx=x1d¯1+x2d¯2

P=ijpijd¯id¯j
y=y1d¯1+y2d¯2yii

ตอนนี้เมื่อเราเปลี่ยนพิกัดเป็นชุดสมการเทนเซอร์ยังคงเดิม:

y=Pz

นั่นเป็นสิ่งที่ดี แต่เวกเตอร์การชำระเงินอยู่ในเกณฑ์ที่แตกต่างกัน:ในขณะที่เราอาจเก็บเวกเตอร์ที่ผลิตได้ในแบบเก่า . การเปลี่ยนแปลงเมตริกซ์เกินไป:d_j' มันเป็นเรื่องง่ายที่จะได้รับวิธีเมตริกซ์จะต้องเปลี่ยนก็จะเป็นที่เมทริกซ์หมุนถูกกำหนดให้เป็นd ในกรณีของเรามันคือค่าสัมประสิทธิ์ของมัด

z=z1d¯1+z2d¯2
y=y1d¯1+y2d¯2
P=ijpijd¯id¯j
PAd¯=Ad¯

เราสามารถทำงานออกสูตรสำหรับการเปลี่ยนแปลงเมตริกซ์และพวกเขาจะเกิดผลเช่นเดียวกับในตัวอย่างที่มีและ 0x1=x2=1z1=0.71,z2=0


2
ผมสับสนรอบที่นี่: ก่อนหน้านี้คุณบอกว่ากำแรกคือการที่เราSo, let's look at an example where we spend just z1=1.42 on bundle 1. In this case, the first merchant gets x1=1 dollars, and the second merchant gets the same x2=1. pay both 0.71 dollarsดังนั้นการใช้จ่าย 1.42 ในชุดแรกควรได้รับ 0.71 และไม่ใช่ 1 ใช่ไหม
อะมีบา

@ameba แนวคิดของชุดที่ 1 คือดังนั้นด้วยชุดที่ 1 คุณจะได้นั่นคือ 1 $ต่อd¯1/2+d¯2/22d¯1+d¯2
Aksakal

2
@ Aksakal ฉันรู้ว่าการสนทนานี้ค่อนข้างเก่า แต่ฉันก็ไม่เข้าใจเช่นนั้น (แม้ว่าฉันจะพยายามจริงๆ) แนวคิดที่ว่าชุดที่ 1 คือมาจากไหน คุณสามารถทำอย่างละเอียด? เป็นอย่างไรเมื่อคุณจ่าย 1.42 สำหรับชุดรวมทั้งร้านค้าได้รับ 1 d¯1/2+d¯2/2
Matek

@Aksakal นี้ดีมากขอบคุณ! ฉันคิดว่าคุณพิมพ์ผิดในบรรทัดสุดท้ายที่คุณพูด x1 = x2 = 1 (ถูกต้อง) และ z1 = 0.71, z2 = 0 สมมุติว่าฉันเข้าใจทุกอย่างถูกต้อง z1 ควรเป็น 1.42 (หรือ 1.41 ซึ่งใกล้เคียงเล็กน้อย ถึง 2 ^ 0.5)
Mike Williamson

71

นี่ไม่ใช่คำตอบสำหรับคำถามของคุณ แต่เป็นการแสดงความคิดเห็นเพิ่มเติมเกี่ยวกับปัญหาที่ได้รับการหยิบยกขึ้นมาในความคิดเห็นของคนต่าง ๆ เช่น: การเรียนรู้ด้วยเครื่อง "เทนเซอร์" เป็นสิ่งเดียวกับเทนเซอร์ในคณิตศาสตร์หรือไม่?

ตอนนี้ตาม Cichoki 2014 ยุคของการประมวลผลข้อมูลขนาดใหญ่: แนวทางใหม่ผ่าน Tensor Networks และ Decompositions ของ Tensorและ Cichoki et al. 2014, การสลายตัวของเทนเซอร์สำหรับการประมวลผลสัญญาณ ,

เมตริกซ์ลำดับสูงกว่าสามารถตีความได้ว่าเป็นอาร์เรย์แบบหลายทาง [... ]

เมตริกซ์อาจถูกมองว่าเป็นอาเรย์ตัวเลขหลายดัชนี [... ]

เทนเซอร์ (เช่นอาร์เรย์แบบหลายทาง) [... ]

เรียกว่าเทนเซอร์ในการเรียนรู้ของเครื่อง

ดังนั้นในการเรียนรู้ของเครื่อง / การประมวลผลข้อมูลเทนเซอร์จึงถูกกำหนดให้เป็นอาร์เรย์ตัวเลขหลายมิติ ตัวอย่างเช่นเมตริกซ์ 3 มิติจะเป็นภาพวิดีโอของขนาด เมทริกซ์ข้อมูลปกติเป็นตัวอย่างของเมตริกซ์ 2D ตามข้อกำหนดนี้1000640×480n×p

นี่ไม่ใช่วิธีการกำหนดเทนเซอร์ในคณิตศาสตร์และฟิสิกส์!

เมตริกซ์สามารถกำหนดให้เป็นอาร์เรย์หลายมิติตามกฎหมายการเปลี่ยนแปลงบางอย่างภายใต้การเปลี่ยนแปลงของพิกัด ( ดู Wikipediaหรือประโยคแรกในบทความ MathWorld ) ความหมายที่ดีกว่า แต่เทียบเท่า ( ดูวิกิพีเดีย ) กล่าวว่าเมตริกซ์บนปริภูมิเวกเตอร์เป็นองค์ประกอบของ * โปรดทราบว่านี้หมายความว่าเมื่อแสดงเป็นอาร์เรย์หลายมิติเทนเซอร์มีขนาดหรือฯลฯ ที่คือมิติของVVVVp×pp×p×ppV

เทนเซอร์ทั้งหมดที่รู้จักกันดีในวิชาฟิสิกส์เป็นเช่นนั้น: เมตริกซ์ความเฉื่อยในกลศาสตร์เป็น , เมตริกซ์แม่เหล็กไฟฟ้าในสัมพัทธภาพพิเศษ , Riemann โค้งเมตริกซ์ในสัมพัทธภาพทั่วไปคือ4 ความโค้งและแม่เหล็กไฟฟ้าเทนเซอร์เป็นจริงเขตเมตริกซ์ซึ่งเป็นส่วนของการรวมกลุ่มเมตริกซ์ (ดูเช่นที่นี่แต่ได้รับทางเทคนิค) แต่ทั้งหมดที่กำหนดไว้กว่าปริภูมิเวกเตอร์ V3×34×44×4×4×4 V

แน่นอนว่าเราสามารถสร้างผลิตภัณฑ์เทนเซอร์ ของ -dimensionalและมิติแต่องค์ประกอบของมันมักจะไม่เรียกว่า "เทนเซอร์" ตามที่ระบุไว้เช่นที่นี่ใน Wikipedia :VWpVqW

โดยหลักการแล้วเราสามารถนิยาม "เมตริกซ์" เพียงเพื่อเป็นองค์ประกอบของผลิตภัณฑ์เทนเซอร์ใด ๆ อย่างไรก็ตามวรรณกรรมทางคณิตศาสตร์มักจะสงวนเทอมเทอร์สำหรับองค์ประกอบของผลิตภัณฑ์เทนเซอร์ของเวกเตอร์สเปซและคู่ตามที่กล่าวไว้ข้างต้นV

ตัวอย่างหนึ่งของเมตริกซ์จริงในสถิติจะเป็นเมทริกซ์ความแปรปรวนร่วม มันคือและแปลงในวิธีการเฉพาะเมื่อระบบพิกัดในพื้นที่คุณลักษณะ -dimensionalถูกเปลี่ยน มันเป็นเทนเซอร์ แต่ data matrixไม่ใช่p×ppVn×pX

แต่อย่างน้อยเราก็คิดว่าเป็นองค์ประกอบของผลิตภัณฑ์เทนเซอร์โดยที่คือ -dimensional และคือ -dimensional? สำหรับ concreteness ให้แถวในสอดคล้องกับคน (หัวเรื่อง) และคอลัมน์กับการวัดบางอย่าง (คุณสมบัติ) การเปลี่ยนแปลงของพิกัดในสอดคล้องกับการแปลงเชิงเส้นของคุณสมบัติและจะทำในสถิติตลอดเวลา (คิดถึง PCA) แต่การเปลี่ยนพิกัดในดูเหมือนจะไม่สอดคล้องกับสิ่งใดที่มีความหมาย(และฉันขอให้ใครก็ตามที่มีตัวอย่างตอบโต้เพื่อแจ้งให้เราทราบในความคิดเห็น)XWVWnVpXVW. ดังนั้นจึงไม่ได้ดูเหมือนว่ามีสิ่งใดที่ได้รับจากการพิจารณาเป็นองค์ประกอบของVXWV

และที่จริงแล้วสัญกรณ์ทั่วไปคือการเขียนโดยที่คือชุดของการฝึกอบรมทั้งหมด (ซึ่งโดยวิธีคือ กำหนดเป็นอาร์เรย์สี่เหลี่ยมของตัวเลขโดยไม่มีคุณสมบัติการแปลงใด ๆ ที่สันนิษฐาน)XRn×pRn×pn×p

ข้อสรุปของฉันคือ: (a) เครื่องเรียนรู้เทนเซอร์ไม่ใช่คณิตศาสตร์ / ฟิสิกส์เทนเซอร์และ (b) ส่วนใหญ่ไม่มีประโยชน์ที่จะเห็นพวกเขาเป็นองค์ประกอบของผลิตภัณฑ์เทนเซอร์เช่นกัน

แต่มันเป็นภาพรวมหลายมิติของเมทริกซ์ น่าเสียดายที่ไม่มีคำศัพท์ทางคณิตศาสตร์ที่กำหนดไว้ดังนั้นจึงดูเหมือนว่าความหมายใหม่ของ "เทนเซอร์" อยู่ที่นี่เพื่อให้อยู่ต่อไป


19
ฉันเป็นนักคณิตศาสตร์ที่บริสุทธิ์และนี่เป็นคำตอบที่ดีมาก โดยเฉพาะอย่างยิ่งตัวอย่างของเมทริกซ์ความแปรปรวนร่วมเป็นวิธีที่ยอดเยี่ยมในการทำความเข้าใจ "คุณสมบัติการแปลงสภาพ" หรือ "สมมาตร" ที่ดูเหมือนจะทำให้เกิดความสับสนด้านบน ถ้าคุณเปลี่ยนพิกัดบนพื้นที่คุณลักษณะมิติ, เมทริกซ์ความแปรปรวนแปลงในโดยเฉพาะอย่างยิ่งและอาจจะเป็นที่น่าแปลกใจวิธี; หากคุณทำการเปลี่ยนแปลงที่ไร้เดียงสามากขึ้นกับพันธมิตรของคุณคุณจะได้ผลลัพธ์ที่ไม่ถูกต้อง p
Tom Church

10
ขอบคุณ @Tom ฉันขอขอบคุณที่คุณลงทะเบียนกับ CrossValidated เพื่อแสดงความคิดเห็นนี้ เป็นเวลานานแล้วที่ฉันเรียนเรขาคณิตเชิงอนุพันธ์ดังนั้นฉันจึงมีความสุขถ้ามีคนยืนยันสิ่งที่ฉันเขียน เป็นเรื่องน่าเสียดายที่ไม่มีคำศัพท์ที่กำหนดขึ้นในวิชาคณิตศาสตร์สำหรับ "เมทริกซ์หลายมิติ"; ดูเหมือนว่า "เมตริกซ์" กำลังจะติดอยู่ในชุมชนการเรียนรู้ของเครื่องเป็นคำสำหรับการที่ คุณคิดว่าควรจะเรียกมันว่าอย่างไร สิ่งที่ดีที่สุดที่อยู่ในใจของฉันคือ matrices (เช่น -matrix เพื่ออ้างถึงวัตถุวิดีโอ) คล้ายกับ categories n3n
อะมีบา

4
@amoeba ในการเขียนโปรแกรมการฝึกอบรม multidemensional มักจะเรียกว่าอาร์เรย์แต่บางภาษาเช่น MATLAB จะเรียกพวกเขาการฝึกอบรม ตัวอย่างเช่นใน FORTRAN อาร์เรย์สามารถมีได้มากกว่า 2 มิติ ในภาษาอย่าง C / C ++ / Java อาร์เรย์เป็นมิติเดียว แต่คุณสามารถมีอาร์เรย์ของอาร์เรย์ทำให้มันทำงานเหมือนอาร์เรย์หลายมิติ MATLAB สนับสนุนอาร์เรย์ 3 มิติขึ้นไปในไวยากรณ์
Aksakal

3
นั่นเป็นเรื่องที่น่าสนใจมาก ฉันหวังว่าคุณจะเน้นจุดนั้น แต่โปรดระวังอย่าให้ชุดของเวกเตอร์สเปซสับสนเนื่องจากความแตกต่างสำคัญในสถิติ โดยเฉพาะอย่างยิ่ง (รับตัวอย่างหนึ่งของคุณ) แม้ว่าการรวมกันเชิงเส้นของผู้คนจะไม่มีความหมาย แต่การรวมกันเชิงเส้นของฟังก์ชันที่มีคุณค่าในชุดของคนก็มีความหมายและสำคัญ มันเป็นกุญแจสำคัญในการแก้ปัญหาการถดถอยเชิงเส้น
whuber

8
ต่อ T. Kolda, B, Bada, "การสลายตัวของเทนเซอร์และแอปพลิเคชั่น" SIAM Review 2009, epubs.siam.org/doi/pdf/10.1137/07070111X 'เมตริกซ์เป็นอาร์เรย์หลายมิติ อย่างเป็นทางการยิ่งขึ้นเทนเซอร์ N-way หรือ Nth-order เป็นองค์ประกอบของผลิตภัณฑ์เทนเซอร์ของปริภูมิเวกเตอร์ N ซึ่งแต่ละอันมีระบบพิกัดของตัวเอง แนวคิดเรื่องเทนเซอร์นี้ไม่ต้องสับสนกับเทนเซอร์ในวิชาฟิสิกส์และวิศวกรรม (เช่นเทนเซอร์เครียด) ซึ่งโดยทั่วไปเรียกว่าเทนเซอร์ฟิลด์ในคณิตศาสตร์ "
Mark L. Stone

14

ในฐานะคนที่ศึกษาและสร้างโครงข่ายประสาทเทียมและถามคำถามนี้ซ้ำหลายครั้งฉันได้ข้อสรุปว่าเรายืมแง่มุมที่เป็นประโยชน์ของสัญกรณ์เทนเซอร์เพียงเพราะพวกมันทำให้ง่ายขึ้นมากและทำให้การไล่ระดับสีของเราเป็นรูปร่างดั้งเดิม กฎลูกโซ่เมตริกซ์เป็นหนึ่งในเครื่องมือที่มีรากศัพท์ที่หรูหราที่สุดที่ผมเคยเห็น สัญลักษณ์เทนเซอร์เพิ่มเติมสนับสนุนการทำให้เรียบง่ายมีประสิทธิภาพการคำนวณที่เป็นเพียงฝันร้ายที่จะหาเมื่อใช้รุ่นขยายทั่วไปของแคลคูลัสเวกเตอร์

ในแคลคูลัส Vector / Matrixนั้นมีผลิตภัณฑ์เมทริกซ์ 4 ประเภท (Hadamard, Kronecker, Ordinary และ Elementwise) แต่ในแคลคูลัสเทนเซอร์มีการคูณเพียงชนิดเดียว แต่ครอบคลุมการคูณเมทริกซ์ทั้งหมดและอื่น ๆ หากคุณต้องการที่จะใจกว้างตีความเมตริกซ์หมายถึงอาร์เรย์หลายมิติที่เราตั้งใจจะใช้เมตริกซ์แคลคูลัสตามที่จะหาสัญญาซื้อขายล่วงหน้าไม่ว่าวัตถุที่เราจะจัดการเป็นเทนเซอร์

ในความซื่อสัตย์ทั้งหมดเราอาจเรียกว่าเทนเซอร์อาเรย์หลายมิติของเราเพราะผู้เชี่ยวชาญด้านการเรียนรู้เครื่องส่วนใหญ่ไม่สนใจสิ่งนั้นมากเกี่ยวกับการยึดมั่นกับคำจำกัดความของคณิตศาสตร์หรือฟิสิกส์ระดับสูง ความจริงก็คือเราเพิ่งยืมEinstein Summation Conventions และ Calculiที่พัฒนาขึ้นมาอย่างดีซึ่งโดยทั่วไปจะใช้เมื่ออธิบายเทนเซอร์ บางทีวันหนึ่งเราอาจพัฒนาสัญกรณ์และการประชุมชุดใหม่ที่ขโมยเฉพาะสิ่งที่พวกเขาต้องการจากเมตริกซ์แคลคูลัสโดยเฉพาะสำหรับการวิเคราะห์โครงข่ายประสาทเทียม แต่เป็นสนามเล็กที่ต้องใช้เวลา


โปรดลงทะเบียน & / หรือรวมบัญชีของคุณ (คุณสามารถหาข้อมูลเกี่ยวกับวิธีการทำเช่นนี้ได้ในส่วนบัญชีของฉันในศูนย์ช่วยเหลือของเรา) จากนั้นคุณจะสามารถแก้ไขและแสดงความคิดเห็นเกี่ยวกับคำตอบของคุณเอง
gung

10

ตอนนี้ฉันเห็นด้วยกับเนื้อหาส่วนใหญ่ของคำตอบอื่น ๆ แต่ฉันจะเล่นเป็นทนายของ Devil ในจุดหนึ่ง อีกครั้งมันจะไหลอย่างอิสระดังนั้นขอโทษ ...

Google ประกาศโปรแกรมที่เรียกว่า Tensor Flow สำหรับการเรียนรู้อย่างลึกซึ้ง สิ่งนี้ทำให้ฉันสงสัยว่า 'เมตริกซ์' เกี่ยวกับการเรียนรู้อย่างลึกซึ้งเพราะฉันไม่สามารถเชื่อมโยงกับคำจำกัดความที่ฉันเห็น

ป้อนคำอธิบายรูปภาพที่นี่

แบบจำลองการเรียนรู้อย่างลึกซึ้งนั้นเกี่ยวกับการเปลี่ยนแปลงองค์ประกอบจากที่หนึ่งไปอีกที่หนึ่ง เช่นถ้าเราพิจารณาสองชั้นของเครือข่ายบางอย่างที่คุณอาจเขียนประสานของตัวแปรเปลี่ยนเป็นฟังก์ชันเชิงชั้นก่อนหน้านี้โดยใช้สัญกรณ์บวกแฟนซี:iy

yi=σ(βijxj)

ตอนนี้ความคิดคือการรวมกลุ่มของการเปลี่ยนแปลงดังกล่าวเพื่อให้ได้ตัวแทนที่เป็นประโยชน์ของพิกัดเดิม ตัวอย่างเช่นหลังจากการเปลี่ยนแปลงครั้งสุดท้ายของภาพการถดถอยโลจิสติกอย่างง่ายจะสร้างความแม่นยำในการจำแนกประเภทที่ยอดเยี่ยม ในขณะที่ภาพดิบมันจะไม่แน่นอน

ตอนนี้สิ่งที่ดูเหมือนว่าจะหายไปจากสายตาคือคุณสมบัติความแปรปรวนที่หาได้ในเมตริกซ์ที่เหมาะสม โดยเฉพาะอย่างยิ่งเมื่อขนาดของตัวแปรที่แปลงแล้วอาจแตกต่างจากชั้นหนึ่งไปอีกชั้น [เช่นบางสิ่งที่ฉันเห็นในเทนเซอร์ทำให้มันไม่สมเหตุสมผลสำหรับยาโคบที่ไม่ใช่สแควร์ - ฉันอาจขาดวิธีการบางอย่าง]

สิ่งที่ได้รับการเก็บรักษาไว้คือแนวคิดของการเปลี่ยนแปลงของตัวแปรและการนำเสนอเวกเตอร์บางอย่างอาจมีประโยชน์มากกว่าสิ่งอื่นสำหรับงานเฉพาะ การเปรียบเทียบว่ามันเหมาะสมกว่าหรือไม่ที่จะแก้ไขปัญหาในระบบคาร์ทีเซียนหรือพิกัดเชิงขั้ว


แก้ไขในการตอบสนองต่อ @Aksakal:

เวกเตอร์ไม่สามารถรักษาไว้ได้อย่างสมบูรณ์แบบเนื่องจากการเปลี่ยนแปลงจำนวนพิกัด อย่างไรก็ตามอย่างน้อยข้อมูลที่เป็นประโยชน์อาจถูกเก็บไว้ภายใต้การเปลี่ยนแปลง ตัวอย่างเช่นกับ PCA เราอาจวางพิกัดดังนั้นเราจึงไม่สามารถแปลงกลับได้ แต่การลดขนาดอาจมีประโยชน์อย่างไรก็ตาม หากการแปลงต่อเนื่องทั้งหมดไม่สามารถย้อนกลับได้คุณสามารถแมปกลับจากเลเยอร์ถัดไปสู่พื้นที่อินพุต ตามที่เป็นอยู่ฉันเห็นเฉพาะโมเดลความน่าจะเป็นที่เปิดใช้งาน (RBM) ด้วยการสุ่มตัวอย่าง


1
ในบริบทของโครงข่ายประสาทเทียมฉันคิดเสมอว่าเทนเซอร์นั้นทำหน้าที่เป็นอาร์เรย์หลายมิติ คุณสามารถอธิบายรายละเอียดเกี่ยวกับคุณสมบัติความไม่แปรเปลี่ยนของการจัดหมวดหมู่ / การเป็นตัวแทนได้อย่างไร?
YS

บางทีฉันอาจจะไม่ชัดเจน แต่ดูเหมือนว่าฉัน - หากการตีความถูกต้อง - เป้าหมายของคุณสมบัติคงที่ได้ลดลง สิ่งที่ดูเหมือนว่าจะถูกเก็บไว้เป็นความคิดของการเปลี่ยนแปลงตัวแปร
คาดเดา

@ โครงสร้างถ้าคุณมี vectorในพิกัดคาร์ทีเซียนแล้วแปลงเป็นพิกัดเชิงขั้วเวกเตอร์ยังคงเหมือนเดิมนั่นคือมันยังคงชี้จากจุดเดียวกันในทิศทางเดียวกัน คุณกำลังบอกว่าในการเรียนรู้ของเครื่องจักรการแปลงพิกัดจะเปลี่ยนเวกเตอร์เริ่มต้นหรือไม่? r¯
Aksakal

แต่นั่นไม่ใช่คุณสมบัติของการเปลี่ยนแปลงมากกว่าเมตริกซ์ใช่ไหม อย่างน้อยเมื่อมีการแปลงชนิดแบบเชิงเส้นและแบบองค์ประกอบซึ่งดูเหมือนว่าได้รับความนิยมมากขึ้นในตาข่ายประสาท ประโยชน์เพิ่มเติมของเทนเซอร์คืออะไร
YS

1
@ โครงร่าง PCA เป็นเพียงการหมุนและการฉายภาพ มันเหมือนกับการหมุนพื้นที่ N-มิติไปยังพีซีพื้นฐานแล้วฉายไปที่พื้นที่ย่อย เทนเซอร์ถูกใช้ในสถานการณ์ที่คล้ายกันในวิชาฟิสิกส์เช่นเมื่อมองดูกองกำลังบนพื้นผิวภายในร่างกาย ฯลฯ
Aksakal

7

นี่คือข้อความที่ตัดตอนมาจากการแยกตัวประกอบแบบไม่ลบกับแอปพลิเคชั่นไปยังสถิติและการมองเห็นคอมพิวเตอร์ A. Shashua และ T. Hazanซึ่งเป็นหัวใจของสาเหตุที่อย่างน้อยบางคนก็หลงใหลในเทนเซอร์

ปัญหามิติใด ๆ สามารถแสดงในรูปแบบสองมิติโดยการเชื่อมโยงมิติ ตัวอย่างเช่นปัญหาในการค้นหาการสลายตัวที่ไม่เป็นลบอันดับต่ำของชุดของรูปภาพคือ 3-NTF (การแยกตัวประกอบแบบไม่ลบเทนเซอร์) ด้วยรูปภาพที่สร้างชิ้นส่วนของคิวบ์สามมิติ แต่ยังสามารถแสดงเป็น ปัญหา NMF (ไม่ใช่ตัวประกอบเมทริกซ์ที่ไม่เป็นลบ) โดยการทำให้ภาพเป็นภาพเวกเตอร์ (ภาพที่สร้างคอลัมน์ของเมทริกซ์)

มีเหตุผลสองประการว่าทำไมการแสดงเมทริกซ์ของชุดภาพจึงไม่เหมาะสม:

  1. การซ้ำซ้อนเชิงพื้นที่ (พิกเซลไม่จำเป็นต้องอยู่ใกล้เคียงมีค่าที่คล้ายกัน) หายไปใน vectorization ดังนั้นเราคาดว่าจะมีการแยกตัวประกอบที่มีประสิทธิภาพน้อยลงและ
  2. การสลายตัวของ NMF ไม่ซ้ำกันดังนั้นแม้ว่าจะมีรูปแบบกำเนิด (ของชิ้นส่วนในท้องถิ่น) NMF จะไม่จำเป็นต้องย้ายไปในทิศทางนั้นซึ่งได้รับการยืนยันเชิงประจักษ์โดย Chu, M. , Diele, F. , Plemmons, R. , & Ragni, S. "การปรับความเหมาะสมการคำนวณและการตีความของเมทริกซ์เชิงลบแบบไม่เชิงเส้น" SIAM Journal on Matrix Analysis, 2004 ตัวอย่างเช่นส่วนที่ไม่คงที่ของชุดภาพจะมีแนวโน้มที่จะก่อให้เกิดผีในทุกปัจจัยและปนเปื้อน NTF นั้นมีความแปลกใหม่อยู่เสมอดังนั้นเราจึงคาดว่าโครงการ NTF จะมุ่งไปสู่ตัวแบบกำเนิดและไม่ได้รับอิทธิพลจากส่วนที่ไม่เปลี่ยนแปลงโดยเฉพาะ

6

[แก้ไข] เพิ่งค้นพบหนังสือโดยปีเตอร์ McCullagh, Tensor วิธีการในสถิติ

เทนเซอร์แสดงคุณสมบัติที่น่าสนใจในการระบุส่วนผสมที่ไม่รู้จักในสัญญาณ (หรือภาพ) โดยเฉพาะอย่างยิ่งรอบความคิดของการสลายตัวของเมตริกซ์ Canonical Polyadic (CP) ดูตัวอย่างเช่นเทนเซอร์: แนะนำโดยย่อ , P. Comon, 2014 ภายใต้ชื่อ "การแยกแหล่งที่มาตาบอด (BSS)":

การสลายตัวของเทนเซอร์เป็นหัวใจสำคัญของอัลกอริธึมแยกแหล่งที่มา (BSS) หลายแห่งไม่ว่าจะโดยชัดแจ้งหรือโดยปริยาย โดยเฉพาะอย่างยิ่งการสลายตัวของเมตริกซ์ Canonical Polyadic (CP) มีบทบาทสำคัญในการระบุส่วนผสมที่ไม่ได้กำหนด แม้จะมีความคล้ายคลึงกันบ้าง CP และเอกเทศค่าการสลายตัว (SVD) แตกต่างกันมาก โดยทั่วไปแล้วเทนเซอร์และเมทริกซ์นั้นมีคุณสมบัติที่แตกต่างกันไป

ผลที่ไม่ซ้ำกันบางอย่างได้รับมาสำหรับเทนเซอร์ลำดับที่สามเมื่อเร็ว ๆ นี้: ในเอกลักษณ์ของการสลายตัวแบบ polyadic แบบบัญญัติของเทนเซอร์ลำดับที่สาม ( ตอนที่ 1 , ส่วนที่ 2 ), I. Domanov et al , 2013

การสลายตัวของเทนเซอร์คือการเชื่อมต่อ nodaways บ่อยครั้งกับการกระจัดกระจายแบบเบาบางเช่นโดยการจัดโครงสร้างของปัจจัยการสลายตัว (orthogonality, Vandermonde, Hankel) และตำแหน่งระดับต่ำเพื่อให้เหมาะสมกับลักษณะที่ไม่เป็นเอกลักษณ์

ด้วยความต้องการที่เพิ่มขึ้นสำหรับการวิเคราะห์ข้อมูลที่ไม่สมบูรณ์และการกำหนดการวัดที่ซับซ้อนจากเซ็นเซอร์อาร์เรย์ทำให้เทนเซอร์ถูกนำมาใช้มากขึ้นสำหรับการทำให้เมทริกซ์เสร็จการวิเคราะห์ตัวแปรแฝงและการแยกแหล่งที่มา

หมายเหตุเพิ่มเติม: เห็นได้ชัดว่าการสลายตัวของ Canonical Polyadic นั้นเทียบเท่ากับ Waring การสลายตัวของพหุนามแบบเอกพันธ์ในฐานะผลรวมของพลังของรูปแบบเชิงเส้นด้วยการใช้งานในการระบุระบบ (บล็อกโครงสร้างแบบ Wiener-Hammerstein หรือแบบไม่เชิงเส้นรัฐ)


3

ฉันขอแนะนำหนังสือของฉันด้วยความเคารพ: Kroonenberg, PM ประยุกต์การวิเคราะห์ข้อมูลหลายทางและ Smilde et al. การวิเคราะห์แบบหลายทาง การใช้งานในสาขาวิทยาศาสตร์เคมี (ทั้งไวลีย์) ที่น่าสนใจอาจเป็นบทความของฉัน: Kroonenberg, PM (2014) ประวัติการวิเคราะห์องค์ประกอบหลายทางและการวิเคราะห์การติดต่อสามทาง ใน Blasius, J. และ Greenacre, MJ (Eds.) การแสดงภาพและการใช้คำพูดเป็นข้อมูล (หน้า 77–94) นิวยอร์ก: แชปแมนและฮอล / ซีอาร์ซี ไอ 9781466589803

การอ้างอิงเหล่านี้พูดถึงข้อมูลหลายทางแทนที่จะเป็นเทนเซอร์ แต่อ้างถึงพื้นที่วิจัยเดียวกัน


-1

มันเป็นความจริงที่ว่าผู้คนใน Machine Learning ไม่ได้ดูเทนเซอร์ด้วยความระมัดระวังเช่นเดียวกับนักคณิตศาสตร์และแพทย์ นี่คือกระดาษที่อาจอธิบายความคลาดเคลื่อนนี้: Comon P. , "Tensors: คำแนะนำสั้น ๆ " IEEE Sig พร นิตยสาร , 31 พฤษภาคม 2014


5
ความแตกต่างระหว่างเทนเซอร์ในวิชาคณิตศาสตร์ / ฟิสิกส์และเทนเซอร์ในการเรียนรู้ของเครื่องเป็นหนึ่งใน "การดูแล" หรือไม่? ดูเหมือนว่าเครื่องเรียนรู้คนใช้ "เมตริกซ์" เป็นคำทั่วไปสำหรับอาร์เรย์ของตัวเลข (เซนต์คิตส์และเนวิส, เมทริกซ์และอาร์เรย์กับ 3 หรือมากกว่าแกนเช่นใน TensorFlow) ในขณะที่ "เมตริกซ์" ในบริบททางคณิตศาสตร์ / ฟิสิกส์แตกต่างกัน ความหมาย แนะนำว่าคำถามเกี่ยวกับ "การดูแล" คือฉันคิดว่าการใช้งานผิดในลักษณะ "ไม่ถูกต้อง" ในความสามารถในการเรียนรู้ของเครื่องเมื่อความจริงแล้วบริบทการเรียนรู้ของเครื่องไม่มีความตั้งใจที่จะจำลองการใช้คณิตศาสตร์ / ฟิสิกส์อย่างแม่นยำ
Sycorax
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.