ในการเรียนรู้ของเครื่องทำไมตัวยกส่วนเกินจึงใช้แทนตัวห้อย?


20

ฉันสละแน่นอนแอนดรูอึ้งบนเครื่องการเรียนรู้ผ่าน Coursera สำหรับสมการตัวยกจะถูกใช้แทนตัวห้อย ตัวอย่างเช่นในสมการต่อไปนี้ใช้แทน : x ix(ผม)xผม

J(θ0,θ1)=12ม.Σผม=1ม.(ชั่วโมงθ(x(ผม))-Y(ผม))2

เห็นได้ชัดว่านี่เป็นเรื่องธรรมดา คำถามของฉันคือเหตุใดจึงใช้ตัวยกแทนตัวห้อย? Superscripts ถูกใช้แล้วสำหรับการยกกำลัง จริงอยู่ที่ฉันดูเหมือนจะสามารถแยกแยะความแตกต่างระหว่างกรณียกและยกกำลังใช้กรณีโดยให้ความสนใจกับวงเล็บอยู่หรือไม่ แต่มันก็ดูเหมือนจะทำให้เกิดความสับสน


4
ฉันสงสัยว่าอาจเป็นเพราะคนวิทยาการคอมพิวเตอร์บางคนไม่มีประสบการณ์ในการคำนวณทางคณิตศาสตร์มาตรฐานและดังนั้นจึงต้องใช้สัญลักษณ์ของตนเอง นักคณิตศาสตร์ทำเช่นนี้บางครั้งเกินไปและมันน่าผิดหวังเมื่อคุณได้แนวคิดที่ซับซ้อนมากขึ้น
rocinante

5
การiจัดทำดัชนีอยู่เหนือขนาดชุดข้อมูลหรือมากกว่าองค์ประกอบของเวกเตอร์xหรือไม่ หากอดีตนั่นคือมาตรฐานโดยสิ้นเชิง หากหลังนั่นคือทั้งหมดที่ไม่ได้มาตรฐาน และสาเหตุที่ใช้ตัวยกเป็นเพราะบางครั้งคุณต้องการอ้างถึงองค์ประกอบของเวกเตอร์โดยใช้ตัวห้อย
เร็กซ์เคอร์

4
@rocinante lol no เป็นเพราะตัวห้อยถูกใช้เพื่อทำดัชนีเวกเตอร์แล้ว
Neil G

4
@rocinante นั่นค่อนข้างเกรงใจ แล้วเวกเตอร์ที่แยกจากกัน / สัญกรณ์ Einstein เป็นอย่างไร?
Will Vousden

4
@rocinante ฉันต้องสะท้อนผู้อื่นโดยขีดเส้นใต้ว่าการใช้ถ้อยคำของคุณนั้นโชคร้าย เราทุกคนมีแนวโน้มที่จะพิจารณาสิ่งที่เป็นท้องถิ่นและคุ้นเคยเป็นมาตรฐาน
Nick Cox

คำตอบ:


26

ถ้าหมายถึงเวกเตอร์ดังนั้นx_iเป็นเครื่องหมายมาตรฐานสำหรับพิกัดi -th ของxคือx = (x_1, x_2, \ ldots, x_m) \ in \ mathbb R ^ mx Rเมตรx ฉันฉันx x = ( x 1 , x 2 , ... , x เมตร ) RเมตรxxRmxiix

x=(x1,x2,,xm)Rm.

หากคุณมีคอลเลกชันของเวกเตอร์ดังกล่าวคุณจะแสดงถึงเวกเตอร์ th ได้อย่างไร? คุณไม่สามารถเขียนนี่มีความหมายมาตรฐานอื่น ๆ ดังนั้นบางครั้งผู้คนเขียนและฉันเชื่อว่าทำไมแอนดรูว์ถึงทำฉันx ฉันx ( i )nixix(i)

กล่าวคือ

x(1)=(x1(1),x2(1),,xm(1))Rmx(2)=(x1(2),x2(2),,xm(2))Rmx(n)=(x1(n),x2(n),,xm(n))Rm.

ฉันไม่เห็นด้วย แต่มักใช้เช่นการวัดซ้ำ xij
Cliff AB

1
ใช่ แต่เทียบเท่ากับ ; สิ่งที่จะเทียบเท่าของ ? x ( i ) j x ( i )xijxj(i)x(i)
อะมีบาพูดว่า Reinstate Monica

1
ใช่นั่นเป็นข้อได้เปรียบ ผมคิดว่าจะใช้ในบางครั้ง แต่นี้อาจจะสับสนกับ m n j = 1 x i j / mxi.j=1nxij/m
หน้าผา AB

1
หากคุณต้องการทำซ้ำมากกว่าเมทริกซ์ดังนั้นดูเหมือนจะเป็นวิธีที่ใช้งานง่ายที่สุด ดังนั้นสัญกรณ์จะคงที่เมื่อเปลี่ยนจากเวกเตอร์เป็นเมทริกซ์ xmn(i)
josh

2
@JAB ใช่มันเป็นการทำให้สัญกรณ์ชัดเจนยิ่งขึ้น ("การบอกกล่าวชนิด" ตามที่คุณพูด) แน่นอนหนึ่งสามารถตกลงใช้สำหรับเวกเตอร์i- th และx i jสำหรับองค์ประกอบj -th ของi -th เวกเตอร์ มีการประชุมต่าง ๆ ที่เป็นไปได้นี่เป็นเพียงหนึ่งในนั้น ฉันไม่ได้บอกว่ามันเป็นสิ่งที่ดีที่สุดเพียงแค่อธิบายเหตุผลที่อยู่เบื้องหลัง xiixijji
อะมีบาพูดว่า Reinstate Monica

11

การใช้สคริปต์สุดยอดตามที่คุณพูดฉันเชื่อว่ามันไม่ธรรมดาในวรรณกรรมการเรียนรู้ของเครื่อง ฉันต้องทบทวนบันทึกหลักสูตรของอึ้งเพื่อยืนยัน แต่ถ้าเขาใช้สิ่งนั้นที่นั่นฉันจะบอกว่าเขาจะเป็นจุดเริ่มต้นของการเพิ่มจำนวนของสัญกรณ์นี้ นี่คือความเป็นไปได้ ไม่ว่าจะด้วยวิธีใดก็ตาม แต่ฉันไม่คิดว่านักเรียนหลักสูตรออนไลน์จำนวนมากกำลังตีพิมพ์วรรณกรรมเกี่ยวกับการเรียนรู้ของเครื่องดังนั้นสัญกรณ์นี้จึงไม่ค่อยเป็นที่นิยมในวรรณคดีจริง หลังจากทั้งหมดนี้เป็นหลักสูตรเบื้องต้นในการเรียนรู้ของเครื่องไม่ใช่หลักสูตรระดับปริญญาเอก

สิ่งที่พบได้บ่อยกับสคริปต์ซุปเปอร์คือแสดงการวนซ้ำของอัลกอริทึมโดยใช้สคริปต์ซุปเปอร์ ตัวอย่างเช่นคุณสามารถเขียนการวนซ้ำของวิธีของนิวตันเป็น

θ(t+1)=θ(t)H(θ(t))1θ(t)

ที่เป็นรัฐและθ ( T )คือการไล่ระดับสีH(θ(t))θ(t)

(... ใช่นี่ไม่ใช่วิธีที่ดีที่สุดในการใช้วิธีการของนิวตันเนื่องจากการผกผันของเมทริกซ์ของ Hessian ... )

ที่นี่แทนค่าของในการทำซ้ำนี่คือการใช้สคริปต์สุดยอด (แต่ไม่แน่นอนเท่านั้น) ที่ฉันรู้ θ t t hθ(t)θtth

แก้ไข: เพื่อชี้แจงในคำถามเดิมดูเหมือนว่าจะแนะนำว่าในสัญกรณ์ ML,เทียบเท่ากับสัญกรณ์ของสถิติ ในคำตอบของฉันฉันระบุว่านี่ไม่ได้แพร่หลายอย่างแท้จริงในวรรณกรรม ML นี่เป็นเรื่องจริง อย่างไรก็ตามในขณะที่ออกโดยชี้ @amoeba มีความอุดมสมบูรณ์ของสัญกรณ์ยกใน ML วรรณกรรมสำหรับข้อมูล แต่ในกรณีเหล่านี้ไม่ได้มักจะหมายถึงสังเกตของเวกเตอร์เดียวxx(i)xix(i)ithx


1
การปะทะกันกับการใช้ตัวยกเครื่องหมายวงเล็บ / วงเล็บเหลี่ยมสำหรับการนับซ้ำ (สัญกรณ์ที่ใช้กันทั่วไปในหลากหลายพื้นที่) เป็นสิ่งสำคัญที่จะยกระดับ
Glen_b

2
นอกจากนี้ยังใช้เพื่อระบุดัชนีของตัวอย่างในชุดการฝึกอบรมซึ่งคล้ายกับการวนซ้ำ แต่ไม่เหมือนกันเพราะคุณมักจะวนซ้ำการฝึกซ้ำหลายครั้ง
Rex Kerr

3
ฉันเคยเห็นจำนวนการวนซ้ำที่ระบุไว้โดยใช้ตัวห้อย ( ) รวมทั้งในบรรทัด ( a ( n + 1 ) = a ( n ) + 1 ) ซึ่งเป็นเหตุผลว่าทำไมเมื่อใช้สัญกรณ์เฉพาะฉันมักจะใส่บางสิ่งบางอย่างในช่วงเริ่มต้นที่จะทำให้เข้าใจผิด ดังนั้นสิ่งที่มีการใช้สัญกรณ์ผู้อ่านสามารถ (หวังว่า) ความหมายที่เหมาะสมสำหรับกรณีที่อาจคลุมเครือแทนที่จะคาดเดาตามอนุสัญญาที่พวกเขารู้ an+1=an+1a(n+1)=a(n)+1
JAB

1
ฉันเห็นด้วยกับ @JAB โดยทั่วไปแล้วฉันไม่คิดว่ามันจะเป็นเรื่องเลวร้ายสำหรับคนที่จะเขียนและใช้รหัสเพื่อขอยืมสัญกรณ์จากซอฟต์แวร์ในการรักษาทางคณิตศาสตร์ ตัวอย่างเช่นและเป็นที่ถกเถียงกันผู้คนใช้คอมพิวเตอร์เป็นกลุ่มทางคณิตศาสตร์ในการใช้สัญลักษณ์ที่สะอาดเช่นเพื่อประเมินว่า 1 ถ้าเป็นจริงและ 0 ถ้าเป็นเท็จแทนที่จะเป็นพิธีการที่ไม่จำเป็นเช่นI ( x > 0 ) ; ที่นี่ฉันเพียงแค่ติดตามหลัง Donald Knuth (x>0)ผม(x>0)
Nick Cox

@ NickCox โดยทั่วไปฉันเห็นเฉพาะรูปแบบเมื่อเป็นไปได้เท่านั้น มิฉะนั้นx > 0เป็นเพียงข้อ จำกัด ที่ไม่เท่าเทียมกัน เมื่อพูดถึงสมการทางคณิตศาสตร์พวกมันแบ่งออกเป็นชิ้น ๆ แทนหรือพวกเขาเพียงแค่แทนสมการตัวเองว่าเป็นความไม่เท่าเทียมกันเช่นการทำอย่างอื่นจะทำให้เกิดความกำกวม (คล้ายกับวิธี=ในคณิตศาสตร์มีความละเอียดอ่อนกว่าหรือในภาษาโปรแกรมส่วนใหญ่แนะนำข้อ จำกัด หรือคำจำกัดความมากกว่าการมอบหมายจริงหรือการตรวจสอบความเท่าเทียมกัน)ผม(x>0)x>0====
JAB

4

Superscripts ถูกใช้สำหรับการยกกำลังแล้ว

ในตัวยกคณิตศาสตร์จะใช้ซ้ายและขวาขึ้นอยู่กับฟิลด์ ทางเลือกเป็นมรดกทางประวัติศาสตร์เสมอไม่มีอะไรเพิ่มเติม ใครก็ตามที่ได้เข้ามาในสนามเป็นครั้งแรกให้กำหนดวิธีการใช้ย่อยหรือตัวยก

ตัวอย่างสองตัวอย่าง Superscripts ถูกใช้เพื่อแสดงถึงอนุพันธ์: f(x)(n)

ในพีชคณิตเมตริกซ์ทั้ง super และตัวห้อยถูกใช้อย่างมากสำหรับสิ่งเดียวกันเช่นอาจหมายถึงiแถวและคอลัมน์j มันค่อนข้างชัดเจน: T k i = R j ฉัน C k jRiiijTik=RijCjk

นอกจากนี้ผมจำได้ว่าก่อนที่จะใช้สคริปต์ตัวอักษร (prescripts) ในสาขาฟิสิกส์เช่นฉันเจ B L k ฉันคิดว่ามันเป็นกับเมตริกซ์jiBkl

ดังนั้นการเลือกตัวยกของอึ้งก็มีคุณค่าทางประวัติศาสตร์ด้วยเช่นกัน ไม่มีเหตุผลที่แท้จริงในการใช้หรือไม่ใช้หรือต้องการให้ห้อย ที่จริงแล้วฉันเชื่อว่าที่นี่คน ML กำลังใช้สัญลักษณ์เทนเซอร์ แน่นอนพวกเขามีความเชี่ยวชาญในเรื่องเช่นเห็นนี้กระดาษ


1
อีกตัวอย่างสำหรับประเด็นของคุณ: สัญกรณ์ Einstein
Neil G
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.