สัญลักษณ์คลาสสิคในสถิติพีชคณิตเชิงเส้นและการเรียนรู้ของเครื่องคืออะไร และการเชื่อมต่อระหว่างสัญลักษณ์เหล่านี้คืออะไร?


26

เมื่อเราอ่านหนังสือการทำความเข้าใจสัญลักษณ์มีบทบาทสำคัญในการทำความเข้าใจเนื้อหา น่าเสียดายที่ชุมชนต่าง ๆ มีระเบียบแบบสัญกรณ์ต่างกันสำหรับการกำหนดสูตรในแบบจำลองและปัญหาการปรับให้เหมาะสม คนใดคนหนึ่งสามารถสรุปการกำหนดสูตรบางอย่างที่นี่และให้เหตุผลที่เป็นไปได้?

ฉันจะให้ตัวอย่างที่นี่: ในวรรณคดีพีชคณิตเชิงเส้นหนังสือคลาสสิกแปลกเบื้องต้นเกี่ยวกับพีชคณิตเชิงเส้น สัญกรณ์ที่ใช้มากที่สุดในหนังสือเล่มนี้คือ

Ax=b

ที่ไหนเป็นเมทริกซ์ค่าสัมประสิทธิ์ ,เป็นตัวแปรที่จะแก้ไขและเป็นเวกเตอร์บนด้านขวาของสมการ เหตุผลหนังสือเลือกสัญกรณ์นี้เป็นเป้าหมายหลักของพีชคณิตเชิงเส้นคือการแก้ระบบเชิงเส้นและคิดออกว่าเป็นเวกเตอร์xด้วยการกำหนดสูตรดังกล่าวปัญหาการเพิ่มประสิทธิภาพของ OLS คือAxbx

minimizex  Axb2

ในสถิติหรือการเรียนรู้ด้วยเครื่อง (จากองค์ประกอบของหนังสือของการเรียนรู้ทางสถิติ ) ผู้คนใช้สัญลักษณ์ที่แตกต่างกันเพื่อแสดงสิ่งเดียวกัน:

Xβ=y

ที่ไหนXเป็นเมทริกซ์ข้อมูล , βเป็นค่าสัมประสิทธิ์หรือน้ำหนักที่จะเรียนรู้การเรียนรู้ , yคือการตอบสนอง เหตุผลที่คนใช้นี้เป็นเพราะคนที่อยู่ในสถิติหรือชุมชนการเรียนรู้เครื่องข้อมูลการขับเคลื่อนเพื่อให้ข้อมูลและตอบสนองเป็นสิ่งที่น่าสนใจที่สุดสำหรับพวกเขาที่พวกเขาใช้Xและyที่จะเป็นตัวแทน

ตอนนี้เราสามารถเห็นความสับสนที่เป็นไปได้ทั้งหมด: AในสมการแรกเหมือนกับXในสมการที่สอง และในสมการที่สองXไม่จำเป็นต้องมีการแก้ไข สำหรับข้อกำหนด: Aคือเมทริกซ์สัมประสิทธิ์ในพีชคณิตเชิงเส้น แต่เป็นข้อมูลในสถิติ βถูกเรียกว่า "สัมประสิทธิ์"

นอกจากนี้ฉันพูดถึงXβ=yไม่ใช่สิ่งที่ผู้คนใช้กันอย่างแพร่หลายในการเรียนรู้ของเครื่องจักรคนใช้เวอร์ชันเวกเตอร์ครึ่งหนึ่งที่สรุปจุดข้อมูลทั้งหมด เช่น

miniL(yi,f(xi))

ฉันคิดว่าเหตุผลนี้เป็นสิ่งที่ดีเมื่อพูดถึงการไล่ระดับสีแบบสุ่มและฟังก์ชันการสูญเสียอื่น ๆ นอกจากนี้สัญกรณ์เมทริกซ์ที่รัดกุมจะหายไปสำหรับปัญหาอื่นนอกเหนือจากการถดถอยเชิงเส้น

สัญลักษณ์เมทริกซ์สำหรับการถดถอยโลจิสติก

ใครสามารถให้ข้อสรุปเพิ่มเติมเกี่ยวกับสัญลักษณ์ข้ามวรรณกรรมที่แตกต่างกันได้หรือไม่ ฉันหวังว่าคำตอบที่ชาญฉลาดสำหรับคำถามนี้สามารถใช้เป็นข้อมูลอ้างอิงที่ดีสำหรับผู้ที่อ่านหนังสือข้ามวรรณกรรมที่แตกต่างกัน

โปรดอย่าถูก จำกัด โดยตัวอย่างของฉัน และ yมีอีกหลายคน เช่นAx=bXβ=y

ทำไมถึงมีสูตร / การสูญเสียสองรูปแบบที่แตกต่างกัน?


5
สัญกรณ์ไม่ได้มีอยู่จริงเพราะความจริงบางอย่างที่พิสูจน์ได้จากภายนอก มันเป็นภาษาดังนั้นมันจึงเป็นบริบทโดยเนื้อแท้และมีไว้สำหรับการนิยามใหม่ ถ้าฉันเขียน x * b และบอกว่านั่นหมายถึงเมทริกซ์ x ดอทโปรดัคเตอร์เวกเตอร์ b มันแค่เป็นตัวหนาหรือไม่
Sycorax พูดว่า Reinstate Monica

3
ฉันจะบอกว่าและมีสัญกรณ์เทียบเท่า เพียงแค่ชื่อของตัวแปรที่มีการเปลี่ยนแปลง โดยทั่วไปแล้วคุณจะไม่พบการตั้งชื่อที่สอดคล้องกันของตัวแปรจากกระดาษหนึ่งไปอีกกระดาษแม้แต่ในเขตข้อมูล Ax=bXβ=y
user20160

6
ในปัจจุบันนี้มี 10 โหวต 150 มุมมอง; ดูเหมือนว่าจะเป็นเธรดที่มีคุณค่าและมีประโยชน์ ยิ่งกว่านั้นมันมีคำตอบที่ upvoted; ดังนั้นฉันไม่คิดว่ามันจะกว้างเกินไปที่จะตอบ
gung - Reinstate Monica

3
ฉันเห็นด้วยกับ @gung ชุมชนมีความสนใจในคำถามนี้อย่างชัดเจน ฉันเสนอชื่อให้เปิดใหม่
แมทธิวดรูรี่

1
ฉันคิดว่ามันกว้างเกินไปสำหรับคิวปกติ - แต่เนื่องจากมันได้รับความนิยมค่อนข้างมากแล้วฉันจึงเพิ่มการโหวตของฉันเพื่อเปิดอีกครั้งสำหรับสี่รายการที่อยู่ที่นั่น
Scortchi - Reinstate Monica

คำตอบ:


18

บางทีคำถามที่เกี่ยวข้องคือ "คำที่ใช้ในภาษาต่าง ๆ คืออะไรและมีการเชื่อมโยงระหว่างคำเหล่านี้คืออะไร"

สัญกรณ์มีความหมายเหมือนกับภาษา:

  • บางคำมีความหมายเฉพาะภูมิภาค บางคำมีความเข้าใจอย่างกว้างขวาง
  • เช่นเดียวกับประเทศที่ทรงพลังเผยแพร่ภาษาของพวกเขาสาขาวิชาที่ประสบความสำเร็จและนักวิจัยผู้มีอิทธิพลกระจายความคิดเห็น
  • ภาษาวิวัฒนาการเมื่อเวลาผ่านไป: ภาษามีการผสมผสานของประวัติศาสตร์ที่มาและอิทธิพลที่ทันสมัย

คำถามเฉพาะของคุณ ...

  • ฉันไม่เห็นด้วยกับการโต้แย้งของคุณว่าทั้งสองติดตาม "สัญกรณ์ที่แตกต่างอย่างสิ้นเชิง" ทั้งและใช้ตัวอักษรพิมพ์ใหญ่เพื่อแสดงถึงการฝึกอบรม พวกเขาไม่ได้ว่าแตกต่างกันXβ=yAx=b
  • การเรียนรู้ของเครื่องเกี่ยวข้องอย่างมากกับสถิติซึ่งเป็นสาขาที่ใหญ่และครบกำหนด การใช้เพื่อเป็นตัวแทนของ data matrix นั้นเป็นแนวทางที่อ่านได้ง่ายและเป็นมาตรฐานที่สุดที่จะติดตาม ในขณะที่เป็นมาตรฐานสำหรับการแก้ปัญหาระบบเชิงเส้นนั่นไม่ใช่วิธีที่คนทำสถิติเขียนสมการปกติ คุณจะพบว่าผู้ชมสับสนมากขึ้นหากพยายามทำเช่นนั้น เมื่ออยู่ในกรุงโรม ...XAx=b
  • ในบางแง่มุมหัวใจของคำถามที่คุณแก้ไขคือ "อะไรคือต้นกำเนิดของสถิติในอดีตโดยใช้ตัวอักษรเพื่อแสดงข้อมูลและตัวอักษรเพื่อเป็นตัวแทนของตัวแปรที่ไม่รู้จักที่จะแก้ปัญหา?" xβ
    • นี่เป็นคำถามสำหรับนักสถิติเชิงสถิติ! การค้นหาสั้น ๆ ฉันเห็นนักสถิติชาวอังกฤษผู้มีอิทธิพลและนักวิชาการเคมบริดจ์ Udny Yule ใช้เพื่อแสดงข้อมูลในบทนำของทฤษฎีสถิติ (1911) เขาเขียนสมการถดถอยเมื่อโดยมีวัตถุประสงค์กำลังสองน้อยที่สุดในการย่อขนาดและด้วยวิธีแก้ปัญหา2} อย่างน้อยก็กลับไปแล้ว ...xx1=a+bx2(x1abx2)2b12=x1x2x22
    • แม้จะมีอิทธิพลมากขึ้นชาวประมง RA ใช้สำหรับตัวแปรตามและสำหรับตัวแปรอิสระในหนังสือของเขา 1925 วิธีการทางสถิติสำหรับการวิจัยแรงงาน (นำหมวกไปที่ @Nick Cox เพื่อให้ลิงก์พร้อมข้อมูล)yx

สัญกรณ์ที่ดีเป็นเหมือนภาษาที่ดี หลีกเลี่ยงศัพท์แสงเฉพาะด้านเมื่อทำได้ เขียนภาษาอังกฤษของ BBC ที่เทียบเท่าคณิตศาสตร์ซึ่งเป็นภาษาที่ทุกคนสามารถพูดภาษาอังกฤษได้ ควรเขียนทุกครั้งที่เป็นไปได้โดยใช้สัญลักษณ์ที่ชัดเจนและเข้าใจได้ทั่วไป


1
นักประวัติศาสตร์สถิติมือสมัครเล่นคนนี้สามารถให้การแก้ไขอย่างรวดเร็วซึ่ง Yule ไม่เคยเป็นศาสตราจารย์ ... ที่น่าสนใจยิ่งกว่านั้นคือมีเว็บไซต์ที่เกี่ยวข้องที่ jeff560.tripod.com/stat.html
Nick Cox

2
math.hawaii.edu/~tom/history/stat.htmlดูเหมือนจะเป็นสำเนา อนุสัญญาที่เป็นระบบเช่นกรีกสำหรับพารามิเตอร์และโรมันสำหรับตัวแปรฉันเข้าใจว่าส่วนใหญ่มาจาก RA Fisher แต่มีการยึดเอาไว้มากมายเช่นสำหรับตัวอย่างสถิติไคสแควร์ไม่แสดงอาการของการซีดจาง χ2
Nick Cox

@NickCox ลิงค์ที่น่าอัศจรรย์jeff560.tripod.com/stat.html (สำหรับฉัน ... ) ที่อ้างอิง Yule และ RA Fisher! ต้นกำเนิดทางคณิตศาสตร์ที่เก่าที่สุดของการถดถอยเห็นได้ชัดว่ากลับไปก่อนหน้านี้เพื่อ Gauss และ Laplace แต่ในการค้นหามือสมัครเล่นที่สมบูรณ์ของฉันพวกเขาดูเหมือนจะใช้สัญกรณ์ที่แตกต่างกัน
Matthew Gunn

jeff560.tripod.com/stat.html ที่ฉันเขียนคืออัปเดต 2014 www.math.hawaii.edu/~tom/history/stat.html เป็นสำเนาของรุ่นตั้งแต่ปี 2007
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.