"หนึ่งร้อน" การเข้ารหัสที่เรียกว่าในวรรณคดีวิทยาศาสตร์คืออะไร?


10

อะไรคือชื่อของโอเปอเรเตอร์ที่นำเวกเตอร์ที่มีหมวดหมู่และแปลงให้เป็นตัวแทนแบบไบนารี่โดยใช้การเข้ารหัสแบบร้อนแรง ฉันสงสัยเพราะฉันกำลังเขียนบทความทางวิทยาศาสตร์และต้องการชื่อที่เหมาะสมสำหรับสิ่งนั้น


3
การเข้ารหัสดัมมี่เป็นอีกชื่อหนึ่ง ในการเรียนรู้ของเครื่องจักรทุกคนใช้ประเภทง่าย ๆ เพียงอย่างเดียวดังนั้นจึงค่อนข้างชัดเจนว่านี่คืออะไร แต่มีการเข้ารหัสความคมชัดประเภทอื่น (ชื่ออื่น) ที่มีเครื่องหมายลบและแนวคิดอื่น ๆ ที่มีบทบาทคล้ายกันใช้ในสถิติและอื่น ๆ คุณสามารถเจาะจงมากขึ้น
Gijs

7
ในสถิติและการวิเคราะห์ข้อมูลนานก่อนการเรียนรู้ของเครื่องการเข้ารหัสประเภทเด็ดขาดนี้รู้จักกันในชื่อตัวแปรจำลองหรือตัวแปรตัวบ่งชี้ชนิดความคมชัด
ttnphns

คำตอบ:


18

สถิติโทรเข้ารหัสหนึ่งร้อนเป็นหุ่นเข้ารหัส ตามที่คนอื่นแนะนำ (รวมถึงScortchiในความคิดเห็น) นี่ไม่ใช่คำพ้องที่แน่นอน แต่นี่เป็นคำที่มักจะใช้สำหรับตัวแปรหมวดหมู่ที่เข้ารหัส 0-1

ดูเพิ่มเติมที่: "ตัวแปรตัวจำลอง" กับ "ตัวบ่งชี้ตัวแปร" สำหรับข้อมูลเล็กน้อย / หมวดหมู่


3
ดุจ !! ไม่อยากเชื่อเลยว่าฉันลืมไป ฉันยังอ้างถึงพวกเขาเป็นตัวบ่งชี้
ทิมอทรัยเดรด

2
ฉันไม่คิดว่า "การเข้ารหัสแบบหลอกตา" เป็นคำพ้องที่ดี มันใช้ทั้งในความหมายทั่วไปหมายถึงการแสดงตัวแปรเด็ดขาดด้วยชุดของตัวแปรตัวเลขหรือสำหรับ "การเข้ารหัสระดับอ้างอิง" ซึ่งแตกต่างจาก "การเข้ารหัสแบบร้อนแรง" เช่นในการเข้ารหัสแบบร้อนกับการเข้ารหัสแบบจำลอง . "ระดับหมายถึงการเข้ารหัส" (ดูมีสิ่งที่เรียกว่า“หมายถึงการเข้ารหัส” (เหมือนหุ่นเขียนโปรแกรมและผลการเข้ารหัส) ในรูปแบบการถดถอย? ) หมายถึงการเข้ารหัสหนึ่งร้อน แต่ความหมายบริบทจำลองเชิงเส้นอาจจะเกินไป ...
Scortchi - คืนสถานะ โมนิก้า

2
... อย่างยิ่งสำหรับการใช้งานทั่วไป
Scortchi - Reinstate Monica

3
ฉันไม่เคยเห็นคำนิยามต่อ se แต่สำหรับฉันตัวแปรจำลองในสถิติมักแสดงถึงการเข้ารหัสของปัจจัย N ด้วยตัวแปร (N-1) ในขณะที่การเข้ารหัสแบบร้อนแรงจะเข้ารหัสปัจจัย N ด้วยตัวแปร N ความแตกต่างนี้มีความสำคัญอย่างมากในการปฏิบัติ ถ้าใครใช้การเข้ารหัสแบบร้อนแรงสำหรับการถดถอยใครจะไร้สาระเพราะการพึ่งพาของตัวแปร!
เม.ย.

2
@aginensky แม้ว่าผู้คนควรให้ความสนใจอย่างแน่นอนกับตัวแปรที่พวกเขามี แต่รูทีนการถดถอยที่ดีจะไม่สร้างความไร้สาระในสถานการณ์นั้น: มันจะละเว้นตัวทำนายเพียงตัวเดียวและบอกคุณอย่างนั้น
Nick Cox

8

ขึ้นอยู่กับกลุ่มเป้าหมายของคุณ

ดังที่ทิมกล่าวว่านักสถิติเรียกมันว่าการจำลองแบบหุ่นและนั่นคือสิ่งที่ฉันคาดว่าจะเห็นเมื่ออธิบายบางอย่างเช่นแบบจำลองการถดถอย "มีการรวมตัวแปรหลอกตาเพื่อปรับตำแหน่งของร้าน" ฉันคิดว่าการเรียกมันว่าการเข้ารหัสแบบร้อนแรงจะดูเหมือนแปลกเล็กน้อยที่นี่

อย่างไรก็ตามดังที่ทิมอีกคนกล่าวว่าการเข้ารหัสแบบร้อนแรงนั้นเป็นเรื่องธรรมดาในวรรณกรรมการเรียนรู้ของเครื่อง มันหมายถึงการมีอยู่ของโหนด (เช่นในเครือข่ายประสาท), สายทางกายภาพ (ในอุปกรณ์) หรืออะไรทำนองนั้นอย่างน้อยก็สำหรับฉัน

อย่างเป็นทางการฉันเดาว่าคุณกำลังใช้ชุดตัวบ่งชี้ฟังก์ชันแต่นั่นอาจเป็นวิธีที่ไม่เป็นทางการมากเกินไปIX


6

คำนี้มาจากวิศวกรรมอิเล็กทรอนิกส์ แค่คิดว่าใครจะโทร 1 "ร้อน"? เฉพาะผู้ที่ทำงานด้วยไฟฟ้าที่ "ร้อน" หรือหมายถึง "ชีวิต" มีศักย์ไฟฟ้าบนลวด "หนึ่งร้อน" หมายถึงการออกแบบวงจรที่ระดับสัญญาณไฟฟ้าไม่ต่อเนื่องในสายหนึ่งจะถูกถอดรหัสเป็นร้อน / เย็นในชุดของสายไฟ ฉันคิดว่าบางคนเรียนรู้เครื่องด้วยพื้นหลัง EE พบว่าน่าสนใจเปรียบเทียบ

ในเศรษฐมิติและสถิติคุณอาจพบdummyหรือindicatorตัวแปรที่ค่อนข้างคล้ายกันเพราะสิ่งเหล่านี้ใช้เพื่อแสดงหมวดหมู่ที่แตกต่างด้วยตัวชี้วัดที่แตกต่างกัน มีความแตกต่างเล็กน้อยว่า ตัวอย่างเช่นคุณสร้างหุ่น K-1 สำหรับหมวดหมู่ K เนื่องจากหมวดหมู่พื้นฐานสอดคล้องกับหุ่นทั้งหมดที่ตั้งค่าเป็น 0 ในทางกลับกันฉันคิดว่าในการเข้ารหัสฮอตที่คุณมีสาย K ซึ่งหมวดหมู่ฐานจะมีสายของตัวเอง ( ตัวแปร).


5

ฉันได้รับการฝึกฝนทางสถิติและเพิ่งได้ยิน "การเข้ารหัสแบบหนึ่งร้อน" ในการเรียนรู้ด้วยเครื่อง / comp sci lit ฉันมักจะอ้างถึงเมทริกซ์แบบ one-hotted เป็นเมทริกซ์การออกแบบ / เมทริกซ์ข้อมูล / กรอบการออกแบบ


คุณมีข้อมูลอ้างอิงที่ฉันสามารถอ้างอิงได้หรือไม่? ฉันกำลังเขียนสิ่งพิมพ์ทางวิทยาศาสตร์และต้องการให้ชัดเจนเกี่ยวกับวิธีการนี้สำหรับผู้อ่านทุกคนเพราะกระดาษไม่ได้สำหรับชุมชน ML แต่กว้างขึ้น
แตกหัก

ไม่สามารถพูดได้ว่าฉันเคยได้ยินคำว่า "หนึ่งแต้ม" แต่ในทำนองเดียวกันฉันมาที่นี่จากทิศทางคณิตศาสตร์ / สถิติ (ผลการค้นหาของ Google เกี่ยวกับ "one-hotted" น่าสนใจ - ฉันได้รับการผสมผสานระหว่างความหมายการเรียนรู้ของเครื่องและผู้คนพูดถึง "one hotted-up car".)
Michael Lugo

3

วิทยาศาสตร์ทางกายภาพและวิศวกรรมก็เรียกว่า(ทั่วไป) Kronecker เดลต้า

ในรูปแบบง่าย, เดลต้า Kroneker ที่กำหนดเป็นแต่นี่นิด ๆ ทั่วไปที่จะδ [ เงื่อนไข]{ 1 ถ้า[ เงื่อนไข] 0อื่น

δi,j{1ifi=j0else,
δ[condition]{1if[condition]0else.

δicategory

δicategory{1ificategory0else,
δi

Kronecker delta มีประโยชน์จริง ๆ ในSigma / Pi / Einstein / etc สัญกรณ์เนื่องจากช่วยให้สามารถระบุเงื่อนไขได้

เพียงเพื่อให้ความสัมพันธ์นี้ให้กับโครงสร้างการเขียนโปรแกรมทั่วไปของ Kronecker เดลต้าcondition?1:0ซึ่ง?:เป็นผู้ประกอบการที่มีเงื่อนไข


δi,jδi=j


ฉันไม่เห็นลิงก์ที่นี่ ฮอตหนึ่งถอดรหัสหนึ่งตัวแปรในชุดสำหรับแต่ละสถานะของตัวแปร Kronecker delta ใช้ในแอปพลิเคชันนี้อย่างไร
Aksakal

{0,1}δVWδAcuraδHonda

δi,jδCompanyName,VW

VWACURAi=1..NVWiACURAiiCARiVWi=δ(CARi,VW)

VWiδVWiδiVWi10

2

1K

นี่คือคำพูดจากหนังสือ

K1KKxxk10K=6x3=1x

x=(0,0,1,0,0,0)T

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.