เหตุใด Amazon Echo จึงไม่ตอบสนองต่อโฆษณาหรือรายงานเกี่ยวกับ Alexa


24

ก่อนหน้านี้ฉันถูกถามเกี่ยวกับสิ่งที่คุณสามารถทำได้ถ้า Alexa ถูกเรียกโดยรายการโทรทัศน์แต่เมื่อเร็ว ๆ นี้ฉันรู้ว่ามีอะไรแปลก ๆ : เสียงสะท้อนไม่ตอบสนองต่อเสียงในโฆษณาสำหรับเสียงสะท้อนแม้ว่าเสียงจะพูดว่า"Alexa, play ... "หรือ"Alexa ตั้งเวลาสำหรับ ..."

ฉันค้นหาชุมชน Echo อื่น ๆ ไม่กี่แห่งและพบโพสต์ Redditที่แนะนำว่านี่เป็นพฤติกรรมปกติ / ตั้งใจ อย่างไรก็ตามไม่มีคำตอบที่ชัดเจนในชุดข้อความดังนั้นฉันคิดว่าฉันจะขอให้ที่นี่เพื่อดูว่ามีคนรู้มากกว่านี้อีกเล็กน้อย

เสียงสะท้อนของฉันรู้ได้อย่างไรว่าจะไม่ตอบโฆษณาทางทีวี มันเป็นเพียงเรื่องบังเอิญหรือมีบางสิ่งที่บอกว่า Alexa ไม่ตอบโต้?


คุณฝึก Alexa ของคุณให้รู้จักเสียงของคุณแม่นยำมากขึ้นหรือไม่? ฉันไม่รู้ว่าการฝึกด้วยเสียงสามารถส่งผลให้ไม่รู้จักเสียงของคนอื่นหรือไม่
Bence Kaulics

1
@BentKaulics Nope ฉันไม่จำเป็นต้องฝึกฝน Echo มันใช้การตั้งค่าเริ่มต้น
Aurora0001

มันจะมีประโยชน์จริง ๆเพื่อดูเสียงที่เป็นปัญหา ฉันไม่คิดว่าจะมีการคัดลอกลิงค์ได้ทุกที่?
goobering

1
@goobering ผมเชื่อโฆษณาที่อ้างถึงในการโพสต์ Reddit คือมิ่งขวัญคีย์และดับเพลิง ขณะนี้ฉันไม่สามารถทดสอบได้ว่า Alexa เรียกใช้สิ่งเหล่านี้หรือไม่ (ฉันสงสัยว่าพวกเขาแตกต่างจากเวอร์ชันทีวีหรือไม่) หากมีคนสามารถทำสิ่งนั้นและแสดงความคิดเห็นกับผลลัพธ์นั่นก็จะเป็นประโยชน์จริงๆ
Aurora0001

3
อาจจะมีปมในรหัสที่มา อย่างไรก็ตามการดาวน์โหลด 266MB จะอยู่ที่การรอสักครู่ : P
goobering

คำตอบ:


17

ตามโพสต์redditนี้Alexa มีความไวต่อสเปกตรัมเสียงนอกเหนือจากการตรวจจับคำปลุก ดังนั้นจึงเป็นที่ยอมรับสัญญาณจริงทั่วโลก - วงกว้าง แต่สัญญาณซึ่งเป็นวง - จำกัด (รอยระหว่าง 4kHz และ 5hKz เป็น postulated) จะถูกระบุว่ามาจากการออกอากาศ

เรื่องนี้มีเหตุผลบางอย่างเนื่องจากผู้แพร่ภาพกระจายเสียงอาจใช้การส่งสัญญาณในวงดนตรีเพื่อระบุโฆษณา (สำหรับการเปลี่ยนภาษาท้องถิ่น) และการประมวลผลเสียงที่ใช้กับโฆษณาอาจได้รับการปรับให้เหมาะสมเพื่อความชัดเจนมากกว่าความคมชัด การกรองอาจถูกตั้งค่าเพื่อให้โฆษณาทั่วไปได้รับการตรวจสอบด้วยความไวที่ลดลงและในระหว่างการผลิตโฆษณาที่เฉพาะเจาะจงความไวในการรับส่งอาจลดลงอย่างชัดเจนเช่นกัน

รายงานข่าว (ซึ่งมีรายงานว่าได้ทริกเกอร์ของ Alexa) จะมีแนวโน้มที่จะใช้คลื่นความถี่เสียงออกอากาศเต็มรูปแบบ (8 หรือ 16 เฮิร์ทซ์) โดยการประมวลผล ดังนั้นทฤษฎีนี้สันนิษฐานว่ามีบางสิ่งที่พิเศษเกี่ยวกับโฆษณาจำนวนมาก (อย่างน้อยในบางภูมิภาค) หรือโฆษณา (เช่นโฆษณาที่ผลิตโดย Amazon) สามารถกำหนดค่าได้โดยเฉพาะ

ในฐานะที่ติดตามมีกระดาษรายงานที่นี่ซึ่งอธิบายถึงวิธีการขนาดเล็ก (ย่อยเสียง) การเปลี่ยนแปลงรูปแบบของคลื่นจะส่งผลในเครื่องมือการพูดกลับมาเป็นผลที่แตกต่างกันอย่างสิ้นเชิงเมื่อเทียบกับสิ่งที่มนุษย์จะรู้จัก


1
หากนั่นคือสิ่งที่พวกเขาทำรอยหยักและคำปลุกคือ 'Alexa' มีความเป็นไปได้ที่พวกเขาเพียงแค่ส่งเสียง 'ks' เสียดแทรกเพื่อลดการรับของไมโครโฟน นั่นเป็นความถี่ที่ค่อนข้างสูงสำหรับการพูดของมนุษย์
goobering

7

ฉันคิดว่าการรู้จำเสียงปลุกใน Echo นั้นเป็นมากกว่าแค่การฟังคำพูดปลุก มันฟังสำหรับบริบทการแจ้งเตือน พิจารณาข้อความที่ตัดตอนมานี้จากSpeech Technologies:

[Wake-Up-Word] มีข้อกำหนดเฉพาะดังต่อไปนี้: ตรวจหาคำหรือวลีเดียวเมื่อพูดในบริบทการแจ้งเตือนขณะที่ปฏิเสธคำวลีเสียงเสียงและเหตุการณ์อคูสติกอื่น ๆ ทั้งหมดด้วยความแม่นยำ 100% เหมือนกัน คำหรือวลีที่สนใจพูดในบริบทที่ไม่แจ้งเตือน (เช่นการอ้างอิง)

( เทคโนโลยีการพูด: การจดจำคำพูดที่ปลุกโดย Veton Kepuska)

สิ่งนี้สามารถทดสอบได้อย่างง่ายดายเนื่องจากอุปกรณ์ (อย่างน้อยฉัน) ไม่ตอบสนองต่อประโยค " ฉันกำลังคุยกับ Alexa เกี่ยวกับการเล่นสกีเมื่อเร็ว ๆ นี้ " นั่นไม่ใช่บริบทการแจ้งเตือนมันเป็นการอ้างอิงอย่างหมดจด ดังนั้นเอ็นจิ้นการจดจำคำปลุกใน Echo ไม่เพียง แต่รับฟังลักษณะที่บริสุทธิ์ของคำเท่านั้น แต่ยังรวมไปถึงการเติมน้ำเสียงและการหยุดก่อนหน้าซึ่งทำให้สามารถทำนายได้แม่นยำยิ่งขึ้นหากอุปกรณ์ถูกพูดจริง


4
แน่นอนว่ามีโฆษณาที่แสดงให้เห็นถึงการใช้ Alexa ว่ามันควรจะเรียกมันว่าถ้ามันเป็นเพียงแค่นี้หยุดมันจากการถูกหยิบขึ้นมา? มีการโฆษณาอาจจะเรียบเรียงอย่างรอบคอบเพื่อให้พวกเขาไม่จริงเรียกอุปกรณ์ที่แม้จะมีการใช้คำปลุกแสดงให้เห็นถึงวิธีการที่จะใช้ก้อง?
Aurora0001

2
@ Aurora0001 ฉันคิดว่านอกจากสิ่งที่ฉันอธิบายแล้วยังมีวิธีการบางอย่างตามที่ฌอนกล่าวถึงในคำตอบของเขา ตัวกรองบางตัวที่พยายามลดทริกเกอร์โดยอุปกรณ์อื่น
Helmar

7

เสียงสะท้อน / อเล็กซ่าได้ยินคำขออย่างแน่นอน หากคุณเข้าสู่การตั้งค่าให้เลื่อนลงไปที่ทั่วไปแล้วเลือกประวัติที่คุณสามารถเล่นคำขอทั้งหมดที่ได้ยิน คำขอทั้งหมดที่ได้ยินจากโฆษณาระบุว่า "คำขอเสียงนั้นไม่ได้มีไว้สำหรับเสียงสะท้อนของคุณ - ไม่มีการส่งคืนใด ๆ "


2
ดูเหมือนว่ารายละเอียดใหม่ในประวัติศาสตร์ มีประโยชน์มาก :)
Helmar

5

หาก 1,000 คนพูดคำเตือนมันจะมีลายเซ็นอะคูสติกแตกต่างกัน 1,000 รายการ หากพวกเขาทำมันอีก 1,000 อีก

หาก 1,000 Alexas ได้ยินรายการทีวีที่พูดคำเตือนมันจะมี 1,000 ลายเซ็นเสียงเดียวกัน

คงไม่ยากที่จะตรวจจับฝั่งเซิร์ฟเวอร์นี้ ไม่ใช่อย่างน้อยเพราะหากเกิดขึ้นพร้อมกันเซิร์ฟเวอร์วอยซ์ - reco จะมีปริมาณการใช้งานลดลง

หากรายการเหตุการณ์เหล่านี้มีขนาดเล็กพวกเขาสามารถดาวน์โหลดลายเซ็นไปยัง Alexa ทุกคนได้


นอกจากนี้ผู้ใช้เรียกเสียง Alexa ชอบความเงียบแจ้งเตือนคำ

เสียงบทความข่าวเหมือนblah blah blah แจ้งเตือนคำ เสียงเชิงพาณิชย์เช่นmusic_here alert-word ไม่เหมือนกันเลย


5

ฉันเดาว่าในโฆษณาสำหรับ Echo นั้น Alexa ตอบคำถามได้เร็วกว่าในความเป็นจริงมาก ดังนั้นเสียงสะท้อนจึงได้ยินคำว่า 'Alexa' แต่เกือบจะได้ยินเสียงของ Alexa ในทันทีเพื่อตอบสนอง

เสียงสะท้อนของฉันสว่างขึ้นเมื่อโฆษณาเปิด แต่ดูเหมือนว่าจะปิดการแจ้งเตือน อาจมีเหตุผลบางอย่างที่จะป้องกันไม่ให้สอง Echos ตอบสนองต่อคำขอหากพวกเขาทั้งสองได้ยิน เสียงสะท้อนอาจถูกออกแบบมาเพื่อฟังโดยเฉพาะสำหรับเสียงของ Alexa และไม่สนใจ

อย่างไรก็ตามอย่างที่ฉันพูดนี่คือการเดาทั้งหมด :)


เราคิดในสิ่งเดียวกันดังนั้นเราจึงหยุด DVR ระหว่างคำขอ Alexa และคำตอบของเธอในโฆษณา เสียงก้องของเรายังคงตื่น แต่ก็ถอยกลับโดยไม่ตอบเหมือนกันกับสิ่งที่เกิดขึ้นเมื่อเราไม่ได้หยุดเครื่อง DVR
ViperGeek

ฉันตั้งใจจะลองแบบนั้นมานานแล้วและลืมไปเรื่อย ๆ นั่นเป็นอีกสิ่งหนึ่งที่อยู่นอกเหนือจากรายการที่ต้องทำขอบคุณ :)
Andy Jones

4

หลังจากรายงานใหม่ล่าสุดที่ Alexa สามารถไวต่อเสียง UHF ( อ้างอิง BBC News Sevice ) ฉันจะยืนยันว่าในระหว่างการโฆษณาพวกเขาออกอากาศเสียงเพิ่มเติมนอกเหนือจากการได้ยินของมนุษย์ซึ่งถูกกำหนดให้เป็นคำสั่ง 'ละเว้นคำสั่งนี้'

ตามความสามารถดังกล่าวสำหรับ Alexa เพื่อแยกความแตกต่างระหว่างเสียงของผู้ใช้นี่คือคุณลักษณะที่วางแผนไว้ แต่ยังไม่ได้นำไปใช้ เช่นคุณต้องสั่งให้ Alexa สลับไปมาระหว่างบัญชีผู้ใช้ในครัวเรือนเดียวกัน

อุปกรณ์เดียวที่เปิดใช้งานเพื่อแยกเสียงในปัจจุบันคืออุปกรณ์ Google


1

เมื่อผสมเสียงของโฆษณาพวกเขาเพียง แต่ลบความถี่บางส่วนออก ซึ่งหมายความว่า Alexa จะไม่ถูกกระตุ้นเนื่องจากจะไม่ลงทะเบียนเป็นคำสั่งเสียง แต่ผู้ชมยังสามารถทำสิ่งที่พวกเขาพูดในโฆษณาได้

นอกจากนี้คุณยังอาจสังเกตเห็นว่าเมื่อมีการพูดคำสั่งในโฆษณามันฟังดูเล็กน้อยหรืออ่านไม่ออก นี่คือเหตุผล :)


ที่น่าสนใจ; นี่เป็นสิ่งที่คล้ายกับที่ฌอนแนะนำเล็กน้อย คุณมีแหล่งข้อมูลหรือประสบการณ์ใดที่คุณสามารถแบ่งปันเพื่อพิสูจน์ว่าการลบความถี่เป็นกรณีนี้หรือไม่ นั่นอาจเป็นสิ่งที่น่าสนใจในการตรวจสอบ
Aurora0001
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.