การควบคุมด้วยเสียงผ่านสภาพแวดล้อมเดสก์ทอป

16

ฉันต้องการเปิดใช้งานระบบที่สามารถตอบสนองต่อคำสั่งเสียงของผู้ใช้และเรียกใช้สคริปต์ตามคำสั่งด้วยวาจา GIVEN

เป็นการดีที่ฉันต้องการให้คอมพิวเตอร์ฟังอย่างต่อเนื่อง

เมื่อได้ยินคำว่า "คอมพิวเตอร์" จะมีเสียงเปิดใช้งานและฟังคำสั่งเป็นเวลา 10 วินาที (หรือมากกว่านั้น)

เมื่อเปิดใช้งานและในขณะที่กำลังฟังอยู่ฉันต้องการให้อีกคำหนึ่งของ buzz สามารถเรียกใช้สคริปต์ได้

เช่น ....

(คอมพิวเตอร์ไม่ได้ทำงาน) "คอมพิวเตอร์" (คอมพิวเตอร์ฟังทันที) "เข้าถึงข้อความใหม่" (ข้อความเป็นคำที่มีคำพูด * IGNORES "ACCESS NEW" - คอมพิวเตอร์เรียกใช้สคริปต์และเปิดวิวัฒนาการหรือความเห็นอกเห็นใจ) อาจมีเบราว์เซอร์หนึ่งอันสำหรับปิดหน้าต่างและแสดงเดสก์ท็อปหรืออะไรอีกมากมาย

เป็นไปได้ไหม

microphone voice-recognition

— BorgDomination
แหล่งที่มา

7

gnome-Voice-ควบคุม

พัฒนาขึ้นโดยเป็นส่วนหนึ่งของ Google Summer of Code 2007 นี่เป็นแนวคิดในการพัฒนาคุณลักษณะบางอย่างที่จะปรับปรุงการใช้งานใน Gnome Desktop

เป้าหมายคือการใช้ระบบควบคุมเสียงบนเดสก์ท็อป ระบบประกอบด้วยแอปพลิเคชันที่จะตรวจสอบสัญญาณเสียง (ไมโครโฟน) และเมื่อตรวจพบสัญญาณเสียงที่สำคัญซอฟต์แวร์จะจับประมวลผลและรับรู้สัญญาณแล้วดำเนินการตามที่ต้องการผ่าน Gnome Desktop ในชุดของการกระทำอาจรวมถึงการย่อขยายปิดหน้าต่างที่ใช้งานอยู่ เปิดโปรแกรมเฉพาะ สลับจากเดสก์ท็อปหนึ่งไปอีกเดสก์ท็อปหนึ่ง ท่ามกลางคนอื่น ๆ. GnomeVoiceControl มีการใช้งานใน C ร่วมกับ CMU Sphinx ซึ่งเป็นเครื่องมือโอเพ่นซอร์สที่สร้างขึ้นเพื่อแปลงเสียงพูดเป็นข้อความ

สไลด์โชว์โดยผู้แต่ง

น่าเสียดายที่ดูเหมือนว่ามันจะไม่พัฒนาไปไกลกว่า "เป้าหมาย" พื้นฐาน - แต่ดูเหมือนว่าจะมีบางกิจกรรมที่เพิ่มการรองรับภาษาใหม่ ๆ เช่นบัลแกเรียและตุรกีในปีนี้

ติดตั้ง:

sudo apt-get install gnome-voice-control

ตัวพแลทิพัซ

มีโครงการที่น่าสนใจเรียกตุ่นปากเป็ด - โดยทั่วไปแล้วลินุกซ์ส่วนหน้าจะพูด Dragon Naturally พูดตามธรรมชาติซึ่งทำงานในไวน์

การอ้างสิทธิ์เพื่อชื่อเสียงสำหรับแอปพลิเคชันนี้คือ "สามารถเรียกใช้โปรแกรมและสคริปต์ Windows หรือ Linux เช่น" start terminal "

VEDICS

นี่เป็นโครงการ newishที่บอกว่าใช้งานได้กับส่วนติดต่อ Unity

หน้าโครงการบอกว่ารับรู้ "รัน [ชื่อโปรแกรม]" - ดังนั้นในทางทฤษฎีคุณ [ชื่อโปรแกรม] อาจเป็นสคริปต์ใด ๆ ที่คุณต้องการเรียกใช้

— fossfreedom
แหล่งที่มา

ขอบคุณสำหรับการตอบกลับที่รวดเร็วเป็นพิเศษ ฉันได้ยินเกี่ยวกับโปรแกรมนั้นและฉันติดตั้ง แต่ดูเหมือนจะไม่ได้รับการกำหนดค่าที่ผ่านมา - เพียงแค่บอกว่า "config" ฉันประหลาดใจที่ไม่มีการทำงานมากในหน้านี้ อาจมีหน้าต่างที่เทียบเท่ากับที่ฉันสามารถวิ่งไปกับไวน์ได้หรือไม่?

— BorgDomination

1

เสียงคำพังเพยรุ่นเก่าที่อยู่ใน synaptic ให้ผลลัพธ์แบบเดียวกันกับฉัน ฉันพยายามล่าสุดจากเว็บไซต์และดูเหมือนว่าจะได้รับเพิ่มเติม แต่ฉันไม่เคยทำให้มันทำงานได้อย่างถูกต้อง การพึ่งพาตนเองนั้นเป็นสิ่งที่เจ็บปวด

— Kendrick

3

Simon ฟัง

นี่เป็นโครงการโอเพนซอร์ซที่มีวัตถุประสงค์เพื่อแทนที่เมาส์และ / หรือคีย์บอร์ดโดยการรู้จำเสียงที่พัฒนาขึ้นครั้งแรกสำหรับผู้พิการทางร่างกาย

มีppaจากที่เราสามารถติดตั้งแอปพลิเคชันได้: ppa: grasch-simon-listens / simon

— Takkat
แหล่งที่มา

ไซมอนทำงานกับเคเดสเท่านั้นหรือไม่ มันดูยอดเยี่ยมมากและฉันติดตั้งแล้วแต่ไม่สามารถใช้กับ gnome-shell ได้ การจัดการหน้าต่างพิเศษ ถ้าฉันต้องการแสดงหน้าต่างทั้งหมดเช่นนั้นจะทำงานแตกต่างกันใน kde env และ gnome env ใช่มั้ย

— Joshua Robison

1

ควรแก้ไขการพึ่งพาเมื่อติดตั้งบน Ubuntu <= 12.04 จาก ppa แต่ฉันไม่ได้ลองมาเมื่อเร็ว ๆ นี้และฉันไม่รู้ว่ามันจะรบกวนการทำงานของเชลล์ GNOME ได้อย่างไร ไม่มีเวอร์ชั่น (ยัง) สำหรับ 12.10

— Takkat

3

Google2Ubuntu

Google2Ubuntu เป็นเครื่องมือที่ช่วยให้คุณควบคุมคอมพิวเตอร์ของคุณโดยใช้คำสั่งเสียงผ่าน Google รู้จำเสียง API

เรียกใช้คำสั่งดังต่อไปนี้ใน terminal ในการติดตั้งgoogle2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

แหล่ง

— Avinash Raj
แหล่งที่มา

1

การรู้จำเสียงของ Linux

มันได้รับการพัฒนาให้ทำงานภายใต้ลีนุกซ์ดิสทริบิวชั่น, มันสามารถกำหนดค่าได้และง่ายต่อการขยาย, รองรับพจนานุกรมที่กำหนดเอง, การจดจำตามบริบท, โหมดการเขียนตามคำบอกและมาโครที่กำหนดค่าได้

ในการติดตั้ง Linux Speech Recognition ให้ไปที่หน้าGitHubของโครงการ ดาวน์โหลดไฟล์ ZIP และแตกไฟล์

จากนั้นติดตั้งการอ้างอิงบางอย่าง:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

เปิดโฟลเดอร์ที่คลายบีบอัด (Palaver-master) ในเทอร์มินัลแล้วดำเนินการตั้งค่า:

cd /~Path-to-folder~/Palaver-master/
./setup

ตอนนี้มันเป็นเพียงการกำหนดปุ่มลัดเพื่อเปิดใช้งานการบันทึกเพื่อที่จะทำเช่นนั้นไปที่การตั้งค่าระบบ ... > คีย์บอร์ด> ทางลัด> ทางลัดที่กำหนดเองคลิกที่ปุ่มบวกเพื่อเพิ่มทางลัดตั้งชื่อการรับรู้เสียงและตั้งคำสั่ง

/~Path-to-folder~/Palaver-master/hotkey

คลิกใช้คลิกที่ทางลัดแล้วกำหนดปุ่มลัดเพื่อเปิดใช้งานการจำแนกเสียง

โปรดสังเกตว่ายังไม่มีการสร้าง build ที่เสถียรดังนั้นอย่าคาดหวังว่าคำสั่งจะทำงานได้อย่างสมบูรณ์ในขั้นตอนนี้วลีจำนวนมากจะถูกจดจำ แต่จะไม่มีการดำเนินการจริง

— Rodrigo Martins
แหล่งที่มา

ณ ตอนนี้

— Palaver

0

Snips.ai

เพิ่งลองใช้กับ pi3 - น่าจะมี
Runs in docker อยู่

https://snips.ai/

— พอลชไนเดอร์
แหล่งที่มา

1

ยินดีต้อนรับสู่ถาม Ubuntu โปรดทราบว่าหากคุณเข้าร่วมกับเครื่องมือนี้คุณต้องพูดอย่างชัดเจนในโพสต์ของคุณ ดูว่าจะไม่เป็นผู้ส่งสแปมอย่างไร

— Glorfindel

1

เว็บไซต์อย่างเป็นทางการพูดว่า: โอเพ่นซอร์ส: เรามุ่งมั่นที่จะเปิด Snips เมื่อเวลาผ่านไปดังนั้น Snips อาจคุ้มค่าที่จะลอง

— karel