การรู้จำเสียง - ซอฟต์แวร์ MP3 เป็นข้อความ [ปิด]


16

ฉันกำลังมองหาโปรแกรมอิสระลำโพง (เชิงพาณิชย์หรือฟรี) ที่จะช่วยให้ฉันสามารถคัดลอกไฟล์ MP3 ที่มีการบันทึกคำพูด (โดยเฉพาะอย่างยิ่งพอดคาสต์) เป็นข้อความ ฉันอยากลอง Dragon Nasty Speaking แต่ดูเหมือนว่ามันสนับสนุนการถอดเสียงบันทึกเสียงของฉันเท่านั้น ดังนั้นทางเลือกคืออะไร?


ความคิดเห็นโดย Avi: ฉันไม่เชื่อว่าเป็นไปได้ - ผู้พูดอิสระ
Ivo Flipse

ระบบปฏิบัติการอะไร
studiohack

Windows หรือ Linux
pako

คำตอบ:


7

Dragon Naturally Speaking จะนำเข้าไฟล์ MP3 และพยายามคัดลอกไฟล์เหล่านั้น มันชอบที่จะปรับแต่งการรับรู้เสียงให้กับลำโพงแต่ละตัว แต่ทำงานได้ดีโดยไม่ต้องจูน มันอาจจะทำงานได้ดีที่สุดถ้าลำโพงพอดแคสต์ของคุณมีเสียงเหมือน Tom Brokaw


2
ฉันลองใช้ Dragon NTC พูดตามธรรมชาติ แต่มันก็ทำงานได้แย่มากสำหรับพอดคาสต์กับผู้พูดที่ไม่รู้จัก มันทำงานได้ค่อนข้างดีกับเสียงของฉันเองหลังจากฝึกอบรมโปรแกรม
pako

1
มันสามารถนำเข้าไฟล์เสียงอื่น ๆ และถอดเสียงได้หรือไม่
Larry Morries

4

วิธีแก้ปัญหาที่เป็นไปได้วิธีหนึ่งคืออัปโหลดวิดีโอของคุณไปที่ Youtube และลองใช้คำอธิบายภาพอัตโนมัติที่คุณสามารถเปิดใช้งาน ... มันยังไม่แม่นยำเกินไป แต่คุณสามารถดาวน์โหลดไฟล์คำบรรยายภาพและแก้ไขด้วยตัวคุณเอง สำหรับปัญหาด้านลิขสิทธิ์ / การละเมิดลิขสิทธิ์ของเพลงคุณสามารถทำให้วิดีโอเป็นส่วนตัวในโปรไฟล์ของคุณหากเป็นไปได้


1
@studioback: วิธีนี้ใช้โดย Youtube กับวิดีโอของตัวเองเท่านั้นไม่ใช่วิธีที่คนอื่นอัปโหลดหรือเปล่า?
ทิม

1
@Tim: สำหรับทั้งคู่จริง ๆ แล้ว
studiohack

1
@studiohack: วิดีโออื่น ๆ ที่อัพโหลดโดยคนอื่นทำอย่างไร? ฉันหมายถึงโดยไม่ต้องดาวน์โหลดและอัพโหลดเป็นวิดีโอของฉันเองเหรอ?
ทิม

1
ในวิดีโอส่วนใหญ่จะมีไอคอน CC อยู่ด้านล่างให้คลิกแล้วทำการถอดรหัสอัตโนมัติ ...
studiohack


2

ฉันจะเตือนไม่ให้ลองใช้ Dragon NTC พูดตามธรรมชาติ - ฉันเขียนสคริปต์บางอย่างบน iPhone jailbroken ของฉันเพื่อคัดลอก / แปลงไฟล์ข้อความเสียงทั้งหมดจากโทรศัพท์ของฉันไปยังโฟลเดอร์บนพีซีของฉันและให้บริการถอดความ Dragon Naturally Speaking

ผลลัพธ์ของการรันการถอดความจากไฟล์ที่มีลำโพงที่แตกต่างกันนั้นใช้ไม่ได้อย่างสมบูรณ์ ฉันได้ลองใช้ตัวเลือกโอเพนซอร์ส แต่การรู้จำเสียงด้วยลำโพงไม่ขึ้นอยู่กับพจนานุกรมที่มีขนาดเล็กมาก


1

ฉันใช้http://www.voicebase.comกับพอดคาสต์และวิดีโอเป็นภาษาอังกฤษและใช้งานได้ดีมาก ได้ฟรี 50 ชั่วโมงเสียง

คุณสามารถดาวน์โหลดการถอดความเสียงใน rtf, srt หรือ pdf

คุณสามารถดาวน์โหลดการถอดความเครื่องได้ประมาณ 10-15 นาทีหลังจากที่คุณอัปโหลดและบางครั้งก็เร็ว


1

โอเพ่นซอร์ส: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

โฆษณา: Dragon NaturallySpeaking (Windows)

คุณสามารถลองใช้วิธีนี้หากคุณลองใช้osxซึ่งสามารถทำได้โดยใช้ความกล้าและเสียง

นอกจากนี้คุณยังสามารถพบความเกี่ยวข้องเชื่อมโยงบางอย่างสำหรับopensourceอีกคุ้มค่าที่จะลองแชร์เป็นvoxcribecc

หากคุณเป็นโปรแกรมเมอร์. net คุณสามารถใช้วิธีนี้เพื่อสร้างชุดของคุณเอง


0

Podzinger จะเป็นทางออกที่ดี แต่ฉันไม่แน่ใจว่าทางลาด (ชื่อใหม่สำหรับ บริษัท ที่เคยเป็น EveryZing ผู้ผลิต Podzinger) เสนอบริการฟรีอีกต่อไป ...

http://en.wikipedia.org/wiki/Podzinger

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.