โปรแกรมสร้างคำบรรยายอัตโนมัติโดยใช้คำพูดเป็นข้อความหรือไม่


12

ฉันมีวิดีโอที่ฉันต้องการสร้างคำบรรยาย มีโปรแกรมที่สามารถใช้คำพูดเป็นข้อความพื้นฐานได้หรือไม่

  1. ตั้งค่าเริ่มต้น / หยุดที่ถูกต้องของแต่ละคำบรรยายแต่ละรายการ
  2. สร้างคำบรรยายข้อความพื้นฐาน (ใช้การเรียงลำดับคำพูดเป็นข้อความ)

ฉันรู้เกี่ยวกับคำบรรยายคำพังเพย อย่างไรก็ตามต้องใช้ความพยายามอย่างมากในการสร้างคำบรรยายเหล่านั้นด้วยตนเอง คุณต้องเลือกด้วยตัวเองว่าเป็นจุดเริ่มต้นและหยุดสำหรับแต่ละประโยค

Youtube มีคุณสมบัติข้างต้น (สร้างคำบรรยายข้อความพื้นฐานตามเวลาที่ถูกต้องโดยใช้คำพูดเป็นข้อความ) อย่างไรก็ตามฉันจะไม่อัปโหลดวิดีโอไปยัง Youtube เพียงเพื่อให้ได้คำบรรยายของฉัน เป็นไปได้ไหมที่จะทำคำบรรยายอย่างมีประสิทธิภาพใน Ubuntu

อัปเดต : ฉันวางแผนที่จะใช้คำบรรยาย. srt เท่านั้นและไม่จำเป็นต้องเขียนโค้ดลงบนวิดีโอ ความต้องการที่ยิ่งใหญ่ที่สุดของฉันคือการให้โปรแกรมค้นหาการเริ่ม / หยุดโดยอัตโนมัติสำหรับแต่ละประโยคเพื่อให้ฉันเขียนข้อความลงไป

Update # 2 : มีซอฟต์แวร์ Speech-to-Text สำหรับ Linux พร้อมแพ็คเกจ CMU Sphinx เป็นไปได้ที่จะใช้ CMU Sphinx กับโปรแกรมคำบรรยายตามhttp://sourceforge.net/projects/cmusphinx/forums/forum/5471/topic/3949891นอกจากนี้เครื่องมือคำบรรยายหนึ่งยังตระหนักถึงคุณสมบัติของ CMU Sphinx http: //groups.google.com/group/universal-subtitles-testing/browse_thread/thread/613361ffb921b43b (เครื่องมือบนเว็บ) อย่างไรก็ตามไม่มีการอ้างอิงในซอร์สโค้ดล่าสุดที่พวกเขาเพิ่ม CMU Sphinx ภารกิจยังคงค้นหาโปรแกรมที่ใช้ CMU Sphinx สำหรับการพูดพื้นฐานเป็นข้อความ (ซึ่งจะตั้งค่าการกำหนดเวลาที่ถูกต้องเช่นกัน) เช่นเดียวกับ Youtube


ฉันคิดว่ามีแอปพลิเคชั่นนกกางเขน
RolandiXor

คำตอบ:


3

ฉันใช้Aegisubบน Windows มาหลายปีและมีความสุขกับมันมาก เห็นได้ชัดว่ามันพร้อมใช้งานสำหรับ Linux มันค่อนข้างอธิบายตนเอง

Aegisub สร้างไฟล์คำบรรยายเท่านั้นเช่นไฟล์. srt ในการรวมวิดีโอและคำบรรยายเพื่อสร้างคำบรรยายแบบฮาร์ดโค้ดคุณยังต้องใช้โปรแกรมที่สอง
บน Windows ฉันใช้ VirtualDub แต่ไม่สามารถใช้งานได้กับ Linux คุณสามารถใช้ VLC เพื่อทำสิ่งนี้บน Linux :

สร้างหมวดย่อยของคุณใน Aegisub โดยบันทึกเป็นไฟล์. ass ตามปกติ

ใช้ VLC เพื่อเพิ่มแทร็กคำบรรยายลงในวิดีโอของคุณ คำบรรยาย -> เพิ่มไฟล์คำบรรยาย ...

กำหนดค่าสไตล์การแสดงคำบรรยายและการตั้งค่าเพื่อให้แสดงตามความต้องการของคุณ เครื่องมือ -> การตั้งค่า -> คำบรรยาย / OSD

ตอนนี้คุณสามารถดูวิดีโอเพื่อให้แน่ใจว่าหมวดย่อยแสดงตามที่คุณต้องการ ตัวอย่างเช่นฉันสามารถตรวจสอบหมวดย่อยบางอย่างที่ฉันได้ระบุไว้ใน Aegisub ที่จะแสดงที่ด้านบนของหน้าจอมากกว่าด้านล่าง

ผลลัพธ์จะเหมือนกันกับที่ดูตอนนี้ดังนั้นตรวจสอบให้แน่ใจว่าทุกอย่างดี

  1. ไปที่สื่อ -> แปลง / บันทึก ... (Ctrl + R)

  2. ภายใต้การเลือกไฟล์เพิ่มไฟล์วิดีโอของคุณ ทำเครื่องหมาย "ใช้ไฟล์คำบรรยาย" และเรียกดูไฟล์ย่อย. ass ของคุณ

  3. คลิกลูกศรลงที่ปุ่มแปลง / บันทึกและคลิกแปลง ... (Alt + O)

  4. ภายใต้การตั้งค่าให้แน่ใจว่าตัวเลือกการแปลงถูกเลือก เลือกตัวเลือกแสดงผลลัพธ์ Subs จะไม่ถูกเพิ่มด้วยเหตุผลบางอย่างถ้าคุณทำเครื่องหมายนี้

  5. แก้ไขโปรไฟล์เพื่อให้การตั้งค่าวิดีโอและเสียงเป็นสิ่งที่คุณต้องการ ภายใต้แท็บคำบรรยายให้ทำเครื่องหมายในกล่องคำบรรยายและใช้ตัวแปลงคำบรรยาย DVB ตรวจสอบให้แน่ใจว่าคุณทำเครื่องหมาย 'คำบรรยายทับซ้อนบนวิดีโอ' กดบันทึก

  6. ป้อนโฟลเดอร์ปลายทางและชื่อไฟล์ในกล่องปลายทาง

  7. กดเริ่ม

รอให้เสร็จและนั่นแหละ ข้อแม้ด้วยวิธีนี้คือการเข้ารหัสจะเกิดขึ้นแบบเรียลไทม์กับวิดีโอดังนั้นหากคุณมีวิดีโอ 2 ชั่วโมงมันจะใช้เวลา 2 ชั่วโมง นี่เป็นเพราะการทำเครื่องหมายในช่อง 'แสดงผลลัพธ์' แต่ด้วยเหตุผลบางอย่างจะใช้งานได้เฉพาะเมื่อคุณทำเครื่องหมายนี้

นอกจากนี้ยังมีอื่น ๆคำบรรยายบรรณาธิการ

อัปเดต:
ฉันจำ Aegisub ไม่ได้ที่มีฟังก์ชั่นการตั้งค่าเริ่มต้นและจุดสิ้นสุดของประโยคที่พูดโดยอัตโนมัติในไฟล์คำบรรยาย และฉันไม่เห็นการพูดถึงฟังก์ชั่นดังกล่าวที่ใดก็ได้ในเว็บไซต์ อย่างไรก็ตามมันมี (การรวมคีย์) สวยง่ายต่อการตั้งเวลาด้วยตนเอง

มีโปรแกรมใดบ้างที่มีฟังก์ชั่นดังกล่าว (ในระบบปฏิบัติการใด ๆ )?


ฉันก็ใช้ Aegsub บน Windows ฉันไม่ทราบว่ามันพร้อมใช้งานบน Linux .. ขอบคุณ Pit :) ... Aegsub เป็นตัวย่อที่มีความสามารถมาก ... รูปแบบเริ่มต้นคือ ASS (วิวัฒนาการจาก SSA .. Sub-StationAlpha รูปแบบ) .. มันจัดการ Unicode และมีเครื่องมือพิเศษสำหรับการเตรียมข้อความคาราโอเกะ ....
Peter.O

2
ขอบคุณสำหรับ Aegisub ฉันพยายามคิดเวิร์กโฟลว์สำหรับโปรแกรมนี้ มันสามารถสแกนวิดีโอทั้งหมดและสร้างการกำหนดเวลาสำหรับแต่ละคำบรรยายได้หรือไม่? ไม่ปรากฏว่ามีคุณสมบัติเป็นคำพูดเป็นข้อความ
user4124

คุณอาจต้องการที่จะอ่านdocs.aegisub.org/manual/...
Pit

Aegisub ไม่สร้างคำบรรยายอัตโนมัติ เราต้องเขียนคำบรรยายโดยใช้มัน ดังนั้นนี่อาจไม่ใช่คำตอบสำหรับคำถามนี้
Harshitha Palihawadana

คำถามถูกแก้ไข 3 ปี (!) หลังจากคำตอบของฉัน ต้นฉบับ "โปรแกรมที่จะใช้ในการสร้างคำบรรยายสำหรับวิดีโอ" ไม่ได้พูดถึงสิ่งใดจากอัตโนมัติหรือข้อความเป็นคำพูด
หลุม

3

ฉันไม่พบวิธีรับโปรแกรมคำบรรยายเพื่อเพิ่มคำบรรยายพื้นฐานโดยอัตโนมัติโดยการวิเคราะห์เสียงในวิดีโอ

ดังนั้นทางเลือกที่ฉันใช้คือ

  1. อัปโหลดวิดีโอไปยัง Youtube (เช่นส่วนตัว) และใช้สิ่งอำนวยความสะดวกในการสร้างเพื่อสร้างคำบรรยายพื้นฐานโดยอัตโนมัติ

จากนั้น

  1. เพิ่มวิดีโอไปที่http://www.universalsubtitles.org/และสร้างกรอบเวลาสำหรับแต่ละประโยคด้วยตนเองหากวิธีการอัตโนมัติใน Youtube ไม่ทำงานหรือประโยคกำลังปะทุ
  2. ใช้คำบรรยาย GNOME (พบในศูนย์ซอฟต์แวร์) เพื่อล้างคำบรรยายและแก้ไขเวลาใด ๆ

1
คำตอบนี้ดูเหมือนจะเกี่ยวข้องกับคำถามของการสร้างไฟล์คำบรรยายโดยอัตโนมัติ
Garrett

เป็นเรื่องที่น่าแปลกใจที่ YouTube สามารถสร้างคำบรรยาย (หยาบ) โดยอัตโนมัติ แต่เห็นได้ชัดว่าไม่มีโปรแกรมใดที่สามารถทำได้
การ์เร็ตต์

3

ฉันเองชอบคำบรรยายของ Gnome ที่มีอยู่ในที่เก็บ

sudo apt-get install gnome-subtitles

1

คุณสามารถใช้ยูทิลิตีบรรทัดคำสั่งนี้ได้

Autosubเป็นเครื่องมือสำหรับการรู้จำเสียงอัตโนมัติและการสร้างคำบรรยาย ใช้วิดีโอหรือไฟล์เสียงเป็นอินพุตดำเนินการตรวจจับกิจกรรมเสียงเพื่อค้นหาภูมิภาคของคำพูดทำการร้องขอแบบขนานไปยัง Google Web Speech API เพื่อสร้างการถอดรหัสสำหรับภูมิภาคเหล่านั้น (ทางเลือก) แปลเป็นภาษาอื่นและในที่สุดก็บันทึกผลลัพธ์ คำบรรยายไปยังดิสก์

https://github.com/agermanidis/autosub/

ผู้ใช้ Python3 ทำสิ่งนี้:

pip install git+https://github.com/BingLingGroup/autosub.git@alpha

ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง ffmpeg แล้ว


0

ตกลงพบเครื่องมือบางอย่างที่ดูดีและคล้ายกับเวิร์กช็อปคำบรรยาย - เครื่องมือแก้ไขคำบรรยาย (apt-get install subtitleeditor)

พยายามที่จะเปรียบเทียบกับคำบรรยายของ Gnome ตัวแก้ไขคำบรรยายดูเครื่องมือล่วงหน้ามากขึ้น


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.