ฉันจะใช้การรู้จำเสียงโดยไม่มีกล่องโต้ตอบที่น่ารำคาญในโทรศัพท์ Android ได้อย่างไร


124

เป็นไปได้ไหมโดยไม่ต้องแก้ไข Android API ฉันพบบทความเกี่ยวกับเรื่องนี้ มีความคิดเห็นหนึ่งที่ฉันควรแก้ไข Android APIs แต่มันไม่ได้บอกว่าจะทำการปรับเปลี่ยนอย่างไร ใครสามารถให้คำแนะนำเกี่ยวกับวิธีการได้บ้าง? ขอบคุณ!


ฉันพบบทความนี้ SpeechRecognizer ความต้องการของเขาแทบจะเหมือนกับของฉัน เป็นข้อมูลอ้างอิงที่ดีสำหรับฉัน!


ฉันแก้ไขปัญหานี้ได้ทั้งหมดแล้ว
ฉันใช้โค้ดตัวอย่างที่ใช้งานได้จากเว็บไซต์ในประเทศจีน นี่คือซอร์สโค้ดของฉัน

package voice.recognition.test;

import android.app.Activity;
import android.content.Intent;
import android.os.Bundle;
import android.view.View;
import android.view.View.OnClickListener;
import android.speech.RecognitionListener;
import android.speech.RecognizerIntent;
import android.speech.SpeechRecognizer;
import android.widget.Button;
import android.widget.TextView;
import java.util.ArrayList;
import android.util.Log;



public class voiceRecognitionTest extends Activity implements OnClickListener 
{

   private TextView mText;
   private SpeechRecognizer sr;
   private static final String TAG = "MyStt3Activity";
   @Override
   public void onCreate(Bundle savedInstanceState) 
   {
            super.onCreate(savedInstanceState);
            setContentView(R.layout.main);
            Button speakButton = (Button) findViewById(R.id.btn_speak);     
            mText = (TextView) findViewById(R.id.textView1);     
            speakButton.setOnClickListener(this);
            sr = SpeechRecognizer.createSpeechRecognizer(this);       
            sr.setRecognitionListener(new listener());        
   }

   class listener implements RecognitionListener          
   {
            public void onReadyForSpeech(Bundle params)
            {
                     Log.d(TAG, "onReadyForSpeech");
            }
            public void onBeginningOfSpeech()
            {
                     Log.d(TAG, "onBeginningOfSpeech");
            }
            public void onRmsChanged(float rmsdB)
            {
                     Log.d(TAG, "onRmsChanged");
            }
            public void onBufferReceived(byte[] buffer)
            {
                     Log.d(TAG, "onBufferReceived");
            }
            public void onEndOfSpeech()
            {
                     Log.d(TAG, "onEndofSpeech");
            }
            public void onError(int error)
            {
                     Log.d(TAG,  "error " +  error);
                     mText.setText("error " + error);
            }
            public void onResults(Bundle results)                   
            {
                     String str = new String();
                     Log.d(TAG, "onResults " + results);
                     ArrayList data = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION);
                     for (int i = 0; i < data.size(); i++)
                     {
                               Log.d(TAG, "result " + data.get(i));
                               str += data.get(i);
                     }
                     mText.setText("results: "+String.valueOf(data.size()));        
            }
            public void onPartialResults(Bundle partialResults)
            {
                     Log.d(TAG, "onPartialResults");
            }
            public void onEvent(int eventType, Bundle params)
            {
                     Log.d(TAG, "onEvent " + eventType);
            }
   }
   public void onClick(View v) {
            if (v.getId() == R.id.btn_speak) 
            {
                Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);        
                intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
                intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE,"voice.recognition.test");

                intent.putExtra(RecognizerIntent.EXTRA_MAX_RESULTS,5); 
                     sr.startListening(intent);
                     Log.i("111111","11111111");
            }
   }
}

อย่าลืมลบบันทึกที่น่ารำคาญหลังจากแก้ไขข้อบกพร่อง!


1
เป็นไปได้แน่นอนที่ฉันเคยเห็นแอพอื่น ๆ ทำ (Voice infinity) แต่สำหรับวิธีการฉันไม่ได้เบาะแส ฉันคิดว่าคุณสามารถเริ่มต้นด้วยการดาวน์โหลดแหล่งที่มาของ Android และตรวจสอบใน API ว่าเสียงอยู่ที่ไหนจากนั้นทดลองขยาย ...
Eric

1
ตามที่ระบุไว้โดย Femi ตรวจสอบให้แน่ใจว่ามี<uses-permission android:name="android.permission.RECORD_AUDIO" />ในไฟล์ AndroidManifest.xml ของคุณไม่เช่นนั้น SpeechRecognizer จะไม่รับเสียงใด ๆ
เสนอชื่อ

คำตอบ:


72

ใช้อินเตอร์เฟสSpeechRecognizer แอปของคุณต้องได้รับอนุญาต RECORD_AUDIO จากนั้นคุณสามารถสร้าง SpeechRecognizer ให้RecognitionListenerแล้วเรียกstartListeningใช้เมธอด คุณจะได้รับการโทรกลับไปยังผู้ฟังเมื่อโปรแกรมจดจำเสียงพร้อมที่จะเริ่มฟังเสียงพูดและเมื่อได้รับเสียงพูดและแปลงเป็นข้อความ


ขอบคุณสำหรับคำแนะนำ. ฉันจะลองตอนนี้
Jim31837

10
อย่าลืมทำลาย SpeechRecognier ในวิธี OnDestroy () ตามที่ระบุไว้ที่นี่: stackoverflow.com/a/19931355/2048266เพื่อไม่ให้เกิดhas leaked ServiceConnection android.speech.SpeechRecognizer$Connection@414f0e40 that was originally bound hereข้อผิดพลาด
nommer

คุณช่วยแสดงตัวอย่างได้ไหม นอกจากนี้ฉันสามารถใช้สิ่งนี้ในขณะที่หน้าจอปิดอยู่ได้หรือไม่
Ruchir Baronia

7

GASTมีคลาสนามธรรมที่สะดวกซึ่งคุณสามารถใช้เพื่อใช้SpeechRecognizerคลาสที่มีรหัสใหม่น้อยมาก นอกจากนี้ยังมีตัวอย่างของการเรียกใช้SpeechRecognizerบริการเป็นพื้นหลังโดยใช้สิ่งนี้และสิ่งนี้


คุณช่วยแนะนำวิธีการนำสิ่งเหล่านี้ไปใช้ใน MainActivity ได้ไหม หมายความว่าอย่างไร "* ใช้ {@link Intent} เพื่อเริ่มต้นและหยุด" ขอบคุณมาก
Dante

คุณช่วยแสดงตัวอย่างได้ไหม นอกจากนี้ฉันสามารถใช้สิ่งนี้ในขณะที่หน้าจอปิดอยู่ได้หรือไม่
Ruchir Baronia

6

ขอบคุณสำหรับการโพสต์สิ่งนี้! ฉันพบว่าการกำหนด onclick listener ใน oncreate มีประโยชน์:

@Override
protected void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.activity_main);

    mText = (TextView) findViewById(R.id.textView1);     
    MyRecognitionListener listener = new MyRecognitionListener();
    sr = SpeechRecognizer.createSpeechRecognizer(this);       
    sr.setRecognitionListener(listener);

    findViewById(R.id.button1).setOnClickListener( new View.OnClickListener() {
        @Override
        public void onClick(View v) 
        {
                Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);    
                intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, "en-US");
                intent.putExtra(RecognizerIntent.EXTRA_MAX_RESULTS,1); 
                intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE,"voice.recognition.test");
                sr.startListening(intent);
        }
    });     
}

4

ฉันทำโครงการ Github เพื่อแปลงข้อความเป็นคำพูดและเสียงพูดเป็นข้อความโดยไม่มีกล่องโต้ตอบที่น่ารำคาญ

https://github.com/hiteshsahu/Android-TTS-STT/tree/master/app/src/main/java/com/hiteshsahu/stt_tts/translation_engine

 //SPEECH TO TEXT DEMO
    speechToText.setOnClickListener({ view ->

        Snackbar.make(view, "Speak now, App is listening", Snackbar.LENGTH_LONG)
                .setAction("Action", null).show()

        TranslatorFactory
                .instance
                .with(TranslatorFactory.TRANSLATORS.SPEECH_TO_TEXT,
                        object : ConversionCallback {
                            override fun onSuccess(result: String) {
                                sttOutput.text = result
                            }

                            override fun onCompletion() {
                            }

                            override fun onErrorOccurred(errorMessage: String) {
                                erroConsole.text = "Speech2Text Error: $errorMessage"
                            }

                        }).initialize("Speak Now !!", this@HomeActivity)

    })


    //TEXT TO SPEECH DEMO
    textToSpeech.setOnClickListener({ view ->

        val stringToSpeak :String = ttsInput.text.toString()

        if (null!=stringToSpeak &&  stringToSpeak.isNotEmpty()) {

            TranslatorFactory
                    .instance
                    .with(TranslatorFactory.TRANSLATORS.TEXT_TO_SPEECH,
                            object : ConversionCallback {
                                override fun onSuccess(result: String) {
                                }

                                override fun onCompletion() {
                                }

                                override fun onErrorOccurred(errorMessage: String) {
                                    erroConsole.text = "Text2Speech Error: $errorMessage"
                                }

                            })
                    .initialize(stringToSpeak, this)

        } else {
            ttsInput.setText("Invalid input")
            Snackbar.make(view, "Please enter some text to speak", Snackbar.LENGTH_LONG).show()
        }

    })

ใส่คำอธิบายภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.