序文
最近、マサチューセッツ工科大学が新たな冠状肺炎に感染した人の咳を認識できるAIモデルを開発したというニュースを目にしました。咳の記録を分析することで、無症候性の感染者と健康な人を区別できます。
AIテクノロジーは魔法のように強力だと感じますか?咳をするだけで、無症候性の感染者と健康な人を区別できます。
実際、AI音声認識テクノロジーは、セキュリティ検出シナリオでますます使用されています。
次に、エディターに従ってHuaweiの音声認識サービスについて学習します。
サービス紹介
Huaweiの音声認識サービスは、オンライン(リアルタイム録音)モードを使用して環境内のサウンドイベントを検出し、検出されたサウンドイベントに基づいて、開発者が携帯電話ソフトウェアを介して進行中のイベントをユーザーに通知したり、ユーザーに通知したりするなどのフォローアップコマンドアクションを実行できるようにします。対応する動作と反応を示します。
Huawei音声認識サービスは現在、主に次の13種類の音声イベント検出をサポートしています。
-
笑い
-
泣いている赤ちゃん
-
鼻を鳴らす
-
くしゃみ
-
叫ぶ
-
mew
-
吠えている
-
流水の音(水道の音、小川、波などを含む)
-
カーホーン
-
ドアベル
-
ノッキング
-
火災警報音(火災警報、煙警報などを含む)
- 警報音(消防車警報、救急車警報、警察車警報、防空警報などを含む)
アプリケーションシナリオ
Huaweiの音声認識サービスは、聴覚障害者支援、健康統計、幼児ケアなどのシナリオで使用でき、幅広いアプリケーションがあり、ユーザーエクスペリエンスと安全性を向上させることができます。
たとえば、音声認識サービスの助けを借りて、聴覚障害者は自分の周りで起こっている出来事をすばやく知ることができ、火事、サイレン、悲鳴、流水などの危険な環境にすばやく対応することができます。
乳幼児の保護者の方は、音声認識サービスにより、乳幼児の状態をいつでも知ることができます。携帯電話から乳幼児の泣き声の通知を受け取ると、いつでもそこにいなくても、乳幼児の世話を短時間で行うことができます。
さらに、音声認識サービスを使用して、鼻づまりやくしゃみなどのデータをリアルタイムで検出および記録し、健康状態を分析およびカウントすることもできます。
Huaweiの音声認識サービスは操作が簡単で、APIインターフェイスとSDKパッケージを提供します。開発者は、インターフェイスを呼び出すだけで後続の開発を実行できます。
開発ステップ
1 AppGalleryConnectを構成します。
アプリケーションを開発する前に、AppGalleryConnectで関連情報を構成する必要があります。
具体的な手順については、以下のリンクを参照してください。
https://developer.huawei.com/consumer/cn/doc/development/HMSCore-Guides-V5/config-agc-0000001050990353-V5
2 HMS Core SDKのMavenウェアハウスアドレスを構成し、このサービスのSDK統合を完了します。
2.1 AndroidStudioプロジェクトレベルの「build.gradle」ファイルを開きます。
2.2 HUAWEIagcpプラグインとMavenコードベースを追加します。
-
「allprojects> repositories」でHMSCoreSDKのMavenリポジトリアドレスを設定します。
-
「buildscript> repositories」でHMSCoreSDKのMavenウェアハウスアドレスを構成します。
- 「agconnect-services.json」ファイルがアプリに追加されている場合は、「buildscript> dependencies」にagcp構成を追加する必要があります。
buildscript {
repositories {
google()
jcenter()
maven {url 'https://developer.huawei.com/repo/'}
}
dependencies {
...
classpath 'com.huawei.agconnect:agcp:1.4.1.300'
}
}
allprojects {
repositories {
google()
jcenter()
maven {url 'https://developer.huawei.com/repo/'}
}
}
3音声認識の例を作成します。
MLSoundDector soundDector = MLSoundDector.createSoundDector();
4音声認識結果コールバックを作成して検出結果を取得し、そのコールバックを音声認識インスタンスに渡します。
private MLSoundDectListener listener = new MLSoundDectListener() {
@Override
public void onSoundSucce***esult(Bundle result) {
//识别成功的处理逻辑,识别结果为:0-12(对应MLSoundDectConstants.java中定义的以SOUND_EVENT_TYPE开头命名的13种声音类型)。
int soundType = result.getInt(MLSoundDector.RESULTS_RECOGNIZED);
}
@Override
public void onSoundFailResult(int errCode) {
//识别失败,可能没有授予麦克风权限(Manifest.permission.RECORD_AUDIO)等异常情况。
}
};
soundDector.setSoundDectListener(listener);
5認識を開始します。
boolean isStarted = soundDector.start(context); //context 是上下文
//isStared 等于true表示启动识别成功、isStared等于false表示启动识别失败(原因可能是手机麦克风被系统或其它三方应用占用)
6認識を停止します。
soundDector.stop();
7認識の終了、リソースの解放。
soundDector.destroy();
DEMO演示
詳細については、以下を参照してください。
Huawei Developer Allianceの公式ウェブサイト:https://developer.huawei.com/consumer/cn/hms
開発ガイダンス文書を入手する:https://developer.huawei.com/consumer/cn/doc/development
開発者のディスカッションに参加するには、Redditコミュニティにアクセスしてください。https://www.reddit.com/r/HMSCore/
デモとサンプルコードをダウンロードするには、Githubにアクセスしてください。https://github.com/HMS-Core
統合の問題を解決するには、StackOverflowにアクセスしてください。https://stackoverflow.com/questions/tagged/huawei-mobile-services?tab=Newest
元のリンク:
https://developer.huawei.com/consumer/cn/forum/topic/0201411999326170397?fid=18
作成者:こんにちは