1: ノチラ ★ 2017/09/01(金) 17:55:20.97 _USER

83

Microsoftの研究員が開発した音声認識システムが、人間の速記者と同レベルとされる単語誤り率を達成した。

 Microsoftは米国時間8月21日、同社の音声認識システムが、プロの速記者に匹敵するとされる5.1%の単語誤り率に達したと発表した。

Microsoftは2016年、5.9%の単語誤り率で「ヒューマンパリティ(人間と同程度)」に到達したと考えたが、IBMの研究員らは、そこまでのレベルに達したとするには、IBMの最高記録である5.5%をやや上回る5.1%に達する必要があると主張した。

 IBMが実施した速記者に関する研究では、数人に会話を何回か聞いてもらい、もっとも優秀な速記者の結果が選ばれた。

 Microsoftのシステムは、2016年のテストと同様に、データセット「Switchboard」コーパスを使って測定された。Switchboardコーパスは、見知らぬ者同士が電話越しに米国英語で交わした約2400の双方向の会話から成るデータセットだ。このテストは、スポーツから政治までさまざまなテーマについて交わされた会話を文字化するものだ。

 MicrosoftのテクニカルフェローであるXuedong Huang氏は、次のように述べている。「音響モデリングを改善するため、CNN-BLSTM(Convolutional Neural Network combined with Bidirectional Long-Short-Term Memory:畳み込みニューラルネットワークと双方向長短期記憶の組み合わせ)モデルを追加した。また、複数の音響モデルに基づく予測を組み合わせるアプローチを、フレーム/セノンレベルと単語レベルの両方で取り入れた」

 「さらに、会話セッションの全履歴を使って、会話の次の流れを予測させた。これによって、音声認識システムの言語モデルが強化され、会話のテーマやその場の文脈に有効に適応できるようになった」

 重要な節目を迎えたものの、Microsoftは、さまざまな訛りや話し方を認識するのが機械にはまだ難しく、騒がしい環境ではパフォーマンスが良くないと認めている。

 Microsoftは、文脈を検知して会話をこれまでより正確に文字化するようモデルをトレーニングすることに成功したが、会話の意味を実際に理解するようコンピュータをトレーニングできるまでには、長い道のりがある。


https://japan.cnet.com/article/35106247/
引用元: http://anago.2ch.sc/test/read.cgi/bizplus/1504256120/


2: 名刺は切らしておりまして 2017/09/01(金) 18:00:32.15

日本語も認識出来るの?

3: 名刺は切らしておりまして 2017/09/01(金) 18:01:12.68

人を超えてるgoogleより下ってこと?

4: 名刺は切らしておりまして 2017/09/01(金) 18:01:50.10

しかしこれだけではワープロの入力には使えない。

音声入力での間違いを訂正するのはひどく面倒だ。

編集機能を含めて音声入力を洗練させる必要がある。

7: 名刺は切らしておりまして 2017/09/01(金) 18:12:10.75

コルタナさんは?

11: 名刺は切らしておりまして 2017/09/01(金) 18:16:33.78

>>7 10年もすればスマホ・PCの音声認識も>>1のレベルになるんだろうな

9: 名刺は切らしておりまして 2017/09/01(金) 18:15:37.88

リアルタイム?

10: 名刺は切らしておりまして 2017/09/01(金) 18:16:11.53

1文解析するのに10分かかります

12: 名刺は切らしておりまして 2017/09/01(金) 18:20:50.40

「でんでん」は「云々」と表記されるんだろうか。

14: 名刺は切らしておりまして 2017/09/01(金) 18:31:31.08

喋んのが面倒だわ
音声認識とか全部オフだ

17: 名刺は切らしておりまして 2017/09/01(金) 18:55:01.26

そのうちセンサー駆使して言いたいことも勝手に言ってくれたりして

19: 名刺は切らしておりまして 2017/09/01(金) 19:01:28.55

音が分かっても、意味は分からない。
意味が分からなければ、本当に正しい単語は選べない。

20: 名刺は切らしておりまして 2017/09/01(金) 19:07:20.05

認識するけど聞く耳を持たないんだろ

23: 名刺は切らしておりまして 2017/09/01(金) 19:14:44.58

26: 名刺は切らしておりまして 2017/09/01(金) 19:24:56.94

どうせ日本語はOCRのように難易度が跳ね上がる

29: 名刺は切らしておりまして 2017/09/01(金) 19:31:54.48

俺「Hey,Siri. 京都の天気は?」
Siri 「今日から9月ですね」

30: 名刺は切らしておりまして 2017/09/01(金) 19:42:21.09

日本人よりは遥かに英語リスニング能力高いだろうな

32: 名刺は切らしておりまして 2017/09/01(金) 20:05:01.62

ガヤガヤ会話から議事録を書いてくれるまで頑張れ

33: 名刺は切らしておりまして 2017/09/01(金) 20:19:52.01

日本語は無理でしょ

36: 名刺は切らしておりまして 2017/09/01(金) 21:08:25.09

ブルースクリーンが発生しそうだな

37: 名刺は切らしておりまして 2017/09/01(金) 21:10:52.92

何度言い直しても誤認する言葉をどうにかしてほしい。
音声を聞き取らせる単語登録とかそういう面倒なことじゃなくて、正しく認識されなかったボタンみたいなのを付けて、
すぐさま別の近い候補出すとかさ。そのボタン押された時だけ音声認識ソフトで候補の優先順を登録したらいい。

38: 名刺は切らしておりまして 2017/09/01(金) 21:50:16.84

唇の動きで認識出来たら騒音の中でも使えるな。

39: 名刺は切らしておりまして 2017/09/01(金) 21:58:04.08

正直Googleの音声認識には驚かされる
もうあれには勝てんだろうな

40: 名刺は切らしておりまして 2017/09/01(金) 22:20:36.82

まじか
人から何度も聞き返されるおれとしてはやっとスタートにたったなって感じだ

48: 名刺は切らしておりまして 2017/09/02(土) 06:02:13.29

CortanaさんもSiriさんもめっちゃ活用してるよ

51: 名刺は切らしておりまして 2017/09/02(土) 10:20:28.50

Googleもよく認識してくれるけど、翻訳で同時通訳させるととたんに駄目になるね。
片方だけの翻訳なら実用的なんだけど。

53: 名刺は切らしておりまして 2017/09/02(土) 11:01:43.26

速記者失業だな、乙

58: 名刺は切らしておりまして 2017/09/02(土) 11:50:17.21

日本語なんて言語シェア低いマイナー言語なんて後回しなのは当たり前

作っても大して使われない物になる

日本語は音は単純だが、曖昧なルールで微妙に変わったり、

音が単純な代わりに言葉そのものが変化したりイントネーションで表現したりで意外と難しかったりするのかな

60: 名刺は切らしておりまして 2017/09/02(土) 12:06:24.71

誰も最近の音声入力使っていないで物言っているのが良くわかったw
一度使ってみたら良い。

65: 名刺は切らしておりまして 2017/09/02(土) 14:28:41.04

音声入力で2chをやると恥ずかしいだろうな。