Googleの開発した人工知能(AI)が読唇術に挑戦した結果、人間の専門家が行うよりも高い精度だったという。

GoogleのAI開発部門であるDeepMindとオックスフォード大学の研究者たちが、AIを用いて最も正確な読唇術ソフトウェアの「Watch, Listen, Attend, and Spell」を開発しました。

開発ではAIのニューラルネットワークに何千時間分ものBBCのTV放送で読唇術を学習させ、実際の発言内容の46.8%を正確に読唇可能なソフトウェアに仕上がったそうです。

「46.8%」という数字だけ見るとそれほど画期的なソフトウェアではないように感じるかもしれませんが、AIが読唇した映像をプロの読唇術者が同じように読唇したところ、正しく言葉を拾えたのは全体のわずか12.4%のみで、AIがいかに高精度であるかがわかります。


http://gigazine.net/news/20161125-google-ai-lip-read/



5:名無しさん@1周年 2016/11/26(土) 09:39:03.64 ID:NrsT3uC70.net

独身技術ならオレも人間の専門家を大幅に上回るぞ

14:名無しさん@1周年 2016/11/26(土) 09:52:44.96 ID:6DPL187f0.net

>>5
違う

56:名無しさん@1周年 2016/11/26(土) 14:27:31.11 ID:rmAadiQ+O.net

>>5
泣いた

83:名無しさん@1周年 2016/11/26(土) 15:44:44.35 ID:1nnw9syU0.net

>>5
よう、俺ノ

今度競争してみっか(´・ω・`)

105:名無しさん@1周年 2016/11/26(土) 19:36:37.07 ID:JiAblnUC0.net

>>5
10年以上前ヒトカラがない時代に一人でカラオケ店に行き
アンパンマンであしらわれた広いキッズルームに通され
ノンアルコールで延長までして歌ってきた俺を倒せるかな?

47:名無しさん@1周年 2016/11/26(土) 12:55:59.40 ID:IbPr72qX0.net

このネタを一番最初に演ったのは、2001年宇宙の旅かな

6:名無しさん@1周年 2016/11/26(土) 09:39:07.76 ID:DMMeUPUF0.net

HALみたい。

9:名無しさん@1周年 2016/11/26(土) 09:40:30.87 ID:O2qFSjat0.net

HAL9000に近付いたな。

7:名無しさん@1周年 2016/11/26(土) 09:40:28.75 ID:cqdqzbnz0.net

これからはみんな東北弁だな

52:名無しさん@1周年 2016/11/26(土) 14:02:16.21 ID:qn1KPVsZ0.net

>>7
津軽と南部でも通じないと言うのに
一括りは無理ゲー

8:名無しさん@1周年 2016/11/26(土) 09:40:28.79 ID:CHqhxTEF0.net

口だけじゃなくノドや頬の筋肉とかまで観察されたら
いくら腹話術やっても完全に読まれると思う

15:名無しさん@1周年 2016/11/26(土) 09:54:43.48 ID:42XdGtlJ0.net

これはまじめにすごいな
手話はどうなんだろう

16:名無しさん@1周年 2016/11/26(土) 10:00:04.86 ID:oNkTpE7y0.net

コレと音声判別合わせて、youtubeもレベルアポう

26:名無しさん@1周年 2016/11/26(土) 10:35:27.69 ID:DUgEe3bo0.net

映像に字幕を付けるのも簡単になるな
人間のやる事は少なくした方がいい

18:発毛たけし ◆ayiO.z1dnU 2016/11/26(土) 10:13:13.69 ID:uNP0R/3x0.net

これは恐い

スパイ用だな

20:名無しさん@1周年 2016/11/26(土) 10:19:15.83 ID:HKGWvf4n0.net

まあ確かに怖いね
ユーザーが動画を撮って、グーグルに送って金払えば、会話の内容を教えてもらえる
というサービスを、その気になればすぐにでも始められるってこった

27:名無しさん@1周年 2016/11/26(土) 10:40:17.01 ID:+kYDfmwV0.net

コンピュータは先入観ないからヤバイよな…ほんの少しの音声拾えれば確度も上がりそう

パーソン・オブ・インタレストのマシンの設定にもリアリティでてきた

38:名無しさん@1周年 2016/11/26(土) 11:47:48.26 ID:9gQkJo630.net

まじかよ。もう唇うごかさないで、あのー誰だっけ伏話術のあの人ーとにかく
そういう感じでしゃべるわ

40:名無しさん@1周年 2016/11/26(土) 12:10:19.71 ID:lsQmmYOA0.net

答えいっこくどー

25:名無しさん@1周年 2016/11/26(土) 10:23:02.19 ID:qrn7M3gW0.net

マスク屋のステマじゃないよな?

96:名無しさん@1周年 2016/11/26(土) 19:22:52.04 ID:3qVMOXZD0.net

マスクしたり、手を口元にあてたり、扇子で口元を隠して会話するのが
流行るかも。

87:名無しさん@1周年 2016/11/26(土) 16:56:14.16 ID:nNVIU5Xz0.net

ちょっと野球のグローブ買ってくるわ

46:名無しさん@1周年 2016/11/26(土) 12:54:23.93 ID:Y0zozc9l0.net

DeepMindの使い道は応用範囲広いな
いらない職業どんどん増えそう

51:名無しさん@1周年 2016/11/26(土) 13:54:41.63 ID:uQX9MUrF0.net

ものすごく便利だし明るいニュースだとは思うが、
盗聴の被害も激増するだろうな。

62:名無しさん@1週年 2016/11/26(土) 14:36:05.40 ID:jdubtMPc0.net

あなたの唇を盗み読み(はぁと)

70:名無しさん@1周年 2016/11/26(土) 14:49:39.51 ID:BneNzv7M0.net

ジャニーズが出てる歌番組で学習させると何故か精度がガクンと下がったりw

71:名無しさん@1周年 2016/11/26(土) 14:56:16.81 ID:qIn5bTUi0.net

>>70
制度どうこうはいいから
口パクを翻訳してみてほしいね
何言ってるかわらないような内容が出てくるんだろうし
AKB全員のライブ中にしゃべってる内容を個別にまとめるとかも面白そう

76:名無しさん@1周年 2016/11/26(土) 15:22:06.70 ID:rEipjGWT0.net

アメリカ様の技術が世界から百年進んでいて恐ろしい
仮定としての米の影響の無い状況下での日本では100年たっても出来なかったろうけどさ

93:名無しさん@1周年 2016/11/26(土) 17:33:42.50 ID:7i2MQ9ZU0.net

>>76
日本なんてモノマネで経済成長してきたような国だから
モノマネするネタがなくなれば失速するのは当然
中韓のモノマネ体質を批判してるけどそれは日本もやってきたことだw
ヒトラーがすでに我が闘争で指摘済み

94:名無しさん@1周年 2016/11/26(土) 19:01:59.73 ID:5TBBIfif0.net

凄いなこれ

洋画とかも読心術で日本語化できるじゃん

92:名無しさん@1周年 2016/11/26(土) 17:31:18.74 ID:7i2MQ9ZU0.net

同時通訳とかもAIにやらせばいいんじゃないの
言語学習しなくてもAI通せば簡単に会話ができるようになったら便利じゃん

101:名無しさん@1周年 2016/11/26(土) 19:26:36.40 ID:QqITY77u0.net

そのうち勝手に思考も読み取りそうだなw

108:名無しさん@1周年 2016/11/26(土) 19:42:30.63 ID:kOcPskFB0.net

俺は話さなくても目をみるだけで話したいことが判るけどな
googleもまだまだ

131:名無しさん@1周年 2016/11/26(土) 21:42:00.92 ID:Y/QjOJKP0.net

>>108
俺は何も見なくても気配だけで会話できるぜ
ニュータイプだからな

137:名無しさん@1周年 2016/11/26(土) 22:06:17.63 ID:ttqkpqKj0.net

なるほど、これはうまいニューラルネットと深層学習の応用例。
けど役には立つが、かなり特殊なニーズだな

138:名無しさん@1周年 2016/11/26(土) 22:22:33.60 ID:l1hBeTKP0.net

>>137
顔の矩型選択ってのがすでに技術としてあるじゃん
ってことは、大勢人が集まる場所で、みんなが何を話してたか分析できるわけだから、大きいよ

134:名無しさん@1周年 2016/11/26(土) 21:51:21.72 ID:OB1Wp3040.net

あらゆる情報を学習して全く新しい発明するAIとかはできないのかな


元スレ: http://ai.2ch.sc/test/read.cgi/newsplus/1480120503/