Googleの開発した人工知能(AI)が読唇術に挑戦した結果、人間の専門家が行うよりも高い精度だったという。
GoogleのAI開発部門であるDeepMindとオックスフォード大学の研究者たちが、AIを用いて最も正確な読唇術ソフトウェアの「Watch, Listen, Attend, and Spell」を開発しました。
開発ではAIのニューラルネットワークに何千時間分ものBBCのTV放送で読唇術を学習させ、実際の発言内容の46.8%を正確に読唇可能なソフトウェアに仕上がったそうです。
「46.8%」という数字だけ見るとそれほど画期的なソフトウェアではないように感じるかもしれませんが、AIが読唇した映像をプロの読唇術者が同じように読唇したところ、正しく言葉を拾えたのは全体のわずか12.4%のみで、AIがいかに高精度であるかがわかります。
http://gigazine.net/news/20161125-google-ai-lip-read/
5:名無しさん@1周年 2016/11/26(土) 09:39:03.64 ID:NrsT3uC70.net
独身技術ならオレも人間の専門家を大幅に上回るぞ
14:名無しさん@1周年 2016/11/26(土) 09:52:44.96 ID:6DPL187f0.net
>>5
違う
56:名無しさん@1周年 2016/11/26(土) 14:27:31.11 ID:rmAadiQ+O.net
>>5
泣いた
83:名無しさん@1周年 2016/11/26(土) 15:44:44.35 ID:1nnw9syU0.net
>>5
よう、俺ノ
今度競争してみっか(´・ω・`)
105:名無しさん@1周年 2016/11/26(土) 19:36:37.07 ID:JiAblnUC0.net
>>5
10年以上前ヒトカラがない時代に一人でカラオケ店に行き
アンパンマンであしらわれた広いキッズルームに通され
ノンアルコールで延長までして歌ってきた俺を倒せるかな?
47:名無しさん@1周年 2016/11/26(土) 12:55:59.40 ID:IbPr72qX0.net
このネタを一番最初に演ったのは、2001年宇宙の旅かな
6:名無しさん@1周年 2016/11/26(土) 09:39:07.76 ID:DMMeUPUF0.net
HALみたい。
9:名無しさん@1周年 2016/11/26(土) 09:40:30.87 ID:O2qFSjat0.net
HAL9000に近付いたな。
7:名無しさん@1周年 2016/11/26(土) 09:40:28.75 ID:cqdqzbnz0.net
これからはみんな東北弁だな
52:名無しさん@1周年 2016/11/26(土) 14:02:16.21 ID:qn1KPVsZ0.net
>>7
津軽と南部でも通じないと言うのに
一括りは無理ゲー
8:名無しさん@1周年 2016/11/26(土) 09:40:28.79 ID:CHqhxTEF0.net
口だけじゃなくノドや頬の筋肉とかまで観察されたら
いくら腹話術やっても完全に読まれると思う
15:名無しさん@1周年 2016/11/26(土) 09:54:43.48 ID:42XdGtlJ0.net
これはまじめにすごいな
手話はどうなんだろう
16:名無しさん@1周年 2016/11/26(土) 10:00:04.86 ID:oNkTpE7y0.net
コレと音声判別合わせて、youtubeもレベルアポう
26:名無しさん@1周年 2016/11/26(土) 10:35:27.69 ID:DUgEe3bo0.net
映像に字幕を付けるのも簡単になるな
人間のやる事は少なくした方がいい
18:発毛たけし ◆ayiO.z1dnU 2016/11/26(土) 10:13:13.69 ID:uNP0R/3x0.net
これは恐い
スパイ用だな
20:名無しさん@1周年 2016/11/26(土) 10:19:15.83 ID:HKGWvf4n0.net
まあ確かに怖いね
ユーザーが動画を撮って、グーグルに送って金払えば、会話の内容を教えてもらえる
というサービスを、その気になればすぐにでも始められるってこった
27:名無しさん@1周年 2016/11/26(土) 10:40:17.01 ID:+kYDfmwV0.net
コンピュータは先入観ないからヤバイよな…ほんの少しの音声拾えれば確度も上がりそう
パーソン・オブ・インタレストのマシンの設定にもリアリティでてきた
38:名無しさん@1周年 2016/11/26(土) 11:47:48.26 ID:9gQkJo630.net
まじかよ。もう唇うごかさないで、あのー誰だっけ伏話術のあの人ーとにかく
そういう感じでしゃべるわ
40:名無しさん@1周年 2016/11/26(土) 12:10:19.71 ID:lsQmmYOA0.net
答えいっこくどー
25:名無しさん@1周年 2016/11/26(土) 10:23:02.19 ID:qrn7M3gW0.net
マスク屋のステマじゃないよな?
96:名無しさん@1周年 2016/11/26(土) 19:22:52.04 ID:3qVMOXZD0.net
マスクしたり、手を口元にあてたり、扇子で口元を隠して会話するのが
流行るかも。
87:名無しさん@1周年 2016/11/26(土) 16:56:14.16 ID:nNVIU5Xz0.net
ちょっと野球のグローブ買ってくるわ
46:名無しさん@1周年 2016/11/26(土) 12:54:23.93 ID:Y0zozc9l0.net
DeepMindの使い道は応用範囲広いな
いらない職業どんどん増えそう
51:名無しさん@1周年 2016/11/26(土) 13:54:41.63 ID:uQX9MUrF0.net
ものすごく便利だし明るいニュースだとは思うが、
盗聴の被害も激増するだろうな。
62:名無しさん@1週年 2016/11/26(土) 14:36:05.40 ID:jdubtMPc0.net
あなたの唇を盗み読み(はぁと)
70:名無しさん@1周年 2016/11/26(土) 14:49:39.51 ID:BneNzv7M0.net
ジャニーズが出てる歌番組で学習させると何故か精度がガクンと下がったりw
71:名無しさん@1周年 2016/11/26(土) 14:56:16.81 ID:qIn5bTUi0.net
>>70
制度どうこうはいいから
口パクを翻訳してみてほしいね
何言ってるかわらないような内容が出てくるんだろうし
AKB全員のライブ中にしゃべってる内容を個別にまとめるとかも面白そう
76:名無しさん@1周年 2016/11/26(土) 15:22:06.70 ID:rEipjGWT0.net
アメリカ様の技術が世界から百年進んでいて恐ろしい
仮定としての米の影響の無い状況下での日本では100年たっても出来なかったろうけどさ
93:名無しさん@1周年 2016/11/26(土) 17:33:42.50 ID:7i2MQ9ZU0.net
>>76
日本なんてモノマネで経済成長してきたような国だから
モノマネするネタがなくなれば失速するのは当然
中韓のモノマネ体質を批判してるけどそれは日本もやってきたことだw
ヒトラーがすでに我が闘争で指摘済み
94:名無しさん@1周年 2016/11/26(土) 19:01:59.73 ID:5TBBIfif0.net
凄いなこれ
洋画とかも読心術で日本語化できるじゃん
92:名無しさん@1周年 2016/11/26(土) 17:31:18.74 ID:7i2MQ9ZU0.net
同時通訳とかもAIにやらせばいいんじゃないの
言語学習しなくてもAI通せば簡単に会話ができるようになったら便利じゃん
101:名無しさん@1周年 2016/11/26(土) 19:26:36.40 ID:QqITY77u0.net
そのうち勝手に思考も読み取りそうだなw
108:名無しさん@1周年 2016/11/26(土) 19:42:30.63 ID:kOcPskFB0.net
俺は話さなくても目をみるだけで話したいことが判るけどな
googleもまだまだ
131:名無しさん@1周年 2016/11/26(土) 21:42:00.92 ID:Y/QjOJKP0.net
>>108
俺は何も見なくても気配だけで会話できるぜ
ニュータイプだからな
137:名無しさん@1周年 2016/11/26(土) 22:06:17.63 ID:ttqkpqKj0.net
なるほど、これはうまいニューラルネットと深層学習の応用例。
けど役には立つが、かなり特殊なニーズだな
138:名無しさん@1周年 2016/11/26(土) 22:22:33.60 ID:l1hBeTKP0.net
>>137
顔の矩型選択ってのがすでに技術としてあるじゃん
ってことは、大勢人が集まる場所で、みんなが何を話してたか分析できるわけだから、大きいよ
134:名無しさん@1周年 2016/11/26(土) 21:51:21.72 ID:OB1Wp3040.net
あらゆる情報を学習して全く新しい発明するAIとかはできないのかな
元スレ: http://ai.2ch.sc/test/read.cgi/newsplus/1480120503/