ネット上のコメントにヘイトスピーチが含まれているかどうかを正確に識別できる「罵り検知アルゴリズム」をヤフーが開発した。

ヤフーのアルゴリズム(PDF)は、テストケースの90パーセントで罵りコメントを正しく識別することができた。論文によると、ディープラーニングなどの「最新式」の手法よりも性能がいいという。

ヤフーは、最高に正確なヘイト検知アルゴリズムを開発するため、キーワードに基づくシステムを超えたシステムを開発しようとした。そこで、「Yahoo! News」と「Yahoo! Finance」の記事に付いた罵り言葉のコメントとそうでないコメントで構成されたデータセットを用い、コメントの長さ、侮辱語の数、および句読法をアルゴリズムに分析させて、罵りのメッセージの典型的な特徴を割り出した。

また、訓練を受けた人間の評価者が、同じコメントの集まりを分析し、罵り言葉であるかどうかを評価した。これを、人間から見れば無条件に罵りだとわかる投稿についてアルゴリズムを訓練するのに役立てた。「暗黙の罵り」を見分ける人間の能力を生かそうというわけだ。

ヤフーはさらに、アマゾンのサイト「Mechanical Turk」を利用して、罵り言葉の評価をアウトソースした(Mechanical Turkでは、誰もがサインアップして、画像の分類や言葉の分析といった一定の人間の知能を必要とする仕事ができる)。

今回の研究では、訓練を受けていない人が、ネット上のコメント1件あたり0.02ドル相当の額で、罵り言葉かそうでないかの分類に取り組んだ。ヤフーの訓練されたスタッフに比べると、Mechanical Turkの作業者は検知の成績がかなり悪かった。このことは、罵りの検知にはよく訓練された人間のスタッフの存在が重要だということを示している。

アルゴリズムはヤフーのデータベース以外ではテストされていないが、同社はこのアルゴリズムは自然言語処理における「大きな前進」だと自信をもっている。罵り言葉のデータベースは「Yahoo Webscope」でまもなく公開される予定だ。


http://wired.jp/2016/08/01/yahoo-online-abuse-algorithm/



16:名刺は切らしておりまして 2016/08/01(月) 18:43:16.39 ID:UBlivZE3.net

ネトウヨオワタw

27:名刺は切らしておりまして 2016/08/01(月) 18:50:42.17 ID:EYLsxJIR.net

1%のネット右翼を一匹残らず駆除するシステムですね

25:名刺は切らしておりまして 2016/08/01(月) 18:48:45.64 ID:Ulbkui66.net

朝鮮人が差別用語になるなら何でもヘイト用語だな

24:名刺は切らしておりまして 2016/08/01(月) 18:48:16.98 ID:+XpheytO.net

都合悪い事は全て消すニダ

5:名刺は切らしておりまして 2016/08/01(月) 18:40:28.59 ID:S3LudASC.net

言論の自由はどこに?

4:名刺は切らしておりまして 2016/08/01(月) 18:40:24.93 ID:jQskNEeF.net

ヘイトスピーチ(朝鮮への意見)を見逃さない言論弾圧のための人工知能だろ

12:名刺は切らしておりまして 2016/08/01(月) 18:42:02.88 ID:6enPHsEk.net

これで、半島や支那の不利な言論は封殺か…。

10:名刺は切らしておりまして 2016/08/01(月) 18:41:06.41 ID:q4qfaq7B.net

色々なものがヘイト認定されて誰も行かなくなるだろうなw

14:名刺は切らしておりまして 2016/08/01(月) 18:42:27.91 ID:5BPH6ts1.net

日本人向けは関知しないから恐ろしい

8:名刺は切らしておりまして 2016/08/01(月) 18:40:41.85 ID:SqVKLHeG.net

逝ってヨシはすり抜けるかな?

7:名刺は切らしておりまして 2016/08/01(月) 18:40:33.26 ID:ZH/KmfNN.net

これにはオバマもニガ笑い

61:名刺は切らしておりまして 2016/08/01(月) 19:14:34.01 ID:4AGvT5wE.net

>>7
やるなあ。

11:名刺は切らしておりまして 2016/08/01(月) 18:41:29.41 ID:1Wcw+5w4.net

アホンダラー ダボかぁー しばくどー
播州弁はヘイトじゃないので区別をお願い

22:名刺は切らしておりまして 2016/08/01(月) 18:47:26.56 ID:VOh6X1O1.net

半年ROMってろ

31:名刺は切らしておりまして 2016/08/01(月) 18:52:39.91 ID:MH58YSFM.net

外国のヤフーだろこれ

23:名刺は切らしておりまして 2016/08/01(月) 18:47:45.78 ID:WzyG0j17.net

そんなモン開発してるから会社を身売りしなきゃならなくなるんだ

20:名刺は切らしておりまして 2016/08/01(月) 18:46:41.65 ID:m3WVJFLB.net

1ちゃんねるの再来かw
ほんとアホは学ばないな。

21:名刺は切らしておりまして 2016/08/01(月) 18:47:10.68 ID:v1J5JbmI.net

自分の民族に都合が悪いものは全てヘイト認定
只のワガママ坊ちゃんかよ

37:名刺は切らしておりまして 2016/08/01(月) 18:57:16.10 ID:BwA+MZhU.net

そんなことより罵詈雑言風説の流布だらけのヤフーファイナンス掲示板をどうにかしろよ

48:名刺は切らしておりまして 2016/08/01(月) 19:03:45.72 ID:W+DF30kw.net

ネトウヨ終了

50:名刺は切らしておりまして 2016/08/01(月) 19:07:16.21 ID:U1fDz4j8.net

>>48
安心しろ、ジャップも差別用語だ。

71:名刺は切らしておりまして 2016/08/01(月) 19:18:03.47 ID:obgBTXqL.net

>>50
なら「じゃっぷぅ」で

32:名刺は切らしておりまして 2016/08/01(月) 18:53:42.55 ID:xomKRE8j.net

たてよみ、ななめよみに対応できんの?

36:名刺は切らしておりまして 2016/08/01(月) 18:56:01.41 ID:57btmdRP.net

よろしい 

すり抜けてみせよう

45:名刺は切らしておりまして 2016/08/01(月) 19:02:19.67 ID:cIOIQb62.net

言葉狩りが横行する暗黒時代の幕開けだ

41:名刺は切らしておりまして 2016/08/01(月) 19:00:00.77 ID:KSZzMrdW.net

全ての文字列がヘイト認定されそう

62:名刺は切らしておりまして 2016/08/01(月) 19:14:41.25 ID:O4J9PWYK.net

ヘイトスピーチする人間自体を巧妙に消していく時代に向かう可能性も

49:名刺は切らしておりまして 2016/08/01(月) 19:05:40.26 ID:id0mD28c.net

機械に左右される社会が到来しました

28:名刺は切らしておりまして 2016/08/01(月) 18:51:22.95 ID:0yYS0GkI.net

なにを書いても削除され人工知能の反乱の始まりであった。

54:名刺は切らしておりまして 2016/08/01(月) 19:10:27.33 ID:hxdBCb1l.net

こうやって衰退して行くんだろうな

72:名刺は切らしておりまして 2016/08/01(月) 19:18:28.46 ID:hznihudK.net

>>1
つまり、言葉狩りシステムだろ?
でも残念ながら、差別ってのは、言葉じゃないのよ。
どんな言葉でも侮蔑できる。

80:名刺は切らしておりまして 2016/08/01(月) 19:30:40.72 ID:RUbVQqED.net

ほめ殺しも認識するのかね

87:名刺は切らしておりまして 2016/08/01(月) 19:34:22.52 ID:bCd0NDhq.net

中国の掲示板みたいに某国とか言うのが流行りそう

114:名刺は切らしておりまして 2016/08/01(月) 19:53:34.38 ID:pMUC2Jrx.net

ヘイトスピーチが問題じゃないんだよ。
罵りになっている問題の根源探ししてくれよ(笑)


元スレ: http://anago.2ch.sc/test/read.cgi/bizplus/1470044298/