Facebook、AI採用の画像の音声キャプションを視覚障害者向けに提供開始 | ニコニコニュース

画面をスワイプすると音声で写真の内容説明が再生される
ITmedia ニュース

 米Facebookは4月4日(現地時間)、Facebookの各種サービスに投稿された画像の内容を人工知能(AI)で解析し、音声で内容を説明する「自動代替テキスト」機能を発表した。まずは英語版iOSアプリでテストを開始した。iOSの画面読み上げ機能を有効にしておくと利用できる。

【拡大画像や他の画像】

 Facebookによると、毎日20億件以上の写真がFacebook、Instagram、Facebookメッセンジャー、WhatsApp上で共有されている。目の不自由な人はこれらの写真を見られず、音声読み上げ機能を使うとテキストは読み上げられるが写真については写真が添付されていることが分かるだけだ。例えば「日曜日のぜいたく!」という投稿にピザの写真がついていても、読み上げられるのは「日曜日のぜいたく 写真」となる。

 自動代替テキスト機能は、物体認識技術を採用することで写真の内容の説明を自動的に生成する。Facebookサービス上に表示されている写真をスワイプすると、写真の内容の音声による説明を再生できる。例えば上述のピザの投稿の場合は、「日曜日のぜいたく 写真、食べ物のピザ、○人が反応し、○人がシェアしました」と読み上げられる。

 Facebookは米Googleや米Microsoftと同様に人工知能開発に注力しており、画像認識技術を採用した自動アルバム生成サービス「Moments」も提供している。

 同社は約5万人の視覚障害を持つFacebookユーザーのアクティビティを解析した結果、こうしたユーザーのソーシャルネットワークは平均より小さく、また、目の不自由さに関連する投稿が多いことが分かったという。この研究に基いて、今後も視覚障害を持つユーザーのためのサービス改善を進めていくとしている。

 米Twitterも3月末、ツイートに添付された画像の内容を読み上げる機能を追加したが、こちらは人工知能による自動解析ではなく、画像を添付するユーザーがあらかじめ説明を入力しておく必要がある。