東京新聞のニュースサイトです。ナビゲーションリンクをとばして、ページの本文へ移動します。

トップ > 首都圏 > 記事一覧 > 1月の記事一覧 > 記事

ここから本文

【首都圏】

見出し付けるAI 静大とコラボ、初の紙面化

AIが作った見出しを見て意見を交わす狩野芳伸准教授(右)と岩間寛悟さん=浜松市中区の静岡大浜松キャンパスで

写真

 中日新聞(東京新聞)は、静岡大情報学部の狩野芳伸准教授の研究室が開発中の人工知能(AI)に、初めて記事の見出しを作ってもらった。AIはこの記事に加え、過去一年の主なニュースの見出しにも挑戦。見出しを担当する整理記者が付けた見出しと比べ、その出来栄えは−。 (相沢紀衣、写真も)

 AIを作ったのは、同大四年の岩間寛悟(かんご)さん(21)。本紙が五年分のデータベースを提供し、AIが見出しの作り方を学習。見出しの基本に沿い、十字以内で指定すると、瞬時に多数の候補が生まれた。AIが良いと判断した順番に並んだ五十〜百の候補から、記者が選んだ。

 岩間さんは、新聞の見出しを見て「パターンを学習できる」と仮説を立て、まず過去五年で実際に掲載された見出しをAIに取り込んだ。その後、記事のデータベースから、特定の単語の後ろにはどんな単語が来るのか、その確率の高さを学ばせた。これとは別に、単語リストなどを取り込み、語彙(ごい)を増やした。

 過去約一年間に実際に報道した十一本のニュースに見出しを付けてもらうと、政治の記事の方が得意な傾向が見られた。犯罪を計画段階で処罰する「共謀罪」の趣旨を盛り込んだ「テロ等準備罪」を新設する改正組織犯罪処罰法が昨年六月に成立したニュースでは、整理記者が付けたものと全く同じ「『共謀罪』法成立」の見出しを生成。同一月の米大統領の就任式でも、「トランプ米大統領就任」と、紙面で使えるレベルの見出しを作った。

 一方で、同十二月に発表された流行語大賞のニュースは、年間大賞に選ばれた「インスタ映え」と「忖度(そんたく)」という言葉を見出しに取れなかった。AIは、記事中の単語を、過去の記事や見出しとの比較で「重要」かどうか判断する。岩間さんは「文章の意味をわかっているわけではないので、過去記事にないような新出の言葉を見出しにすることは難しい」と解説する。

 他にも、「数字」の重要性を判断することが苦手といい、最年少棋士の藤井聡太四段が公式戦新記録の二十九連勝を達成したニュースでは「藤井四段がプロ戦連勝」など具体性に欠ける見出しが作られた。

 日本新聞協会によると、今回のようにAIが生成した見出しを実際に新聞で印刷した例は「聞いたことがない」という。

 今回の結果を受け、岩間さんは「まだまだ改善の余地がある。さまざまなやり方を試して精度を上げていきたい」と話した。

◆人物述語把握を

<静岡大の狩野芳伸准教授の話> 見出しを作るには、記事の重要な部分を把握し登場する人物や事柄の関係性を踏まえて文字数内にまとめなければならない。そのためには主語述語の関係や名詞の意味などの正確な分析が必要だが、今のシステムはまだ不十分で、使えるものとそうでないものが交じっている。

 今回は第一歩にすぎないが、人間のような言葉の理解と生成を最終目標に、少しずつ改善していきたい。見出しに限らず、多くの問題には必ずしも正解がない。高度な作業や判断は人間が負い、コンピューターがそれを助けることで、よりよいものを作れるのではないか。

◆AIの「てにをは」感じて 助詞に苦戦、進化は急速

 政治は得意、数字は苦手−。静岡大の狩野芳伸准教授の研究室が開発中の人工知能(AI)に本紙の見出しを作ってもらったところ、このような傾向が見られた。「てにをは」の使い方にも課題が残る一方で、AIの学習のスピードは早く、将来の大きな可能性を感じさせる。

 珍しい単語や新しい単語が苦手なのは、過去記事をもとに見出しを作っているからだ。昨年以前はあまり紙面に登場しなかった森友学園の籠池泰典前理事長や、ノーベル文学賞のカズオ・イシグロさんの名前は認識できず、「森友の容疑者逮捕」や「ノーベル文学賞が受賞」に。「てにをは」も苦労している。

 本文中に出てこない単語で見出しを作る場合も。安室奈美恵さん引退への記事では「大ヒット曲『なみえ』」と、漢字の振り仮名の「なみえ」が曲名になってしまった。浅田真央さんの引退会見の記事で生成した「生き生き人生語る」や、日馬富士引退の「大相撲の貴さ感じて」なども、本文に該当するような文章は出てこないが、それらしい見出しになっている。

 井伊直虎が男だった可能性があるという新史料発見の記事では、第一段落に登場する「浜松市北区」の「北」の一字に反応。近年は北朝鮮に関するニュースが頻出しているからか「北の井伊さんら描く」「北の今川さん発表」と、北朝鮮を主語とするような見出しを作った。

 課題は多いが、AIの言語生成の可能性は広がり続けている。狩野研究室では、他にも自然言語処理技術の実用化を目指して研究に取り組んでいる。

 電通と共同開発したAI「AICO(アイコ)」は昨年十一月、一般公募のキャッチコピー大会で最終選考に残るコピーを生み出した。開発が進めば、インターネット広告などで、閲覧した人の趣味や好みに合わせた広告配信が可能になる。

 科学技術振興機構とのプロジェクトでは、精神疾患の診断を自動で行うことを目指す。また、うそをついたり見破ったりと人間ならではの駆け引きを会話で楽しむ「人狼(じんろう)ゲーム」を自動プレーする対話システムの研究も進めている。

写真
 

この記事を印刷する

東京新聞の購読はこちら 【1週間ためしよみ】 【電子版】 【電子版学割】

PR情報