sports games article generation of judo and kendo tournaments

5
スポヌツ蚘事速報システムの構築金鷲旗・玉竜旗倧䌚を事䟋に 嶋田 和孝 † 塩田 å®° † è¿‘è—€ 陜䞀 † 村重 剛匘 †† 矢柀 達也 †† † 九州工業倧孊 知胜情報工孊研究系 〒820-8502 犏岡県飯塚垂川接 680-4 †† 株匏䌚瀟西日本新聞瀟 技術局 技術䌁画宀 〒810-8721 犏岡県犏岡垂䞭倮区倩神 1-4-1 E-mail: †[email protected], ††{takehiro.murashige,tatsuya.yazawa}@nishinippon-np.jp あらたし 本皿では西日本新聞瀟が䞻催する柔剣道倧䌚である金鷲旗・玉竜旗倧䌚を察象ずした詊合結果の速報シ ステムに぀いお報告するこの速報システムは人間が入力した勝敗デヌタを基に 4050 文字皋床の速報蚘事を自動 生成するたず事前にテンプレヌトを半自動生成する過去に人間が曞いた戊評蚘事からテンプレヌト候補を自動 生成しその埌人手によるテンプレヌトの取捚遞択ず粟錬化を行うそのテンプレヌトを利甚した速報システムは 2019 幎の金鷲旗・玉竜旗倧䌚で実運甚され1390 詊合の速報蚘事を自動生成した8 日間の倧䌚開催期間に 275 䞇回 の閲芧があり高い゚ンゲヌゞメント率を埗た キヌワヌド スポヌツ速報蚘事生成テンプレヌト型 Sports games article generation of Judo and Kendo tournaments Kazutaka SHIMADA † , Tsukasa SHIOTA † , Yoichi KONDO † , Takehiro MURASHIGE †† , and Tatsuya YAZAWA †† † Kyushu Institute of Technology 680-4 Kawazu, Iizuka, Fukuoka 820-8502, JAPAN †† The Nishinippon Shimbun Co. Ltd. 1-4-1 Tenjin, Fukuoka Chuoku, Fukuoka, 810-8721 JAPAN E-mail: †[email protected], ††{takehiro.murashige,tatsuya.yazawa}@nishinippon-np.jp Abstract In this paper, we report a sports game article generation system for Judo and Kendo tournaments. The system is based on a template-based sentence generation mechanism. We generate template candidates automat- ically, and then polish the templates by hand in advance. The system generated articles of 1390 games by using the polished templates and posted the articles to Twitter. We obtained approximately 3 million views and high engagement rates. Key words Sports game information, Article generation, Template-based method 1. はじめに 新聞瀟にずっお日々の新聞䜜成には倚くの劎力がかかりそ の効率化は重芁な課題である近幎ニュヌラルネットワヌク を利甚した文章の自動生成に関する研究が倚く行われおいる が実際の新聞蚘事ではむンタビュヌが必芁であったり蚘 事内容ぞの人手による怜蚌・考察が必芁であったりず完党な自 動化は難しい䞀方でスポヌツの結果など単なる事実を䌝 えるだけであれば蚘事の自動䜜成が可胜である堎合も少なく ない本皿では西日本新聞瀟が䞻催する柔剣道倧䌚金鷲旗 および玉竜旗倧䌚の詊合結果の速報システムに぀いお述べる 金鷲旗および玉竜旗倧䌚ではこれたで図 1 に瀺すような戊評 蚘事を蚘者が曞いおいた䞀぀の蚘事自䜓は数文4050 文 字皋床の短い蚘事だが倧䌚䞭の党詊合に぀いおこのよう 図 1 実際の新聞蚘事の䟋2018 幎 7 月 27 日付西日本新聞玙面より 匕甚 な蚘事を䜜成するこずは劎力のかかる䜜業であるそこでこ の戊評蚘事の自動生成を詊みるこの自動生成によっお蚘者 の劎力は倧幅に削枛されるたたこの自動生成された蚘事を Twitter ぞ投皿する仕組みも導入するこれにより埓来は翌 - 20 - 䞀般瀟団法人 電子情報通信孊䌚 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信孊技報 This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere. Copyright ©2021 by IEICE IEICE Technical Report NLC2021-10(2021-09)

Upload: others

Post on 23-Feb-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Sports games article generation of Judo and Kendo tournaments

瀟団法人 電子情報通信孊䌚THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS

信孊技報TECHNICAL REPORT OF IEICE.

スポヌツ蚘事速報システムの構築金鷲旗・玉竜旗倧䌚を事䟋に嶋田 和孝† 塩田 宰† è¿‘è—€ 陜䞀† 村重 剛匘†† 矢柀 達也††

† 九州工業倧孊 知胜情報工孊研究系 〒820-8502 犏岡県飯塚垂川接 680-4†† 株匏䌚瀟西日本新聞瀟 技術局 技術䌁画宀 〒810-8721 犏岡県犏岡垂䞭倮区倩神 1-4-1

E-mail: †[email protected], ††{takehiro.murashige,tatsuya.yazawa}@nishinippon-np.jp

あらたし 本皿では西日本新聞瀟が䞻催する柔剣道倧䌚である金鷲旗・玉竜旗倧䌚を察象ずした詊合結果の速報システムに぀いお報告するこの速報システムは人間が入力した勝敗デヌタを基に 4050文字皋床の速報蚘事を自動生成するたず事前にテンプレヌトを半自動生成する過去に人間が曞いた戊評蚘事からテンプレヌト候補を自動生成しその埌人手によるテンプレヌトの取捚遞択ず粟錬化を行うそのテンプレヌトを利甚した速報システムは2019幎の金鷲旗・玉竜旗倧䌚で実運甚され1390詊合の速報蚘事を自動生成した8日間の倧䌚開催期間に 275䞇回の閲芧があり高い゚ンゲヌゞメント率を埗たキヌワヌド スポヌツ速報蚘事生成テンプレヌト型

Sports games article generation of Judo and Kendo tournamentsKazutaka SHIMADA†, Tsukasa SHIOTA†, Yoichi KONDO†, Takehiro MURASHIGE††, and

Tatsuya YAZAWA††

† Kyushu Institute of Technology 680-4 Kawazu, Iizuka, Fukuoka 820-8502, JAPAN†† The Nishinippon Shimbun Co. Ltd. 1-4-1 Tenjin, Fukuoka Chuoku, Fukuoka, 810-8721 JAPAN

E-mail: †[email protected], ††{takehiro.murashige,tatsuya.yazawa}@nishinippon-np.jp

Abstract In this paper, we report a sports game article generation system for Judo and Kendo tournaments. Thesystem is based on a template-based sentence generation mechanism. We generate template candidates automat-ically, and then polish the templates by hand in advance. The system generated articles of 1390 games by usingthe polished templates and posted the articles to Twitter. We obtained approximately 3 million views and highengagement rates.Key words Sports game information, Article generation, Template-based method

1. は じ め に新聞瀟にずっお日々の新聞䜜成には倚くの劎力がかかりその効率化は重芁な課題である近幎ニュヌラルネットワヌクを利甚した文章の自動生成に関する研究が倚く行われおいるが実際の新聞蚘事ではむンタビュヌが必芁であったり蚘事内容ぞの人手による怜蚌・考察が必芁であったりず完党な自動化は難しい䞀方でスポヌツの結果など単なる事実を䌝えるだけであれば蚘事の自動䜜成が可胜である堎合も少なくない本皿では西日本新聞瀟が䞻催する柔剣道倧䌚金鷲旗および玉竜旗倧䌚の詊合結果の速報システムに぀いお述べる金鷲旗および玉竜旗倧䌚ではこれたで図 1に瀺すような戊評蚘事を蚘者が曞いおいた䞀぀の蚘事自䜓は数文4050 文字皋床の短い蚘事だが倧䌚䞭の党詊合に぀いおこのよう

図 1 実際の新聞蚘事の䟋2018 幎 7 月 27 日付西日本新聞玙面より匕甚

な蚘事を䜜成するこずは劎力のかかる䜜業であるそこでこの戊評蚘事の自動生成を詊みるこの自動生成によっお蚘者の劎力は倧幅に削枛されるたたこの自動生成された蚘事をTwitterぞ投皿する仕組みも導入するこれにより埓来は翌

— 1 —- 20 -

䞀般瀟団法人 電子情報通信孊䌚THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS

信孊技報

This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere.                                           Copyright ©2021 by IEICE

IEICE Technical Report NLC2021-10(2021-09)

Page 2: Sports games article generation of Judo and Kendo tournaments

図 2 Twitter による速報の出力詊合ごずに䞀぀の tweet ずしお投皿される䞀぀の tweet には詊合結果から自動生成された速報蚘事ず星取り衚が含たれる校名にモザむク凊理

日の朝刊たで公開されなかった戊評蚘事が詊合終了ずほが同時に公開されるこずになり速報性を保぀こずもできるずいうメリットが生たれる叀くから利甚されおいる文章生成はテンプレヌトに基づく手法が倚かった基盀ずなる文を甚意し汎甚的な郚分たずえば遞手名などをスロット化し入力デヌタをそのスロットに適甚するこずで文章を生成する手法である型にはたったような文しか生成できないが制埡がしやすいずいうメリットがある䞀方で前述のように近幎の文章生成に関する研究ではニュヌラルネットワヌクを利甚した手法Encoder-Decoderモデルに基づく手法 [1]などが倚く提案されおいるニュヌラルネットワヌクによる手法ではそれ以前の手法ず比范しお流ちょうで自然な文が生成される傟向がある実際にヘッドラむン生成 [1]など様々なタスクでその有甚性が確かめられおいるしかしながらニュヌラルネットワヌクよる手法では事実性の問題元デヌタにはない情報を生成しおしたうこずが生じるこずが知られおいる実際に我々が過去に䜜成した野球のむニング速報の自動生成においおテンプレヌト型ずニュヌラル型の 2皮類の生成システムを比范評䟡した際同様の傟向が埗られおいる [2]本システムが新聞瀟による速報システムだずいう点を螏たえるず誀報は蚱されないそこで本皿では事実性を担保しやすく出力の制埡が容易なテンプレヌト型の速報生成システムを構築する過去に蚘者が曞いた戊評蚘事を基に田川らの手法 [2]を参考にしテンプレヌトを自動生成する生成されたテンプレヌトを人手により怜蚌・敎備し遞別されたテンプレヌトを甚いお戊評を自動生成しそれを速報ずしお Twitterに投皿する本システムは実際に 2019幎の金鷲旗および玉竜旗倧䌚で運甚された泚1その抂芳を図 2に瀺す本システムは詊合結

泚1次幎床以降も運甚予定だったがコロナ犍により 2020 幎および 2021幎の倧䌚が䞭止ずなったため実運甚は珟状では 2019 幎のみである

果を入力ずしその詊合結果星取り衚ず結果から生成された速報蚘事を Twitterに投皿し公開する泚22019幎の倧䌚では党 1390詊合の速報を生成し275䞇回の閲芧があった

2. 関 連 研 究スポヌツの詊合蚘事などを生成する研究は倚く存圚するた

ずえばAllenら [3]は野球に関する様々なデヌタから新聞蚘者が曞いたような詊合の蚘事の生成に取り組んでいるTagawaand Shimadaは [4]は Twitterから抜出したサッカヌの詊合に関する tweetを぀なぎ合わせおその詊合の芁玄を生成する手法を提案しおいる吉田ら [5]は競茪を察象ずしたテンプレヌトベヌスの予想蚘事生成に関する研究をしおいる本システムは詊合結果をデヌタずしお受け取りそれを文ず

しお生成するこれは data2textなどずも呌ばれるdata2textではスポヌツ以倖にも様々な研究が存圚するMcRoy らはhas-property(John,age,20)のような圢匏から“John’s age is20.”のような文を生成するシステムを開発しおいる具䜓的には事前に定矩された文をそのたた返すルヌル (The Stringrule) や事前に定矩されたテンプレヌトのスロットを埋めた文を返すルヌル (The Template rule)などの 10のルヌルを甚意しおいる人手でテンプレヌトを甚意するのはコストのかかる䜜業だが本研究では田川らの手法を参考に既存の戊評蚘事からテンプレヌトを自動生成しその効率化も図るただし効率化のみならず内容の正確さを最重芁課題ずしおいるためこのテンプレヌトを粟錬化し事実ず異なる蚘事が生成されないように现心の泚意を払っおいるニュヌラルネットワヌクによる data2textの研究も枚挙に暇

がないMurakamiら [6]は日経平均株䟡の 1日分のデヌタず 7営業日分の終倀のデヌタから抂況テキストの自動生成に取り組んでいる同じく村䞊ら [7]は気圧や気枩颚向きなどの予枬倀が栌玍された数倀予報マップから倩気予報コメントの自動生成に取り組んでいる䞀方でこれたでに述べおきたように本システムでは事実性の担保や制埡のしやすさから今回はニュヌラルネットワヌクによる手法ではなくテンプレヌト型の手法を採甚しおいる

3. 金鷲旗・玉竜旗速報生成システム本節では䜜成した速報生成システムの抂芳ずシステム䞊で

最も重芁なテンプレヌトの生成に぀いお順に説明する3. 1 システム抂芳本システムの党䜓像を図 3に瀺す速報生成システムの入力

デヌタは人間が入力した察戊デヌタである詊合䌚堎に垞駐するスタッフが公匏蚘録を基に星取り衚を䜜成しそれをシステムに入力するシステムは定期的に入力デヌタの曎新をチェックし新芏の察戊結果が入力されおいればそのデヌタを基に速報の生成を開始する過去の察戊結果のデヌタずその察戊成瞟に察するテンプレヌ

トは事前に半自動的に生成されおいるテンプレヌトは過去に

泚2https://twitter.com/nishinippon_kg

— 2 —- 21 -

Page 3: Sports games article generation of Judo and Kendo tournaments

先鋒 新谷 ×

次鋒 朚村 ○ ●

äž­å … 鈎朚 ×

副将 栗田 ●

倧将 岩郚 ○ ○

察戊結果を入力

先鋒 䜐藀 ○ ×

次鋒 䌊藀 ●

äž­å … 小林 ×

副将 䞭村 ×

倧将 吉田 ○

先鋒 高橋 ×

次鋒 枡蟺 ○ ●

äž­å … 山田 ×

副将 山口 ●

倧将 束本 ○ ○

先鋒 田侭 ●

次鋒 山本 ○ ●

äž­å … 井䞊 ●

副将 朚村 ○ ×

倧将 林 ○ ○




副将[NAME:4]が盞手次鋒を抜き、䞭堅ず匕き分け。倧将[NAME:5]が連続しお人抜き、抜き぀抜かれ぀の攻防を制した。

次鋒[NAME:2]の勝ちで倧将[NAME:5]に぀ないだ。[NAME:5]が盞手副将、倧将を制し、次回戊ぞ

先鋒[NAME:1]が人抜き。最埌に倧将[NAME:5]が勝った。

次鋒朚村の勝ちで倧将岩郚に぀ないだ。岩郚が盞手副将、倧将を制し、次回戊ぞ

diff: 4

diff: 0

diff: 4

採甚

同じ戊瞟デヌタを怜玢

スロットにデヌタを挿入し蚘事を生成

Twitterぞ投皿

剣道男, 2回戊 (Aパヌト)

詊合結果をリアルタむムに倚くの人に届ける

図 3 速報生成システムの流れ

人間の蚘者が曞いた戊評を基に人名などの郚分がスロット化されたものであるテンプレヌトに぀いおの詳现は次節で述べるシステムは入力された察戊デヌタず䞀臎する過去の察戊デヌタを怜玢する具䜓的には入力デヌタず過去の戊瞟ずの線集距離を総圓たりで取り距離が 0完党䞀臎ずなるものを採甚する0ずなるものが耇数ある堎合はランダムに䞀぀遞び0ずなるものが存圚しない堎合はこれも埌述する汎甚的なテンプレヌトを甚いる遞ばれたテンプレヌトのスロットに凊理察象ずなっおいる察戊成瞟䞭のデヌタ人名などを適甚しその蚘事を Twitterに星取り衚ず䜵せお投皿する

3. 2 テンプレヌト生成本システムで最も重芁な芁玠はテンプレヌトであるこのテンプレヌトは過去の金鷲旗・玉竜旗で人間に蚘者が曞いた戊評蚘事から半自動生成をする倧きな流れずしおは

• 人名の削陀などによるテンプレヌト候補の自動生成• 人手によるテンプレヌトの取捚遞択ず粟錬化

で構成される過去に蚘者が曞いた戊評蚘事は 3852 本あり䞊蚘の凊理を経お速報システムでは玄 600皮類のテンプレヌトを䜜成し利甚しおいる以降順に説明する

3. 2. 1 テンプレヌト候補の自動生成たずテンプレヌト候補の自動生成に぀いおであるここではたずえば先鋒笠が朜き倒しや合わせ技などで 5人抜き。終始攻めの姿勢を芋せ、盞手を寄せ付けなかった。

ずいう文から先鋒 [SenpoName]が 5人抜き。終始攻めの姿勢を芋せ、盞手を寄せ付けなかった。

のようなテンプレヌトを䜜り出したい具䜓的には人名郚分のスロット化ず技名などの䞍芁語の削陀である人名をスロット化するには戊評䞭の人名箇所を特定する必芁がある今回テンプレヌト化の察象ずなるものは戊瞟星取り衚ずそれに玐付いた戊評蚘事である぀たり星取り衚䞭の人名から戊評に珟れる人名郚分は容易に掚定が可胜であるそこで星取り衚䞭の人名を利甚しお文字列マッチングを行い戊評䞭の人名箇所をスロット化する次に技名の陀去である本来なら技名柔道なら内股や倧倖刈り剣道なら面や胎もスロット化しテンプレヌトの芁玠ずすべきではあるが珟状での入力デヌタには決たり技などの情報は存圚せず入力ずなるのは星取り衚で衚珟される勝ち・負け・匕き分けの情報のみである埓っお技名のスロット化

は今回は行わないしかし技名がテンプレヌトに残っおいるこずは事実性の䜎䞋に繋がるため無芖できないたずえば前述の䟋で「朜き倒しや合わせ技」の郚分が残ったたたでは入力された詊合の決たり技がこれらず異なる堎合は誀報を生成しおしたうこずになりそれは避けなければならない技名は基本的に有限であるため蟞曞ベヌスで削陀箇所を特

定する技名から盎近の栌助詞たでを削陀するなどシンプルなルヌルで技名箇所を削陀する

3. 2. 2 人手による粟錬化3. 2. 1 節で説明した手法により原理的には 3852 個のテン

プレヌトが䜜成されるしかし自動生成されたテンプレヌトには倚くの文法的な誀りなどが含たれる特に技名の削陀はシンプルなルヌルで行われおおり倚くの䞍適切箇所が残る兞型的には次の䟋のように修食しおいる節が誀っお残っおしたう堎合が倚い

緊迫した攻防で 2回戊同様倧将戊に。期埅に応え、切れ味鋭い内股を繰り出し䞀本勝ち。↓技名「内股を」を削陀

緊迫した攻防で 2回戊同様倧将戊に。期埅に応え、切れ味鋭い繰り出し䞀本勝ち。

他にもそのデヌタ固有の衚珟が存圚する堎合も少なくないたずえば遞手の䜓型を衚すような衚珟「倧柄な先鋒 [Sen-poName]」や「次鋒 [JihoName]が長身を掻かし」などや遞手の行為「勝利を決めガッツポヌズ」などがあるこれら䞍適切な箇所を機械孊習によっお特定するこずもアプロヌチの䞀぀ではあるがこれに぀いおは埌述する機械孊習による手法では (1)蚓緎デヌタの䜜成にコストがかかる(2)蚓緎デヌタの芏暡が十分ずはいえない最倧で 3852蚘事(3)機械孊習では 100%の粟床は埗にくいなどの珟実的な問題を勘案し実運甚するシステムを䜜るずいう本皿での立ち䜍眮を螏たえ3. 2. 1節で䜜成したテンプレヌト候補を人手により取捚遞択し誀り箇所の蚂正などを行い質の高いテンプレヌトを䜜成するたたいく぀か远加でスロットを䜜成するたずえば䞀進䞀退の熱戊。3 勝 2 敗 1 分けから副将[FukushoName]が盞手倧将ず匕き分けお、3回戊突砎。

のような䟋で「3 回戊」ずいう郚分は実際には䜕回戊目であっおも適甚が可胜であるこのような郚分もスロット化し「[gameNum]回戊突砎」のようにテンプレヌトを改良する加えおこれらずは別に芋出しを生成するためのテンプレヌ

トも甚意する具䜓的には以䞋の圢をしおいる

— 3 —- 22 -

Page 4: Sports games article generation of Judo and Kendo tournaments

#[gameType] [gameNum] 回戊 [gamePart] パヌト[winnerResult] [winner] (gameCond) [loser]

gameTypeは Twitterのハッシュタグを䜜るために甚いられ「柔道男子」「柔道女子」「剣道男子」「剣道女子」のいずれかが入るgameNumはその詊合が䜕回戊かgamePartにはいく぀かに分かれたトヌナメント衚のパヌト番号winnerResultには詊合結果が適甚されるwinnerず loserにはチヌム名が適甚されgameCondは決着が付いた状態倧将同士や䞍戊 n人などが適甚されるこれらのデヌタは入力デヌタ含たれたメタデヌタや星取り衚から埋めるこずができる具䜓的には

#剣道男子 2回戊 Aパヌト 3勝 2敗 2分九工倧付属高校倧将同士知胜情報高校

のような圢になる芋出しテンプレヌトはこの䞀぀のみでありすべおの速報蚘事の先頭に埋め蟌たれるさらに生成のためのテンプレヌトが芋぀からない堎合を考える必芁がある今回は完党䞀臎する戊瞟のテンプレヌトを利甚するずいう制玄を課しおいるため入力された戊瞟ず䞀臎するデヌタが存圚しない堎合も生じうるこの問題は完党䞀臎の戊瞟デヌタ線集距離が 0がない堎合はより近い戊瞟のデヌタ線集距離が 1以䞊で代甚するずいう方法でも察応可胜だが実際に生成される速報蚘事を確認したずころ事実性が倧幅に䜎䞋する堎合があったそのため類䌌デヌタを䜿うのではなく完党䞀臎するものがなかった堎合に䜿う汎甚的なテンプレヌトも手䜜業で甚意する具䜓的には次のような汎甚テンプレヌトを適甚する

[Role][Name]が [winNum]人抜きし[nextGame]回戊進出を決めた。

ここでは戊瞟から最も勝ち数が倚い遞手を特定しその遞手の圹職を Roleに名前を Nameに入れその遞手の勝ち星数を winNumに適甚する耇数人抜きをした遞手がいなければ単に芋出し文 + [nextGame]回戊進出を決めた。

ずだけ出力される

4. 結果・分析・考察この節では実装および実運甚したシステムに぀いおその結果を分析・考察する前述のように本システムは 2019幎7月 22日から 29日たで実斜された金鷲旗・玉竜旗倧䌚で実運甚された同倧䌚で開催された 1390詊合分の速報蚘事を自動生成したシステムは入力を受け取っお以降は完党に自動化されおおりTwitter投皿前の人手チェックなどは行っおいないすべおの事䟋を怜蚌したわけではないが速報ずしおの事実性はほが 100%の粟床を保っおいるず考えられる本システムで生成された蚘事ず実際に蚘者が曞いた蚘事ずの比范をするただし2019幎の人手蚘事は存圚しないため以䞋は過去の戊瞟ず過去の蚘事ずの比范に基づく考察である自動䞭堅たで匕き分ける接戊。副将同士で海接が勝。盞手倧将に匕き分け、勝利した。蚘者䞭堅たで匕き分けが続く熱戊。副将海接が人抜いお盞手察象ず匕き分け、接戊を制した。

䞊蚘のように自動生成の蚘事は人間の蚘者が曞いた蚘事ず遜色

図 4 動画からの骚栌情報の取埗

ない䞀方で以䞋の事䟋は人間の蚘者が曞いた蚘事のほうが掗緎されおいるず感じる䟋である

自動人が匕き分ける実力䌯仲の奜詊合。最埌は倧将田䞭が盞手倧将を砎り勝利を぀かんだ。蚘者副将たで匕き分けが続く互角の戊い。倧将田䞭は延長の末、力匷い面で盞手察象を䞋した。

蚘者は実際に詊合を芋お蚘事を曞いおいる衚珟を決めおいるためこの䟋の「力匷い面で」のような衚珟を曞くこずができるしかしながら前述のように本システムの入力には勝敗のデヌタず詊合に関するメタ情報䜕回戊の詊合かなどしかないため決め技やその堎面がどのように衚珟されるべきかを掚定するこずができない速報ずしおは問題ない範囲の差ではあるがより人間の衚珟力に近づけるには星取り衚以倖のデヌタモダリティが必芁ずなるだろう2019幎の倧䌚を撮圱した映像を OpenPose [8] で解析したずころ骚栌デヌタは比范的良奜に取埗できるこずを確認しおいる図 4近幎MS-AAGCNなど骚栌情報やその動き結合情報を統合的に利甚しお行動を掚定する手法も倚く研究されおいる [9]動画から埗られる情報を甚いお動䜜特城などを掚定しより衚珟力のある速報生成システムを構築するこずは興味深い今埌の課題である前述のように衚珟力では倚少人間に劣るずころはあるもの

の適切に詊合内容を䌝える蚘事を生成するこずには成功しおいるこれは3. 2. 2節で説明した人手による粟錬化の功瞟が倧きいしかし文そのものは短いずいえど 4000匱のテンプレヌトを目芖で確認し修正を繰り返すずいう䜜業コストは決しお小さくない泚3したがっお䞍芁箇所やテンプレヌトずしお䜿えない衚珟をできるだけ自動的に特定できるこずが望たしいそこでこのシステム運甚埌に取り陀きたい箇所に BIO方匏でアノテヌションをし機械孊習モデルによる削陀箇所の掚定実隓を行ったここではその郚分をすべお取り陀くずテンプレヌトずしお利甚できるようになる箇所を掚定する問題ずしお削陀開始点に Bタグそれ以倖の削陀察象に Iタグ削陀しないずころに Oタグを぀けたたずえば「先鋒近藀が華麗な技で 5人抜き。」ずいう文があった堎合削陀察象は「華麗な技」だけではなく「華麗な技で」ずなるためアノテヌションは

泚3もちろんこの 1 回のテンプレヌトの粟錬化で次幎床以降少なくずも蚘者は 1300 詊合もの蚘事を曞かなくお枈むずいうのが倧きなメリットであるのは疑いようもない

— 4 —- 23 -

Page 5: Sports games article generation of Judo and Kendo tournaments

è¡š 1 䞍芁箇所の掚定実隓Accuracy Precision Recall F 倀

0.89 0.39 0.57 0.46

先鋒/O è¿‘è—€/O が/O 華麗な/B 技/I で/I 5/O 人/O

抜き/O 。/O

ずなるここでたずえば「先鋒塩田の玠早い足さばきで 5人抜きを達成」ずいう文があったずしお削陀したいのは「玠早い足さばき」に関連する郚分だがこの衚珟を削陀するず「先鋒塩田の 5人抜きを達成」ずいう非文になるこのような堎合は郚分的にタグを付けるのではなくこの文すべおが削陀察象になるようにアノテヌションをしおいる぀たり文頭が Bでそれ以降はすべお Iずする1800文皋床に䞊蚘のアノテヌションをしbi-LSTMでモデルを構築した実装には nagisa泚4を利甚しおいるデヌタのうち8割を蚓緎デヌタに2割をテストデヌタずした堎合の粟床は衚 1ずなったAccuracyは各BIOタグの正誀を衚しおおりPrecisionRecallF倀は削陀すべき箇所すべおを正しく掚定できた堎合぀たりある削陀箇所に察しお Bから始たる Iの系列が過䞍足なく掚定された堎合の粟床であるこの Precisionでは䜜業者にさらなる負荷を掛ける可胜性もあり実運甚には向かないだろうこの点に぀いおも今埌の課題である以䞋はうたくいった䟋ずうたくいかなかった䟋である成功䟋先鋒倧島が切れのある動きで䞀気に 4人抜き。盞手倧将ず匕き分け、惜しくも 5人抜きならず。→ 先鋒倧島が䞀気に 4人抜き。盞手倧将ず匕き分け、惜しくも 5人抜きならず。先鋒森光の鋭い技が光る。面や小手、胎を巧みに䜿い分け盞手を圧倒。3床目の 5人抜きを達成。→ «党削陀»倱敗䟋先鋒近藀が倚圩な攻めで盞手を翻匄ほんろう。5人抜きで䞀気に勝負を決め、貫犄を芋せた。→ 先鋒近藀が盞手を (ほんろう)。5人抜きでた先鋒から副将たで匕き分け。倧将同士は延長回にも぀れ蟌んだが、䞭野の匕き面が決たった。→ 先鋒から副将たで匕き分け。倧将は

最埌に速報システムによる蚘事化ずWeb配信の効果に぀いお分析・考察する速報蚘事は党詊合分ほがリアルタむムにTwitterに投皿された期間䞭8日間に 275䞇回閲芧された投皿にどのぐらいの人が反応したか星取り衚画像のクリックやリツむヌトいいねを抌す行為などを枬る゚ンゲヌゞメント率を調べたずころ各投皿に平均で 9%最倧で 22%の反応があった2019幎以前の新聞蚘事ずの差は単玔には比范できないが速報ずしおの情報の充実さや芖認性速報蚘事ず星取り衚の䜵甚も含めお肯定的な評䟡が埗られおいるず刀断しおよいだろうたた速報蚘事配信による副次的なメリッ

泚4https://github.com/taishi-i/nagisa

トずしおTwitterナヌザからの反応によっお詊合デヌタの間違いも怜出された具䜓的にはナヌザから実際の詊合結果ず速報蚘事が䞀臎しないずの指摘があったこれは速報生成郚テンプレヌトのミスではなくデヌタベヌスに入力されたデヌタの誀り぀たりデヌタ入力スタッフによるミスであったこのようなデヌタ入力ミスの怜知にも今回の速報生成システムは効果的に機胜しおいるこずが確認された

5. お わ り に本皿ではスポヌツ速報生成システムの䞀事䟋ずしお柔剣

道倧䌚の速報生成システムに぀いお説明したテンプレヌト型の生成手法を採甚したテンプレヌト候補を過去の戊評から自動生成しそれを人手で粟錬した質の高いテンプレヌト矀を䜜成したこずで100%の事実性を保った速報システムを実珟できた速報システムは倚くのナヌザに閲芧され副次的な産物ずしおデヌタの入力ミスの怜知などにも圹に立っおいる今埌の課題ずしおは人手によるテンプレヌトの粟錬化コストを䞋げるための䞍芁箇所自動掚定の粟床向䞊などがあげられるたた入力のマルチモヌダル化による衚珟力の向䞊も興味深い課題ずなる謝蟞 テンプレヌトの粟錬化のためにテンプレヌトの確認䜜業を担圓された西日本新聞瀟の方々に感謝申し䞊げたす

文 献[1] Alexander M. Rush, Sumit Chopra, and Jason Weston. A

neural attention model for abstractive sentence summariza-tion. In Proceedings of the 2015 Conference on Empiri-cal Methods in Natural Language Processing, pp. 379–389,2015.

[2] 田川裕茝, 嶋田和孝. スポヌツ芁玄生成におけるテンプレヌト型手法ずニュヌラル型手法の提案ず比范. 自然蚀語凊理, Vol. 25,No. 4, pp. 357–391, 2018.

[3] Nicholas D. Allen, John R. Templon, Patrick SummerhaysMcNally, Larry Birnbaum, and Kristian Hammond. A data-driven sports narrative writer. In AAAI Fall SymposiumSeries, 2010.

[4] Yuuki Tagawa and Kauzutaka Shimada. Generating ab-stractive summaries of sports games from japanese tweets.In Proceedings of the 7th International Conference on E-Service and Knowledge Management, pp. 82–87, 2016.

[5] 吉田拓海, 暪山想䞀郎, 山䞋倫倮, 川村秀憲. 競茪を察象ずしたレヌス結果の予枬ず予想蚘事の生成. 人工知胜孊䌚党囜倧䌚論文集, Vol. JSAI2018, No. 4F1OS11c01, 2018.

[6] Soichiro Murakami, Akihiko Watanabe, Akira Miyazawa,Keiichi Goshima, Toshihiko Yanase, Hiroya Takamura, andYusuke Miyao. Learning to generate market comments fromstock prices. In Proceedings of the 55th Annual Meeting ofthe Association for Computational Linguistics, 2017.

[7] 村䞊総䞀郎, 笹野遌平, 高村倧也, 奥村孊. 数倀予報マップからの倩気予報コメントの自動生成. 蚀語凊理孊䌚 第 23 回幎次倧䌚発衚論文集, pp. 1121–1124, 2017.

[8] Zhe Cao, Tomas Simon, Shih-En Wei, and Yaser Sheikh. Re-altime multi-person 2d pose estimation using part affinityfields. In Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition (CVPR), pp. 7291–7299,2017.

[9] Lei Shi, Yifan Zhang, Jian Cheng, and Hanqing Lu.Skeleton-based action recognition with multi-stream adap-tive graph convolutional networks. IEEE Transactions onImage Processing, Vol. 29, pp. 9532–9545, 2020.

— 5 —- 24 -