番組情報データベースの linked open data化の検討linked open data化の検討 宮崎...

7
02 番組情報データベースの Linked Open Data化の検討 宮崎 勝  浦川 真  山田一郎  三浦菊佳  住吉英樹  藤沢 寛  中川俊夫 Study on Program Information Database as Linked Open Data Masaru MIYAZAKI, Makoto URAKAWA, Ichiro YAMADA, Kikuka MIURA, Hideki SUMIYOSHI, Hiroshi FUJISAWA and Toshio NAKAGAWA 要 約 放送局が制作した番組コンテンツに関連する情報を外部 のさまざまなサービスで利用できるようにする手法の一つ として,番組関連情報をソフトウエア処理可能なデータと してウェブに公開し,外部サービスからも利用できるよう にするための検討を進めている。本稿では,W3Cで勧告 されているLinked Open Data(LOD)の技術を利用した, 番組情報データベースの構築について報告する。 番組 コンテンツの内容に関する知識をLOD形式のデータとし て表現することにより,さまざまな番組情報を横断的に利 用したサービスが実現可能となる環境を構築した。 ABSTRACT As a new content-serving method in which the TV content information can reach awaiting viewers via various external services, we propose in this paper program-related information as machine-readable web data that can be used in external services. We report on the construction of the program information database using the linked open data (LOD) technique recommended by the World Wide Web Consortium. Based on experimental results, we determine that services employing a variety of program information can be realized by representing knowledge about the content as LOD data. 48 NHK技研 R&D/No.156/2016.3

Upload: others

Post on 21-May-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

02

番組情報データベースのLinked Open Data化の検討宮崎 勝  浦川 真  山田一郎  三浦菊佳  住吉英樹  藤沢 寛 中川俊夫

Study on Program Information Database as Linked Open Data

Masaru MIYAZAKI, Makoto URAKAWA, Ichiro YAMADA, Kikuka MIURA, Hideki SUMIYOSHI, Hiroshi FUJISAWA and Toshio NAKAGAWA

要 約

放送局が制作した番組コンテンツに関連する情報を外部

のさまざまなサービスで利用できるようにする手法の一つ

として,番組関連情報をソフトウエア処理可能なデータと

してウェブに公開し,外部サービスからも利用できるよう

にするための検討を進めている。本稿では,W3Cで勧告

されているLinked Open Data(LOD)の技術を利用した,

番組情報データベースの構築について報告する。番組

コンテンツの内容に関する知識をLOD形式のデータとし

て表現することにより,さまざまな番組情報を横断的に利

用したサービスが実現可能となる環境を構築した。

ABSTRACT

As a new content-serving method in which the TV

content information can reach awaiting viewers via

various external services, we propose in this paper

program-related information as machine-readable

web data that can be used in external services. We

report on the construction of the program information

database using the linked open data (LOD) technique

recommended by the World Wide Web Consortium.

Based on experimental results, we determine that

services employing a variety of program information

can be realized by representing knowledge about the

content as LOD data.

48 NHK技研 R&D/No.156/2016.3

*1 インターネットで利用される技術の標準化を行っている非営利団体。

*2 ここでは,番組映像だけでなく,テキストや外部情報へのリンクなども含めた番組に関するあらゆる情報を指す。

*3 http://www.bbc.co.uk/nature/wildlife/を参照。

1.まえがき

インターネット上に膨大なコンテンツが流通するようになり,ネットユーザーは多様な選択肢の中から自分の好みに合ったコンテンツを見つけ,楽しむことができるようになった。ユーザーがスマートフォンやタブレットといったモバイル端末を利用する時間が増えることで,相対的にテレビを見る時間は減っていく。このような状況の中で,魅力のある番組コンテンツをネットユーザーも含めた多くのユーザーに届けていくためには,今までのようにユーザーがテレビのチャンネルを合わせて番組コンテンツを視聴してくれるのを待つだけではなく,番組コンテンツの情報が,外部のさまざまなサービスで自動的に利用される環境を構築することで,結果的にニーズに合った番組コンテンツをユーザーに届ける,といった手法が有効である。このような手法としては,W3C(World Wide Web

Consortium)*1で勧告されているセマンティックウェブ,およびLinked Open Data(LOD)の技術の利用が考えられる。従来のインターネットでは,ウェブ同士がハイパーリンクでつながった空間を通じて,人々がさまざまな情報を得ることができた。このウェブはあくまでも「人が見て理解するためのウェブ」であったが,ウェブ上の情報が膨大になるにしたがって,その情報をソフトウエアが自動処理し,人々にさまざまなサービスを提供できるようにする,という考え方が生まれた。これがセマンティックウェブである1)。一方,LODは,インターネット上のさまざまな場所にあるデータを,セマンティックウェブの考え方に基づいてソフトウエアによる自動処理が可能な形式で表現し,さらにそのデータ同士を明確な意味を持ったリンク情報で結びつけることにより,「ソフトウエアのためのデータのウェブ」を実現する技術である。番組情報*2をソフトウエアが解釈できる形式で記述し,外部データとのリンク情報などを追加

してLODとして提供することで,外部サービスなどでの番組情報の利用が活性化し,結果として,番組コンテンツの利活用促進が期待できる。当所では,セマンティックウェブやLODの分野で用いられるRDF(Resource Description Framework)形式2)で番組情報を表現し,外部のLODとリンク付けすることにより,番組を取り巻くさまざまなデータの連結点となるデータベースの検討を進めている。1図に,番組情報のRDF表現の例を示す。RDFでは,すべてのデータを「トリプル」と呼ばれる主語,述語,目的語からなる3つの要素で記述する。この例では,ある番組(episode12345)のジャンルが国内ドラマ(genre0300)であることが表現されている。このRDF表現された番組情報を蓄積したデータベース,およびその利用機能を合わせて実装したシステムを「番組情報データハブ」と呼ぶ。本稿では,番組情報データハブの構築手法とともに,番組情報データハブを利用したアプリケーションの例について報告する。

2.放送メディアとLOD

英国のBBC(British Broadcasting Corporation:英国放送協会)は,早い段階からLOD技術による番組コンテンツ展開の可能性を認識し,LODを用いたコンテンツデータの活用に取り組んできた。すべての番組のすべての放送回や,番組で取り上げた音楽アーティストに関する情報をLODとして公開しており,さまざまな外部サービスから参照されている。また,Wildlife*3のサイトでは,動物の種や行動といった情報をRDFで記述することによって,個別の動物や種などから関連する情報

※1 番組の1つのエピソード(放送回)を記述するための定義。 ※2 クラスの定義に実際の値などを入れて作る実体。  ※3 1つのジャンルを記述するための定義。

述 語

番組のジャンルを表す述語

目的語

番組のジャンルデータ:国内ドラマ(Genreクラス※3のインスタンス)

主 語

nhklod : episode12345

nhklod : Episode

Episodeクラス

nhklod : genre0300

個別の番組データ(Episodeクラス※1のインスタンス※2)

nhklod : hasGenre

rdf : type

nhklod : Genre

Genreクラス

rdf : type

RDFトリプル

1図 番組情報のRDF表現の例

49NHK技研 R&D/No.156/2016.3

02

番組情報データベースのLinked Open Data化の検討宮崎 勝  浦川 真  山田一郎  三浦菊佳  住吉英樹  藤沢 寛 中川俊夫

Study on Program Information Database as Linked Open Data

Masaru MIYAZAKI, Makoto URAKAWA, Ichiro YAMADA, Kikuka MIURA, Hideki SUMIYOSHI, Hiroshi FUJISAWA and Toshio NAKAGAWA

要 約

放送局が制作した番組コンテンツに関連する情報を外部

のさまざまなサービスで利用できるようにする手法の一つ

として,番組関連情報をソフトウエア処理可能なデータと

してウェブに公開し,外部サービスからも利用できるよう

にするための検討を進めている。本稿では,W3Cで勧告

されているLinked Open Data(LOD)の技術を利用した,

番組情報データベースの構築について報告する。番組

コンテンツの内容に関する知識をLOD形式のデータとし

て表現することにより,さまざまな番組情報を横断的に利

用したサービスが実現可能となる環境を構築した。

ABSTRACT

As a new content-serving method in which the TV

content information can reach awaiting viewers via

various external services, we propose in this paper

program-related information as machine-readable

web data that can be used in external services. We

report on the construction of the program information

database using the linked open data (LOD) technique

recommended by the World Wide Web Consortium.

Based on experimental results, we determine that

services employing a variety of program information

can be realized by representing knowledge about the

content as LOD data.

48 NHK技研 R&D/No.156/2016.3

や番組へすぐに飛ぶことができる。また,音声認識やクラウドソーシング*4によるタグ付けを利用し,さまざまな番組をLODとしてリンクさせるシステム*5も,アカデミックな分野で高く評価されている。当所においても,LODの技術を用いた新しい番組提

供手法の検討を進めてきた。例えば,国立国会図書館が公開しているWeb NDL Authorities*6のデータを利用して番組同士をつなげ,その関係を2次元空間上で視覚的に表現することで,視聴者の番組内容に関する関心を広げていく情報提示手法を提案している(2図)3)。このようなデータベースの構築により,さまざまな外部サービスから番組コンテンツに至る経路を提供するとともに,関連コンテンツをたどることにより,ユーザーにより深く,広い知識を提供していくことが可能となる。現在のサービスでは行われていない番組コンテンツ同

士のリンク付けに加え,番組コンテンツの内容に関する意味情報の記述をLOD技術を用いて行うことで,番組情報をさまざまなサービスで活用することができる。次章では,放送局のサービスだけでなく,放送局以外の事業者による多様なサービスで利用することが可能な番組情報データハブの構築について述べる。

3.LOD形式を利用した番組情報データハブの構築

NHKでは,番組送出のための編成情報や,放送や番組ウェブページで利用するための付加情報のデータベースなど,さまざまな番組関連データベースが数多く整備

され,利用されている。それらはリレーショナルデータベース(RDB:Relational Database)*7の表形式データとして蓄積されており,互いに連携して新しいサービスに利用されることはそれほど多くはない状況であった。しかし,例えば,ある健康番組では特定の食材の効能などが紹介され,別の料理番組ではその食材を使ったレシピが紹介されるといったように,異なる番組で同じテーマに関する情報を提供していることも多い。異なる番組同士を共通の概念を介して結ぶことで,双方の番組情報を連携させた新しいサービスの創出が期待できる。本章では,既存のデータベースから抽出した番組情報に外部知識とのリンクなどを付与することでLOD形式の番組情報データハブを構築し,番組横断的サービスを実現する手法について述べる。

3.1 データ構造の設計番組情報データハブを構築するために,番組名や放送時間といった番組の基本情報,局内にある関連コンテンツ情報,および放送局内外にある番組関連知識へのリンク情報を記述するためのデータ構造を設計した。データ構造の概念図を3図に示す。設計にあたってはBBCのProgrammes Ontology*8を

参考とし,NHK独自の番組情報などを記述できるよう

*4 インターネットを通じて,不特定多数の人の力を活用するプロセス。

*5 http://worldservice.prototyping.bbc.co.uk/を参照。

*6 http://id.ndl.go.jp/auth/ndla/を参照。

*7 表形式で表されるデータとその関係から構成される,現在最も一般的に利用されているデータベース。

*8 番組を記述するための語彙や関係を明確に定義したもの。 http://www.bbc.co.uk/ontologies/poを参照。

2図  2次元空間上で視覚的に表現された番組ネットワークの例

50 NHK技研 R&D/No.156/2016.3

報告 02

番組内容系情報

タイトル,サブタイトル,概要など

番組放送系情報

放送日,再放送情報,ジャンル,放送エリア,チャンネルなど

外部知識へのリンク

出演者,重要単語,DBpediaへのリンク,知識マップへのリンク,ハッシュタグ

番組構造系情報

番組シリーズ,番組枠,シーン,ショット

関連コンテンツへのリンク

番組ロゴ,番組ウェブページ,映像,画像

Episodeクラス(番組コンテンツ)

TVクラス (コンテンツ提供手段)

原因結果

関係

概念マップ

対処法

関係

“皮膚炎”

単語

ID:XXXXXXX “ためしてガッテン 糖尿病が完治する?”

番組

“ハウスダスト”

単語

“糖尿病”

単語コンテンツマップ

3図 番組情報記述のためのデータ構造

4図 知識マップの例

に拡張を行っている。番組情報は,大きく分けて,個々の番組コンテンツそのものの定義を示す「Episodeクラス」と,コンテンツ提供手段の定義を示す「TVクラス」の情報から構成される。Episodeクラスには,タイトルや番組概要などの番組内容系情報,3.3節で述べるDBpediaや知識マップといった外部知識へのリンク情報,番組シリーズやシーンなどの番組構造系情報,映像,画像,番組ウェブページといった関連コンテンツへのリンク情報を付与する。TVクラスには,放送日などの番組放送系情報をリンク付けしている。

3.2 番組基本情報および 局内コンテンツへのリンクNHKは,2014年1月から「NHK番組表APIサービ

ス」*9を開始し,データの形で番組情報の一部公開を始めている。このサービスは,全国のNHKの番組表や番組ロゴ,番組ハッシュタグ*10などの情報を提供しており,API(Application Programming Interface)*11を介してJSON*12形式でデータを取得することが可能である。このAPIは,NHKが実施しているウェブサービスやスマホアプリ,ハイブリッドキャストサービスなどで利用されているほか,一般にも公開されており,誰でもこのAPIを利用したアプリやサービスを開発することが可能である。当所では,この番組表APIを利用して,番組情報データハブのベースとなる詳細な番組情報を抽出

した。さらに,個々の番組ウェブサイトのURL(Uniform Resource Locator)をはじめ,局内のデータベースにある番組関連動画,静止画などへのリンク情報も半自動で付与した。

3.3 番組関連知識外部のさまざまなサービスとの連携を実現するために,番組表情報に含まれる出演者名および番組概要文からTF-IDF*13を指標として重要単語を抽出し,日本語版DBpedia*14に記述された語彙へのリンク情報を自動で付与した。また,さらなる外部知識として,当所で構築を進めている番組関連知識データである「知識マップ」へのリンク情報を自動で付与した。知識マップは,ウェブ上の膨大なテキスト情報を分析して得られた「上位-下位」「原因-結果」といった単語間の関係を示す「概念マップ」4)5),および,コンテンツの概要文を分析して得られた単語とコンテンツの間の関係を示す「コンテン

*9 http://api-portal.nhk.or.jp/を参照。

*10 Twitterなどでタグとして用いられる,先頭に“#”などのハッシュ記号を付与したキーワード。

*11 コンピュータープログラムが持つ機能やデータを別のプログラムから呼び出して利用するための手順やデータ形式。

*12 JavaScript Object Notation:さまざまなソフトウエアで利用されているデータ記述言語。

*13 Term Frequency - Inverse Document Frequency:文書中の単語の重要度を表す指標の一つ。

*14 Wikipedia日本語版から情報を抽出してLODとして公開するプロジェクト。http://ja.dbpedia.org/を参照。

51NHK技研 R&D/No.156/2016.3

や番組へすぐに飛ぶことができる。また,音声認識やクラウドソーシング*4によるタグ付けを利用し,さまざまな番組をLODとしてリンクさせるシステム*5も,アカデミックな分野で高く評価されている。当所においても,LODの技術を用いた新しい番組提供手法の検討を進めてきた。例えば,国立国会図書館が公開しているWeb NDL Authorities*6のデータを利用して番組同士をつなげ,その関係を2次元空間上で視覚的に表現することで,視聴者の番組内容に関する関心を広げていく情報提示手法を提案している(2図)3)。このようなデータベースの構築により,さまざまな外部サービスから番組コンテンツに至る経路を提供するとともに,関連コンテンツをたどることにより,ユーザーにより深く,広い知識を提供していくことが可能となる。現在のサービスでは行われていない番組コンテンツ同士のリンク付けに加え,番組コンテンツの内容に関する意味情報の記述をLOD技術を用いて行うことで,番組情報をさまざまなサービスで活用することができる。次章では,放送局のサービスだけでなく,放送局以外の事業者による多様なサービスで利用することが可能な番組情報データハブの構築について述べる。

3.LOD形式を利用した番組情報データハブの構築

NHKでは,番組送出のための編成情報や,放送や番組ウェブページで利用するための付加情報のデータベースなど,さまざまな番組関連データベースが数多く整備

され,利用されている。それらはリレーショナルデータベース(RDB:Relational Database)*7の表形式データとして蓄積されており,互いに連携して新しいサービスに利用されることはそれほど多くはない状況であった。しかし,例えば,ある健康番組では特定の食材の効能などが紹介され,別の料理番組ではその食材を使ったレシピが紹介されるといったように,異なる番組で同じテーマに関する情報を提供していることも多い。異なる番組同士を共通の概念を介して結ぶことで,双方の番組情報を連携させた新しいサービスの創出が期待できる。本章では,既存のデータベースから抽出した番組情報に外部知識とのリンクなどを付与することでLOD形式の番組情報データハブを構築し,番組横断的サービスを実現する手法について述べる。

3.1 データ構造の設計番組情報データハブを構築するために,番組名や放送時間といった番組の基本情報,局内にある関連コンテンツ情報,および放送局内外にある番組関連知識へのリンク情報を記述するためのデータ構造を設計した。データ構造の概念図を3図に示す。設計にあたってはBBCのProgrammes Ontology*8を参考とし,NHK独自の番組情報などを記述できるよう

*4 インターネットを通じて,不特定多数の人の力を活用するプロセス。

*5 http://worldservice.prototyping.bbc.co.uk/を参照。

*6 http://id.ndl.go.jp/auth/ndla/を参照。

*7 表形式で表されるデータとその関係から構成される,現在最も一般的に利用されているデータベース。

*8 番組を記述するための語彙や関係を明確に定義したもの。 http://www.bbc.co.uk/ontologies/poを参照。

2図  2次元空間上で視覚的に表現された番組ネットワークの例

50 NHK技研 R&D/No.156/2016.3

ツマップ」6)により構成される。4図に知識マップの例を示す。概念マップに関しては,現在,単語間の関係の種類について28種類,合計約1,012万個の単語間関係が記述されている。4図で示したコンテンツマップをRDFで表現した例を5図に示す。

3.4 推論ルールの追加関連する情報をシンプルなクエリ*15で取得できるように,データ構造の定義の際にSWRL*16でルールを記述し,推論により自動でトリプルが追加されるようにした。6図に,推論ルールの記述例およびそれを用いた問い合わせの例を示す。RDF上では,画像は「第2話」といった個々のエピソードにのみhasImageプロパティ*17を用いて紐

ひも

付けられているが,推論によりそのエピソードのシリーズにも自動的に紐付けられる。そのため,「花子とアン」という番組シリーズを指定するだけで,関連した画像を取得することができる。このような推論ルールの追加により,サービス事業者やユーザーのクエリ作成の負担を減らすことが可能となる。

3.5 番組情報データハブの実装最終的に,番組情報,関連コンテンツとのリンク,関連知識とのリンクを記述したRDFを,「トリプルストア」と呼ばれるRDF専用のデータベースシステムに蓄積し,RDF用の問い合わせ言語であるSPARQL(SPARQL Protocol and RDF Query Language)により情報を取得することができるSPARQLエンドポイント*18およびウェブAPIを用意することで,さまざまなサービスから利用できる環境を実現した。番組情報データハブ構築の流れを7図に示す。本稿執筆時点のデータ構造によって,2ヶ月間のNHKの全テレビ番組約6,700個のデータを実験的にRDFで表現したところ,約189万個のトリプルが生成された。

cw592054

“糖尿病”

cmap899920

nhkpo : rel502139

“対処法”

ep423334

“ためしてガッテン 糖尿病が完治する?”

ConceptWord

ContentMap

Relation

Episode

rdf : type

rdf : type

rdf : type

rdf : type

rdfs : label

rdfs : label

hasRelation

isRelationLinkFrom

isRelationLinkTo

title

SWRLによる推論ルール記述例 isSeriesOf(?s1, ?e1), hasImage(?e1, ?i1) -> hasImage(?s1, ?i1)

Episode

hasImage(推論により自動追加される関係)

花子とアン(第2話)

ImageSeries

花子とアン

クエリ例:SELECT ?i WHERE{ ?s rdf:type cin:Series ?s nhkpo:title “花子とアン”̂^xsd:string. ?s nhkpo:hasImage ?i}

isSeriesOf hasImage

5図 RDFで表現されたコンテンツマップの例

6図 推論ルールの記述例およびそれを用いた問い合わせの例

*15 データベースから情報を取り出すための問い合わせ。

*16 Semantic Web Rule Language:セマンティックウェブの分野で利用されるルール記述言語。

*17 番組エピソードの関連画像を表すための属性。

*18 トリプルストアから情報を取り出すための問い合わせを受け付ける機能。

52 NHK技研 R&D/No.156/2016.3

報告 02

4.アプリケーションの例

番組情報データハブを利用したアプリケーションの例を8図に示す。ウェブページなどを閲覧しているときに興味をもった単語を選択すると,それに関連した番組のコンテンツを「辞書を引くように」表示することができる。8図の例では,「脳梗塞」というキーワード,およびそのキーワードに紐付いた関係である「予防法」を選択すると,「脳梗塞の予防法」に関連した番組の一覧を表示する。ここでは,脳梗塞の治療法を紹介した番組や,さらには脳梗塞の予防に効くと言われている「黒酢」のレシピを紹介した料理番組なども表示することができる。データハブにはさまざまなジャンルの番組の情報,お

よび概念マップやコンテンツマップといった番組関連知識が含まれているため,このような番組横断的なサービスも実現可能となり,ユーザーのニーズに合致した数多

くのコンテンツとの出会いを提供することができる。

5.あとがき

本稿では,既存の番組関連データベースの情報に外部知識や関連コンテンツの情報を付与し,LOD形式で記述した番組情報データハブの構築手法,およびその利用例を示した。今後は,情報,教養,教育などの分野におけるコンテンツ情報のデータハブ化,および実サービス導入へ向けた検討を進め,実際の運用を通じたデータハブの改善と高度化手法の確立を目指す。また放送局の立場でのコンテンツのオープンデータ化やAPI提供の可能性検証を進めるとともに,放送局外のサードパーティー*19

によるサービスと連携するための技術要件や課題などを

外部のデータ NHKの局内データ

動画データベース静止画データベース

概念マップ・コンテンツマップ

編成情報など

表形式データ

利用

NHK内サービス・アプリ

外部のサービス・アプリ

番組情報データハブ

RDF(トリプル)形式データ

(トリプルストア)・データ構造設計・推論ルール設計

番組関連情報収集,リンク付与,変換処理

NHK番組表API

7図 番組情報データハブ構築の流れ

8図 番組情報データハブを利用したアプリケーションの例(ウェブページ上の単語からの関連番組検索・表示)

*19 ここでは,放送事業者以外の幅広い事業者(アプリケーション開発者,受信機メーカーなど)を指す。

53NHK技研 R&D/No.156/2016.3

ツマップ」6)により構成される。4図に知識マップの例を示す。概念マップに関しては,現在,単語間の関係の種類について28種類,合計約1,012万個の単語間関係が記述されている。4図で示したコンテンツマップをRDFで表現した例を5図に示す。

3.4 推論ルールの追加関連する情報をシンプルなクエリ*15で取得できるように,データ構造の定義の際にSWRL*16でルールを記述し,推論により自動でトリプルが追加されるようにした。6図に,推論ルールの記述例およびそれを用いた問い合わせの例を示す。RDF上では,画像は「第2話」といった個々のエピソードにのみhasImageプロパティ*17を用いて紐

ひも

付けられているが,推論によりそのエピソードのシリーズにも自動的に紐付けられる。そのため,「花子とアン」という番組シリーズを指定するだけで,関連した画像を取得することができる。このような推論ルールの追加により,サービス事業者やユーザーのクエリ作成の負担を減らすことが可能となる。

3.5 番組情報データハブの実装最終的に,番組情報,関連コンテンツとのリンク,関連知識とのリンクを記述したRDFを,「トリプルストア」と呼ばれるRDF専用のデータベースシステムに蓄積し,RDF用の問い合わせ言語であるSPARQL(SPARQL Protocol and RDF Query Language)により情報を取得することができるSPARQLエンドポイント*18およびウェブAPIを用意することで,さまざまなサービスから利用できる環境を実現した。番組情報データハブ構築の流れを7図に示す。本稿執筆時点のデータ構造によって,2ヶ月間のNHKの全テレビ番組約6,700個のデータを実験的にRDFで表現したところ,約189万個のトリプルが生成された。

cw592054

“糖尿病”

cmap899920

nhkpo : rel502139

“対処法”

ep423334

“ためしてガッテン 糖尿病が完治する?”

ConceptWord

ContentMap

Relation

Episode

rdf : type

rdf : type

rdf : type

rdf : type

rdfs : label

rdfs : label

hasRelation

isRelationLinkFrom

isRelationLinkTo

title

SWRLによる推論ルール記述例 isSeriesOf(?s1, ?e1), hasImage(?e1, ?i1) -> hasImage(?s1, ?i1)

Episode

hasImage(推論により自動追加される関係)

花子とアン(第2話)

ImageSeries

花子とアン

クエリ例:SELECT ?i WHERE{ ?s rdf:type cin:Series ?s nhkpo:title “花子とアン”̂^xsd:string. ?s nhkpo:hasImage ?i}

isSeriesOf hasImage

5図 RDFで表現されたコンテンツマップの例

6図 推論ルールの記述例およびそれを用いた問い合わせの例

*15 データベースから情報を取り出すための問い合わせ。

*16 Semantic Web Rule Language:セマンティックウェブの分野で利用されるルール記述言語。

*17 番組エピソードの関連画像を表すための属性。

*18 トリプルストアから情報を取り出すための問い合わせを受け付ける機能。

52 NHK技研 R&D/No.156/2016.3

抽出し,ネットサービスにおける放送コンテンツのさらなる活用を実現するための検討を続けていく。

本稿は,人工知能学会「セマンティックウェブとオントロジー研

究会」における以下の発表を元に,加筆・修正したものである。

宮崎,浦川,山田,三浦,住吉,藤沢,中川:“番組情報データベー

スのLOD化の検討,”人工知能学会第34回セマンティックウェブと

オントロジー研究会,SIG-SWO-A1402-01(2014)

宮みや

崎ざき

勝まさる

1997年入局。名古屋放送局を経て,2000年から放送技術研究所において,知識処理を用いたコンテンツハンドリング,ソーシャルメディア,放送通信連携サービスの研究に従事。現在,放送技術研究所ハイブリッド放送システム研究部に所属。技術経営修士(専門職),博士(工学)。

1) T. Berners-Lee, J. Hendler and O. Lassila:The Semantic Web,Scientifi c American(2001)

2) 神埼:セマンティック・ウェブのためのRDF/OWL入門,森北出版(2005)

3) 有安,中川:“LODを用いた番組情報ネットワーク形成手法の提案,”FIT,F-035(2013)

4) S. D. Saeger, K. Torisawa, J. Kazama, K. Kuroda and M. Murata:“Large Scale Relation Acquisition using Class Dependent Patterns,”Proceedings of the IEEE International Conference on Data Mining(ICDM'09),pp.764-769(2009)

5) 山田,橋本,呉,鳥澤,黒田,S. D. Saeger,土田,風間:“Wikipediaを利用した上位下位関係の詳細化,”自然言語処理,Vol.19,No.1,pp.3-24(2012)

6) 三浦,山田,宮崎,加藤,田中:“単語間の意味的関係を用いたテレビ-番組マップ生成,”情処学全大,5C-4(2014)

参考文献

浦うら

川かわ

真まこと

三み

浦うら

菊きく

佳か

2005年入局。山形放送局,技術局を経て,2014年から放送技術研究所において,セマンティック技術によるコンテンツ展開手法の研究に従事。現在,放送技術研究所ハイブリッド放送システム研究部に所属。

2002年入局。名古屋放送局を経て,2004年から放送技術研究所において,自然言語処理,情報抽出の研究に従事。現在,放送技術研究所ヒューマンインターフェース研究部に所属。

山やま

田だ

一いち

郎ろう

住すみ

吉よし

英ひで

樹き

中なか

川がわ

俊とし

夫お

藤ふじ

沢さわ

寛ひろし

1993年入局。名古屋放送局を経て,1996年から放送技術研究所において,情報検索,情報抽出の研究に従事。現在,放送技術研究所ヒューマンインターフェース研究部副部長。博士(情報科学)。

1980年入局。広島放送局を経て,1984年から放送技術研究所において,コンピューターを応用した番組制作システム,メタデータ制作システムの研究に従事。現在,放送技術研究所ハイブリッド放送システム研究部上級研究員。博士(工学)。

1989年入局。編成局におけるインターネットサービスの開発業務を経て,2012年から放送技術研究所において,インターネットサービスの研究に従事。現在,放送技術研究所ハイブリッド放送システム研究部部長。

1995年入局。松江放送局を経て,1998年から放送技術研究所において,地上デジタル放送,インターネット,放送通信連携サービスの研究に従事。メディア企画室を経て,現在,放送技術研究所ハイブリッド放送システム研究部上級研究員。

54 NHK技研 R&D/No.156/2016.3