オープンデータとlinked open data(lod)

17
オープンデータと Linked Open Data(LOD) LODチャレンジ実行委員会 関西支部長 /大阪大学 産業科学研究所 古崎 晃司 [email protected] 4LODハッカソン関西 2014127日(日) 2014/12/07 4LODハッカソン関西 1

Upload: kouji-kozaki

Post on 13-Jul-2015

269 views

Category:

Technology


2 download

TRANSCRIPT

オープンデータとLinked Open Data(LOD)

LODチャレンジ実行委員会 関西支部長

/大阪大学 産業科学研究所

古崎 晃司

[email protected]

第4回LODハッカソン関西2014年12月7日(日)

2014/12/07 第4回LODハッカソン関西 1

自己紹介

古崎(こざき)晃司 所属: 大阪大学産業科学研究所 准教授

専門: 情報科学(オントロジー工学)=“かしこい”コンピュータ(ソフトウェア)を作る

→学問にとどまらず,世の中で使われる技術を作りたい

大阪生まれ・大阪育ち(茨木・高槻),大阪在住(高槻)

オープンデータとの関わり LODチャレンジ実行委員会(2011~) 関西支部長

→Linked Open Dataを技術普及させたい

「LODチャレンジ2014」への応募作品を増やしたい

特に,地元「大阪(関西)」でのコミュニティを大きくしたい

2014/12/07 2

研究成果として公開中のソフト

第4回LODハッカソン関西

講演の概要

本講演のねらい

「オープンデータ」と「Linked Open Data(LOD)」の技術的な概要を知って頂く

講演内容

(大阪での取り組みの紹介)

オープンデータ概要と5★オープンデータ

Linked Open Data(LOD)の技術概要

2014/12/07 第4回LODハッカソン関西 3

大阪でのオープンデータの取り組みの経緯(去年まで)

2011- Linked Open Dataチャレンジ2011の開催

国内初の「オープンデータ活用に関するコンテスト」 古崎は実行委員として活動,大阪でもイベントを開催 鯖江市や横浜市が受賞

2012- Linked Open Dataチャレンジ2012の開催

鯖江市や横浜市が会津若松市などが受賞

2013- 日本各地で「インターナショナル・オープンデータデイ」(2月)が開催

関西での開催が無かったため,古崎は名古屋に参加… 大阪でも「オープンデータ(やLOD)の取り組み」を進めたいと,勉強会を開催

同じような考えのLinked Open Data Initiative(LODI)/ ATR Creativeの高橋さんと,「オープンデータ(LOD)のイベント」を大阪イノベーションハブ(OIH)で開催するように…

Linked Open Dataチャレンジ2013の開催 大阪市さんが,イベント+LODチャレンジ向けに「オープンデータ」を提供して下される!

2014- 大阪イノベーションハブ(OIH)が,オープンデータの先進国であるイギリスの

The Open Data Institute (ODI) のアジア初のCity Nodeに!(2/17) 大阪(関西)初の「インターナショナル・オープンデータデイ」 LODチャレンジ2013にて,大阪市が「LODチャレンジデー賞」を受賞

2014/12/07 4

一部の自治体が開始

大阪でも急展開

第4回LODハッカソン関西

2012.7 電子行政オープンデータ戦略

2013.6 G8サミット「オープンデータ憲章」

2013.12 Data.go.jp試験運用開始

日本政府の取り組み

大阪イノベーションハブ(OIH)

大阪イノベーションハブ(OIH)大阪市のグローバルイノベーション支援拠点

The Open Data Institute (ODI)オープンデータを推進する国際機関(本部はイギリス)

2014/12/07 第4回LODハッカソン関西 5

http://www.innovation-osaka.jp/ja/ http://theodi.org/

ODIのCity Node(各地での推進拠点)へ

大阪で開催したイベント(2013年度)Linked Open Data ハッカソン関西

大阪イノベーションハブにて,3回のイベントを開催(2013年度)→大阪市が「イベント用にデータ提供」

第1回「提供されたデータのLOD化」(10/19)

第2回「アプリの開発」(12/6-7) → LODチャレンジへ応募

第3回「インターナショナル・オープンデータ・デイ」(2/11,22)として開催

これまでの資料・成果のまとめ http://lodosaka.jp/

2014/12/07 第4回LODハッカソン関西 6

大阪で開催したイベント(2014年度)

Firefox OS×HTML5×LOD WEBイノベーションハッカソン

2014/12/07 7

6月末~9月中旬にかけた3回(5日間)のイベントで,6チームの参加者がアプリを開発

LODに加え,Firefox OS(Mozilla Japan),HTML5(HTML5-WEST.jp),WordPressといったWeb技術のコミュニティの協力を頂き,これらの技術とオープンデータを活用したFirefox OSスマートフォンのアプリを開発.

第4回LODハッカソン関西

オープンデータの概要 オープンデータの定義

誰でも自由に使える形で公開されているデータ(http://opendatahandbook.org/ja/what-is-open-data/ 参照)

2つの観点 ライセンス(cf.クリエイティブコモンズ)

使用目的を限定せず(例:商用も可),再配布,改変も可

「作成者のクレジットの表示」の義務付け程度の制限はOK→“まじめな人”(※)が,安心して使える

=より多くの人の利用が見込まれる(※悪いことをする人は,ライセンスを気にせず勝手に使う)

機械可読な形式 プログラムで処理しやすいフォーマットが望まれる

→“使いたい人”が,簡単に使える=低コストで多くのアプリ(活用事例)が作れる LOD(Linked Open Data)は,「オープンデータの5つの段階」で「5つ星」

と言われている公開方法(http://5stardata.info/ja/ 参照)2014/12/07 第4回LODハッカソン関西 8

5 ★ オープンデータ

2014/12/07 第4回LODハッカソン関西 9

★ (どんな形式でも良いので) あなたのデータをオープンライセンスでWeb上に公開しましょう

★★ データを構造化データとして公開しましょう★★★ 非独占の形式を使いましょう★★★★ 物事を示すのにURIを使いましょう,そうすることで他の人々があなたのデータ

にリンクすることができます★★★★★ あなたのデータのコンテキストを提供するために他のデータへリンクしましょう

http://5stardata.info/ja/より引用

ライセンスについて

フォーマットについて

Webの発明者でありLinked Dataの創始者でもあるティム・バーナーズ=リーがオープンデータのために提案したスキーム※注:図中のPDF,エクセル,CSVのアイコンは,

あくまでも例示であって,そのフォーマットを推奨している訳ではない.

Linked Open Data(LOD) Linked Data:Web上のデータを,つなぐ(linkする)ことで,新しい価値

を生み出そうとする取り組み.Webの創始者Tim Berners-Lee氏が提唱

※ Linked Open Data(LOD):オープンな形で公開されたLinked Data

2014/12/07 第4回LODハッカソン関西

http://linkeddata.org/

• 誰もが同じ方法で,「データをつなぐことができる仕組み」を提供している.• 技術的には,

-データ公開の共通フォーマット(URIによる名前付け,RDFによるグラフ表現-コンピュータが,データにアクセスする共通の仕組みが提供されている.

→Web上に公開された膨大なデータを統合した1つのデータベースとして利用できる.

10

Linked Dataの4つの条件

1. Use URIs as names for things全てのモノやコトにURIをつけましょう

2. Use HTTP URIs so that people can lookup those names.それらのURIをhttp(Webブラウザと同じ方法)で参照(アクセス)できるようにしましょう

3. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)そのURIを参照したら,役に立つ情報を提供するように

4. Include links to other URIs. so that they can discover more things.多くのモノ・コトを発見できるように,外部へのリンクを含めよう.

2014/12/07 第4回LODハッカソン関西 11

原文引用元 http://www.w3.org/DesignIssues/LinkedData.html日本語訳参考 http://www.slideshare.net/takeda/lod-5163454

Linked Dataの例

2014/12/07 第4回LODハッカソン関西 12

大阪府

大阪市

都道府県 223㎢

2,687,287人

面積

人口

吹田市

豊中市

…バラ科

市の木

隣接自治体

隣接自治体

http://ja.dbpedia.org/resource/大阪市 というURIから得られる情報

サクラ

Cherry blossom英名

リソース:URIで表されるモノ・コト

プロパティ:

リソース間の関係を表す

リテラル:文字列

主語 述語 目的語

トリプル※RDF(Linked Dataのデータモデル)は,「トリプルの組み合わせ」で表される

(DBpedia Japaneseより)

目的語が他のリソースのとき,トリプルを辿って更なる情報が得られる

※図中のリソース(楕円),プロパティ(リンク)は

DBPedia

2014/12/07 第4回LODハッカソン関西

Wikipediaの各記事のインフォボックスの情報を抽出して自動生成されるLOD様々なデータをつなぐLODのハブ的な存在となっている.

http://dbpedia.org/

日本語版のDBPediaはhttp://jp.dbpedia.org/ インフォボックスの例

13

Linked Dataが目指すこと WWW(World Wide Web)

文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための革命的な仕組みを提供したことで,今日のWebの発展につながった.

Linked Data データを共有(公開)し,相互につなぐ仕組

みを提供する.

Linked Dataの原理 データの構造化

構造化されたデータはより洗練された処理を可能にする

分散したデータをつなぐハイパーリンク 文書単位では無く,データ単位のリンクを可能にする.

データの島々から一つのグローバルデータ空間へ 分散されたデータ群を1つのグローバルなデータ空間へ統合する

参考:『Linked Data-Webをグローバルなデータ空間にする仕組み(Tom Heath, Christian Bizer(武田英明監訳),丸善,2013)』 1章.

2014/12/07 第4回LODハッカソン関西 14

既に公開・リンクされているLOD~LODクラウド~

2014/12/07 第4回LODハッカソン関西

2007/5/12007/10/8

2008/9/182009/7/142010/9/22http://lod-cloud.net/

2011/9/19時点

1つの丸が個別に公開されたDBを表す.

参考:「Linked Data-Webをグローバルなデータ空間にする仕組み」 3章.データのWeb

マスメディア

地理情報

図書館・教育

ユーザ作成データ

政府情報クロス・ドメイン

ライフサイエンス

DBPedia

open.govopen.gov.uk

15

既に公開・リンクされているLOD~LODクラウド~

2014/12/07 第4回LODハッカソン関西 16

Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzschand Richard Cyganiak. http://lod-cloud.net/

1つの丸が個別に公開されたLOD(DB)を表す

2014/08/30時点

行政関係のデータ

公開したオープンデータが他のオープンデータと「つながる」ことで「新たな価値」が生まれる

まとめ オープンデータ

データを“誰でも,自由に使える”で公開することで,様々な活用が期待されている.

「ライセンス」と「機械可読なフォーマット」の2つの観点で議論される

Linked Open Data(LOD) データを“つなぐ(Linkする)”ことで新たな価値を生み出す

オープンデータを公開する形式としても有力視されている すべてのデータをLODとすべきかについては議論もあり

例)大規模な数値データのLOD化は非効率?

参考資料 LODハッカソンin関西まとめ http://lodosaka.jp/ LODに関する入門資料

Linked Open Data Initiative(LODI)によるLOD連続講座のスライド

http://linkedopendata.jp/?cat=172014/12/07 第4回LODハッカソン関西 17