それは、地域を変えていく力

LOD/RDFを勉強しよう

オープンデータと言っても、どんなデータなの?
ホームページやPDFでいろんなデータが公開されているじゃないですか?

もちろん、いろんな生活情報は行政のホームページ等で公開されています。
これらは、それを見る人用にいろんな加工がされています。
今、オープンデータで求められているので、コンピュータが読める形でのデータの公開です。

コンピュータがそのデータを読み込み、いろんな情報と合わせて、より有益な情報として公開していく事がオープンデータの穏当の意味です。

では、コンピュータが読めるデータって何ですか?
webページやPDFドキュメンと、人が見やすく加工されていますが、そこから生のデータをコンピュータが読み取るのは、かなり面倒な作業が必要です。時には人の手により、データを再入力しなくてはなりません。

コンピュータにとって分かりやすいデータとは何でしょう。
それが、RDFなのです。

ちょっと技術的で難しい話しですが、世界でその標準化が進んでいます。
例えば電話番号は、電話、Tel:、Telephon、电话、هاتف、いろんな国により表現が違います。しかしコンピュータはこれを電話として認識し、サービスを提供する必要があるのです。国や人、表現、言語が違っても、この電話番号データをコンピュータは認識し、処理出来るようにするための決まり事がRDFなのです。

さらにLODとは何ですか?
RDFで定義されたデータ同士を繋いでいく事。例えばある人物の情報をRDFで定義したとしましょう。
しかし、そのデータだけでなく、その人物に関してはいろんな情報がネットワーク上にあります。
例えば、Wikipediaなどにもその人物に関する情報が掲載されているかも知れません。
こういった、データを結びつければ、より多くの情報を得る事が出来ます。
それが、LOD(Linked Open Data)なのです。このように繫がったデータを探し出す企画も標準化されており、これがSPARQLです。

技術のある人は、是非このスライドで知識をつけて、オープンデータにチャレンジしてみてください。

三浦 雅孝

いつの間にか、Code for Hachiojiの暫定キャプテンを努めています。 みんなでいろんな挑戦をして、少しでも八王子の活性化に繫がれば嬉しいです。