オープンデータと言っても、どんなデータなの?
ホームページやPDFでいろんなデータが公開されているじゃないですか?
もちろん、いろんな生活情報は行政のホームページ等で公開されています。
これらは、それを見る人用にいろんな加工がされています。
今、オープンデータで求められているので、コンピュータが読める形でのデータの公開です。
コンピュータがそのデータを読み込み、いろんな情報と合わせて、より有益な情報として公開していく事がオープンデータの穏当の意味です。
では、コンピュータが読めるデータって何ですか?
webページやPDFドキュメンと、人が見やすく加工されていますが、そこから生のデータをコンピュータが読み取るのは、かなり面倒な作業が必要です。時には人の手により、データを再入力しなくてはなりません。
コンピュータにとって分かりやすいデータとは何でしょう。
それが、RDFなのです。
ちょっと技術的で難しい話しですが、世界でその標準化が進んでいます。
例えば電話番号は、電話、Tel:、Telephon、电话、هاتف、いろんな国により表現が違います。しかしコンピュータはこれを電話として認識し、サービスを提供する必要があるのです。国や人、表現、言語が違っても、この電話番号データをコンピュータは認識し、処理出来るようにするための決まり事がRDFなのです。
さらにLODとは何ですか?
RDFで定義されたデータ同士を繋いでいく事。例えばある人物の情報をRDFで定義したとしましょう。
しかし、そのデータだけでなく、その人物に関してはいろんな情報がネットワーク上にあります。
例えば、Wikipediaなどにもその人物に関する情報が掲載されているかも知れません。
こういった、データを結びつければ、より多くの情報を得る事が出来ます。
それが、LOD(Linked Open Data)なのです。このように繫がったデータを探し出す企画も標準化されており、これがSPARQLです。
技術のある人は、是非このスライドで知識をつけて、オープンデータにチャレンジしてみてください。