新規作成 | 一覧 | RSS | FrontPage | 検索 | 更新履歴
[Calendar/When/RDF/Event/1.Web/1.GUI/1.導入/データセット登録] (前:1.導入|次:2.画面説明) (English)

データセット登録

examples-datasetsをそのまま使用する場合には本項の設定は不要ですので、本項をスキップして2.画面説明をご覧ください。

Webサーバーのクライアントが、自分に合わせた「イベント機能」を使用するには、必要な情報を準備する必要があります。

(関連項目→B.Cashもご覧ください)

データセット本体

当然ながらイベント情報を保持するデータセットの本体が必要です。

When.exe Ruby版の「イベント機能」を担当するWebサーバー(http://hosi.org)から読める場所(インターネット上またはWebサーバーのローカルファイルシステム)に配置します。

配置場所は、後述の「データセット定義ファイル」の{ts:reference}で指定します。

国会図書館デジタルライブラリの暦画像」のように、そこからさらに画像データなど別の情報へリンクさせることもできます。

When.exe Ruby版の「イベント機能」では、下記のうちSPARQLサーバー以外の場合は、インターネットから読んだデータセット本体の全体をローカルファイルにキャッシュし、オンメモリにロードして処理を行います。

SPARQLサーバー上にデータセット本体がある場合は、オンメモリにデータセットをロードすることなくそのSPARQLサーバーに query を発行して処理を行います。

ブログ記事2015-12-19「外部データ参照の実装 現状の整理」でデータセットの配置方式の長所と欠点の比較がされていますので参考にしてください。

SPARQLサーバー

「データセット定義ファイル」の{ts:reference}に記述されたSPARQLサーバーのエンドポイントに対して query を発行して処理を行います。

RDFファイル

RDFの諸形式のファイルです。

現状、ttl(Turtle)・rdf(RDF/XML)・nt(N-Triples)・n3(Notation3)・html(RDFa)が利用可能できます。

[具体例] test-history-events-edge.ttl

CSVファイル

カンマ区切り形式のファイルです。

ヘッダがない場合はカラムの番号(1~)、ヘッダがある場合はカラム名でイベント情報の要素を扱います。

[具体例] japanese-holiday.csvtest-history-events.csv

HTMLなどその他の形式のファイル

CSVでもRDFでもないその他の形式のファイルは、テキストファイルとして扱い、文字列の正規表現マッチによりイベント情報を抽出して利用できます。

[具体例] 徳川将軍一覧 (足利将軍の場合は、再任などの事例があり異なる正規表現が必要です)

RDFであっても、{dcq:valid}ロールの述語の目的語がrdfs:LiteralではなくiCalendarなどのrdfs:Resourceで、取得したい時間情報がそのiCalendarなどを主語とするトリプルの目的語に配置されている場合は、現在の「データセット定義ファイル」フォーマットでは扱えません。このような場合も、RDFではない一般のテキストファイルとして扱い正規表現でイベント情報を抽出できることがあります(→具体例mori_wikichoshi.csv)。

When.exe Ruby版内蔵データ

When.exe Ruby版内蔵の暦年代(TM_CalendarEra)をデータセットとして利用できます。

[具体例] JapanesePrimeminister(インターネットには読みに行きません)

データセット定義ファイル

データセット本体をどのように読み込んだり扱ったりするか、そのデータセットの仕様を記述する CSV形式のファイルです。

「イベント機能」のWebサーバーから読める場所(インターネット上またはWebサーバーのローカルファイルシステム)に配置します。

配置場所は、後述の「データセットリストファイル」で指定します。

データセット定義ファイルの具体例はA.Datasetをご覧ください。

データセット定義ファイルのフォーマットについては1.DataSetsで詳しく説明します。

データセットリストファイル

Webサーバーのクライアントが、利用したいデータセットをリストアップしたスペース区切り形式のファイルです。

GitHub 上に配置します。

[具体例] example-datasets (データセット定義ファイルのURLは、プレフィクスを使わずにフルパスで記述してもかまいません)

このファイルの役割は一種の「認証機能」です。

GitHub上の素性の特定可能な人物が配置したファイルをデータセット登録の起点とすることで、「イベント機能」のWebサーバーが問題のあるデータを扱うことを抑止しています。