この記事は1年以上前に書かれました。
内容が古くなっている可能性がありますのでご注意下さい。
内容が古くなっている可能性がありますのでご注意下さい。
これから数回に亘って、RDF(Resource Description Framework)のデータを格納してSPARQLエンドポイントを提供するRDFストアの環境構築について解説します。
第1回は、OpenLink Software社のVirtuosoの環境を構築します。
OpenLink Virtuosoには、商用版とオープンソース版(GPLv2ライセンス)があります。今回使用するのは、もちろんオープンソース版です。インストール先のOSはLinuxとし、ディストリビューションはCentOS 6.5を選択しました。Virtuosoは、LinuxのほかにWindowsとMac OS Xでも動作します。
CentOSにVirtuosoをインストールする場合、GitHubからソースコードを入手してビルドすることになります。開発環境がない場合は、yumでインストールします。
# yum install gcc gmake autoconf automake libtool flex bison gperf gawk m4 make openssl-devel readline-devel git
次に、GitHubからソースコードを入手します。
$ git clone git://github.com/openlink/virtuoso-opensource.git
あとは、お決まりの手順となります。
$ cd virtuoso-opensource $ ./autogen.sh $ ./configure --prefix=/usr/local/ --with-readline $ make # make install
ビルドが終了したら、以下のコマンドでVirtuosoを起動します。
# virtuoso-t +configfile /usr/local/var/lib/virtuoso/db/virtuoso.ini
Virtuosoを起動したら、ブラウザでポート8890に接続します。
このような画面が表示されればOKです。
左側のメニュー最上部にあるConductorのリンクをクリックすると、アカウントとパスワードの入力を求められます。デフォルトでdbaとdavの2つのアカウントが用意されており、パスワードはアカウントと同じです。
Conductorにログインすると、Virtuosoを管理できるようになります。
Conductor画面の「Linked Data」タブをクリックすると、SPARQLクエリの実行画面になります。試しに、以下のクエリ
select * where { ?s ?p ?o. } limit 100
を実行すると、
あらかじめデータが入っていることが分かります。
Conductorにログインしなくても、ポート8890の/sparqlに接続すると、
DBpedia Japaneseなどで見覚えのあるSPARQLエンドポイントの画面が表示され、ここでもSPARQLクエリを実行することができます。