RDFストア環境構築(Virtuoso編)1

この記事は1年以上前に書かれました。
内容が古くなっている可能性がありますのでご注意下さい。


これから数回に亘って、RDF(Resource Description Framework)のデータを格納してSPARQLエンドポイントを提供するRDFストアの環境構築について解説します。
第1回は、OpenLink Software社のVirtuosoの環境を構築します。

OpenLink Virtuosoには、商用版とオープンソース版(GPLv2ライセンス)があります。今回使用するのは、もちろんオープンソース版です。インストール先のOSはLinuxとし、ディストリビューションはCentOS 6.5を選択しました。Virtuosoは、LinuxのほかにWindowsとMac OS Xでも動作します。

CentOSにVirtuosoをインストールする場合、GitHubからソースコードを入手してビルドすることになります。開発環境がない場合は、yumでインストールします。

# yum install gcc gmake autoconf automake libtool flex bison gperf gawk m4 make openssl-devel readline-devel git

次に、GitHubからソースコードを入手します。

$ git clone git://github.com/openlink/virtuoso-opensource.git

あとは、お決まりの手順となります。

$ cd virtuoso-opensource
$ ./autogen.sh
$ ./configure --prefix=/usr/local/ --with-readline 
$ make
# make install

ビルドが終了したら、以下のコマンドでVirtuosoを起動します。

# virtuoso-t +configfile /usr/local/var/lib/virtuoso/db/virtuoso.ini

Virtuosoを起動したら、ブラウザでポート8890に接続します。

このような画面が表示されればOKです。
左側のメニュー最上部にあるConductorのリンクをクリックすると、アカウントとパスワードの入力を求められます。デフォルトでdbaとdavの2つのアカウントが用意されており、パスワードはアカウントと同じです。

Conductorにログインすると、Virtuosoを管理できるようになります。

Conductor画面の「Linked Data」タブをクリックすると、SPARQLクエリの実行画面になります。試しに、以下のクエリ

select * where {
?s ?p ?o.
}
limit 100

を実行すると、

あらかじめデータが入っていることが分かります。

Conductorにログインしなくても、ポート8890の/sparqlに接続すると、

DBpedia Japaneseなどで見覚えのあるSPARQLエンドポイントの画面が表示され、ここでもSPARQLクエリを実行することができます。

RDFストア環境構築 123