Wikimedia Commonsを用いた石造物3Dデータの公開と共有

Wikimedia Advent Calendar 2020 | 17日目

この記事は3月に開催予定でコロナ禍により中止されたイベントの予稿集原稿として2月に執筆したものです。

はじめに
筆者はフォトグラメトリで作成した石造物の3Dモデルを二次利用可能なオープンデータとしてWikimedia Commons(https://commons.wikimedia.org/ 以下コモンズと記す)で公開する活動を2019年7月に開始した。当初の主な目的は、ウィキペディアの記事で3Dモデルを使用することにより、記事内容の理解に役立てることであった。以前から郷土史関係のウィキペディア記事を執筆しており、石造物の写真を用いることがあったが、一枚の写真で伝えられる情報量は少なく、限界を感じていた。例えば角柱型の石造物では、正面の主銘文以外の紀年銘や地名は側面や背面に刻まれていることが多い。そこで、3Dモデルの情報量と表現力に可能性を見出したのである。
2019年11月からは、3Dモデルに加えて各石造物のメタ情報(緯度経度や銘文・刻像などの情報)をGitHubで公開し、GitHub Pagesを用いてマップ上に表示する「石造物3Dアーカイブ」プロジェクト(https://stonework-3d-archive.github.io/)として、より多くのデータの作成と蓄積を目指し、草の根の活動ながらも発展的に継続をしている(篠田・小池 2020)。さらに現在では、メタ情報を構造化データ(Linked Open Data)としてウィキデータ(https://www.wikidata.org/)にも格納している。


図1 石造物3Dアーカイブのマップ(ポップアップからコモンズにリンクしている)

本稿では、石造物3Dデータの公開と共有にコモンズを用いる理由について記し、その意義について考察する。

なぜコモンズを用いるのか
インターネットの普及に伴って個人による情報発信は非常に容易かつ高度なものになった。1990年代の後半には、インターネットサービスプロバイダ(ISP)が会員に提供する無料ホームページサービスを使用するのが主であり、筆者も1995年に個人ホームページを開設している。しかし、中小ISPの淘汰とともに多くの個人ホームページが失われ、2019年3月の「Yahoo!ジオシティーズ」サービス終了が追い打ちをかけることになった。一方で、2000年代には無料のブログサービスが普及して個人による情報発信の主流となったが、2019年12月の「Yahoo!ブログ」サービス終了の衝撃は記憶に新しい。インターネットにおける個人による情報発信は継続性の乏しいものであり、多くの貴重な情報が儚くも失われてしまった。
3Dモデリングの普及により、個人が3Dモデルの公開に利用できる多くのサービスが誕生している。その中で有力なものとしてSketchfab(https://sketchfab.com/)が挙げられる。容量制限があるものの無料で利用することができ、多くのファイル形式に対応し、モバイルブラウザやSNSでも閲覧することができ、ユーザー数や登録された3Dモデルの数も多い。しかし、スタートアップ企業が運営するサービスという点では不安が残る。これまでも多くのスタートアップが淘汰されたり大企業に飲み込まれたりするのを目にし、その大企業ですら、いとも簡単にサービスを閉じてしまう。
自力で公開環境を用意するのはどうだろうか。安価なレンタルサーバとPotree(http://potree.org/)のようなオープンソースソフトウェアを利用すれば可能である。しかし、一個人による運営では継続性の保証は難しく、「石造物3Dアーカイブ」のようなプロジェクトであっても、安定した運営基盤を築くことは容易ではない。
継続性という観点において、コモンズを利用するのが最も現実的な解であると考えている。コモンズを運営しているウィキメディア財団は2003年に設立された非営利団体であり、長い歴史を持つとは云い難いが、ウィキペディアを始めとする多くのウィキメディア・プロジェクトを運営し、無料かつ広告なしでコンテンツを提供している。広告収入に頼る多くのインターネットサービスとは一線を画し、個人や財団等からの寄付によって運営することにより、特定企業の影響を排除しながらも安定した運営基盤を築いている。ウィキメディア財団は米国に拠点を置いているが、その他の多くの国にローカルチャプターが存在し、独自の資産を持って運用され、ウィキメディア財団の活動を支援している(ただし、日本ではまだローカルチャプターは設立されていない)。

とはいえ、100パーセント確実ということはあり得ない。ウィキメディア・プロジェクトが何らかの理由で閉鎖されることが絶対にないと言い切ることはできない。そのような場合に参考になるのは、日本政府が公開していたオープンデータのカタログサイト「DATA.GO.JP」試行版の突然の公開停止である。2013年12月に公開され、オープンデータ活用の機運の高まりとともにアクセスが増えていたサイトが、予算年度の切り替った2014年4月に停止してしまったのである。このときは、研究者が停止前に保存していたデータを元にミラーサイト「DATAGO.JP」を構築することにより急場をしのぎ(林 雅之 2014)、10月にはDATA.GO.JPの正式版(https://www.data.go.jp/)が公開された。
また、2016年の米国では、地球温暖化に懐疑的なトランプ政権によって気候データベースが削除されてしまうことに対する危惧から、データをアーカイブする草の根の運動が広がった(ジェームス・テンプル 2017)。
このような取り組みが可能になったのは、データが二次利用可能なライセンスで提供されていたからであり、データの継続性のためにはライセンスも重要であると言うことができる。

コモンズのライセンス
コモンズが採用しているライセンスは、クリエイティブ・コモンズ(Creative Commons、略称CC)が策定したクリエイティブ・コモンズ・ライセンス(CCライセンス)である。CCは、著作物を第三者にも再利用可能にするためのライセンスを策定する団体であり、ウィキメディア財団やウィキメディア・コモンズとの直接の関係はない。
コモンズでファイルをアップロードする際に、適用するライセンスの種類を選択するようになっている。ここで選択できるのは、図2のライセンス選択画面に挙げられた5種類のいずれかである。「サイトで推奨されるライセンス」は、現時点(2020年2月10日時点。以降も同様)では「クリエイティブ・コモンズ表示4.0」である。このライセンスはCC BY 4.0と呼ばれ、ライセンス条項の公式翻訳をCCのWebサイト(https://creativecommons.org/licenses/by/4.0/legalcode.ja)で読むことができる。


図2 コモンズのライセンス選択画面

CCライセンスには、この他にも非営利や改変禁止といった条件の付いたものもあるが、コモンズでは使用することができない。なぜなら、それらのライセンスは二次利用可能な範囲を制限してしまうからである。
二次利用可能であるということは、公開されている3Dモデルを単にコモンズの中で閲覧するのみではなく、商用/非営利を問わずに誰でも自由に再配布することができ、加工をして様々な方法で活用することによって、オリジナルにはなかった新しい価値が生み出される可能性があることを意味する。

コモンズのメリットとデメリット
コモンズは誰でも無料で利用することができ、個々のファイルについてはサイズ制限があるものの、アップロードできるファイルの数や総ファイル容量についての制限はない。しかし、どのような内容のファイルでも良いというわけではなく、「教育的なメディア資料」でなければならない。
また、メディアの種類毎に利用できるファイル形式が規定されており、3Dモデルの場合、現時点ではSTL形式のみである。コモンズで許容されているのは「自由なファイル形式」のみであり、有料のプログラムを使用しないと閲覧できなかったり、特許の使用料が必要になるファイル形式は許容されていない。
インターネットの普及期に多く利用されたGIFファイルに関して、データ圧縮に使用しているLZWアルゴリズムの使用料を請求するとユニシス社が唐突に宣言して大きな混乱が生じたことがある。その後、特許の失効によってGIFは自由に使えるフォーマットとなりコモンズでも許容されているが、そのような問題を生じさせないために、利用できるファイル形式の限定は必要である。
コモンズのメリットとして、特別なプログラムやプラグインを使用せずにWebブラウザだけで3Dモデルを閲覧できるということも挙げることができる。ただし、現時点ではモバイル版のブラウザでは3Dモデルを回転したりズームすることはできない。
デメリットとしては、現時点では最大100メガバイトというサイズ制限と、STLファイルの仕様上、テクスチャの情報が失われてしまうということが挙げられる。ファイルサイズを縮小するためにメッシュ数を削減すると、必然的に細部の情報が失われることになる。しかし、それでも願文や紀年銘などの主たる銘文が読めなくなるということはなく、造立に関わった講員の名前が多数列挙されている場合に、若干読みにくくなる程度である。
テクスチャが失われることによるデメリットとしては、石造物の場合には色や質感による石材の判別ができなくなることが大きい。その一方で、銘文や刻像はカビや苔などの汚れの影響をなくすことによってかえって見やすくなることが多い。また、屋外にある石造物を晴天時に撮影すると、四角柱型の場合は必ずどこか一つの面は逆光となり見辛いものになってしまうが、テクスチャのない3Dモデルでは順光で撮影した面と同様のクオリティで見ることができる。
図3はSketchfabで公開しているテクスチャの付いた石造物の3Dモデルである(https://skfb.ly/6QttW)。図4は同じ3DモデルをSTL形式にしてコモンズで公開したものであり、テクスチャは失われている(https://commons.wikimedia.org/wiki/File:七夜待塔(苦林古墳).stl)。同じ石造物の同じ面(背面)を表示させているが、テクスチャのある図3では光は後方(正面側)斜めから当たって逆光になっており、大きな白カビも影響して銘文を読むことは困難である。一方で図4では光は前方斜めから当たり、ノイズとなる汚れもなく銘文をはっきりと読むことができる。


図3 Sketchfabで公開した3Dモデル


図4 コモンズで公開した3Dモデル

ウィキペディアでの利用
石造物の3Dモデル作成を始めた当初の目的がウィキペディアの記事での使用にあったことは、本稿の最初に述べたとおりである。当然のことながら、同じウィキメディア・プロジェクトにあるウィキペディアとコモンズは相性が良い。3Dモデルを効果的に使用することは、単に記事内容の理解に役立つだけではなく、「教育的なメディア資料」としての3Dモデルの有用性を知らしめ、その普及にも役立つものと考えている。そこで、いくつかの記事における3Dモデルの活用方法を紹介する。

「地神塔」(https://ja.wikipedia.org/wiki/地神塔)の記事で解説している「五神名地神塔」は、五角柱に「埴安媛命 倉稲魂命 大己貴命 天照大神 少彦名命」の五神名(塔によって表記には差異がある)を刻むユニークな石塔である。六角柱の石塔は六地蔵石幢などで見ることがあるが、五角柱というのは珍しい。しかし、五角柱であること写真で伝えるのは難しい。上から見下ろすアングルで撮影しなければならず、そうすると刻まれた文字を読むことが困難になってしまう。また、すべての神名を読めるようにするには、複数枚の写真を用意しなければならない。3Dモデルを用いれば、これらの問題は解決する。モデルを回転させて5つの面のそれぞれ確認し、視点を上に移動して五角柱であることを確認することができる。


図5 「地神塔」での3Dモデル利用例

八王子と横浜港を結ぶ「神奈川往還」(https://ja.wikipedia.org/wiki/神奈川往還)の記事には、八王子市鑓水にある道標の3Dモデルを掲載している。この道について、鑓水商人と呼ばれる絹商人の往来が盛んとなり絹の道と称されたと記事に書かれており、道標には鑓水商人の像が彫られている。道標の正面には「此方 八王子」と刻まれ、左側面には「此方 はら町田 神奈川 ふじさわ」と刻まれている。八王子から横浜方面へ向かう商人や旅人は、この道標を見て左に向かったのだろう。記事と3Dモデルを合わせて見ることにより、当時の人々の旅をより身近なものとして理解することができる。


図6 「神奈川往還」での3Dモデル利用例

ウィキデータとの連携
ウィキデータもウィキメディアプロジェクトの一つである。近年、文化施設(GLAM:Gallery, Library, Archive, Museum)の収蔵物等をオープンデータ化するOpenGLAMの活動が盛んになっており、その一環としてコモンズとウィキデータを活用する事例が増えている。ウィキデータに入力しておけば、後述するWikidata Query Serviceを使用して特定の条件に当てはまる石造物を検索することも容易になる。
そこで、コモンズで公開している石造物のメタ情報(緯度経度や銘文・刻像などの情報)は、ウィキデータにも格納し、コモンズとウィキデータを相互にリンクさせている。


図7 コモンズからウィキデータへのリンクhttps://commons.wikimedia.org/wiki/File:七夜待塔(苦林古墳).stl


図8 ウィキデータからコモンズへのリンクhttps://www.wikidata.org/wiki/Q81015075

コモンズからウィキデータへは、「構造化データ」タブの「題材」プロパティ(P180)からリンクする(図7)。ウィキデータからコモンズへは、「3Dモデル」プロパティ(P4896)からリンクする。P180やP4896はウィキデータにおけるプロパティの識別子である。識別子は不変だが、「題材」や「3Dモデル」などの「ラベル」は変更することができる。

ウィキデータでは、項目(図8の例では、Q81015075)についてのデータを、プロパティと値のペアで入力する。値は、数値や文字列で入力する場合もあるが、項目で入力することが多い。プロパティの種類によって、入力可能な値の型が規定されている。
石造物に刻まれた文字は、くずし字や旧字体、異体字を使用していることが多く、慣れていないと読むのが難しい。そこで、「銘」プロパティ(P1684)を使用してデータ化している。図9の例では、「ぐミやうじ道」(弘明寺道)という現在では使われない表記法が使用されている。


図9 ウィキデータへの入力例https://www.wikidata.org/wiki/Q81947026

プロパティと値のペア(ウィキデータの用語では「主張(claim)」という)には、「修飾子(qualifier)」を付与することができる。修飾子もプロパティと値のペアで入力する。図9の例では、修飾子「あてはまる部分(P518)」を使用して銘文の刻まれた位置を、「オブジェクトの役割(P3831)」を使用してその銘文の役割を示している。
「主張」には「情報源」を入力することが求められている。これは、ウィキペディアにおいて検証可能性のために出典の明示が求められているのと同様である。


図10 情報源の入力例https://www.wikidata.org/wiki/Q84021183

情報源を示すことは、単に利用者によるデータの検証を可能とするのみならず、出典にあたることによって芋づる式に多くの関連情報を引き出すことを可能にし、利用者にとってのメリットは多い。図10の例では、「牛久市史料 石造物編」という出典が示されており、牛久市にある他の石造物についての情報もこの文献を読めば得られることを推測できる。

Wikidata Query Serviceを用いた3Dモデルの検索
メタ情報をウィキデータに入力したことにより、コモンズで公開している3DモデルをWikidata Query Service(https://query.wikidata.org/)で検索することができる。Wikidata Query Serviceは構造化データの標準的なクエリ言語SPARQLを採用している。
図11の例では、「供養」の文字列を含む銘(P1684)を持つ石造物の3Dモデルを検索し、プレビュー画像の一覧形式で表示している。石橋供養塔のほか、二十三夜供養塔、庚申供養塔などがヒットしている。


図11 Wikidata Query Serviceを用いた検索例

この例は非常に単純な検索だが、より複雑なクエリを書くことにより、例えば紀年銘は右側と左側のどちらに刻まれることが多いのだろうか、時代や地域による違いはあるのだろうか、という疑問にも答えることができる。ただし、そのような検索を有用なものとするためには、より多くのデータが必要になることは言うまでもない。

まとめ
本稿では、石造物3Dデータの公開と共有にコモンズを用いる理由として、継続性とオープンライセンスを挙げた。対象としている石造物が数百年ものあいだ風雪に耐えてきたのに、そのデータが数年余りで失われてしまうようなことのないようにしたい。
また、せっかくデータがあっても活用されないのでは存在する意味がない。そこで、3Dデータの活用例としてウィキペディア記事での使用例を紹介した。
3Dデータの活用の幅は広い。3Dプリンタで出力すれば手にとって眺めることもでき、石造物をより身近に感じるだろう。オープンデータとして様々に活用されることにより、石造物に親しみを覚える人が増え、石造物の保護へと繋がることを願っている。
ウィキデータについては、コンピュータ・プログラムでの利用にも適することから、人工知能(AI)による活用なども考えられる。近年、AIを用いたくずし字認識が登場して注目を集めているが、紙に書かれたり印刷された文字を用いて学習したAIでは、石に刻まれた文字はうまく認識できないようである。ウィキデータと3Dモデルを利用して学習したAIの登場が期待される。

石造物3Dアーカイブ・プロジェクトでは、石造物3Dデータの作成とコモンズでの公開に協力して頂けるコントリビュータを募集している。石造物は日本各地に存在しており、非常に数が多く、地域によるバリエーションも豊富である。フォトグラメトリの題材としては、手頃なサイズのため初心者にも手掛けやすい。ぜひとも身近にある石造物の3Dデータを作成・公開し、地域の歴史と文化を未来へとつなげて頂きたい。

引用文献
篠田 浩輔・小池 隆 2020 「石造物3Dアーカイブプロジェクト―その手法と可能性―」『情報処理学会研究報告 人文科学とコンピュータ』122
林 雅之 2014 「日本政府のデータカタログサイト(試行版)「data.go.jp」の閉鎖に伴う仮サイト「datago.jp」の開設と今後」オルタナティブ・ブログ https://blogs.itmedia.co.jp/business20/2014/04/datagojpdatagoj-3b07.html (2020.2.20閲覧)
ジェームス・テンプル 2017 「米国政府の気候データ100TB以上を新政権から保護する動き」MIT Technology Review https://www.technologyreview.jp/s/22396/climate-data-preservation-efforts-mount-as-trump-takes-office/(2020.2.20閲覧)