オープンデータ」カテゴリーアーカイブ

AIによるデータエンリッチメント

データの利活用において分析や可視化の技術も大切ですが、まずはデータそのものが重要であることは言うまでもありません。そこで注目されているのがデータクレンジングとデータエンリッチメントです。
データクレンジングでは、欠損や重複を修正したり表記の統一や正規化をすることによってデータの品質を向上させます。データエンリッチメントでは、元のデータに情報を付加してより有用なものに拡張します。

今回は、月待塔のデータを集める月待ビンゴプロジェクトの成果である月待塔オープンデータを対象としてデータエンリッチメントを実施します。月待塔オープンデータに画像ファイルそのものは含まれませんが、画像ファイルのURLは含まれています。そこで、URLから画像をダウンロードしてAIにより物体検出した結果を元データに追加し、拡張されたデータを分析することによって得られた知見を紹介します。
続きを読む

資料公開のお知らせ


12月20日に開催されたLODチャレンジ2020オンライン授賞式シンポジウムにおいて、地域振興LOD賞を受賞した作品「失われた谷戸を求めて ~「谷戸のヨコハマ」データセット 」を紹介した際のプレゼン資料を公開しました。

Wikimedia Commonsを用いた石造物3Dデータの公開と共有

Wikimedia Advent Calendar 2020 | 17日目

この記事は3月に開催予定でコロナ禍により中止されたイベントの予稿集原稿として2月に執筆したものです。

はじめに
筆者はフォトグラメトリで作成した石造物の3Dモデルを二次利用可能なオープンデータとしてWikimedia Commons(https://commons.wikimedia.org/ 以下コモンズと記す)で公開する活動を2019年7月に開始した。当初の主な目的は、ウィキペディアの記事で3Dモデルを使用することにより、記事内容の理解に役立てることであった。以前から郷土史関係のウィキペディア記事を執筆しており、石造物の写真を用いることがあったが、一枚の写真で伝えられる情報量は少なく、限界を感じていた。例えば角柱型の石造物では、正面の主銘文以外の紀年銘や地名は側面や背面に刻まれていることが多い。そこで、3Dモデルの情報量と表現力に可能性を見出したのである。
2019年11月からは、3Dモデルに加えて各石造物のメタ情報(緯度経度や銘文・刻像などの情報)をGitHubで公開し、GitHub Pagesを用いてマップ上に表示する「石造物3Dアーカイブ」プロジェクト(https://stonework-3d-archive.github.io/)として、より多くのデータの作成と蓄積を目指し、草の根の活動ながらも発展的に継続をしている(篠田・小池 2020)。さらに現在では、メタ情報を構造化データ(Linked Open Data)としてウィキデータ(https://www.wikidata.org/)にも格納している。
続きを読む