オープンデータ」カテゴリーアーカイブ

「武相自由民権LOD」公開のお知らせ


三多摩地方を含む旧・神奈川県と埼玉県の自由民権運動における結社、人物、イベント、場所、地名をLinked Open Dataにして可視化した「武相自由民権LOD」を公開しました。
RDF/XML形式のデータをCC BYライセンスでGitHubで公開し、SPARQLエンドポイントも提供しています。
武相自由民権LOD」には、データモデルの解説とSPARQLクエリの例を掲載しています。SPARQLクエリの結果は、表やグラフ、ネットワーク、タイムライン、マップなど様々な形式で可視化しています。
この作品は、郷土史研究におけるLinked Open Data活用のProof of Conceptのために作成したものであり、LODチャレンジ2022応募作品でもあります。

AIによるデータエンリッチメント


データの利活用において分析や可視化の技術も大切ですが、まずはデータそのものが重要であることは言うまでもありません。そこで注目されているのがデータクレンジングとデータエンリッチメントです。
データクレンジングでは、欠損や重複を修正したり表記の統一や正規化をすることによってデータの品質を向上させます。データエンリッチメントでは、元のデータに情報を付加してより有用なものに拡張します。

今回は、月待塔のデータを集める月待ビンゴプロジェクトの成果である月待塔オープンデータを対象としてデータエンリッチメントを実施します。月待塔オープンデータに画像ファイルそのものは含まれませんが、画像ファイルのURLは含まれています。そこで、URLから画像をダウンロードしてAIにより物体検出した結果を元データに追加し、拡張されたデータを分析することによって得られた知見を紹介します。
続きを読む

資料公開のお知らせ


12月20日に開催されたLODチャレンジ2020オンライン授賞式シンポジウムにおいて、地域振興LOD賞を受賞した作品「失われた谷戸を求めて ~「谷戸のヨコハマ」データセット 」を紹介した際のプレゼン資料を公開しました。