地理空間インデックスの概要
MongoDBでは、地理情報をデータとして登録し、地理空間インデックスを作成することにより、位置情報を利用した検索クエリが可能になります。たとえば、山手線の駅の地理情報をMongoDBに登録して、地理情報インデックスを張っておけば、自分のいる場所から近い順に山手線の駅を検索するということが可能となります。
MongoDBの地理空間インデックスは、バージョン1.4という非常に早い時期からサポートされており、人気サイトであるfoursquareで使用されているという実績を持っています。
こちらに、地理空間インデックスに関する開発の歴史をまとめました。
バージョン | リリースされた機能 |
1.4 | 地理空間インデックスをサポート |
1.8 | 球面空間でのクエリをサポート |
2.4 | GeoJSONオブジェクトをサポート[1] |
それではさっそく地理空間インデックスを使ってみましょう。
シンプルなデータで地理空間インデックスを使ってみる
2dインデックスの作成
地理空間インデックスを使うためには、2dインデックスという特別なインデックスの作成が必要となります。以下のクエリで、yamanotesenコレクションのlocフィールドに2dインデックスを作成します。
次にデータのinsertを行います。
データの準備
地理空間インデックスを使うため、経度・緯度の情報を含めたデータを挿入します。今回は山手線の7つの駅を使用しました。
駅 | 経度 | 緯度 |
五反田 | 139.723822 | 35.625974 |
恵比寿 | 139.710070 | 35.646685 |
新宿 | 139.700464 | 35.689729 |
新大久保 | 139.700261 | 35.700875 |
池袋 | 139.711086 | 35.730256 |
上野 | 139.777043 | 35.713790 |
品川 | 139.738999 | 35.628760 |
経度・緯度は配列またはハッシュとして保存します。今回はlocというフィールドに配列として保存します。yamanotesenというコレクションにinsertするクエリは、以下のようになります。
準備は整いましたので、いよいよ検索してみましょう。
近傍を検索するクエリ
近傍の検索には、$nearオペレータを使用します。今回は渋谷駅[ 139.701238, 35.658871 ]から近い順に3つの駅を取得してみましょう。クエリは、このようになります。
今回準備した7つの駅で、渋谷駅から近い駅上位3件の結果はこのようになりました(_idの表示は省略しています)。
検索結果の詳細情報取得
geoNearコマンドを使用することで、オブジェクトまでの距離と、いくつかの統計情報を取得することができます。
resultsフィールドで返される配列内のdisフィールドが距離になります。今回は渋谷駅から恵比寿駅までの距離が0.015050010631232593となっています。これは、平面空間上における、座標[ 139.701238, 35.658871 ]と 座標[ 139.710070, 35.646685 ]の2点間の距離です。
経度・緯度の1度の距離を乗することで、実際の距離を計算することが可能です。正確な値ではありません[3]が、今回は経度・緯度の1度を全て111.262283kmとして計算してみますと、
0.015050010631232593×111.262283=約1.7km
となります。
地球は球面なので平面空間で計算すると誤差が出てしまいます。MongoDBは球面空間でのクエリもサポートしていますので、次は球面空間で計算してみましょう。
地球の球面を考慮したクエリ
球面空間で近傍の検索には、$nearSphereオペレータを使用します。使い方は$nearオペレータと同じです。
球面空間でgeoNearコマンドを使用するには、runCommandの中にspherical:trueというオプションを追加します。
spherical:trueとしてgeoNearコマンドを使用すると、disフィールドは0.0002468278845577094となりました。単位はラジアンなので、地球の半径距離6378kmを乗することで実際の距離になります。
0.0002468278845577094×6378=約1.5km
渋谷駅と恵比寿駅の直線距離として、かなり現実に近い数値が取得できることがわかりました。
範囲内の検索
$geoWithinオペレータ[4]と以下のオペレータを使用することで、指定範囲内のドキュメントや、指定点から円形範囲のドキュメントを取得できます。
オペレータ | 用途 |
$box | 指定した四角形内のドキュメントを取得 |
$polygon | 指定した多角形内のドキュメントを取得 |
$center | 中心と半径を指定した円内のドキュメントを取得 |
$centerSphere | 球面空間での$center |
GeoJSONで地理空間インデックスを使ってみる
バージョン2.4からGeoJSONがサポートされました。GeoJSONは、空間上で点や直線や多角形という図形を扱うためのフォーマットです。GeoJSONを使用することで、交差する図形の検索ができるようになりました。また、これまでに紹介した近傍の検索も可能です。概要に関しては、この連載の前回(第8回「リリース間近! MongoDB 2.4の新機能」)で紹介しましたので、今回はインデックスの作成と、交差する図形の検索クエリを紹介します。
2dsphereインデックスの作成
GeoJSONを使用するには、これまで使用していた2dインデックスではなく、2dsphereインデックスを使用します。geojsonコレクションのgeoフィールドに2dsphereインデックスを作成するクエリは、このようになります。
GeoJSONオブジェクトのinsert
今回はGeoJSONオブジェクトの一つである、LineStringを使用します。これは空間に直線を表現するオブジェクトです。3つのLineStringをinsertしてみます。
上記のクエリにより、図1のように垂直な直線が3本ある状態となりました。
交差する図形の検索
交差するGeoJSONオブジェクトを検索するには$geoIntersectsオペレータを使用します。上の3本の直線に対して、水平な直線[ [ 0, 5 ], [ 12, 5 ] ]を引き、交差するオブジェクトを検索してみます。
クエリはこのようになります。
検索結果には、横の直線と交差しているオブジェクトであるtate05とtate10の2つが返ってきました。
次回のテーマ
今回はMongoDBの特徴的な機能の一つである地理空間インデックスについて紹介いたしました。すでに多くの位置情報を利用したサービスで使用されていましたが、バージョン2.4でGeoJSONをサポートしたことにより、さらに使用範囲が広くなりました。今後も、位置情報を利用する際の選択肢として、MongoDBは有力な候補となりそうです。
次回はMongoDBでのMap/Reduceについて紹介する予定です。