java 实现搜索附近人功能

方案一:

现在很多手机软件都用附近搜索功能,但具体是怎么实现的呢》
在网上查了很多资料,mysql空间数据库、矩形算法、geohash我都用过了,当数据上了百万之后mysql空间数据库方法是最强最精确的(查询前100条数据只需5秒左右)。

接下来推出一个原创计算方法,查询速度是mysql空间数据库算法的2倍

$lng是你的经度,$lat是你的纬度

  1. SELECT lng,lat,
  2. ( POWER( MOD( ABS(lng - $lng), 360), 2) + POWER( ABS(lat - $lat), 2)) AS distance
  3. FROM `user_location`
  4. ORDER BY distance LIMIT 100
经测试,在100万数据中取前100条数据只需2.5秒左右。

####################################

另外的几种算法还是在这里展示一下:

一、距形算法

  1. define(EARTH_RADIUS, 6371);//地球半径,平均半径为6371km
  2. /**
  3. *计算某个经纬度的周围某段距离的正方形的四个点
  4. *
  5. *@param lng float 经度
  6. *@param lat float 纬度
  7. *@param distance float 该点所在圆的半径,该圆与此正方形内切,默认值为0.5千米
  8. *@return array 正方形的四个点的经纬度坐标
  9. */
  10. function returnSquarePoint($lng, $lat,$distance = 0.5){
  11. $dlng = 2 * asin(sin($distance / (2 * EARTH_RADIUS)) / cos(deg2rad($lat)));
  12. $dlng = rad2deg($dlng);
  13. $dlat = $distance/EARTH_RADIUS;
  14. $dlat = rad2deg($dlat);
  15. return array(
  16. 'left-top'=>array('lat'=>$lat + $dlat,'lng'=>$lng-$dlng),
  17. 'right-top'=>array('lat'=>$lat + $dlat, 'lng'=>$lng + $dlng),
  18. 'left-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng - $dlng),
  19. 'right-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng + $dlng)
  20. );
  21. }
  22. //使用此函数计算得到结果后,带入sql查询。
  23. $squares = returnSquarePoint($lng, $lat);
  24. $info_sql = " select id,locateinfo,lat,lng from `lbs_info` where lat<> 0 and lat>{$squares[ 'right-bottom'][ 'lat']} and lat<{$squares[ 'left-top'][ 'lat']} and lng>{$squares[ 'left-top'][ 'lng']} and lng<{$squares[ 'right-bottom'][ 'lng']} ";

java代码如下:

  1. /**
  2. * 默认地球半径
  3. */
  4. private static double EARTH_RADIUS = 6371;
  5. /**
  6. * 计算经纬度点对应正方形4个点的坐标
  7. *
  8. * @param longitude
  9. * @param latitude
  10. * @param distance
  11. * @return
  12. */
  13. public static Map<String, double[]> returnLLSquarePoint( double longitude,
  14. double latitude, double distance) {
  15. Map<String, double[]> squareMap = new HashMap<String, double[]>();
  16. // 计算经度弧度,从弧度转换为角度
  17. double dLongitude = 2 * (Math.asin(Math.sin(distance
  18. / ( 2 * EARTH_RADIUS))
  19. / Math.cos(Math.toRadians(latitude))));
  20. dLongitude = Math.toDegrees(dLongitude);
  21. // 计算纬度角度
  22. double dLatitude = distance / EARTH_RADIUS;
  23. dLatitude = Math.toDegrees(dLatitude);
  24. // 正方形
  25. double[] leftTopPoint = { latitude + dLatitude, longitude - dLongitude };
  26. double[] rightTopPoint = { latitude + dLatitude, longitude + dLongitude };
  27. double[] leftBottomPoint = { latitude - dLatitude,
  28. longitude - dLongitude };
  29. double[] rightBottomPoint = { latitude - dLatitude,
  30. longitude + dLongitude };
  31. squareMap.put( "leftTopPoint", leftTopPoint);
  32. squareMap.put( "rightTopPoint", rightTopPoint);
  33. squareMap.put( "leftBottomPoint", leftBottomPoint);
  34. squareMap.put( "rightBottomPoint", rightBottomPoint);
  35. return squareMap;
  36. }
二、 空间数据库算法

以下location字段是跟据经纬度来生成的空间数据,如:
location字段的type设为point
"update feed set location=GEOMFROMTEXT('point({$lat} {$lng})') where id='{$id}'"

mysql空间数据查询

  1. SET @center = GEOMFROMTEXT( 'POINT(35.801559 -10.501577)');
  2. SET @radius = 4000;
  3. SET @bbox = CONCAT( 'POLYGON((',
  4. X(@center) - @radius, ' ', Y(@center) - @radius, ',',
  5. X(@center) + @radius, ' ', Y(@center) - @radius, ',',
  6. X(@center) + @radius, ' ', Y(@center) + @radius, ',',
  7. X(@center) - @radius, ' ', Y(@center) + @radius, ',',
  8. X(@center) - @radius, ' ', Y(@center) - @radius, '))'
  9. );
  10. SELECT id,lng,lat,
  11. SQRT( POW( ABS( X(location) - X(@center)), 2) + POW( ABS(Y(location) - Y(@center)), 2 )) AS distance
  12. FROM `user_location` WHERE 1= 1
  13. AND INTERSECTS( location, GEOMFROMTEXT(@bbox) )
  14. AND SQRT( POW( ABS( X(location) - X(@center)), 2) + POW( ABS(Y(location) - Y(@center)), 2 )) < @radius
  15. ORDER BY distance LIMIT 20

geo算法

参考文档:

http://blog.csdn.net/wangxiafghj/article/details/9014363geohash  算法原理及实现方式
http://blog.charlee.li/geohash-intro/  geohash:用字符串实现附近地点搜索
http://blog.sina.com.cn/s/blog_7c05385f0101eofb.html    查找附近点--Geohash方案讨论
http://www.wubiao.info/372        查找附近的xxx 球面距离以及Geohash方案探讨
http://en.wikipedia.org/wiki/Haversine_formula       Haversine formula球面距离公式
http://www.codecodex.com/wiki/Calculate_Distance_Between_Two_Points_on_a_Globe   球面距离公式代码实现
http://developer.baidu.com/map/jsdemo.htm#a6_1   球面距离公式验证  
http://www.wubiao.info/470     Mysql or Mongodb LBS快速实现方案


geohash有以下几个特点:

首先,geohash用一个字符串表示经度和纬度两个坐标。某些情况下无法在两列上同时应用索引 (例如MySQL 4之前的版本,Google App Engine的数据层等),利用geohash,只需在一列上应用索引即可。

其次,geohash表示的并不是一个点,而是一个矩形区域。比如编码wx4g0ec19,它表示的是一个矩形区域。 使用者可以发布地址编码,既能表明自己位于北海公园附近,又不至于暴露自己的精确坐标,有助于隐私保护。

第三,编码的前缀可以表示更大的区域。例如wx4g0ec1,它的前缀wx4g0e表示包含编码wx4g0ec1在内的更大范围。 这个特性可以用于附近地点搜索。首先根据用户当前坐标计算geohash(例如wx4g0ec1)然后取其前缀进行查询 (SELECT * FROM place WHERE geohash LIKE 'wx4g0e%'),即可查询附近的所有地点。

查找附近网点geohash算法及实现 (Java版本),geohashjava


Geohash比直接用经纬度的高效很多。

Geohash算法实现(Java版本)

  1. package com.DistTest;
  2. import java.util.BitSet;
  3. import java.util.HashMap;
  4. public class Geohash {
  5. private static int numbits = 6 * 5;
  6. final static char[] digits = { '0', '1', '2', '3', '4', '5', '6', '7', '8',
  7. '9', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm', 'n', 'p',
  8. 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z' };
  9. final static HashMap<Character, Integer> lookup = new HashMap<Character, Integer>();
  10. static {
  11. int i = 0;
  12. for ( char c : digits)
  13. lookup.put(c, i++);
  14. }
  15. public double[] decode(String geohash) {
  16. StringBuilder buffer = new StringBuilder();
  17. for ( char c : geohash.toCharArray()) {
  18. int i = lookup.get(c) + 32;
  19. buffer.append( Integer.toString(i, 2).substring( 1) );
  20. }
  21. BitSet lonset = new BitSet();
  22. BitSet latset = new BitSet();
  23. //even bits
  24. int j = 0;
  25. for ( int i= 0; i< numbits* 2;i+= 2) {
  26. boolean isSet = false;
  27. if ( i < buffer.length() )
  28. isSet = buffer.charAt(i) == '1';
  29. lonset.set(j++, isSet);
  30. }
  31. //odd bits
  32. j= 0;
  33. for ( int i= 1; i< numbits* 2;i+= 2) {
  34. boolean isSet = false;
  35. if ( i < buffer.length() )
  36. isSet = buffer.charAt(i) == '1';
  37. latset.set(j++, isSet);
  38. }
  39. //中国地理坐标:东经73°至东经135°,北纬4°至北纬53°
  40. double lon = decode(lonset, 70, 140);
  41. double lat = decode(latset, 0, 60);
  42. return new double[] {lat, lon};
  43. }
  44. private double decode(BitSet bs, double floor, double ceiling) {
  45. double mid = 0;
  46. for ( int i= 0; i<bs.length(); i++) {
  47. mid = (floor + ceiling) / 2;
  48. if (bs.get(i))
  49. floor = mid;
  50. else
  51. ceiling = mid;
  52. }
  53. return mid;
  54. }
  55. public String encode(double lat, double lon) {
  56. BitSet latbits = getBits(lat, 0, 60);
  57. BitSet lonbits = getBits(lon, 70, 140);
  58. StringBuilder buffer = new StringBuilder();
  59. for ( int i = 0; i < numbits; i++) {
  60. buffer.append( (lonbits.get(i))? '1': '0');
  61. buffer.append( (latbits.get(i))? '1': '0');
  62. }
  63. return base32(Long.parseLong(buffer.toString(), 2));
  64. }
  65. private BitSet getBits(double lat, double floor, double ceiling) {
  66. BitSet buffer = new BitSet(numbits);
  67. for ( int i = 0; i < numbits; i++) {
  68. double mid = (floor + ceiling) / 2;
  69. if (lat >= mid) {
  70. buffer.set(i);
  71. floor = mid;
  72. } else {
  73. ceiling = mid;
  74. }
  75. }
  76. return buffer;
  77. }
  78. public static String base32(long i) {
  79. char[] buf = new char[ 65];
  80. int charPos = 64;
  81. boolean negative = (i < 0);
  82. if (!negative)
  83. i = -i;
  84. while (i <= - 32) {
  85. buf[charPos--] = digits[( int) (-(i % 32))];
  86. i /= 32;
  87. }
  88. buf[charPos] = digits[( int) (-i)];
  89. if (negative)
  90. buf[--charPos] = '-';
  91. return new String(buf, charPos, ( 65 - charPos));
  92. }
  93. }




球面距离公式:

  1. package com.DistTest;
  2. public class Test{
  3. private static final double EARTH_RADIUS = 6371000; //赤道半径(单位m)
  4. /**
  5. * 转化为弧度(rad)
  6. * */
  7. private static double rad(double d)
  8. {
  9. return d * Math.PI / 180.0;
  10. }
  11. /**
  12. * 基于googleMap中的算法得到两经纬度之间的距离,计算精度与谷歌地图的距离精度差不多,相差范围在0.2米以下
  13. * @param lon1 第一点的精度
  14. * @param lat1 第一点的纬度
  15. * @param lon2 第二点的精度
  16. * @param lat3 第二点的纬度
  17. * @return 返回的距离,单位m
  18. * */
  19. public static double GetDistance(double lon1,double lat1,double lon2, double lat2)
  20. {
  21. double radLat1 = rad(lat1);
  22. double radLat2 = rad(lat2);
  23. double a = radLat1 - radLat2;
  24. double b = rad(lon1) - rad(lon2);
  25. double s = 2 * Math.asin(Math.sqrt(Math.pow(Math.sin(a/ 2), 2)+Math.cos(radLat1)*Math.cos(radLat2)*Math.pow(Math.sin(b/ 2), 2)));
  26. s = s * EARTH_RADIUS;
  27. s = Math.round(s * 10000) / 10000;
  28. return s;
  29. }
  30. public static void main(String []args){
  31. double lon1= 109.0145193757;
  32. double lat1= 34.236080797698;
  33. double lon2= 108.9644583556;
  34. double lat2= 34.286439088548;
  35. double dist;
  36. String geocode;
  37. dist=Test.GetDistance(lon1, lat1, lon2, lat2);
  38. System.out.println( "两点相距:" + dist + " 米");
  39. Geohash geohash = new Geohash();
  40. geocode=geohash.encode(lat1, lon1);
  41. System.out.println( "当前位置编码:" + geocode);
  42. geocode=geohash.encode(lat2, lon2);
  43. System.out.println( "远方位置编码:" + geocode);
  44. }
  45. //wqj7j37sfu03h2xb2q97
  46. /*
  47. 永相逢超市
  48. 108.83457500177
  49. 34.256981052624
  50. wqj6us6cmkj5bbfj6qdg
  51. s6q08ubhhuq7
  52. */
  53. }



附近网点距离排序


  1. package com.DistTest;
  2. import java.sql.DriverManager;
  3. import java.sql.ResultSet;
  4. import java.sql.SQLException;
  5. import java.sql.Connection;
  6. import java.sql.Statement;
  7. public class sqlTest {
  8. public static void main(String[] args) throws Exception {
  9. Connection conn = null;
  10. String sql;
  11. String url = "jdbc:mysql://132.97.**.**/test?"
  12. + "user=***&password=****&useUnicode=true&characterEncoding=UTF8";
  13. try {
  14. Class.forName( "com.mysql.jdbc.Driver"); // 动态加载mysql驱动
  15. // System.out.println("成功加载MySQL驱动程序");
  16. // 一个Connection代表一个数据库连接
  17. conn = DriverManager.getConnection(url);
  18. // Statement里面带有很多方法,比如executeUpdate可以实现插入,更新和删除等
  19. Statement stmt = conn.createStatement();
  20. sql = "select * from retailersinfotable limit 1,10";
  21. ResultSet rs = stmt.executeQuery(sql); // executeQuery会返回结果的集合,否则返回空值
  22. double lon1= 109.0145193757;
  23. double lat1= 34.236080797698;
  24. System.out.println( "当前位置:");
  25. int i= 0;
  26. String[][] array = new String[ 10][ 3];
  27. while (rs.next()){
  28. //从数据库取出地理坐标
  29. double lon2=Double.parseDouble(rs.getString( "Longitude"));
  30. double lat2=Double.parseDouble(rs.getString( "Latitude"));
  31. //根据地理坐标,生成geohash编码
  32. Geohash geohash = new Geohash();
  33. String geocode=geohash.encode(lat2, lon2).substring( 0, 9);
  34. //计算两点间的距离
  35. int dist=( int) Test.GetDistance(lon1, lat1, lon2, lat2);
  36. array[i][ 0]=String.valueOf(i);
  37. array[i][ 1]=geocode;
  38. array[i][ 2]=Integer.toString(dist);
  39. i++;
  40. // System.out.println(lon2+"---"+lat2+"---"+geocode+"---"+dist);
  41. }
  42. array=sqlTest.getOrder(array); //二维数组排序
  43. sqlTest.showArray(array); //打印数组
  44. } catch (SQLException e) {
  45. System.out.println( "MySQL操作错误");
  46. e.printStackTrace();
  47. } finally {
  48. conn.close();
  49. }
  50. }
  51. /*
  52. * 二维数组排序,比较array[][2]的值,返回二维数组
  53. * */
  54. public static String[][] getOrder(String[][] array){
  55. for ( int j = 0; j < array.length ; j++) {
  56. for ( int bb = 0; bb < array.length - 1; bb++) {
  57. String[] ss;
  58. int a1=Integer.valueOf(array[bb][ 2]); //转化成int型比较大小
  59. int a2=Integer.valueOf(array[bb+ 1][ 2]);
  60. if (a1>a2) {
  61. ss = array[bb];
  62. array[bb] = array[bb + 1];
  63. array[bb + 1] = ss;
  64. }
  65. }
  66. }
  67. return array;
  68. }
  69. /*打印数组*/
  70. public static void showArray(String[][] array){
  71. for( int a= 0;a<array.length;a++){
  72. for( int j= 0;j<array[ 0].length;j++)
  73. System.out.print(array[a][j]+ " ");
  74. System.out.println();
  75. }
  76. }
  77. }


一直在琢磨LBS,期待可以发现更好的方案。现在纠结了。

简单列举一下已经了解到的方案:
1.sphinx geo索引
2.mongodb geo索引
3.mysql sql查询
4.mysql+geohash
5.redis+geohash

然后列举一下需求:
1.实时性要高,有频繁的更新和读取
2.可按距离排序支持分页
3.支持多条件筛选(一个经纬度数据还包含其他属性,比如社交系统的性别、年龄)

方案简单介绍:
1.sphinx geo索引
支持按照距离排序,并支持分页。但是尝试mva+geo失败,还在找原因。
无法满足高实时性需求。(可能是不了解实时增量索引配置有误)
资源占用小,速度快

2.mongodb geo索引
支持按照距离排序,并支持分页。支持多条件筛选。
可满足实时性需求。
资源占用大,数据量达到百万级请流量在10w左右查询速度明显下降。

3.mysql+geohash/ mysql sql查询
不支持按照距离排序(代价太大)。支持分页。支持多条件筛选。
可满足实时性需求。
资源占用中等,查询速度不及mongodb。
且geohash按照区块将球面转化平面并切割。暂时没有找到跨区块查询方法(不太了解)。

4.redis+geohash
geohash缺点不再赘述
不支持距离排序。支持分页查询。不支持多条件筛选。
可满足实时性需求。
资源占用最小。查询速度很快。




方案二:


最近给andorid做后台查询数据功能,有一个需求是模仿微信的查找附近人功能。 数据库中存储每个用户的经纬度信息及用户信息,通过当前用户传递过来的经纬度查询这个用户半径N公里以内的用户信息。 


数据库表结构

表信息
表名 Mobile_User
mu_id 自增,主键
mu_u_id 用户表的ID 外键
mu_longitud 精度
mu_latitude 纬度
(还有其他的一些信息,这里就列举4个字段足矣)

首先需要一个方法,是把传递过来的经纬度按照半径N公里扩散,找出距离中心经纬度N公里的上下左右经纬度值。效果如图


以中心生成经纬度时 正上方和正下方的精度是不变的,只有纬度变化。 生成左右时道理一样,只有精度变化,纬度是不变的。

所以只需要生成上下的纬度,左右的精度就可以了。


  1. /**  
  2.      * 生成以中心点为中心的四方形经纬度  
  3.      *   
  4.      * @param lat 纬度  
  5.      * @param lon 精度  
  6.      * @param raidus 半径(以米为单位)  
  7.      * @return  
  8.      */    
  9.     public static double[] getAround(double lat, double lon, int raidus) {    
  10.     
  11.         Double latitude = lat;    
  12.         Double longitude = lon;    
  13.     
  14.         Double degree = (24901 * 1609) / 360.0;    
  15.         double raidusMile = raidus;    
  16.     
  17.         Double dpmLat = 1 / degree;    
  18.         Double radiusLat = dpmLat * raidusMile;    
  19.         Double minLat = latitude - radiusLat;    
  20.         Double maxLat = latitude + radiusLat;    
  21.     
  22.         Double mpdLng = degree * Math.cos(latitude * (Math.PI / 180));    
  23.         Double dpmLng = 1 / mpdLng;                 
  24.         Double radiusLng = dpmLng * raidusMile;     
  25.         Double minLng = longitude - radiusLng;      
  26.         Double maxLng = longitude + radiusLng;      
  27.         return new double[] { minLat, minLng, maxLat, maxLng };    
  28.     }  

这样四周的经纬度都已经生成了。    
下一步是查询数据库中和四周经纬度匹配的数据。 如果数据量很大的话会很耗时间,而且会很消耗流量。所以需要用到分页查询 

代码如下 


  1. select * from mobile_user   
  2.             where mu_latitude <> 0  
  3.             and mu_longitud > #left_lat#  
  4.             and mu_longitud < #right_lat#  
  5.             and mu_latitude > #down_lon#  
  6.             and mu_latitude < #top_lon#  
  7.             and mu_u_id <> #uid#  
  8.             order by ACOS(SIN((#lat# * 3.1415) / 180 ) * SIN((mu_latitude * 3.1415) / 180 )   
  9.             +COS((#lat# * 3.1415) / 180 ) * COS((mu_latitude * 3.1415) / 180 )   
  10.             *COS((#lon# * 3.1415) / 180 - (mu_longitud * 3.1415) / 180 ) )   
  11.             * 6380 asc limit #start#,#end#  

我用的是ibatis框架,sql里以#开始并结束的 是我传递过来的参数。  sql语句计算了每条数据和中心经纬度的距离并且以最近进行排序。  sql语句是根据下面的方法演变而来
方法是计算两个经纬度之间的直线距离。


  1. /**  
  2.      * 计算中心经纬度与目标经纬度的距离(米)  
  3.      *   
  4.      * @param centerLon  
  5.      *            中心精度  
  6.      * @param centerLan  
  7.      *            中心纬度  
  8.      * @param targetLon  
  9.      *            需要计算的精度  
  10.      * @param targetLan  
  11.      *            需要计算的纬度  
  12.      * @return 米  
  13.      */    
  14.     private static double distance(double centerLon, double centerLat, double targetLon, double targetLat) {    
  15.     
  16.         double jl_jd = 102834.74258026089786013677476285;// 每经度单位米;    
  17.         double jl_wd = 111712.69150641055729984301412873;// 每纬度单位米;    
  18.         double b = Math.abs((centerLat - targetLat) * jl_jd);    
  19.         double a = Math.abs((centerLon - targetLon) * jl_wd);    
  20.         return Math.sqrt((a * a + b * b));    
  21.     }   


这样既实现了分页处理,又实现了每条数据的经纬度与中心经纬度的直线距离(以米为单位)。   
  
最后就是组成json数组返回给Android使用了。

以下有一些网上的参考:

Symfony2+Doctrine2 ODM+MongoDB的组合:http://www.infoq.com/cn/articles/depth-study-of-Symfony2


Java+redis实现附近的人: http://blog.csdn.net/liaodehong/article/details/59104451   

Java+MySQL实现附近的人:http://blog.csdn.net/hylexus/article/details/78734745





https://blog.csdn.net/lchq1995/article/details/70212644

猜你喜欢

转载自blog.csdn.net/varyall/article/details/80978616