
新智元报道
新智元报道
【新智元导读】任何一张照片,直接就能定位照片中的具体所在地,并呈现出对应的3D场景。GeoSpy使得这一切都成为了现实,但大家也都为此而感到隐私泄露的巨大风险和潜在危害。
在看刑侦片的时候,每当破案遇阻,你是否想象过,一种能够仅基于一张嫌疑人出现的场景照片,就即刻定位到场景所在地的具体经纬度的技术呢?
现在,这种想象,已然成为现实!
初创AI公司graylark发布了一项名为「GeoSpy」的系列产品,因其是一个革命性的照片地理定位系统,近来引发热议。
照片地理定位是什么?
照片地理定位是指仅根据图像的视觉内容确定图像拍摄地点的过程。它已成为计算机视觉中的一个关键领域,其应用范围涵盖安全、导航、社交媒体等多个方面。
早期照片地理定位方法主要关注简单任务,例如识别著名地标或使用嵌入图像中的元数据,如GPS坐标。
然而,研究人员很快意识到更广泛应用的潜力——从不含标志性地标的普通场景中确定位置。随着技术的进步,研究人员超越了元数据,开始分析图像的视觉内容,包括建筑风格、植被和道路标记。
照片地理定位背后的原理包括分析图像特征,如纹理、颜色以及植被、建筑和标牌等上下文元素。随着时间的推移,人工智能的进步和更大数据集的获取显著提高了这些系统的准确性和速度。
GeoSpy支持在参考数据集中没有匹配的图像时也能提供近似位置,非常适合千米范围内的更广泛地理定位任务。
而基于Superbolt的GeoSpy Pro则支持上传一张不带有任何标签数据(如地理位置、拍摄时间)的照片,就能定位到照片中的拍摄所在地,并结合地图给出3D实景。

体验链接:https://superbolt.geospy.ai/
如下图,用户上传了一张车内视角的照片后,它就可以直接定位到对应的地理位置,报告出所在城市和经纬度,甚至能直接给出对应建筑的3D实景地图。
而且还支持给出所查图片的相似图,以形成迁移连接。
看起来这么神奇的效果,是怎么做到的呢?
核心思想其实很简单:如果你用足够多的与真实地点相关的照片来训练一个AI系统,AI就可以学会识别需要人类花费数年才能掌握的微妙线索。
例如一些城市消防栓上使用的独特油漆颜色。虽然这个细节本身并不特别有用,但将其与照片中的可见街道名称或咖啡店招牌结合起来,可能就会让人更肯定地猜测出位置。而将这个过程重复应用于图像中的数千个元素。随着时间的推移,AI比人更有效地识别这些模式。GeoSpy就是利用这一能力,成为了地理定位的强大工具。
进阶版的GeoSpy:Superbolt
Superbolt是GeoSpy的高端产品GeoSpy Pro的关键组件。GeoSpy Pro融合了Superbolt视觉位置识别(VPR)的高精度与GeoSpy的照片估算技术,打造出的地理定位系统具备以下能力:
-
精准定位:利用Superbolt的参考数据库,能将图像匹配精度控制在数米之内。 -
广泛位置推断:在缺乏匹配参考数据时,也可将位置估算范围缩小至数公里以内。
-
稳健性:它对相机角度变化、光照条件,甚至因翻新、新涂漆或老化导致的建筑物外观改变都具有很强的抗性。 -
可扩展性:该嵌入模型能够在保持准确性的同时扩展到数十亿个向量,非常适合实际应用场景。 -
高效性:与以往依赖大量向量的顶尖模型不同,Superbolt采用紧凑的嵌入方式。这些较小的向量不仅更节省内存,处理速度也更快,从而能够实现大规模的实时性能。
-
全球规模:覆盖世界上几乎所有主要城市以及无数较小的地区,提供广泛的地理覆盖范围。 -
高精度:从街角到地标,数据库提供详细的嵌入,使精度达到几米。 -
动态更新:数据库持续更新新鲜图像,确保其反映现实世界的变更,如新建筑或更新的标志。
隐私还能保得住吗?

(文:新智元)