全新视觉识别技术Revisit Anything：上传图片就能识别位置

2,141 0 0

近日，一支研究团队震撼性地推出了一项名为Revisit Anything的视觉位置识别技术。这项技术的神奇之处在于，用户仅需上传一张图片，系统便能迅速且准确地识别出该图片所拍摄的具体地点。

赞助商家

￥100元/年 10字以内	高效AI工具创新必备	智能工具集效率倍增
AI全能工具助力发展	精选AI工具事半功倍	AI工具集合智领未来

内容概述

Revisit Anything技术融合了尖端的SAM（Segment Anything Model）与DINO（Self-Distillation with No Labels）两大模型，致力于优化图像分割的检索性能，进而达成更为精准的地理位置再识别。

该技术的核心优势体现在其强大的图像分段检索功能上。研究团队借助多个丰富的数据集，如Baidu、VPAir、Pitts以及17places等，为这项技术提供了坚实且全面的测试支撑。为了便于用户上手操作，研究团队特别推荐从规模较小的17places数据集入手。

在使用过程中，用户需留意将数据集文件夹名称与配置文件保持一致，以确保数据的顺畅读取。随后，用户可根据需求选择DINO或SAM模型进行特征提取，并可选择性生成VLAD聚类中心。值得一提的是，若已有聚类中心，则可直接从缓存中调用，无需重复生成。完成特征提取后，用户需进一步提取PCA模型，并运行核心的SegVLAD管道，从而获得最终的位置识别结果。此外，所有结果均可保存，便于日后的离线检索与计算。

这项创新研究不仅为视觉位置识别领域带来了一种全新的解决方案，更展示了现代深度学习模型在图像分析中的巨大潜力，有力地推动了该领域的持续进步与发展。

# AI技术资讯