top of page

跨視角影像檢索於物件層級地理定位之應用


專案經理 :呂紹銘

是否同意遠距 :否


跨視角影像檢索(Cross-view Image Retrieval)是將街景影像與衛星影像進行匹配的重要技術,常用於自動導航、城市規劃以及 GPS 訊號不足環境下的定位。傳統方法通常透過比對地面影像與衛星影像來推測拍攝位置,但多數只能判斷影像的大致地理位置,而無法精確定位影像中的特定物體,例如建築物或設施的位置。這樣的限制使得系統難以與地理資料庫結合,以取得目標物件的詳細資訊。

因此本研究將任務定義為跨視角物件地理定位(CVOGL),目標是在已知區域內,根據地面或無人機影像中的目標物件,直接在衛星影像中找出該物件的精確位置。為了進一步探討此問題,過去研究建立了一個全面的的資料集,其包含地面影像、無人機影像與高解析度衛星影像,並為每個目標物件標註對應的定位資訊。並結合採用 DetGeo 的框架,透過雙分支編碼器分別擷取查詢影像與衛星影像的特徵,利用跨視角特徵融合機制整合不同視角的資訊,使模型能夠聚焦於與查詢物件最相關的區域,進而在衛星影像中預測目標物件的位置。

整體而言,該方法可將跨視角影像比對由傳統的影像層級定位進一步提升至物件層級定位,使系統能更精確地對應目標物件於衛星影像中的實際位置,進而提升跨視角地理定位的準確度與應用價值。此技術未來除可應用於智慧導航、城市空間管理與地理資訊查詢外,亦具備延伸至災害應變與災後評估之潛力,例如協助定位受損建築物、關鍵設施與道路節點位置,作為救援資源調度、災情判釋與空間決策的重要技術基礎。



 
 
 

留言


bottom of page