易見紋語科技創新技術總監王均松受邀參加ICPP研討并發表重要論文
公司動態
|
發布時間:2021-08-11 16:30:00

易見紋語科技創新技術總監王均松受邀參加ICPP研討并發表重要論文

什么是ICPP?

ACM International Conference on Parallel Processing (ICPP)并行處理國際會議是世界上歷史最悠久的并行計算學術會議之一,今已經在全球連續舉辦了50屆。它是學術界、工業界、政府的研究人員、科學家和從業人員展示他們在該領域各個方面的最新研究成果的首要論壇。今年,ICPP 2021在線會議在伊利諾伊州芝加哥舉行。

ICPP是計算機并行計算領域最有學術影響力的頂級會議之一。今年大會共收到329篇投稿,共接收87篇論文,論文接收率為26.4%。易見紋語科技和美國伊利諾伊大學厄巴納-香檳分校(UIUC)關于基于GPU分布式系統的的大規模物體紋理識別的論文“Exploring HW/SW Co-Optimizations for Accelerating Large-scale Texture Identification on Distributed GPUs”被大會接收。

from clipboard

2021年810日,易見紋語創新技術總監王均松在線上會議做了該論文的專題報告并回答了聽眾的問題。

from clipboard

此前,易見紋語科技創新性的提出了以物體本身細粒度紋理特征為標識的新一代產品溯源技術,以解決基于數字標簽(如二維碼、RFID等)的防偽技術容易被篡改的缺點。結合目前的數字化ID技術,可實現物理空間和數字空間的可信的掛鉤,做到真正的“一物一紋一碼”。但是,針對系統運行過程中的大規模紋理搜索問題,現有的技術無法達到實時性能。

為達到實時搜索性能,論文基于高性能GPU異構計算技術,從硬件加速和算法軟件等多個方面進行了系統性的優化。在同樣的硬件條件下,相比于OpenCV的開源實現,系統容量提升了20倍,搜索速度提升了31倍。

from clipboard

論文從4個方面進行了優化:

1. 專用于2-最近鄰算法的高度優化的 cuBLAS 實現并使用半精度浮點格式 (PF16)進行了優化,成功地提高了速度并減少了內存占用。該技術使得搜索容量加倍,速度提升了3.7倍。

from clipboard

2. 參考特征矩陣的批處理,有助于增加矩陣乘法期間的數據重用機會,以便更好的發揮GPU的并行處理特征,打破內存強的限制。并將傳統的SIFT算法改為RootSIFT算法以簡化算法的執行過程。該技術使得搜索速度提升了8-10倍。

from clipboard

3. 一種混合緩存設計,利用 GPU的顯存作為“一級緩存”和主機內存作為“二級緩存”來顯著擴大內存容量,以存儲參考特征矩陣。利用多個CUDA流來重疊計算和傳輸時間,使得混合緩存導致的搜索速度下降最小化。利用該技術使得容量上提升了近5倍,但是速度上的下降只有8.4%。

4. 采用非對稱局部特征來減少內存占用。通過應用這種方法,我們從參考紋理圖像中捕獲了更少的特征,而從查詢紋理圖像捕獲了更多的特征,而不是將這兩部分保持相等。它為更大規模的設計節省了內存空間,提高了搜索速度,而不會犧牲明顯的準確性。該技術使我們在只損失0.28%的精度下,容量實現了翻倍,同時速度又提升了34.6%。

最終,我們在生產系統中部署了一個分布式紋理識別系統,采用14 Tesla P100 GPU的分布式計算集群。上述提出的硬件/軟件協同優化策略,該系統的容量可以提升到千萬級別,其搜索速度可以達到每秒百萬張圖像。我們還提供 RESTful API共業務系統集成調用。

from clipboard

目前,易見紋語科技已將紋理識別系統運用到多個農產品上,不斷優化大規模紋理識別的算法和硬件加速性能,利用農企可以用數據進行AI圖像分析,對農作物進行種植管理分析,通過數字科技賦能。幫助農產品企業提高生產管理效率、提升產品質量追溯能力、擴大品牌和市場營銷能力,為農產品的發展提供了新的發展方向,向數字化轉型。


分享
伊人五月大香焦婷五月天综合五月色丁香综缴合