蓋世汽車訊 據(jù)外媒報(bào)道,馬薩諸塞大學(xué)阿默斯特分校(University of Massachusetts Amherst)的研究人員利用新型硅基硬件推動(dòng)了計(jì)算機(jī)視覺的發(fā)展,該硬件能夠捕捉和處理模擬域中的視覺數(shù)據(jù)。相關(guān)研究論文發(fā)表在期刊《Nature Communications》上,最終有望應(yīng)用于大規(guī)模、數(shù)據(jù)密集型和延遲敏感的計(jì)算機(jī)視覺任務(wù)。
“這是一款非常強(qiáng)大的視網(wǎng)膜擬態(tài)硬件,”馬薩諸塞大學(xué)阿默斯特分校電氣與計(jì)算機(jī)工程副教授兼生物醫(yī)學(xué)工程兼職副教授Guangyu X說(shuō)道。“在設(shè)備層面融合傳感單元和處理單元,而不是在物理上將它們分開,這種想法與人眼處理視覺世界的方式非常相似?!?/p>
現(xiàn)有的計(jì)算機(jī)視覺系統(tǒng)通常涉及在物理上分離的傳感單元和計(jì)算單元之間交換冗余數(shù)據(jù)。
然而,該圖像包含的信息量超過了系統(tǒng)識(shí)別物體或其運(yùn)動(dòng)所需的信息量。因此,傳輸和處理這些額外信息所需的時(shí)間會(huì)導(dǎo)致理解捕獲的視覺信息出現(xiàn)延遲,而理解這些信息通常對(duì)時(shí)間敏感且數(shù)據(jù)密集。
Xu教授和他的團(tuán)隊(duì)創(chuàng)建了兩個(gè)集成的柵極可調(diào)硅光電探測(cè)器陣列,或稱傳感器內(nèi)視覺處理陣列。它們共享雙極模擬輸出和低功耗工作模式,一個(gè)陣列可以捕捉動(dòng)態(tài)視覺信息,例如事件驅(qū)動(dòng)的光變化;另一個(gè)陣列可以捕捉靜態(tài)圖像中的空間特征,從而識(shí)別目標(biāo)物體。
這些硅陣列的規(guī)?;l(fā)展為視網(wǎng)膜計(jì)算和智能感知帶來(lái)了希望。對(duì)于動(dòng)態(tài)運(yùn)動(dòng),當(dāng)被要求在復(fù)雜環(huán)境中對(duì)人體運(yùn)動(dòng)(行走、拳擊、揮手和鼓掌)進(jìn)行分類時(shí),新的模擬技術(shù)準(zhǔn)確率高達(dá)90%,而數(shù)字技術(shù)的準(zhǔn)確率則為77.5%至85%。對(duì)于靜態(tài)圖像,該技術(shù)對(duì)手寫數(shù)字的分類準(zhǔn)確率高達(dá)95%,優(yōu)于不具備傳感器內(nèi)置計(jì)算能力的方法(90%)。
這些陣列的獨(dú)特之處在于它們由硅制成,與計(jì)算機(jī)芯片中使用的材料相同,這與之前主要由納米材料制成的傳感器內(nèi)視覺處理器截然不同。因此,這些陣列與現(xiàn)有的互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)更加兼容,CMOS是用于在計(jì)算機(jī)和存儲(chǔ)芯片等各種電子設(shè)備中構(gòu)建集成電路的最常用半導(dǎo)體技術(shù)。這種兼容性使它們特別適合大規(guī)模計(jì)算機(jī)視覺任務(wù),在這些任務(wù)中,許多進(jìn)程同時(shí)執(zhí)行,也稱為高并行性。
“我們的全硅技術(shù)有利CMO集成、大規(guī)模生產(chǎn)和大規(guī)模陣列操作,并且具有較低的可變性,因此我認(rèn)為這是該領(lǐng)域的一大飛躍,”Xu教授說(shuō)道。
Xu教授列舉了這項(xiàng)工作的潛在應(yīng)用的具體例子。首先是自動(dòng)駕駛汽車,“你必須實(shí)時(shí)處理車輛周圍的環(huán)境以及它們的移動(dòng)速度”。處理時(shí)間的任何縮短都會(huì)提高自動(dòng)駕駛汽車的安全性。
另一個(gè)可能受益的領(lǐng)域是生物成像。當(dāng)前的技術(shù)可能捕獲的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過實(shí)際需要。“我們或許可以壓縮數(shù)據(jù)量,并為科學(xué)家提供相同的生物學(xué)見解,”Xu教授說(shuō)道。九游體育官網(wǎng)