人工智能浪潮下,杭州不斷加快腳步。上周三,杭州召開全市人工智能創(chuàng)新高地建設(shè)動員大會,進(jìn)一步明確了打造人工智能創(chuàng)新高地的目標(biāo)與路徑,為杭州在人工智能領(lǐng)域的發(fā)展注入強(qiáng)大動力。在首批創(chuàng)建6家產(chǎn)業(yè)生態(tài)創(chuàng)新空間中,就包括濱江區(qū)中國數(shù)谷具身智能創(chuàng)新空間。
當(dāng)“鋼鐵之軀”在擂臺閃轉(zhuǎn)騰挪,當(dāng)“具身智能”在濱江加速進(jìn)化,人工智能的未來高度在這里被重新定義。
6月13日起,杭報(bào)推出“AI高地in濱江”欄目,首期聚焦一臺現(xiàn)象級機(jī)器人。
擂臺上,選手步伐靈活閃轉(zhuǎn)騰挪,拳腳精準(zhǔn)攻防有力——近期,在“CMG世界機(jī)器人大賽·系列賽”機(jī)甲格斗擂臺賽上,來自杭州高新區(qū)(濱江)的宇樹G1人形機(jī)器人作為唯一參賽機(jī)型,以硬核實(shí)力驚艷“破圈”。
這臺在聚光燈下?lián)]灑自如的“鋼鐵之軀”,是濱江本土明星企業(yè)杭州宇樹科技股份有限公司的力作,已成為現(xiàn)象級產(chǎn)品,閃耀著濱江AI產(chǎn)業(yè)的璀璨光芒。
它的每一次精準(zhǔn)出拳、每一個(gè)穩(wěn)定步態(tài),都深深根植于高新區(qū)(濱江)精心培育、厚積薄發(fā)的人工智能全產(chǎn)業(yè)鏈沃土之中。這臺機(jī)器人,正是濱江打造“人工智能創(chuàng)新高地”堅(jiān)實(shí)底氣的生動縮影。
驅(qū)動格斗機(jī)器人完成復(fù)雜動作的,是其高度智能的“大腦”和“神經(jīng)網(wǎng)絡(luò)”。實(shí)時(shí)運(yùn)動規(guī)劃、環(huán)境感知決策、毫秒級反應(yīng)控制……這些核心能力,無不依賴強(qiáng)大的算法算力支撐。而高新區(qū)(濱江),正是算法模型開發(fā)的活躍之地。
前不久,杭州聯(lián)匯科技股份有限公司(以下簡稱“聯(lián)匯科技”)發(fā)布的VLM-R1大模型,一經(jīng)亮相便在全球開源圈引發(fā)轟動,它可以通過自我修正和多步推理提升泛化能力,具備準(zhǔn)確的視覺識別能力、專業(yè)的知識推理能力、清晰的文本表達(dá)能力,目前已實(shí)現(xiàn)在高泛化開放視覺理解中的技術(shù)突破與應(yīng)用。
“依托VLM-R1模型,我們正竭力構(gòu)建智能體大腦,打造服務(wù)具身智能的‘視覺感知-時(shí)空記憶-推理決策’應(yīng)用決策鏈,推動決策AI向落地具身智能的執(zhí)行AI邁進(jìn)?!甭?lián)匯科技CEO趙天成介紹。
無獨(dú)有偶,在濱江,同樣深耕VLA(視覺語言動作模型)的,還有杭州星衍智能科技有限公司(以下簡稱“星衍智能”),則致力于研發(fā)跨本體形態(tài)的通用VLA具身智能大模型?!熬拖馜eepSeek和ChatGPT都基于LLM(大規(guī)模語言模型)但各有側(cè)重,我們聚焦VLA適配不同類型、功能、場景的機(jī)器人需求?!毙茄苤悄蹸EO杜承彬介紹道。
實(shí)現(xiàn)“通用”,需在海量數(shù)據(jù)中尋找最大“公約數(shù)”,這離不開強(qiáng)大算力的支撐。目前,他們正在開發(fā)新一代跨本體通用大模型,將顯著提升機(jī)器人在不同場景下的適應(yīng)能力。通過獨(dú)特的數(shù)據(jù)采集方案、統(tǒng)一的模型架構(gòu)以及輕量化算法的結(jié)合,讓模型能夠適配不同形態(tài)的機(jī)器人。這不僅能大幅減少重復(fù)開發(fā)工作,還能有效地降低算力消耗。
誠然,算法模型是賦予機(jī)器人“思考”和“決策”能力的核心,是實(shí)現(xiàn)自主行為、適應(yīng)復(fù)雜環(huán)境的“大腦皮層”。濱江不僅擁有算法模型強(qiáng)大的企業(yè),更布局算力基礎(chǔ)設(shè)施,比如杭州市人工智能計(jì)算中心落地濱江,承擔(dān)起普惠算力服務(wù)和產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的任務(wù)。在政策層面,今年濱江推出“每年安排最高1億元的‘算力券’”舉措,真金白銀支持AI研發(fā)創(chuàng)新。
瞬息萬變的格斗場上,精準(zhǔn)感知環(huán)境是生存與制勝的關(guān)鍵。機(jī)器人,同樣需要一雙洞悉世界的“慧眼”,實(shí)現(xiàn)該功能的核心技術(shù)是SLAM(同步定位與建圖)。
由攝像頭、激光雷達(dá),IMU(慣性測量單元)等“看見”的硬件,以及視覺“大腦”的輸入識別、三維環(huán)境和物體重建、物體定位、障礙物檢測與避障等“理解”的軟件共同構(gòu)成,可以實(shí)時(shí)捕捉環(huán)境深度信息、地圖物置及自身姿態(tài),自主處理復(fù)雜視覺任務(wù)。
濱江,已然匯聚了一批計(jì)算機(jī)視覺人工智能和傳感器融合感知的佼佼者。虹軟科技股份有限公司(以下簡稱“虹軟科技”)便是其中的代表。作為行業(yè)領(lǐng)先的人工智能和計(jì)算機(jī)視覺算法解決方案供應(yīng)商,虹軟的視覺AI技術(shù)已廣泛應(yīng)用于手機(jī)、汽車、機(jī)器人、VR/AR/MR、AI眼鏡等多種智能終端。
“SLAM技術(shù)是機(jī)器人環(huán)境感知和人機(jī)交互、實(shí)現(xiàn)自主精確移動、避障等功能的重要基石,虹軟專注于該技術(shù)研發(fā)和落地應(yīng)用近30年,一直走在最前沿?!焙畿浛萍伎偛弥砦难嘟榻B,其中V-SLAM是潛力最大、難度最大的核心模塊,公司已經(jīng)積累了單目、雙目、多目等完整全套V-SLAM技術(shù)引擎,并得到了大量的應(yīng)用。
如果說V-SLAM負(fù)責(zé)“看見”,那么視覺大模型則承擔(dān)“理解”的重任。其中,虹軟視覺大模型整體視覺AI方案ArcMuse計(jì)算技術(shù)引擎,明顯提升其環(huán)境感知能力,增強(qiáng)了SLAM的效果以及惡劣環(huán)境下的適應(yīng)能力,并獲評2024年度杭州市垂直領(lǐng)域優(yōu)秀專用模型。
擂臺上凌厲的拳風(fēng)、穩(wěn)健的步伐,最終要由精密的“肌肉”來執(zhí)行——這代表著機(jī)器人的運(yùn)動之本。
杭州景業(yè)智能科技有限公司(以下簡稱“景業(yè)智能”)的核工業(yè)機(jī)械臂,便是極端環(huán)境下“力量與耐力”的化身,詮釋了“鋼鐵之軀”的物理基礎(chǔ)。其核心技術(shù)成果“核工業(yè)電隨動機(jī)械手”和“核工業(yè)自動取樣系統(tǒng)”連續(xù)兩年獲得了浙江省國內(nèi)首臺(套)產(chǎn)品的認(rèn)定,達(dá)到國際先進(jìn)水平。
“核工業(yè)環(huán)境對機(jī)器人提出了‘三高’要求:高輻射耐受、高密封防泄漏、高可靠冗余設(shè)計(jì)。這要求我們從本體設(shè)計(jì)到算法開發(fā)都必須實(shí)現(xiàn)自主創(chuàng)新?!本皹I(yè)智能相關(guān)負(fù)責(zé)人介紹,公司構(gòu)建了“耐輻照設(shè)計(jì)+智能控制+數(shù)字孿生”三大核心技術(shù)群,形成了覆蓋運(yùn)維、放射性物質(zhì)處理等核心場景的四大類機(jī)器人產(chǎn)品矩陣。
數(shù)據(jù)顯示,景業(yè)智能研發(fā)投入占比常年保持在10%以上,累計(jì)獲得知識產(chǎn)權(quán)320項(xiàng),去年新增發(fā)明專利18項(xiàng),涵蓋耐輻照機(jī)械臂、核藥智能分裝系統(tǒng)等關(guān)鍵技術(shù)。
在該負(fù)責(zé)人看來,人形機(jī)器人或者四足機(jī)器人的核心價(jià)值不在于形態(tài),而在于實(shí)現(xiàn)具身智能,解決實(shí)際問題?!拔覀兿乱淮a(chǎn)品是應(yīng)急救援機(jī)器人,它將代替人類在惡劣環(huán)境中執(zhí)行智能任務(wù)。”該負(fù)責(zé)人透露。同時(shí),該公司研發(fā)的四足機(jī)器人聚焦特種作業(yè),通過多模態(tài)感知與自適應(yīng)控制技術(shù),可在放射性環(huán)境中執(zhí)行復(fù)雜操作。目前,首臺樣機(jī)已進(jìn)入模擬環(huán)境測試階段。
一臺臺機(jī)器人的背后,是千鏈競發(fā)、萬企協(xié)同的磅礴圖景。換句話說,一個(gè)能真正理解世界、適應(yīng)環(huán)境并與之交互的智能未來,正在濱江加速“煉”成。