8月18日,威邁爾VMR正式發(fā)布全球首款人形機器人頭部模組OmniHead(奧視知腦)。
當前,人形機器人在實際應用中普遍面臨環(huán)境感知能力弱、決策依賴預設邏輯的痛點,導致難以擺脫人工遙控,制約了實際應用場景的拓展。OmniHead的推出將有效解決這些技術(shù)瓶頸。
OmniHead是威邁爾專為具身智能打造的頭部模組,搭載高精度RGB-D視覺系統(tǒng)和AI大模型。通過OmniHead開發(fā)者可輕松提升機器人的視覺感知能力和環(huán)境魯棒性,從此擺脫遙操。
01、視覺全景感知
OmniHead的RGB-D深度視覺系統(tǒng)由三組十個RGB-D陣列相機組成,分布于頭部模組的正前方、左后側(cè)和右后側(cè),形成360°x90°的全景視野,實現(xiàn)機器人在復雜場景中的定位、感知和自主導航。
視覺定位技術(shù)
OmniHead采用視覺定位技術(shù),通過RGB-D陣列相機實時獲取周圍環(huán)境的三維信息并快速建圖,為機器人定位導航提供可靠數(shù)據(jù)。
多模態(tài)感知與語義識別
OmniHead的RGB-D相機融合語義感知算法,實現(xiàn)環(huán)境物體類別的精準識別,經(jīng)過訓練可識別桌子、椅子、人、機器人、狗等多類物體,為機器人行為決策提供準確依據(jù)。
多機協(xié)同數(shù)據(jù)同步
三組RGB-D陣列相機可實現(xiàn)視覺數(shù)據(jù)同步采集與傳輸,最終獲得全景三維重建與實時感知。
02、AI大模型+麥克風陣列
深度集成DeepSeek或通義千問大模型和環(huán)形麥克風,支持360°聲源定位與自然語義理解,實現(xiàn)多輪對話與情感化響應。
環(huán)形麥克風陣列6麥協(xié)同降噪,支持5米遠場拾音,搭配聲紋識別算法,實現(xiàn)多人對話場景下的聲源分離與語音增強,并且支持中英雙語交流。
03、開放接口多模態(tài)數(shù)據(jù)融合
OmniHead擁有豐富的開放接口,支持視覺、語音多模態(tài)數(shù)據(jù)聯(lián)合推理,適配各類人形機器人平臺,可拓展具身智能多場景應用,包括商業(yè)辦公、智能制造、智能家居、醫(yī)療陪護等領(lǐng)域。
電話
微信掃一掃