計算機(jī)視覺(CV)和自然語言處理(NLP)早先是兩個較為獨(dú)立的研究領(lǐng)域。CV 重點(diǎn)關(guān)注如何用計算機(jī)代替人眼對目標(biāo)完成識別、跟蹤、測量等任務(wù),對圖像進(jìn)行處理;NLP 則研究計算機(jī)如何處理、運(yùn)用自然語言,包括語言生成、問答、對話等任務(wù)。近年來,以深度神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)和模式識別技術(shù)被廣泛應(yīng)用于 CV 和 NLP 領(lǐng)域,取得了目前最先進(jìn)的效果。
近年來,研究者們試圖將動作控制也引入到「視覺-語言」任務(wù)的框架中。吳琦將此類任務(wù)命名為 V3A(Vision, Ask, Answer, Act),在給定視覺輸入后,我們希望機(jī)器能夠提出問題、回答問題、并通過和人以及機(jī)器之間的語言交流執(zhí)行某些動作。
例如,「Vision+Ask」的任務(wù)包含視覺問題生成、根據(jù)問題生成查詢、圖像描述等;「Vision+Answer」的任務(wù)包含視覺問答、視覺對話等;「Vision+Act」的任務(wù)包含指稱表達(dá)、視覺對齊(visual grounding)、語言引導(dǎo)的視覺導(dǎo)航、具身視覺問答、具身指稱表達(dá)等。
基于康復(fù)機(jī)器人內(nèi)部傳感器識別記錄訓(xùn)練過程中的運(yùn)動學(xué)參數(shù),能夠?qū)崟r定量評估不同的運(yùn)動模式,還能夠掌握患者是否主動參與訓(xùn)練等情況
智能機(jī)器人視覺方面的工作,主要體現(xiàn)在感知、理解、學(xué)習(xí)及推理4個方面,涉及到目標(biāo)檢測、目標(biāo)追蹤、人體姿態(tài)估計、人臉識別、行為識別、推理等技術(shù)
從大型仿人機(jī)器人整機(jī)構(gòu)型國內(nèi)外研究現(xiàn)狀入手,圍繞機(jī)器人整機(jī)構(gòu)型、關(guān)節(jié)運(yùn)動特點(diǎn)、伺服驅(qū)動器、減速器、仿真平臺等方面進(jìn)行深度講解,最后就大型仿人機(jī)器人整機(jī)構(gòu)型未來發(fā)展趨勢給出自己的見解
HRI的MTL可以使機(jī)器人更輕松,更智能地與新用戶進(jìn)行交互,即使使用諸如RL這樣的數(shù)據(jù)密集型方法,也可以避免社交交互失敗的不利影響。MTL和多模態(tài)ML已用于自動識別自閉癥譜系障礙(ASD)兒童
服務(wù)機(jī)器人潛在危險有:電擊、與能量有關(guān)的危險、著火、與熱有關(guān)的危險、機(jī)械危險、輻射、化學(xué)危險等
視頻搜索是涉及信息檢索、自然語言處理(NLP)、機(jī)器學(xué)習(xí)、計算機(jī)視覺(CV)等多領(lǐng)域的綜合應(yīng)用場景
驅(qū)動系統(tǒng)由4個200W無刷直流電機(jī)構(gòu)成,通過50:1的空心軸減速機(jī)可以最高達(dá)2m/s的速度在玉米、高粱等農(nóng)作物的地里前進(jìn)
通過2D激光雷達(dá)信息采用Hector SLAM實現(xiàn)機(jī)器人對地圖的感知和自主導(dǎo)航規(guī)劃,通過頂部的RGB-D相機(jī)采集目標(biāo)物體深度和RGB圖像信息
機(jī)器人的學(xué)習(xí)分為三個部分的軌跡預(yù)測包括示教者的手部運(yùn)動軌跡、示教者的身體移動軌跡以及被操作物體的運(yùn)動軌跡
Cosero是德國波恩大學(xué)的Sven Behnke團(tuán)隊根據(jù)家庭環(huán)境中的日常操作任務(wù)而研制的一款仿人操作機(jī)器人基于深度學(xué)習(xí)方法的目標(biāo)姿態(tài)估計和RGB-D SLAM等感知測量
機(jī)器人、無人機(jī)、自動駕駛汽車等加快落地,智慧城市深入建設(shè),更是為傳感器產(chǎn)業(yè)帶來了難以估量的龐大機(jī)遇
中國移動聯(lián)合產(chǎn)業(yè)合作伙伴發(fā)布《室內(nèi)定位白皮書》,對室內(nèi)定位產(chǎn)業(yè)發(fā)展現(xiàn)狀及面臨的挑戰(zhàn),深入分析了垂直行業(yè)的室內(nèi)定位需求,并詳細(xì)闡述了實現(xiàn)室內(nèi)定位的技術(shù)原理, 及室內(nèi)定位評測體系