今年3月,阿里巴巴達摩院高級研究員、美國密歇根州立大學(xué)終身教授金榕參與了CIO學(xué)院技術(shù)公益大咖說,就《困局與破局:從深度學(xué)習(xí)到AI三大關(guān)鍵技術(shù)》這一主題進行了分享。金榕教授介紹了語音、自然語言處理、計算機視覺三大核心AI技術(shù)的關(guān)鍵進展,并就AI技術(shù)在在實際應(yīng)用中的關(guān)鍵挑戰(zhàn),以及達摩院應(yīng)對挑戰(zhàn)的創(chuàng)新實踐進行了解讀。
達摩院在NLP、語音和CV上的進展與應(yīng)用實踐
2020年5月底OpenAI發(fā)布了有史以來最強的NLP預(yù)訓(xùn)練模型GPT-3,最大的GPT-3模型參數(shù)達到了1750億個參數(shù)
解決了傳統(tǒng)圖卷積神經(jīng)網(wǎng)絡(luò)中圖節(jié)點學(xué)習(xí)到的特征對圖分辨率和連接關(guān)系敏感的問題,可以實現(xiàn)在低分辨率的三維形狀上學(xué)習(xí)特征,在高低分辨率形狀之上進行測試,并且保持不同分辨率特征的一致性
外賣履約時間預(yù)估模型,預(yù)估的是從用戶下單開始到騎手將餐品送達用戶手中所花的時間
記憶增強的圖神經(jīng)網(wǎng)絡(luò)對短期的商品語境信息建模,并使用共享的記憶網(wǎng)絡(luò)來捕捉商品之間的長期依賴,對多個模型進行了對比,在Top-K序列推薦中效果極佳
馬庫斯系統(tǒng)性地闡述了對當(dāng)前AI研究界的批判,從認識科學(xué)領(lǐng)域中針對性地給出了11條可執(zhí)行的建議
MIS 和RMIS觸覺傳感器最常用的傳感原理是基于電氣的傳感器。這些觸覺傳感器進一步分為壓阻型、壓電型和電容型傳感器
應(yīng)用于MIS的觸覺傳感器主要是基于電學(xué)或光學(xué)原理開發(fā)的,應(yīng)該是小尺寸和圓柱形的,可在導(dǎo)管的管身或尖端集成
非接觸式檢測平臺FluSense由麥克風(fēng)陣列和熱成像攝像機組成,用于捕捉不同的候診室人群行為,包括咳嗽和語言活動以及候診室病人數(shù)量
通過機械機構(gòu)實現(xiàn)機械手到工具的動力傳遞,無需外部控制及供能,對機器人的避障路徑規(guī)劃影響極小
神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種,變量敏感性分析用來檢驗輸入屬性變量對模型的影響程度,樣本敏感性分析用來研究具體樣本對模型的重要程度
神經(jīng)網(wǎng)絡(luò)模型本身其實并不是一個黑箱,其黑箱性在于我們沒辦法用人類可以理解的方式理解模型的具體含義和行為
為決策樹模型是一個具有比較好的可解釋性的模型,以決策樹為代表的規(guī)則模型在可解釋性研究方面起到了非常關(guān)鍵的作用