全黄H全肉边做边吃奶视频动漫,久久综合九色综合97_久久久,中文字幕乱码人妻一区二区三区,国产边做边吃奶AⅤ视频免费,国产麻豆乱视频AV,轻点灬大JI巴太粗太长了,欧美极品少妇XXXXⅩ视频


首頁
產(chǎn)品系列
行業(yè)應用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當前位置:首頁 > 新聞資訊 > 機器人知識 > 深度解析大規(guī)模參數(shù)語言模型Megatron-BERT  
 

深度解析大規(guī)模參數(shù)語言模型Megatron-BERT

來源:智東西      編輯:創(chuàng)澤      時間:2020/6/18      主題:其他   [加盟]
大家好,我是NVIDIA解決方案架構(gòu)師王閃閃。今天主要和大家分享兩個部分的內(nèi)容:

1.  BERT模型深度解析

2.  大規(guī)模參數(shù)的語言模型Megatron-BERT

我們今天主要是溫故知新我先帶大家復習一下BERT模型的整體架構(gòu),內(nèi)容不會特別偏數(shù)學,主要把BERT一些要點給大家說清楚,包括BERT的輸入/輸出以及具體它是怎么工作的,然后介紹NVIDIA基于BERT開發(fā)出的一系列好的模型。

首先介紹一下自然語言處理常見的應用方向,第一類是序列標注,比如命名實體的識別、語義標注、詞性標注,循環(huán)智能也是用了序列標注。第二類是分類任務,如文本分類和情感分析,這個方向目前在量化金融領(lǐng)域,尤其是對沖基金上應用性很強,尤其是情感分析。我記得3、4年前,有一條新聞說斯坦福大學的一個碩士生,暑期在他的宿舍里用幾塊GPU卡,自己搭建了一個小的超級計算機,他把Twitter上的信息全部錄下來,每天更新。他使用了BERT進行情感分析,把每天每個人的信息分成三類:positive積極、neutral中性、negative消極。他把三類情感的量化信息和當天納斯達克股票的升跌情況匯總,進行了統(tǒng)計分析,發(fā)現(xiàn)如果Twitter上的信息大部分都是積極的,那么股票就有很大的概率會上漲。我們現(xiàn)在把這類數(shù)據(jù)叫做情感分析因子,它在股票分析上是一個特別重要的推進方向,能讓模型越發(fā)準確。第三類NLP應用方向就是對句子關(guān)系的判斷,如自然語言的推理、問答系統(tǒng),還有文本語義相似性的判斷。最后一類,是生成式任務,如機器翻譯、文本摘要,還有創(chuàng)造型的任務比如機器寫詩、造句等。

BERT模型深度解析

現(xiàn)在我們進入正題:對BERT的講解。要了解BERT,首先我們要說一下Transformer,因為BERT最主要就是基于Transformer和注意力機制,這兩點也是BERT能從GPT、RNN、LSTM等一系列架構(gòu)中能脫穎而出的很大原因。Attention,專業(yè)的叫法是Attention Mechanism,Attention是一個Encoder+Decoder的模型機制。Encoder-Decoder模型是在深度學習中比較常見的模型結(jié)構(gòu):在計算機視覺中這個模型的應用是CNN+RNN的編輯碼框架;在神經(jīng)網(wǎng)絡機器翻譯的應用是sequence to sequence模型,也就是seq2seq。而編碼(Encoder)就是將序列編碼成一個固定長度的向量,解碼(Decoder)就是將之前生成的向量再還原成序列。

那么問題來了,為什么要在Encoder-Decoder模型機制中引入Attention呢?因為 Encoder-Decoder模型有兩個比較顯著的弊端:

一是Encoder會把序列信息壓縮成一個固定長度的向量,那么在Encoder的輸出中,我們暫且把它叫做語義編碼c,c就有可能無法完全地表示出全部序列的信息,尤其是當信息特別長時。

二是先輸入到網(wǎng)絡中的信息會被后輸入的信息覆蓋掉,輸入的信息越長,對先前輸入信息的遺忘程度就越大。因為這兩個弊端,Decoder在解碼的一開始就沒有獲得一個相對完整的信息,也就是語義編碼c沒有一個相對完整的信息輸入,那么它解碼的效果自然就不好。有的同學可能會說想要解決RNN記憶力差的問題,可以考慮用LSTM。我們的確可以考慮LSTM,但LSTM對超長距離的信息記憶,效果也不是很好。

我們再來看看Attention為什么能夠解決這個問題。Attention,顧名思義是注意力。它是模仿人類的注意力,人類在處理一個問題時會把注意力放到那個特別重要的地方,比如我們在短時間內(nèi)去看一張照片,第一眼落到照片上的位置可能是某個建筑物或者是某個人,這取決于我們不同的目的和興趣等。我們不會在短時間之內(nèi)記清楚甚至是看清楚照片上的全部細節(jié),但是我們會將注意力聚焦在某個特定的細節(jié)上并記住它。Attention模型最終輸出結(jié)果也是能夠達到這么一個效果。 

Attention的機制最早也是應用在計算機視覺上面,然后是在自然語言處理上面發(fā)揚光大。由于2018年在GPT模型上的效果非常顯著,所以Attention和 Transformer才會成為大家比較關(guān)注的焦點。之所以Attention的能力在NLP領(lǐng)域得到了徹底釋放,是因為它解決了RNN不能并行計算的弊端,Attention使其每一步的計算不依賴于上一步的計算,達到和CNN一樣的并行處理效果。并且由于Attention只關(guān)注部分的信息,所以它的參數(shù)較少,速度就會快。其次RNN記憶能力較差,所以大家一開始想到的解決方式都是用LSTM和GRU(Gated Recurrent Unit)來解決長距離信息記憶的問題,但是都沒有起到很好的效果。Attention由于只關(guān)注長文本中的一個小部分,可以準確地識別出關(guān)鍵信息,所以取得了特別不錯的效果。

下面我們來說一下Attention是怎么實現(xiàn)的聚焦。主要是因為它是采用了雙向的RNN,能夠同時處理每個單詞前后的信息。在Decoder中,它首先計算每一個Encoder在編碼隱藏層的狀態(tài),然后會和Decoder隱藏層狀態(tài)比較,做出相關(guān)程度的評定。得到的權(quán)值會通過softmax歸一化得到使用的權(quán)重,也就是我們前面所說的編碼向量c。然后對Encoder中對應的不同狀態(tài)的權(quán)重進行加權(quán)求和,有了編碼c之后,我們就可以先計算Decoder隱藏層的狀態(tài),然后再計算Decoder的輸出。這就是一個比較完整的在BERT當中運用Attention以及Encoder-Decoder模型的使用案例。Attention根據(jù)計算區(qū)域、權(quán)值的計算方式等會有很多不同變種。

不止是在NLP領(lǐng)域,在其他很多領(lǐng)域中,Transformer的模型由于很好用都是大家首選的,主要的一個運用機制就是Attention。我們之后會說到的Transformer模型會用到 Multi-head Attention和Self-Attention。首先說一下Self-Attention,Self-Attention是將原文中每個詞和該句子中所有單詞之間進行注意力的計算,主要是為了尋找原文內(nèi)部的關(guān)系。對應到閱讀理解任務,這個模型就可以判定一篇文章中的兩段話是不是同一個意思。Multi-head Attention,則是對一段原文使用多次的注意力,每次會關(guān)注到原文的不同部分,相當于多次地在單層中使用Attention,然后把結(jié)果給拼接起來。 







億級視頻內(nèi)容如何實時更新

基于內(nèi)容圖譜結(jié)構(gòu)化特征與索引更新平臺,在結(jié)構(gòu)化方面打破傳統(tǒng)的數(shù)倉建模方式,以知識化、業(yè)務化、服務化為視角進行數(shù)據(jù)平臺化建設(shè),來沉淀內(nèi)容、行為、關(guān)系圖譜,目前在優(yōu)酷搜索、票票、大麥等場景開始進行應用

基于真實環(huán)境數(shù)據(jù)集的機器人操作仿真基準測試

通過使用仿真和量化指標,使基準測試能夠通用于許多操作領(lǐng)域,但又足夠具體,能夠提供系統(tǒng)的有關(guān)信息

看高清視頻,如何做到不卡頓

優(yōu)酷智能檔突破“傳統(tǒng)自適應碼率算法”的局限,解決視頻觀看體驗中高清和流暢的矛盾

京東姚霆:推理能力,正是多模態(tài)技術(shù)未來亟需突破的瓶頸

姚霆指出,當前的多模態(tài)技術(shù)還是屬于狹隘的單任務學習,整個訓練和測試的過程都是在封閉和靜態(tài)的環(huán)境下進行,這就和真實世界中開放動態(tài)的應用場景存在一定的差異性

利用時序信息提升遮擋行人檢測準確度

Tube Feature Aggregation Network(TFAN)新方法,即利用時序信息來輔助當前幀的遮擋行人檢測,目前該方法已在 Caltech 和 NightOwls 兩個數(shù)據(jù)集取得了業(yè)界領(lǐng)先的準確率

基于網(wǎng)格圖特征的琵琶指法自動識別

根據(jù)各種指法的具體特點,對時頻網(wǎng)格圖、時域網(wǎng)格圖、頻域網(wǎng)格圖劃分出若干個不同的計算區(qū)域,并以每個計算區(qū)域的均值與標準差作為指法自動識別的特征使用,用于基于機器學習方法的指法自動識別

知識圖譜在個性化推薦領(lǐng)域的研究進展及應用

新加坡國立大學NExT中心的王翔博士分析了知識圖譜在個性化推薦領(lǐng)域的應用背景,并詳細介紹了課題組在個性化推薦中的相關(guān)研究技術(shù)和進展,包括基于路徑、基于表征學習、基于圖神經(jīng)網(wǎng)絡等知識圖譜在推薦系統(tǒng)中的融合技術(shù)

重構(gòu)ncnn,騰訊優(yōu)圖開源新一代移動端推理框架TNN

新一代移動端深度學習推理框架TNN,通過底層技術(shù)優(yōu)化實現(xiàn)在多個不同平臺的輕量部署落地,性能優(yōu)異、簡單易用。騰訊方面稱,基于TNN,開發(fā)者能夠輕松將深度學習算法移植到手機端高效的執(zhí)行,開發(fā)出人工智能 App,真正將 AI 帶到指尖

達摩院金榕教授113頁PPT詳解達摩院在NLP、語音和CV上的進展與應用實踐

達摩院金榕教授介紹了語音、自然語言處理、計算機視覺三大核心AI技術(shù)的關(guān)鍵進展,并就AI技術(shù)在在實際應用中的關(guān)鍵挑戰(zhàn),以及達摩院應對挑戰(zhàn)的創(chuàng)新實踐進行了解讀

OpenAI發(fā)布了有史以來最強的NLP預訓練模型GPT-3

2020年5月底OpenAI發(fā)布了有史以來最強的NLP預訓練模型GPT-3,最大的GPT-3模型參數(shù)達到了1750億個參數(shù)

多尺度圖卷積神經(jīng)網(wǎng)絡:有效統(tǒng)一三維形狀離散化特征表示

解決了傳統(tǒng)圖卷積神經(jīng)網(wǎng)絡中圖節(jié)點學習到的特征對圖分辨率和連接關(guān)系敏感的問題,可以實現(xiàn)在低分辨率的三維形狀上學習特征,在高低分辨率形狀之上進行測試,并且保持不同分辨率特征的一致性

履約時間預估:如何讓外賣更快送達

外賣履約時間預估模型,預估的是從用戶下單開始到騎手將餐品送達用戶手中所花的時間
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導診服務機器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無主燈智能化規(guī)范
» 微波雷達傳感技術(shù)室內(nèi)照明應用規(guī)范
» 人工智能研發(fā)運營體系(ML0ps)實踐指
» 四驅(qū)四轉(zhuǎn)移動機器人運動模型及應用分析
» 國內(nèi)細分賽道企業(yè)在 AIGC 各應用場景
» 國內(nèi)科技大廠布局生成式 AI,未來有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務場景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應用場景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時更短 優(yōu)
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人底盤

機器人底盤

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤  迎賓機器人  移動機器人底盤  講解機器人  紫外線消毒機器人  大屏機器人  霧化消毒機器人  服務機器人底盤  智能送餐機器人  霧化消毒機  機器人OEM代工廠  消毒機器人排名  智能配送機器人  圖書館機器人  導引機器人  移動消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  導覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導診機器人 
版權(quán)所有 © 創(chuàng)澤智能機器人集團股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

四会市| 三明市| 常熟市| 长汀县| 阆中市| 南投县| 北票市| 常山县| 伊川县| 柳河县| 宜君县| 阜阳市| 叶城县| 博爱县| 偏关县| 醴陵市| 玉树县| 平乐县| 隆尧县| 高邑县| 许昌市| 陇南市| 建平县| 襄汾县| 桐乡市| 北碚区| 桦川县| 上蔡县| 白银市| 全椒县| 晋州市| 鹤庆县| 平凉市| 阿合奇县| 富阳市| 上犹县| 成武县| 遂平县| 含山县| 丹阳市| 化州市|