當前位置：首頁 > 新聞資訊 > 人工智能應(yīng)用 > DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測下一個 token,激發(fā)深度思考等,提升對話質(zhì)量

DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測下一個 token,激發(fā)深度思考等,提升對話質(zhì)量

來源：北京大學(xué) 編輯：創(chuàng)澤時間：2025/3/7 主題：其他 [加盟]

人工智能概念辨析：介紹大模型相關(guān)術(shù)語，回顧大模型從運算推理、知識工程到深度學(xué)習(xí)的發(fā)展歷程，對比生成模型和推理模型在定位、推理能力、多模態(tài)支持、應(yīng)用場景和用戶交互體驗的差異。

DeepSeek R1

公司與模型：DeepSeek 成立于 2023 年 7 月，獲幻方量化支持，專注大語言模型開發(fā)。旗下模型包括生成模型 V3 和推理模型 R1，R1 具有推理能力強、開源、低成本、國產(chǎn)化等特點，在國際競爭中處于第一梯隊。

使用與部署：提供官方網(wǎng)頁、APP、API，還可通過國家超算平臺等第三方渠道使用。個人可通過 Ollama 部署蒸餾模型，企業(yè)可利用 vLLM 進行生產(chǎn)級部署。部署 R1 滿血版需特定算力支持，不同算力配置價格不同。

模型原理：GPT 采用 Transformer 架構(gòu)，經(jīng)預(yù)訓(xùn)練、監(jiān)督微調(diào)等階段，基于上下文預(yù)測下一個 token。生成模型有語言理解和生成等能力，但存在幻覺等問題。DeepSeek R1 通過思維鏈、強化學(xué)習(xí)和蒸餾技術(shù)，提升推理能力，減少模型大小。

落地應(yīng)用

提示詞技巧：包括真誠直接、使用通用公式、說人話、反向 PUA、善于模仿、擅長銳評、激發(fā)深度思考等，可提升對話質(zhì)量。

應(yīng)用場景：適用于推理密集型任務(wù)、教育與知識應(yīng)用、文檔分析、開放領(lǐng)域問答寫作等場景。在教育與學(xué)術(shù)領(lǐng)域，可用于教學(xué)設(shè)計、作業(yè)批改、論文輔助等；在知識付費領(lǐng)域，可進行課程大綱設(shè)計、直播腳本撰寫等。

附件：DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測下一個 token,激發(fā)深度思考等,提升對話質(zhì)量