人工智能概念辨析:介紹大模型相關(guān)術(shù)語,回顧大模型從運算推理、知識工程到深度學(xué)習(xí)的發(fā)展歷程,對比生成模型和推理模型在定位、推理能力、多模態(tài)支持、應(yīng)用場景和用戶交互體驗的差異。
DeepSeek R1
公司與模型:DeepSeek 成立于 2023 年 7 月,獲幻方量化支持,專注大語言模型開發(fā)。旗下模型包括生成模型 V3 和推理模型 R1,R1 具有推理能力強、開源、低成本、國產(chǎn)化等特點,在國際競爭中處于第一梯隊。
使用與部署:提供官方網(wǎng)頁、APP、API,還可通過國家超算平臺等第三方渠道使用。個人可通過 Ollama 部署蒸餾模型,企業(yè)可利用 vLLM 進行生產(chǎn)級部署。部署 R1 滿血版需特定算力支持,不同算力配置價格不同。
模型原理:GPT 采用 Transformer 架構(gòu),經(jīng)預(yù)訓(xùn)練、監(jiān)督微調(diào)等階段,基于上下文預(yù)測下一個 token。生成模型有語言理解和生成等能力,但存在幻覺等問題。DeepSeek R1 通過思維鏈、強化學(xué)習(xí)和蒸餾技術(shù),提升推理能力,減少模型大小。
落地應(yīng)用
提示詞技巧:包括真誠直接、使用通用公式、說人話、反向 PUA、善于模仿、擅長銳評、激發(fā)深度思考等,可提升對話質(zhì)量。
應(yīng)用場景:適用于推理密集型任務(wù)、教育與知識應(yīng)用、文檔分析、開放領(lǐng)域問答寫作等場景。在教育與學(xué)術(shù)領(lǐng)域,可用于教學(xué)設(shè)計、作業(yè)批改、論文輔助等;在知識付費領(lǐng)域,可進行課程大綱設(shè)計、直播腳本撰寫等。
附件:DeepSeek原理與落地應(yīng)用,基于上下文預(yù)測下一個 token,激發(fā)深度思考等,提升對話質(zhì)量

本地化部署DeepSeek的基本方法,了解更專業(yè)的企業(yè)級部署方法,講解Unsloth R1動態(tài)量化部署的三種實 現(xiàn)路徑:基于llama.cpp、KTransformers以及Ollama框架動態(tài)量化部署
美國在 GenAI領(lǐng)域的領(lǐng)先地位正在被中國迎頭趕上,AI 供應(yīng)鏈格局將被重塑;開放權(quán)重模型正在推動基礎(chǔ)模型層商品化,為應(yīng)用開發(fā)者帶來新機遇;擴大規(guī)模并非通往 AI 進步的唯一途徑
突破大模型訓(xùn)練固定思維,敢于嘗試在低精度 FP8 的模式下訓(xùn)練大模型,出現(xiàn)了較好的效果,每10年計算成本降低約1000倍,但人們的購買量增加了 10 萬倍
DeepSeek大模型的開源,低成本和高性能將大幅降低大模型的獲得,部署和應(yīng)用成本,將加快大模型在 B 端和 C 端應(yīng)用場景的落地;已應(yīng)用于端側(cè)、教育、金融、辦公、傳媒、醫(yī)療、智能汽車、企業(yè)服務(wù)等多個應(yīng)用場景,應(yīng)用領(lǐng)域廣闊
DeepSeek 降低了單個模型的部署成本,AI 應(yīng)用有望大規(guī)模落地, 推理算力需求將顯著增長,相關(guān)廠商有望加速進入業(yè)績兌現(xiàn)期,在 AI 應(yīng)用前沿落地 場景中,全球 AI 應(yīng)用產(chǎn)業(yè)有望迎來共振期
PI 調(diào)用層面,DS/OpenAI 的輸入費用分別為 0.55/15 美元/百萬 token,DS 推理使用成本僅為 OpenAI 的 4%,顯著的降低資金門檻,推動了 AI 技術(shù)平權(quán)
精準數(shù)據(jù)洞察與自動化效能提升方法論;DeepSeek將在企業(yè)服務(wù)、科研創(chuàng)新等垂直領(lǐng)域深度滲透;DeepSeek將通過開源戰(zhàn)略擴大開發(fā)者社區(qū)規(guī)模,并推出模型微調(diào)平臺和低代碼部署工具
周鴻祎以DeepSeek帶來的變革為切入點,深入剖析AI行業(yè)發(fā)展趨勢,并分享了AI技術(shù)于創(chuàng)業(yè)的應(yīng)用前景,未來應(yīng)用將從六大方向?qū)崿F(xiàn)爆發(fā),企業(yè)內(nèi)部未來一定是多個大模型組合工作
AI生成的回答重復(fù)相似,缺乏新意,即使改變提問,無法提供不同的結(jié)論;使用更多樣的訓(xùn)練數(shù)據(jù)和算法,提高AI的多樣性;優(yōu)化訓(xùn)練參數(shù), 避免模型陷入局部最優(yōu)
模型難以處理訓(xùn)練集外的復(fù)雜場景,模型過度依賴參數(shù)化記憶,普通用戶難以辨別AI內(nèi)容的真實性,可能對醫(yī)療建議、法律咨詢等專業(yè)場景的可 靠性產(chǎn)生長期懷疑
DeepSeek技術(shù)突破與應(yīng)用場景,冷啟動數(shù)據(jù)與多階段優(yōu)化,本地部署與端云協(xié)同,垂直領(lǐng)域深耕(醫(yī)療、金融、教育);智能協(xié)作與自動化轉(zhuǎn)型,消費決策與商業(yè)研究賦能
你想要生成什么樣的文案? 這樣的文案具備哪些特征? 你要針對什么生成類似文案? 篇幅、用詞、結(jié)構(gòu)優(yōu)化;批量生成新媒體文案