米蘭(Milan)體育官方網(wǎng)站-DeepSeek發(fā)布V3.1-Terminus 支持128K上下文雙模式運(yùn)行
【米蘭(Milan)體育官方網(wǎng)站】DeepSeek于今日晚間正式宣布,其線上大語(yǔ)言模型已完成重大升級(jí),新版本命名為DeepSeek-V3.1-Terminus,現(xiàn)已面向用戶開(kāi)放在線體驗(yàn)。此次更新標(biāo)志著該公司在模型性能與服務(wù)能力上的進(jìn)一步提升。升級(jí)后的模型提供“思考模型”與“非思考模型”兩種運(yùn)行模式,均支持高達(dá)128K的上下文長(zhǎng)度,能夠處理更復(fù)雜的長(zhǎng)文本任務(wù),滿足專業(yè)場(chǎng)景下的多輪對(duì)話與文檔分析需求。

據(jù)官方公布的技術(shù)參數(shù),非思考模型的輸出長(zhǎng)度默認(rèn)為4K tokens,最大可擴(kuò)展至8K tokens,適用于快速響應(yīng)的常規(guī)交互場(chǎng)景;而思考模型則針對(duì)復(fù)雜推理任務(wù)優(yōu)化,輸出長(zhǎng)度默認(rèn)達(dá)32K tokens,最大支持64K tokens,適合需要深度邏輯分析、代碼生成或長(zhǎng)篇內(nèi)容創(chuàng)作的應(yīng)用。這一雙模式設(shè)計(jì)使用戶可根據(jù)具體需求靈活選擇,兼顧效率與深度。
在服務(wù)定價(jià)方面,DeepSeek公布了透明的計(jì)費(fèi)標(biāo)準(zhǔn),旨在為開(kāi)發(fā)者和企業(yè)用戶提供高性價(jià)比的AI服務(wù)。模型輸入費(fèi)用根據(jù)緩存命中情況區(qū)分:若請(qǐng)求內(nèi)容命中緩存,每百萬(wàn)tokens僅需0.5元;未命中緩存則為4元。模型輸出費(fèi)用統(tǒng)一為每百萬(wàn)tokens 12元。該定價(jià)策略有助于降低高頻調(diào)用場(chǎng)景下的運(yùn)營(yíng)成本,尤其利好需要重復(fù)訪問(wèn)相同知識(shí)庫(kù)的應(yīng)用。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
-米蘭(Milan)體育官方網(wǎng)站