黄色影片AV大片在线观看_亚洲乱亚洲乱妇无码_久久久久久久人妻_亚洲一本之道高清乱码

量化巨頭放大招!大模型性價(jià)比之王來(lái)了

量化巨頭放大招!大模型性價(jià)比之王來(lái)了

七瀨婉奕 2024-12-28 泵業(yè)科技 15 次瀏覽 0個(gè)評(píng)論

  12月26日晚,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(簡(jiǎn)稱“深度求索”)宣布,全新系列模型 DeepSeek-V3 首個(gè)版本上線并同步開(kāi)源,API服務(wù)已同步更新,接口配置無(wú)需改動(dòng)。

  公開(kāi)信息顯示,深度求索成立于2023年7月17日,由知名量化資管巨頭幻方量化創(chuàng)立,幻方量化創(chuàng)始人梁文峰在量化投資和高性能計(jì)算領(lǐng)域具有深厚的背景和豐富的經(jīng)驗(yàn)。

  深度求索表示,DeepSeek-V3在知識(shí)類(lèi)任務(wù)(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5顯著提升,接近當(dāng)前表現(xiàn)最好的模型Anthropic公司于10月發(fā)布的Claude-3.5-Sonnet-1022。

  在美國(guó)數(shù)學(xué)競(jìng)賽(AIME 2024, MATH)和全國(guó)高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,DeepSeek-V3大幅超過(guò)了其他所有開(kāi)源閉源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度從20TPS(Transactions Per Second每秒完成的事務(wù)數(shù)量)大幅提高至60TPS,相比V2.5模型實(shí)現(xiàn)了3倍的提升,能夠帶來(lái)更加流暢的使用體驗(yàn)。?

  據(jù)澎湃新聞報(bào)道,Meta AI研究科學(xué)家田淵棟對(duì)DeepSeek-V3各個(gè)方向上的進(jìn)展都表示贊賞,稱“這是一項(xiàng)了不起的工作”。

  據(jù)官方技術(shù)論文披露,DeepSeek-V3模型的總訓(xùn)練成本為557.6萬(wàn)美元,而GPT-4o等模型的訓(xùn)練成本約為1億美元。深度求索表示,“這是一個(gè)全新的開(kāi)始?!?/p>

  據(jù)財(cái)聯(lián)社報(bào)道,OpenAI的聯(lián)合創(chuàng)始人之一Andrej Karpathy也發(fā)文稱贊道:作為參考,要達(dá)到這種級(jí)別的能力,通常需要約1.6萬(wàn)個(gè)GPU的計(jì)算集群。不僅如此,當(dāng)前業(yè)界正在部署的集群規(guī)模甚至已經(jīng)達(dá)到了10萬(wàn)個(gè)GPU。比如,Llama 3 405B消耗了3080萬(wàn)GPU小時(shí),而看起來(lái)更強(qiáng)大的DeepSeek-V3卻只用了280萬(wàn)GPU小時(shí)。

  性能更強(qiáng)、速度更快的DeepSeek-V3上線,幻方量化給出的定價(jià)是多少呢?

  深度求索表示,“我們的模型 API 服務(wù)定價(jià)也將調(diào)整為每百萬(wàn)輸入 tokens 0.5 元(緩存命中)/ 2 元(緩存未命中),每百萬(wàn)輸出 tokens 8 元?!睋?jù)財(cái)聯(lián)社報(bào)道,加總成本是10元人民幣。

  上一代模型Deepseek-V2.5的價(jià)格是,輸入:0.14美元/百萬(wàn)Token,輸出為:0.28美元/百萬(wàn)Token,加總成本是0.14+0.28=0.42美元,大約3元人民幣。

  這里的Token是大模型在處理數(shù)據(jù)時(shí)的最小單元,一般而言,100萬(wàn)Token相當(dāng)于70萬(wàn)-100萬(wàn)英文單詞,或接近100萬(wàn)中文漢字。列夫?托爾斯泰的名著《戰(zhàn)爭(zhēng)與和平》的英文版大約是大約有1200-1500頁(yè)、58萬(wàn)英文單詞,把它翻譯為中文,大約有100-130萬(wàn)字,讓DeepSeek-V3讀完全文只需要2元左右。

  盡管提價(jià),但與同類(lèi)型模型相比,DeepSeek-V3依舊極具性價(jià)比。比如OpenAI的GPT 4o定價(jià)相當(dāng)高,輸入:5美元/百萬(wàn)Token,輸出:15美元/百萬(wàn)Token,加總成本是20美元,約合人民幣140元。

  本文綜合DeepSeek微信公眾號(hào)、澎湃新聞、財(cái)聯(lián)社

 ?。暶鳎何恼聝?nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。)

你可能想看:

轉(zhuǎn)載請(qǐng)注明來(lái)自隨州市龍晟泵業(yè)有限公司,本文標(biāo)題:《量化巨頭放大招!大模型性價(jià)比之王來(lái)了》

每一天,每一秒,你所做的決定都會(huì)改變你的人生!

發(fā)表評(píng)論

快捷回復(fù):

評(píng)論列表 (暫無(wú)評(píng)論,15人圍觀)參與討論

還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...

Top
網(wǎng)站統(tǒng)計(jì)代碼