高通發(fā)布白皮書,DeepSeek將推動AI推理時代到來
DeepSeek R1的推出標(biāo)志著AI行業(yè)的一次重大變革。以DeepSeek R1蒸餾模型為代表的新一代終端側(cè)推理模型性能獲得了極大的提升,如今,我們已經(jīng)可以在終端側(cè)看到過去只能在云端實(shí)現(xiàn)的AI性能,這將開啟安全、可靠的終端側(cè)AI處理未來。
高通技術(shù)公司發(fā)布最 新白皮書《AI變革正在推動終端側(cè)推理創(chuàng)新》,深入闡述DeepSeek R1推出這一關(guān)鍵時刻背后所代表的更廣泛的AI行業(yè)大潮。在訓(xùn)練成本下降、快速推理部署和針對邊緣環(huán)境的創(chuàng)新推動下,AI正在經(jīng)歷重要變革??萍夹袠I(yè)不再僅僅聚焦于競相構(gòu)建更大的模型,而是轉(zhuǎn)向如何在邊緣側(cè)實(shí)際應(yīng)用中高效地部署模型。對大型基礎(chǔ)模型的蒸餾已催生大量更智能、更小型、更高效的模型,使各行業(yè)能夠更快地規(guī)?;葾I,特別是在終端側(cè)加速集成。
以下為《AI變革正在推動終端側(cè)推理創(chuàng)新》白皮書的內(nèi)容摘要。
尖端AI推理模型DeepSeek R1一經(jīng)問世,便在整個科技行業(yè)引起波瀾。因其性能能夠媲美甚至超越先進(jìn)的同類模型,顛覆了關(guān)于AI發(fā)展的傳統(tǒng)認(rèn)知。
這一關(guān)鍵時刻是更廣泛趨勢的一部分,凸顯了行業(yè)在打造高質(zhì)量小語言模型和多模態(tài)推理模型方面的創(chuàng)新,以及這些創(chuàng)新正在為AI的商用應(yīng)用和終端側(cè)推理落地做好準(zhǔn)備。這些新模型能夠在終端側(cè)運(yùn)行,將加速強(qiáng)大邊緣側(cè)芯片的規(guī)?;瘮U(kuò)展,并創(chuàng)造對此類芯片的需求。
四大趨勢正在顯著提高目前可在終端側(cè)運(yùn)行的AI模型的質(zhì)量、性能和效率,從而推動上述變革:
· 當(dāng)前先進(jìn)的AI小模型已具有卓越性能。模型蒸餾和新穎的AI網(wǎng)絡(luò)架構(gòu)等新技術(shù)能夠在不影響質(zhì)量的情況下簡化開發(fā)流程,讓新模型的表現(xiàn)超越一年前推出的僅能在云端運(yùn)行的更大模型。
· 模型參數(shù)規(guī)模正在快速縮小。先進(jìn)的量化和剪枝技術(shù)使開發(fā)者能夠在不對準(zhǔn)確性產(chǎn)生實(shí)質(zhì)影響的情況下,縮小模型參數(shù)規(guī)模。
· 開發(fā)者能夠在邊緣側(cè)打造更豐富的應(yīng)用。高質(zhì)量AI模型快速激增,意味著文本摘要、編程助手和實(shí)時翻譯等特性在智能手機(jī)等終端上的普及,讓AI能夠支持跨邊緣側(cè)規(guī)?;渴鸬纳逃脩?yīng)用。
· AI正在成為新的UI。個性化多模態(tài)AI智能體將簡化交互,高效地跨越各種應(yīng)用完成任務(wù)。
高通技術(shù)公司在引領(lǐng)并利用從AI訓(xùn)練向大規(guī)模推理轉(zhuǎn)型,以及AI計算處理從云端向邊緣側(cè)擴(kuò)展方面具有戰(zhàn)略優(yōu)勢。公司在開發(fā)定制CPU、NPU、GPU和低功耗子系統(tǒng)領(lǐng)域取得了廣泛的成就。通過與模型廠商展開合作,以及面向跨不同邊緣終端領(lǐng)域的模型部署提供工具、框架和SDK,高通技術(shù)公司賦能開發(fā)者在邊緣側(cè)加速采用AI智能體和應(yīng)用。
近期對AI模型訓(xùn)練方式的顛覆變革和重新評估驗證了AI格局即將向大規(guī)模推理轉(zhuǎn)變的趨勢,這將形成全新邊緣側(cè)推理計算的創(chuàng)新和升級周期。盡管模型訓(xùn)練仍將在云端進(jìn)行,但推理將受益于采用高通?技術(shù)的廣泛終端規(guī)模,并催生更多邊緣側(cè)AI賦能處理器的需求。
高通公司總裁兼CEO安蒙(Cristiano Amon)也在高通公司2025財年第 一季度的財報電話會議中分享了他對當(dāng)前AI行業(yè)發(fā)展趨勢的看法。
他表示,“高通先進(jìn)的連接、計算和邊緣AI技術(shù)以及產(chǎn)品組合持續(xù)保持著高度差異化,在多個行業(yè)中越發(fā)重要。高通對業(yè)務(wù)中不斷增長的邊緣側(cè)AI機(jī)遇保持樂觀、積極的態(tài)度,尤其是在我們迎來新一輪AI創(chuàng)新和規(guī)?;瘮U(kuò)展周期之際。近期的DeepSeek R1及其他類似模型展示了AI模型的發(fā)展速度越來越快,它們變得更小、更強(qiáng)大、更高效,并且可以直接在終端側(cè)運(yùn)行。事實(shí)上,DeepSeek R1的蒸餾模型在發(fā)布僅幾天內(nèi)就能在搭載驍龍平臺的智能手機(jī)和PC上運(yùn)行。隨著我們進(jìn)入AI推理時代,我們期待模型訓(xùn)練仍將在云端進(jìn)行,但推理將越來越多地在終端側(cè)運(yùn)行,使AI變得更便捷、可定制且高效。這將促進(jìn)更多有針對性的專用模型和應(yīng)用的開發(fā)和采用,并因此推動各類終端對高通平臺的需求。憑借行業(yè)最強(qiáng)大和高效的邊緣側(cè)AI處理器,我們對推動這一轉(zhuǎn)型獨(dú)具優(yōu)勢,并將從即將到來的變革中受益?!?/p>
關(guān)注我們
