6月27日,高通公司AI產品技術中國區負責人萬衛星在2024世界移動通信大會(MWC上海)“人工智能領域的投資、創新與生態系統發展”主題會議上發表題為“終端側生成式AI的未來” 的演講。
萬衛星表示,生成式AI的能力和用例正不斷豐富和擴展,高通通過其創新的SoC系統設計,憑借面向生成式AI全新設計的NPU和異構計算系統,為終端側AI規模化擴展提供了有力支持。
“生成式AI正在從云端遷移到邊緣云和終端側,未來端云協同的混合AI將推動生成式AI的規模化擴展。通過在云和邊緣及終端側之間分配工作負載,我們提供更強大、更高效和高度優化的體驗。”萬衛星說,針對新的AI用例和工作負載,高通重新定義和設計了SoC,定義了一個專為AI而打造的SoC的系統,推出了高通AI引擎這個異構計算系統。高通AI引擎中包含CPU、GPU、NPU,以及超低功耗的高通傳感器中樞。
演講中,萬衛星詳細介紹了高通SoC的異構計算系統如何滿足豐富的生成式AI用例的多樣化要求,包括對算力等各種KPI的要求。同時,他還介紹了高算力、低功耗NPU的演進路線,以及如何利用第三代驍龍8移動平臺率先實現多模態大模型的端側運行。
去年高通發布的第三代驍龍8移動平臺,可以支持完整運行100億參數以上的模型。在AI方面,特別是NPU與前代產品相比有哪些提升?據萬衛星介紹,第一,利用微架構升級提供極致性能;第二,手機作為一個集成度非常高的產品,其功耗一直都是需要重點解決的問題,因此高通為NPU設置了加速器專用電源,實現了更加出色的能效;同時,高通還升級了微切片技術,在算子深度融合層面充分釋放硬件算力和片上內存。除此之外,其他的提升和改進還包括更大的帶寬、更高的主頻等,從而打造出擁有卓越AI性能和能效的SoC。
“從參數量級的角度來說,2024年及以后我們將有望看到更多100億參數以上的大模型在端側運行,并帶來較好的用戶體驗。”萬衛星說。
除提供手機SoC,高通也涉足汽車、PC、物聯網、XR等領域,高通AI軟件棧已經賦能其所有產品線的絕大多數AI平臺。“這就意味著,我們的合作伙伴和開發者朋友們,只要在高通的一個平臺上完成模型的部署,就可以非常方便地遷移到高通的其他產品線。”萬衛星說。
另據萬衛星介紹,除了提供領先的硬件和靈活的軟件之外,高通也在構建AI生態系統,支持國內外廣泛的終端側生成式AI模型,持續推動AI技術的發展和創新。
【責任編輯:周靖杰】