我們擅長商業策略與用戶體驗的完美結合。
歡迎瀏覽我們的案例。
10 月,可以說是國內大模型領域的一場小考,好不熱鬧——從騰訊、訊飛、智譜、百川,各家大模型廠商紛紛拿出通用大模型的新版本,試圖一較高下。
本月最后一天,阿里云云棲大會如期開幕,阿里云旗下的通義千問,交上本月的最后一份答卷。
繼 4 月正式發布通義千問大模型后,阿里云發布了通義千問 2.0 版本——與 4 月相比,通義千問 2.0 在復雜指令理解、文學創作、通用數學、知識記憶、幻覺抵御等能力上,都有在性能上取得較大提升。
開放則是本屆云棲的核心主題。“過去十來年,阿里云服務了中國移動互聯網的大發展。今天,隨著大模型技術的迅速發展,智能化時代正在開啟,阿里云要打造 AI 時代一朵最開放的云。”主論壇演講中,阿里巴巴集團董事會主席蔡崇信如此表示。
阿里云也亮出了通義千問和其他模型的比較結果。在 MMLU、C-Eval、GSM8K、HumanEval、MATH 等 10 個主流 Benchmark 測評集上,通義千問 2.0 的得分整體超越 Meta 的 Llama-2-70B。相比 OpenAI 的 Chat-3.5,是九勝一負;相比 GPT-4 則是四勝六負,與 GPT-4 的差距進一步縮小。
來源:阿里云/侵刪
不過,和競品拼測評分數,只能說是大模型比拼的基礎。本屆云棲的重點更多放在產品化、各類能力開放上。比如,通義大模型官網上線了多模態和插件功能,支持圖片輸入、文檔解析等細分任務。并且,通義千問 2.0 在指令遵循、工具使用、精細化創作等方面作了技術優化,這些能力更好地被下游應用場景集成。
來源:阿里云/侵刪
發布會的重點,顯然放在了通義系列的“模型團”上。CTO 周靖人花費了大量時間介紹通義模型家族里的八大行業模型,包括:
通義靈碼-智能編碼助手
通義智文-AI 閱讀助手
通義聽悟-工作學習 AI 助手
通義星塵-個性化角色創作平臺
通義點金-智能投研助手
通義曉蜜-智能客服
通義仁心-個人專屬健康助手
通義法睿-AI 法律顧問
并且,通義千問還正式發布了 APP,在各大手機應用市場正式上線,所有人都可通過 APP 直接體驗最新模型能力。另外,開發者可以通過網頁嵌入、API/SDK 調用等方式,將上述的模型能力集成到自己的大模型應用和服務中。
國內大模型領域已經從通用大模型層,逐漸轉向應用層。要擴大開放,也是為了吸引更多的開發者和客戶。因此,理清邊界很重要。
盡管阿里云這次發布了八大產品模型,但周靖人強調,阿里云此舉并非為了直接 To C 提供服務,而是 To B。做行業模型,更多是像個面向客戶的 Demo,讓客戶先了解到大模型能做什么。
截至 10 月,阿里云已與 60 多個行業頭部伙伴進行深度合作,通義千問已經在辦公、文旅、電力、政務、醫保、交通、制造、金融、軟件開發等領域的落地。
“要做開放的云,我們說到做到。如果有的開發者,有能力做自己的底層通用模型,我們也會提供應用模型的接口和開發平臺,讓開發者來做應用開發。”周靖人對 36 氪表示。
在早上的主論壇上,童語故事創始人兼 CEO 張華,就向開發者分享了一位父親用大模型創業的故事。7 個人的團隊,在阿里云上創業,不到三個月,“童語故事”的 MAU(月活用戶)就到了幾十萬,平均每個月 IT 成本才 1 萬元左右。“有了大模型、云計算這些成熟的技術,才能讓我們實現低成本高效創業。”張華說。
從產品到生態,阿里云已經付出不少切實的努力。去年的云棲大會上,阿里云發布了 AI 開源社區“魔搭”。一年后,魔搭現在已有 280 萬開發者、2300 多個優質模型,模型下載量超過 1 億。
比起從模型到應用都做,阿里云更希望達到的未來是,讓開發者、中小企業借助通義千問的基礎模型能力,借助開源社區的各類資源,快速地開發自己的模型。