我們擅長商業策略與用戶體驗的完美結合。
歡迎瀏覽我們的案例。
微軟宣布開源其大型的預訓練對話語言模型 Grounded Open Dialogue Language Model (GODEL)。根據介紹,GODEL 引入了一類新的預訓練語言模型,可以實現面向任務的對話和社交對話,并通過其響應的有用性進行評估。
GODEL 的前身 DialogGPT 是微軟于 2019 年發布的首個專門為對話設計的大規模預訓練語言模型,有助于使對話式 AI 更易于訪問和使用。與 DialoGPT 相比,GODEL 利用了新階段的基礎預訓練,旨在更好地支持需要當前對話外部信息(如數據庫或文件)來產生良好反應的微調階段。
GODEL 的主要特點之一是它為用戶提供了定義其模型基礎的靈活性,這種靈活性主要體現在 GODEL 在不同對話環境中的通用性。例如,如果有人詢問當地的一家餐館,GODEL 將能夠提供具體而準確的回答,即使這個地方可能不包括在用于訓練它的數據中。
另一個主要特點是其廣泛的對話應用程序。GODEL 可以應用于各種對話,包括面向任務、問答和基礎聊天的對話。在同一次對話中,GODEL 可以針對各種查詢類型產生合理的響應,包括一般性問題或對特定操作的請求。微軟方面稱,其論文結果表明,GODEL 的回答也被評估為是有幫助的。“我們將我們的模型與幾個強大的 baselines 和最先進的方法進行了比較,并表明 GODEL 在人工和自動評估方面都具有優勢。”
目前,微軟已經將 GODEL 完全開源提供;包含三個不同的版本:base、large 和 extra-large。并提供了重新訓練所有預訓練模型和為特定任務微調模型所需的代碼:用于對話式問答的 CoQA 數據集;Wizard of Wikipedia 和 Wizard of the Internet 數據集,用于尋求信息的聊天;MultiWOZ 用于任務完成對話。
“我們希望 GODEL 能夠幫助眾多學術研究團隊通過創新的對話模型推進對話式人工智能領域,同時消除對大量 GPU 資源的需求。我們計劃不斷改進 GODEL,并向研究界提供更多的模型。”
(邯鄲小程序開發)