今年4月,阿里雲推出自研大語言模型通義千問。這一前沿的模型可生成類似於人類表達的中英文雙語內容,還包括70 億及以上參數量級不同的模型規模。此次阿里雲發布的開源版本包括預訓練的 70 億參數基座模型 Qwen-7B 和基於這一模型微調的對話模型 Qwen-7B-Chat。 為進一步助力AI技術普惠,全球學術、研究及商業機構均可免費獲取上述模型的代碼、模型權重和文件。對於商業應用需求,月活躍用戶少於1 億的公司可免費使用模型,用户數超過該量級的企業可向阿里雲申請許可證。
阿里雲智能集團首席技術官周靖人表示:「透過開源自研的大語言模型,我們旨在促進技術普及,並讓生成式AI惠及更多的開發者及中小企業。阿里雲一直不遺餘力地推進不同的開源舉措,我們期待這一開放的模式能啟發更多集體智慧,並進一步促進開源社群的蓬勃發展。」 Qwen-7B 在超過 2 兆token數據集上預訓練,涵蓋通用和專業領域的中英文及其他多語種資料、代碼和數學內容,上下文窗口長度達到 8千。在訓練過程中,Qwen-7B-Chat 模型已經與人類認知對齊。Qwen-7B和Qwen-7B-Chat模型均可部署在雲端及本地基礎設施上,便於用戶對模型微調,以高效、低成本的方式搭建適合自身使用的優質生成式AI模型。 Qwen-7B 預訓練模型於英文能力基準測評MMLU(大規模多任務語言理解)中表現突出,得分高達 56.7,超越一眾具有類似規模或更大規模的主流預訓練開源模型。這一測評旨在考驗文本模型在 57 個不同任務中處理多任務的準確性,涵蓋初等數學、電腦科學和法律等多個領域。在中文常識能力測試集C-Eval 上,Qwen-7B 同樣在同等參數模型中脫穎而出,在Leaderboard獲得最高分。該測評集涵蓋了人文、社會科學、STEM 等四大專業領域的 52 個學科。此外,Qwen-7B 在包括 GSM8K 和 HumanEval 等數學和代碼生成基準測評中亦表現出眾。 今年7月,阿里雲發佈了最新AI繪畫創作大模型「通義萬相」,旨在支持開發者和中小企業開展創新的圖像藝術表達。阿里雲亦於7月宣佈推出通用框架ModelScopeGPT,旨在協助用戶透過使用ModelScope平台上的多元AI模型完成各類極複雜和專業的AI任務,適用領域包括語言、視覺和語音等。ModelScope開源平台由阿里雲於去年推出,目前聚集由20家全球領先AI機構提供的1000多個AI開源模型。
如欲了解更多詳情,請瀏覽ModelScope 、HuggingFace及GitHub的Qwen-7B和 Qwen-7B-Chat模型網頁。 - 新聞稿有效日期,至2023/09/04為止
聯絡人 :Nikki Lee 聯絡電話:070-1010-2090#54 電子郵件:nlee@hoffman.com
上一篇:SEMICON Taiwan 2023 Highlights
下一篇:美高梅與澳門通合辦「社區消費齊齊賞」活動舉辦成功
|
■ 我在中國工作的日子(十四)阿里巴巴敢給股票 - 2023/07/02 ■ 我在中國工作的日子(十三)上億會員怎麼管理 - 2023/06/25 ■ 我在中國工作的日子(十二)最好的公司支付寶 - 2023/06/18 ■ 我在中國工作的日子(十一)兩個女人一個男人 - 2023/06/11 ■ 我在中國工作的日子(十)千團大戰影音帶貨 - 2023/06/04 ■ 我在中國工作的日子(九)電視購物轉型電商 - 2023/05/28 ■ 我在中國工作的日子(八)那些從台灣來的人 - 2023/05/21 ■ 我在中國工作的日子(七)嘉丰資本擦身而過 - 2023/05/14 ■ 我在中國工作的日子(六)跟阿福有關的人們 - 2023/05/07
|