聯(lián)手微軟掀全球AI狂歡Meta推出免費(fèi)商用的Llama 2，最強(qiáng)“GPT-4平替”開源！

今天，F(xiàn)acebook母公司Meta發(fā)布其首個(gè)開源可商用大語言模型Llama 2！今天凌晨，Meta在其官網(wǎng)宣布大語言模型Llama 2正式發(fā)布，Llama 2是Meta大語言模型Llama模型的最新版本，也是Meta首個(gè)免費(fèi)商用的大語言模型。

今天，F(xiàn)acebook母公司Meta發(fā)布其首個(gè)開源可商用大語言模型Llama 2！

智東西7月19日?qǐng)?bào)道，今天凌晨，Meta在其官網(wǎng)宣布大語言模型Llama 2正式發(fā)布，Llama 2是Meta大語言模型Llama模型的最新版本，也是Meta首個(gè)免費(fèi)商用的大語言模型。

全球AIMeta推出免費(fèi)Llama

該模型目前支持70億、130億、700億等多個(gè)參數(shù)規(guī)模版本。相較Llama 1，Llama 2經(jīng)過2萬億個(gè)tokens訓(xùn)練，其對(duì)上下文訓(xùn)練的長度是Llama 1的兩倍，達(dá)到4096。Llama-2-chat模型還接受了超過100萬個(gè)人工標(biāo)注訓(xùn)練。由于其強(qiáng)大的參數(shù)規(guī)模以及性能表現(xiàn)，不少人稱之為“GPT-4最強(qiáng)平替”，也是大模型之戰(zhàn)中AI平權(quán)的又一例證。

此外，Meta和微軟高調(diào)宣布將在生成式AI領(lǐng)域聯(lián)手，微軟將成為Llama 2的首選合作伙伴。微軟Azure客戶將能夠在Azure上輕松安全地微調(diào)和部署Llama 2模型，快速構(gòu)建適用于自身業(yè)務(wù)的專用大模型。

全球AIMeta推出免費(fèi)Llama

“大語言模型正被企業(yè)用作生成式AI的核心要素。”Meta在官網(wǎng)中說道。Llama 2模型的發(fā)布，是Meta在大語言模型領(lǐng)域的又一次有力發(fā)聲。此前，谷歌、微軟曾通過接入大語言模型，更新其旗下多個(gè)產(chǎn)品線。

OpenAI的GPT-4和Meta的Llama分別是大語言模型領(lǐng)域閉源和開源的代表。全球有眾多大模型基于Llama開發(fā)而來，但又受限于無法免費(fèi)商用。隨著Llama2免費(fèi)開源商用，并與微軟這樣的云服務(wù)商深度合作，開源力量可能重新劃分AI市場(chǎng)的格局，對(duì)眾多大模型應(yīng)用企業(yè)也是好消息。

全球AIMeta推出免費(fèi)Llama

現(xiàn)在，用戶需要通過提交表格的方式即可獲得Llama-2-chat模型。用戶下載每個(gè)模型后，將收到大模型的型號(hào)代碼、規(guī)模、用戶指南信息。

全球AIMeta推出免費(fèi)Llama

論文地址：

https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

項(xiàng)目地址：

https://github.com/facebookresearch/llama

Llama-2-chat模型下載地址：

https://ai.meta.com/resources/models-and-libraries/llama-downloads/

一、Llama-2大模型，強(qiáng)在哪里？

Llama 2是一組經(jīng)過預(yù)先訓(xùn)練和精細(xì)調(diào)整的大型語言模型（LLMS），規(guī)模從70億到700億參數(shù)不等。

目前，Meta正式發(fā)布了Llama 2大模型的70億、130億、 700億三個(gè)參數(shù)規(guī)模版本。據(jù)悉，Meta還訓(xùn)練了340億版本，但沒有發(fā)布。在論文中，我們還發(fā)現(xiàn)了330億和650億版本的Llama 2訓(xùn)練數(shù)據(jù)信息。

此次發(fā)布過程中，Meta還隨著Llama-2大模型提供預(yù)訓(xùn)練模型和對(duì)話微調(diào)版本的模型權(quán)重和初始代碼。

全球AIMeta推出免費(fèi)Llama

在此次訓(xùn)練中，Meta還將預(yù)訓(xùn)練語料庫的規(guī)模增加了40%，將模型的上下文長度增加了一倍，并采用了分組查詢注意力（grouped-query attention）方法。

全球AIMeta推出免費(fèi)Llama

根據(jù)Meta公布的測(cè)評(píng)數(shù)據(jù)，Llama 2在許多外部基準(zhǔn)測(cè)試上都優(yōu)于其他開源語言模型，包括推理、編碼、熟練程度和知識(shí)測(cè)試。基于人類對(duì)大模型的有用性以及安全的評(píng)估，Llama 2可能是封閉源模型如GPT等的適當(dāng)替代品。

全球AIMeta推出免費(fèi)Llama

其中，Llama 2-Chat是針對(duì)對(duì)話AI場(chǎng)景進(jìn)行優(yōu)化的，使用來自人類反饋的強(qiáng)化學(xué)習(xí)來確保安全性和有用性。

在訓(xùn)練過程中，Llama 2使用公開的在線數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。然后通過使用監(jiān)督微調(diào)創(chuàng)建Llama-2-chat的初始版本。接下來，Llama-2-chat會(huì)通過人類反饋強(qiáng)化學(xué)習(xí)第一次出現(xiàn)標(biāo)注上（RLHF）進(jìn)行迭代細(xì)化，其中包括拒絕采樣和近端策略優(yōu)化（PPO）。

全球AIMeta推出免費(fèi)Llama

Llama-2大模型將免費(fèi)用于研究和商業(yè)用途。微軟是Llama 2的首選合作伙伴。據(jù)悉，Llama 2可在 Azure AI模型目錄中使用，使用Microsoft Azure的開發(fā)人員能夠使用它進(jìn)行構(gòu)建，并利用其云原生工具進(jìn)行內(nèi)容過濾和安全功能。

Llama 2還針對(duì)在Windows的本地運(yùn)行進(jìn)行了優(yōu)化，為開發(fā)人員提供了無縫工作流程，為跨不同平臺(tái)的客戶帶來生成式AI體驗(yàn)。目前，Llama2也可通過Amazon Web Services（AWS）、Hugging Face和其他提供商獲取。

二、經(jīng)過三方安全測(cè)試，Meta與微軟聯(lián)合推動(dòng)Llama-2落地

人工智能在給社會(huì)帶來巨大進(jìn)步的同時(shí)，也伴隨著風(fēng)險(xiǎn)。Meta希望提供開源，以促進(jìn)大模型的透明度。

據(jù)Meta介紹，Llama-2已經(jīng)通過安全測(cè)試。測(cè)試團(tuán)隊(duì)不但來自于Meta內(nèi)部，通過生成對(duì)抗性提示以促進(jìn)模型微調(diào)，還有第三方機(jī)構(gòu)對(duì)Llama-2進(jìn)行外部對(duì)抗性測(cè)試，以識(shí)別性能差距。

全球AIMeta推出免費(fèi)Llama

在Meta進(jìn)一步的研究論文里，Meta解釋了模型的微調(diào)和評(píng)估方法并指出了其缺點(diǎn)，并披露了此前經(jīng)歷過的已知挑戰(zhàn)和問題。

Meta創(chuàng)建了大模型指南作為指引，以支持開發(fā)人員提供負(fù)責(zé)任的開發(fā)和安全評(píng)估的最佳實(shí)踐。該指南概述了一些實(shí)踐成果，反映了整個(gè)人工智能研究行業(yè)討論有關(guān)負(fù)責(zé)任的生成式AI最先進(jìn)的研究。

Meta還啟動(dòng)了一項(xiàng)新的合作伙伴計(jì)劃，研究人員可以申請(qǐng)加入從業(yè)者社區(qū)，分享有關(guān)Llama-2的經(jīng)驗(yàn)，社區(qū)將制定一個(gè)研究議程來推動(dòng)未來的發(fā)展。同時(shí)，Meta還在政策監(jiān)管下，明確禁止某些使用大語言模型的指導(dǎo)方向，以幫助確保這些模型得到公平和負(fù)責(zé)任的使用。

結(jié)語：開源大模型，Meta加速AI領(lǐng)域發(fā)展

隨著Meta大模型Llama 2發(fā)布，全球的大語言模型矩陣又新增一位重磅嘉賓。Meta和微軟的聯(lián)合，也迅速將Llama 2的應(yīng)用，直接和成千上萬的開發(fā)者連接起來。

相較于上一代，Llama 2 在推理、編碼、熟練程度和知識(shí)測(cè)試，優(yōu)于其他開源語言模型。

隨著大模型研發(fā)和落地的加速狂飆，我們有望看到更多大模型為生活以及產(chǎn)業(yè)帶來巨大影響。

來源：智東西