Meta继续押宝开源大模型 Llama 3拿下“赛点”？

开源与闭源(yuán)之争延续(xù)到大模型时代(dài)。在寻找“新大陆”的路上(shàng)，开(kāi)源与闭源(yuán)的(de)辩(biàn)论，就像是一场关(guān)于AI未来的“航海策略”讨论。

开源一派(pài)认为，开源能够促(cù)进全球科(kē)研人员和开发者的协作，加速AI技术的迭代与创新。同时，开源让更多人参与到(dào)模(mó)型的改进(jìn)和优(yōu)化中(zhōng)，通过集体智慧解决复杂的技术难题。

闭源的(de)倡导者则看(kàn)重其在商业化(huà)、技(jì)术保护和产品差异化方面(miàn)的优势。闭源模型使得企业能够控制产品的开(kāi)发节奏和市场策略(lüè)，保护其商业(yè)利(lì)益。此外，闭(bì)源也有助于企业维护其技术优势，避免竞争对手(shǒu)模仿或超越。

Llama 3的发布让开源大模型在与(yǔ)闭源的竞(jìng)争(zhēng)中再度“扳回一城”。从测试(shì)结果来看，Llama 3的成绩大幅超(chāo)越了Llama 2，也胜(shèng)过了GPT-3.5。

在(zài)AI这场没有硝烟的“航海竞赛”中，大模(mó)型已然成为眼前的灯塔。未知的是，这座灯塔究(jiū)竟是向所有航海者(zhě)开放其光芒，还是仅为特定的(de)船只照亮前行(xíng)的航道。

开源在开发者和研究人员中极受欢迎

Meta正沿着开源路径继续前进。

近日，Meta推出开源大模型(xíng)Llama 3系列，发布(bù)8B和70B两个版本(běn)。Meta创始人兼首席执行官扎克伯格在(zài)同一(yī)天宣布，基(jī)于Llama 3，Meta的AI助手现在已经覆(fù)盖Instagram、WhatsApp、Facebook等全系应用，并单独开启了网站(zhàn)。

与Llama 2相比(bǐ)，Llama 3进行了几项关键的改进：使用具128K token（输入(rù)数据的最小单元）词汇表的tokenizer（编译器），可以更有效地编码(mǎ)语言，从而显著提升模型性能；在8B和70B模型中(zhōng)都采(cǎi)用分组查询(xún)注意力（GQA），以提高Llama 3模型(xíng)的推理(lǐ)效率；在8192个token的(de)序列上训练模(mó)型，使用掩(yǎn)码来确保自注意力（Self-Attention）不会跨越文档边界。

据Meta介绍，Llama 3已经在多种行业基准测试上展现了最先进(jìn)的性能(néng)，提供了包括改进的推(tuī)理能力在内的新功能，是目前市场上最(zuì)好(hǎo)的开源大模(mó)型(xíng)。

此外，Llama 3发(fā)布后，微软Azure、谷歌云、百度智能(néng)云等陆续宣布其平台上线Llama 3。百度方(fāng)面此前对《每日经济新闻》记者表示(shì)，百度智能云千帆大模型平(píng)台在国内首(shǒu)家推出(chū)针对Llama 3全系列(liè)版本的(de)训练推理方案，便于开发者进行再训练，搭建生活细节的句子专属大模型。

工业和(hé)信息(xī)化(huà)部(bù)工业文化发展中心(xīn)AI应用工作(zuò)组执行(xíng)组长、行(xíng)行AI董事长李(lǐ)明顺在接(jiē)受(shòu)《每日(rì)经济新闻》记者采访时表示，Meta的Llama 3发布可能(néng)会带(dài)来更多AI应用落(luò)地机会和场景，它通过提供更大词汇量的(生活细节的句子de)Token词典、更长的输入上(shàng)下文长度(dù)以及优化的模型结构，增强了模型的编(biān)码效率和推理效率(lǜ)。“现在，比起Llama 2，Llama 3在代(dài)码能力和逻辑推理能力上有显著提升，这可能会促进相关(guān)AI应用的(de)性能（提升），尤其是在需(xū)要复杂逻辑和代(dài)码理解(jiě)的场景中去落地。”

OpenAI在(zài)GPT-2之后调转船(chuán)头走向闭源，Meta则成为(wèi)开源(yuán)界的引领者(zhě)之一。

从2020年发布GPT-3，到引发轰动的GPT-3.5，以及2023年(nián)3月发布的GPT-4，都是闭源模型。此前(qián)，马斯克起诉OpenAI时曾直言：“如果OpenAI改名为ClosedAI，我就(jiù)撤销诉讼。”

李明(míng)顺认为，OpenAI的转变可能与其商业战略和(hé)市场定位有关。“初期开(kāi)源有助于快速吸引(yǐn)关注和社区(生活细节的句子qū)参与，但随着公司的发展，我估(gū)计(jì)阿尔特曼（Sam Altman）的野心和商业梦想越(yuè)来越膨胀了，闭源可以更好地(dì)让它融资，包括和微软合作，保护领先的技术优势。”他表(biǎo)示(shì)，从OpenAI的转变中可以(yǐ)看出(chū)，开源(yuán)与闭源的(de)选择并(bìng)非固(gù)定不变，而是需要根据公司战略目(mù)标、市场环境和产品发展阶段灵活调整。天下没什么事情(qíng)是绝对的(de)，很(hěn)多开源公司也是拿着次优代码开源，独家秘方闭源。

在(zài)追逐AGI（通用人工智能）这颗明珠的道路上，迄今(jīn)为止，Meta依旧持续(xù)沿着开源的路径前行。

2024年初，扎克伯(bó)格在(zài)Meta第四(sì)季度及2023全年财(cái)报电话会议上表示：“长期以来，我们(men)的策略是构建并开放源代码通用基础设施，同时保留我们的(de)具体产品实现(xiàn)为(wèi)专有(yǒu)技术。”

他认为，开源(yuán)带来了几个战略好处。首先，开源软件通常(cháng)更加安(ān)全可靠，并且因为社(shè)区的持续反馈、审(shěn)查和开发，更加(jiā)高效。其次(cì)，开源(yuán)软件经常成为行业标准，“当企业开(kāi)始基于我们的技术栈(zhàn)建立标准时，这使得将创新融入我们的产品变得更加容易。这种微妙的(de)优势，能够(gòu)迅速学习和改进，是巨大的竞争优势，而成为行业标准正是这一能力的关键”。第三，开源在开发者和研究人员中极受欢迎。

开源与闭源并不(bù)矛盾

开源还(hái)是(shì)闭(bì)源(yuán)，也许是全球人工智能信徒长久的辩题。在Llama 3诞生前几天，国内同样在(zài)进行一场“辩论(lùn)”。

4月11日，百度董事长(zhǎng)兼首席执行官李彦宏在其内部讲话中直言，大模型开源的意义不大，闭源模型在能力(lì)上会持续领先(xiān)，而(ér)不是一时领先，做模型的创业公司既(jì)做模(mó)型又做应用的“双轮驱动”不是一个(gè)好的模式。在一周(zhōu)后的Create 2024百度AI开发(fā)者大(dà)会上，李彦宏再度提到，大家以前用开源觉得开源便宜，其(qí)实在大模型场景下，开源是最贵的，所以开源(yuán)模型会越来越落后。

360公司创始人周鸿祎则持不同的观点。他表示：“网上有些名人胡说八道，大家也别被他们忽悠，说开源不如闭源好。一(yī)句话，今天没有(yǒu)开源就没有Linux（操作系(xì)统内(nèi)核），没有Linux就没有互联网，就连(lián)说这话的公(gōng)司自己都借助了开(kāi)源的力(lì)量才(cái)成长到今天(tiān)。”

这(zhè)段发言被解(jiě)读为对李彦宏观点的回怼，周鸿祎随后澄(chéng)清道：“我一直是开源(yuán)的信徒，但是我说开源好，是（4月）13日在哈(hā)佛讲的，李厂长（指(zhǐ)李彦宏）说(shuō)闭源好，是（4月）16日在北京讲的(de)。”

生数科(kē)技联合创始人兼CEO唐家渝站在(zài)闭源的一边。在4月18日举行(xíng)的“2024中国生成(chéng)式AI大会”上，唐家渝表示：“在我们看来，开源、闭(bì)源都有各自可以做的商业生态，但是(shì)从模型能力的提升来(lái)说(shuō)，或者持续走(zǒu)到前列来说，闭源还是会走到开源(yuán)的前面。”

昆仑万维董事长(zhǎng)方汉的观(guān)点是，开(kāi)源模型与闭源模型之(zhī)间的差(chà)距正(zhèng)在不断缩小。4月16日，方汉(hàn)在接受(shòu)《每日(rì)经济新闻》记者在内的媒体采访时表示，闭源模型的确是第一，但是开源大模型在2023年(nián)到今年这(zhè)一年间，从落后两年以(yǐ)上，已经进化(huà)到落后4~6个月以上。

此外，方汉认为，在(zài)应用侧，闭源对于产品特性和长尾需求的满(mǎn)足都(dōu)落后于开(kāi)源大模型，开源大模型是一种生态构(gòu)建器，更(gèng)利于(yú)满足用户的长尾需求。开源大模型和闭源大(dà)模型是(shì)一个生态的组成(chéng)部分，不是谁(shuí)压倒(dào)谁，大家(jiā)都有自己的(de)生存空间，也都有更好(hǎo)的(de)明天。

不过，从商业化(huà)上来(lái)讲(jiǎng)，闭(bì)源和开源也许并不矛盾。启明创投合伙(huǒ)人周志峰就认为，开源(yuán)闭源在过去几个大浪潮当中没有很大(dà)的冲突，不太理解为什么很多人把闭源、开源在AI时代看成(chéng)对立的。

李(lǐ)明顺的观点则是，在当前强应用导向的背景下(xià)，开源模式具有显著优势(shì)，能(néng)够吸引全球范围内最广泛(fàn)的(de)人参与(yǔ)，从而使其创新性保持(chí)在较高水(shuǐ)平。

相较之下(xià)，尽管一些闭源大模型在技术上具(jù)有领先地位(wèi)，但其成本太(tài)高。不过他(tā)也强调，开源与(yǔ)闭源在不同公司和应用场景中可(kě)以相互转换。一些(xiē)基于开源的产品在发掘到独特优势后，可能会通过闭源策略建立竞争壁垒。同时，一些闭源(yuán)公司也会不(bù)断将其部分(fēn)产品开源(yuán)。这两个应该是共存(cún)的，未来开源可能用户量级上(shàng)更大，但是行业内，商业(yè)化做得比较好的(de)公司，往往还是闭源(yuán)的(de)多一点(diǎn)。

在开源与闭源的辩论中，也(yě)许(xǔ)答案并非非此即彼。AI的未来可能既不(bù)是完(wán)全(quán)开(kāi)放的“自由港(gǎng)”，也不是彻(chè)底封闭的(de)“孤(gū)岛”，而是(shì)一个既包含开放协作也(yě)包含(hán)封闭竞争的混合生态。在这个生态系统中，开(kāi)放与(yǔ)封闭不(bù)是对立的两极，而是(shì)一枚硬币的两面。

未经允许不得转载：绿茶通用站群生活细节的句子