绿茶通用站群绿茶通用站群

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源与闭源(yuán)之争延续(xù)到大模型时代(dài)。在寻找“新大陆”的路上(shàng),开(kāi)源与闭源(yuán)的(de)辩(biàn)论,就像是一场关(guān)于AI未来的“航海策略”讨论。

开源一派(pài)认为,开源能够促(cù)进全球科(kē)研人员和开发者的协作,加速AI技术的迭代与创新。同时,开源让更多人参与到(dào)模(mó)型的改进(jìn)和优(yōu)化中(zhōng),通过集体智慧解决复杂的技术难题。

闭源的(de)倡导者则看(kàn)重其在商业化(huà)、技(jì)术保护和产品差异化方面(miàn)的优势。闭源模型使得企业能够控制产品的开(kāi)发节奏和市场策略(lüè),保护其商业(yè)利(lì)益。此外 ,闭(bì)源也有助于企业维护其技术优势,避免竞争对手(shǒu)模仿或超越。

Llama 3的发布让开源大模 型在与(yǔ)闭源的竞(jìng)争(zhēng)中再度“扳回一城”。从测试(shì)结果来看,Llama 3的成绩大幅超(chāo)越了Llama 2,也胜(shèng)过了GPT-3.5。

在(zài)AI这场没有硝烟的“航海竞赛”中,大模(mó)型已然成为眼前的灯塔。未知的是,这座灯塔究(jiū)竟是向所有航海者(zhě)开放其光芒,还是仅为特定的(de)船只照亮前行(xíng)的航道。

开源在开发者和研究人员中极受欢迎

Meta正沿着开源路径继续前进。

近日,Meta推出开源大模型(xíng)Llama 3系列,发布(bù)8B和70B两个版本(běn)。Meta创始人兼首席执行官扎克伯格在(zài)同一(yī)天宣布,基(jī)于Llama 3,Meta的AI助手现在已经覆(fù)盖Instagram、WhatsApp、Facebook等全 系应用,并单独开启了网站(zhàn)。

与Llama 2相比(bǐ),Llama 3进行了几项关键的改进:使用具128K token(输入(rù)数据的最小单元)词汇表的tokenizer(编译器),可以更有效地编码(mǎ)语言,从而显著提升模型性能;在8B和70B模型中(zhōng)都采(cǎi)用分组查询(xún)注意力(GQA),以提高Llama 3模型(xíng)的推理(lǐ)效率;在8192个token的(de)序列上训练模(mó)型,使用掩(yǎn)码来确保自注意力(Self-Attention)不会跨越文档边界。

据Meta介绍,Llama 3已经在多种行业基准测试上展现了最先进(jìn)的性能(néng),提供了包括改进的推(tuī)理能力在内的新功能,是目前市场上最(zuì)好(hǎo)的开源大模(mó)型(xíng)。

此外,Llama 3发(fā)布后,微软Azure、谷歌云、百度智能(néng)云等陆续宣布其平台上线Llama 3。百度方(fāng)面此前对《每日经济新闻》记者表示(shì),百度智能云千帆大模型平(píng)台在国内首(shǒu)家推出(chū)针对Llama 3全 系列(liè)版本的(de)训练推理方案,便于开发者进行再训练,搭建生活细节的句子专属大模型。

工业和(hé)信息(xī)化(huà)部(bù)工业文化发展中心(xīn)AI应用工作(zuò)组执行(xíng)组长、行(xíng)行AI董事长李(lǐ)明顺在接(jiē)受(shòu)《每日(rì)经济新闻》记者采访时表示,Meta的Llama 3发布可能(néng)会带(dài)来更多AI应用落(luò)地机会和场景,它通过提供更大词汇量的(生活细节的句子de)Token词典、更长的输入上(shàng)下文长度(dù)以及优化的模型结构,增强了模型的编(biān)码效率和推理效率(lǜ)。“现在,比起Llama 2,Llama 3在代(dài)码能力和逻辑推理能力上有显著提升,这可能会促 进相关(guān)AI应用的(de)性能(提升),尤其是在需(xū)要复杂逻辑和代(dài)码理解(jiě)的场景中去落地。”

OpenAI在(zài)GPT-2之后调转船(chuán)头走向闭源,Meta则成为(wèi)开源(yuán)界的引领者(zhě)之一。

从2020年发布GPT-3,到引发轰动的GPT-3.5,以及2023年(nián)3月发布的GPT-4,都是闭源模型。此前(qián),马斯克起诉OpenAI时曾直言:“如果OpenAI改名为ClosedAI,我就(jiù)撤销诉讼。”

李明(míng)顺认为,OpenAI的转变可能与其商业战略和(hé)市场定位有关。“初期开(kāi)源有助于快速吸引(yǐn)关注和社区(生活细节的句子qū)参与,但随着公司的发展,我估(gū)计(jì)阿尔特曼(Sam Altman)的野心和商业梦想越(yuè)来越膨胀了,闭源可以更好地(dì)让它融资,包括和微软合作,保护领先的技术优势。”他表(biǎo)示(shì),从OpenAI的转变中可以(yǐ)看出(chū),开源(yuán)与闭源的(de)选择并(bìng)非固(gù)定不变,而是需要 根据公司战略目(mù)标、市场环境和产品发展阶段灵活调整。天下没什么事情(qíng)是绝对的(de),很(hěn)多开源公司也是拿着次优代码开源,独家秘方闭源。

在(zài)追逐AGI(通用人工智能)这颗明珠的道路上,迄今(jīn)为止,Meta依旧持续(xù)沿着开源的路径前行。

2024年初,扎克伯(bó)格在(zài)Meta第四(sì)季度及2023全年财(cái)报电话会议上表示:“长期以来,我们(men)的策略是构建并开放源 代码通用基础设施,同时保留我们的(de)具体产品实现(xiàn)为(wèi)专有(yǒu)技术。”

他认为,开源(yuán)带来了几个战略好处。首先,开源软件通常(cháng)更加安(ān)全可靠,并且因为社(shè)区的持续反馈、审(shěn)查和开发,更加(jiā)高效。其 次(cì),开源(yuán)软件经常成为行业标准,“当企业开(kāi)始基于我们的技术栈(zhàn)建立标准时,这使得将 创新融入我们的产品变得更加容易。这种微妙的(de)优势,能够(gòu)迅速学习和改进,是 巨大的竞争优势,而成 为行业标准正是这一能力的关键”。第三,开源在开发者和研究人员中极受欢迎。

开源与闭源并不(bù)矛盾

开源还(hái)是(shì)闭(bì)源(yuán),也许是全球人工智能信徒长久的辩题 。在 Llama 3诞生前几天,国内同样在(zài)进行 一场“辩 论(lùn)”。

4月11日,百度董事长(zhǎng)兼首席执行官李彦宏在其内部讲话中直言,大模型开源 的意义不大,闭源模型在能力(lì)上会持续领先(xiān),而(ér)不是一时领先,做模型的创业公司既(jì)做模(mó)型又做应用的“双轮驱动”不是一个(gè)好的模式。在一周(zhōu)后的Create 2024百度AI开发(fā)者大(dà)会上,李彦宏再 度提到,大家以前用开源觉 得开源便宜,其(qí)实在大模型场景下,开源是最贵的,所以开源(yuán)模型会越来越落后。

360公司创始人周鸿祎 则持不同的观点。他表示:“网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好。一(yī)句话,今天没有(yǒu)开源就没有Linux(操作系(xì)统内(nèi)核),没有Linux就没有互联网 ,就连(lián)说这话的公(gōng)司自己都借助了开(kāi)源的力(lì)量才(cái)成长到今天(tiān)。”

这(zhè)段发言被解(jiě)读为对李彦宏观点的回怼,周鸿祎随后澄(chéng)清道:“我一直是开源(yuán)的信徒,但是我说开源好,是(4月)13日在哈(hā)佛讲的,李厂长(指(zhǐ)李彦宏)说(shuō)闭源好,是(4月)16日在北京讲的(de)。”

生数科(kē)技联合创始人兼CEO唐家渝 站在(zài)闭源的一 边。在4月18日举行(xíng)的“2024中国生成(chéng)式AI大会”上,唐家渝表示:“在我们看来,开源、闭(bì)源都有各自可以做的商业生态,但是(shì)从模型能力 的提升来(lái)说(shuō),或者持续走(zǒu)到前列来说,闭源还是会走到开源(yuán)的前面。”

昆仑万维 董事长(zhǎng)方汉的观(guān)点是,开(kāi)源模型与闭源模型之(zhī)间的差(chà)距正(zhèng)在不断缩小。4月16日,方汉(hàn)在接受(shòu)《每日(rì)经济新闻》记者在内的媒体采访时表示,闭源模型的确是第一,但是开源大模型在2023年(nián)到今年这(zhè)一年间,从落后两年以(yǐ)上,已经进化(huà)到落后4~6个月以上。

此外,方汉认为,在(zài)应用侧,闭源对于产品特性和长尾需求的满(mǎn)足都(dōu)落后于开(kāi)源 大模型,开源大模型是一种生态构(gòu)建器,更(gèng)利于(yú)满足用户的长尾需求。开源大模型和闭源大(dà)模型是(shì)一个生态的组成(chéng)部分,不是谁(shuí)压倒(dào)谁,大家(jiā)都有自己的(de)生存空间,也都有更好(hǎo)的(de)明天。

不过 ,从商业化(huà)上来(lái)讲(jiǎng),闭(bì)源和开源也许并不矛盾。启明创投合伙(huǒ)人周志峰就认为,开源(yuán)闭源在过去几个大浪潮当中没有很大(dà)的冲突,不太理解为什么很多人把闭源、开源在AI时代看成(chéng)对立的。

李(lǐ)明顺的观点则是,在当前强应用导向的背景下(xià),开源模式具有显著优势(shì),能(néng)够吸引全球范围内最广泛(fàn)的(de)人参与(yǔ),从而使其创新性保持(chí)在较高水(shuǐ)平。

相较之下(xià),尽管一些闭源大模型在技术上具(jù)有领先地位(wèi),但其成本太(tài)高。不过他(tā)也强调,开源与(yǔ)闭源在不同公司和应用场景中可(kě)以相互转换。一些(xiē)基于开源的产品在发掘到独特优势后,可能会通过闭源策略建立竞争壁垒。同时,一些闭源(yuán)公司也会不(bù)断将其部分(fēn)产品开源(yuán)。这两个应该是共存(cún)的,未来开源可能用户量级上(shàng)更大,但是行业内,商业(yè)化做得比较好的(de)公司,往往还是闭源(yuán)的(de)多一点(diǎn)。

在开源与闭源的辩论中,也(yě)许(xǔ)答案并非非此即彼。AI的未来可能既不(bù)是完(wán)全(quán)开(kāi)放的“自由港(gǎng)”,也不是彻(chè)底封闭的(de)“孤(gū)岛”,而是(shì)一个既包含开放协作也(yě)包含(hán)封闭竞争的混合生态。在这个生态系统中,开(kāi)放与(yǔ)封闭不(bù)是对立的两极,而是(shì)一枚硬币的两面。

未经允许不得转载:绿茶通用站群 生活细节的句子

评论

5+2=