智东西 08-27
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

编译 | Vendii

编辑 | 漠影

智东西 8 月 27 日消息,据 VentureBeat 报道,德国 AI 创企 Aleph Alpha 今日发布了两个大语言模型(LLM)。这两个模型各拥有 70 亿个参数,可以在多种欧洲语言中提供简洁、长度可控的响应,并已开源。该公司宣称,其模型的性能可以与其他在 70 亿到 80 亿参数量级的顶尖开源模型相媲美。

除了新发布的模型,Aleph Alpha 之前还开发了拥有 700 亿参数(大约是 GPT-3 的 2/5)的预训练模型 Luminous,并在其基础上训练了聊天机器人 Lumi。该公司成立于 2019 年,通常被视为欧洲在 AI 领域的重要参与者之一。2023 年 11 月 7 日,该公司宣布获得超过 5 亿美元(折合约 36 亿人民币)B 轮融资,由博世风投、施瓦茨集团、SAP、惠普等知名财团参投。

下载地址:Aleph-Alpha/Pharia-1-LLM-7B-control at main ( huggingface.co )

一、与 Mistral、Llama 能力相近,且更安全透明

Aleph Alpha 发布了两个版本的模型:标准版(Pharia-1-LLM-7B-control)和 " 对齐 " 版(Pharia-1-LLM-7B-control-aligned)。其中," 对齐 " 版模型经过了进一步的训练,目的是降低模型输出中的有害内容和偏见,从而提高模型的安全性和可靠性。

这两个模型都在多语言基础语料库上训练,并针对德语、法语和西班牙语进行了文化和语言优化,能提供简明扼要、长度可控的回答。该公司在官网上发布了模型在 AlpacaEval(由来自斯坦福的团队开发的大语言模型评测系统)上的评测结果:

标准版 Pharia 在德语、法语和西班牙语上的表现和法国的模型 Mistral、美国的模型 Llama 相差不大,但在英语上的表现则不如两者。" 对齐 " 版 Pharia 则大体上比标准版 Pharia 表现略差一点。

▲ Pharia 与 Mistral、Llama 的分数比较。其中,WR 指胜率,LC 指长度控制胜率(即较短的完成结果优先于较长的)。(图源:Aleph Alpha 发布在 Hugging Face 上的 Model card)

据 Aleph Alpha 官网介绍,模型的训练数据经过严格筛选,确保符合欧盟及相关国家法规中的版权和数据隐私法律。相比之下,许多大语言模型则依赖于大量网络抓取的数据。除了版权和隐私问题之外,网络抓取的数据还可能包含错误、过时或不准确的信息,包含偏见和歧视,甚至可能含有对安全造成威胁的恶意内容。

该公司还开源了其训练代码库 "Scaling",这不仅让研究人员能够使用模型,还让他们能够理解并改进模型的训练过程本身。

此外,该模型引入了创新的技术,使用了一种称为 " 分组查询注意力 "(Group Query Attention,GQA)的技术。Aleph Alpha 声称这提高了推理速度,且几乎没有牺牲质量。模型还采用了 " 旋转式位置编码 "(Rotary Position Embedding,RoPE)的方法,使模型能够更好地理解句子中单词的相对位置。

二、注重模型合规性的欧洲 AI:可审计模型在受监管行业中或有独特优势

随着 AI 技术的飞速发展,其在金融、医疗等高度受监管行业中的应用日益增多。这些行业对 AI 系统的透明度和问责性有着严格要求。欧盟即将实施的 AI 法案进一步强调了这些要求,预计将于 2026 年生效。

在这样的背景下,Aleph Alpha 的模型发布策略与欧盟 AI 法案的监管方向保持一致,显示出该公司对监管适应性的高度重视。通过开源模型,Aleph Alpha 将自己定位为符合欧盟标准的 AI 开发先锋。这一开源策略有利于应对日渐增长的行业监管压力和公众对 AI 伦理的要求。

企业客户越来越需要能够确保合规性和伦理性的 AI 解决方案。随着对 AI 解决方案在特定监管环境下审核和定制的需求增加,Aleph Alpha 的开放方法使其在这些市场中具有潜在的竞争优势。特别是在监管合规性越来越重要的欧洲市场,Aleph Alpha 的战略与 " 可解释 AI" 趋势一致,可能为企业 AI 解决方案中的透明度设定新的标准。

结语:AI 霸权的竞赛中,开源模型该如何取胜?

通过倡导开放性、坚守合规性以及不断推动技术创新,Aleph Alpha 正在挑战目前由科技巨头主导的封闭和不透明的 AI 开发模式。该公司开放了 Pharia 模型及其训练代码,这一行动有助于缓解公众对于 AI 系统 " 黑箱 " 特性的担忧,增强对 AI 技术的信任,这种透明度对于建立公众信任至关重要。

然而,从长远来看,这种开源方法是否能够与科技巨头形成有效竞争,仍然有待观察。虽然开放性有助于激发创新并吸引开发者社区,但它也需要大量的资源来持续推动并围绕这些模型构建一个繁荣的生态系统。Aleph Alpha 需要在促进社区参与和实现战略发展之间找到合适的平衡点,以保持在迅速演变的 AI 行业中的竞争力。

来源:VentureBeat、Aleph Alpha 官网、Hugging Face

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

开源 惠普 德国 法语
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论