阿联酋技术创新研究所利用新架构革新人工智能语言模型

公司 文传商讯

经Hugging Face独立验证,Falcon Mamba 7B是全球性能第一的开源状态空间语言模型(SSLM)

SSLM的内存成本低,无需额外内存即可生成任意长文本块

Falcon Mamba 7B还优于传统的Transformer架构模型,如Meta的 Llama 3.1 8B和Mistral的7B

新模型体现了阿布扎比在人工智能研发领域的创新和开拓精神

阿联酋阿布扎比–(美国商业资讯)–技术创新研究所(TII)是全球领先的科研中心和阿布扎比先进技术研究理事会(ATRC)的应用研究支柱。该研究所发布了Falcon系列中的一款新的大型语言机型——Falcon Mamba 7B。经Hugging Face独立验证,新模型是全球性能第一的开源状态空间语言模型(SSLM)。

作为Falcon系列的首款SSLM,它有别于之前所有使用Transformer架构的Falcon模型。新的Falcon Mamba 7B模型是该研究所正在进行的开创性研究及其以开源形式向社区提供突破性工具和产品的又一例证。

ATRC秘书长兼阿联酋总统战略研究和先进技术事务顾问Faisal Al Bannai阁下表示:“Falcon Mamba 7B标志着TII连续第四次获得人工智能模型排名第一,巩固了阿布扎比作为全球人工智能研发中心的地位。这一成就彰显了阿联酋对创新的坚定承诺。”

在Transformer架构模型方面,Falcon Mamba 7B在HuggingFace新引入的基准测试中优于Meta的Llama 3.1 8B、Llama 3 8B和Mistral的7B。同时,在其他SSLM中,Falcon Mamba 7B在旧基准测试中击败了所有其他开源模型,它将成为HuggingFace新的更严苛基准测试排行榜上的第一款模型。

TII首席执行官Najwa Aaraj博士表示:“技术创新研究所继续通过Falcon系列人工智能模型突破技术发展的界限。Falcon Mamba 7B代表了真正的开创性工作,为未来的人工智能创新铺平了道路,这些创新将增强人类的能力并改善生活。”

状态空间模型在理解随时间演变的复杂情况(如一整本书的内容)方面表现极为出色。这是因为SSLM不需要额外的内存来消化如此大量的信息。

另一方面,基于Transformer的模型在记住和使用它们之前处理过的序列信息方面非常高效。这使它们在内容生成等任务中表现出色,然而,由于它们会将每个单词与其他单词进行比较,这就需要大量的计算能力。

SSLM可应用于各种领域,如估计、预测和控制任务。与Transformer架构模型类似,它们在自然语言处理任务中也有出色表现,可应用于机器翻译、文本摘要、计算机视觉和音频处理。

TII人工智能跨中心部门代理首席研究员Hakim Hacid博士表示:“在推出Falcon Mamba 7B之际,我为TII促进其发展的合作生态系统感到自豪。这次发布标志着我们向前迈出了一大步,启发了新的视角,进一步推动了对智能系统的探索。在TII,我们正在突破SSLM和Transformer模型的界限,以激发生成式人工智能领域的更多创新。”

Falcon LLM的下载次数已超过4500万次,证明了该模型的巨大成功。Falcon Mamba 7B将基于TII Falcon License 2.0发布。这是一种基于Apache 2.0的宽松软件许可证,包含一项促进人工智能负责任使用的可接受使用政策。如需了解有关这一新模型的更多信息,请访问FalconLLM.TII.ae。

*来源: AETOSWire

阿联酋技术创新研究所利用新架构革新人工智能语言模型(照片:AETOSWire)

技术创新研究所(TII):性能基准 -(信息图表:AETOSWire)

✽本文转载自互联网,请读者仅作参考,并自行核实相关内容(BW)。

通过智能优化ISP设置,精准匹配目标视觉感知引擎,实现卓越的目标识别性能 中国上海--(美国商业资讯)--芯原股份(芯原,股票代码:688521.SH)今日宣布推出其基于人工智能(AI)的自动图像信号处理器(ISP)调优系统AcuityPe…
  • 公司
  • 2小时前
  • 文传商讯
阿姆斯特丹--(美国商业资讯)--人工智能驱动型企业DAM领域的全球领导者Bynder发布其AI Agents,这是一套全新的人工智能创新技术,将执行内容的充实、发现、转换和管理等关键业务任务,为新一代战略性DAM部署的发展铺平道路。 By…
洛杉矶--(美国商业资讯)-- Gallant Capital Partners(简称“Gallant”)今日宣布完成对Altify(简称“公司”)的收购。Altify是一家领先的销售支持软件平台,为企业提供关键的销售转型服务。Altify…
合同包括在三年内完成18口超深水井的钻探工作 利用AI钻井技术提升作业效率和油井质量 休斯顿--(美国商业资讯)--全球能源技术公司SLB (NYSE: SLB)已获得澳大利亚独立能源公司Woodside Energy (NYSE: WDS…
  • 能源
  • 2小时前
  • 文传商讯
  • 人物
  • 6小时前
  • 每日财经网
1月14日,超讯通信(603322)发布公告称,公司拟以自有资金出资3360万元,对外投资成立控股子公司四川讯曦智能科技有限公司(暂定名,以登记机关最终核准名称为准,以下简称“讯曦智能”),后者主要承担芯片的技术服务和服务器整机生产,以及销…
  • 公司
  • 1月15日
  • 每日财经网
在经济结构调整与产业升级的关键时期,国有企业在市场发展中的中流砥柱作用愈加凸显。随着2024年新“国九条”“并购重组六条”以及资本市场“1+N”政策体系的陆续落地,一系列有的放矢的增量政策发挥作用,也为国有企业进行产业链上下游的重组整合创造…
NetApp丰富的数据管理功能帮助客户加速人工智能创新 加州圣何塞--(美国商业资讯)--智能数据基础设施公司NetApp®(NASDAQ:)今日宣布NVIDIA验证了高性能NetApp企业级存储系统,该系统搭载NetApp ONTAP®,…
  • 公司
  • 3月20日
  • 文传商讯