阿联酋研究机构推出开源大型语言模型

    阿联酋阿布扎比酋长国官办的技术创新研究院(TII)近日宣布,阿联酋首个大型人工智能模型“Falcon40B”现已开源,可用于研究和商业用途。Falcon是一个基础大型语言模型(LLM),由TII的人工智能和数字科学研究中心(AIDRC)牵头开发,于2023年3月首次推出。其拥有400亿个参数,使用1万亿个通证进行训练。据斯坦福大学的HELM LLM基准测试工具测算,Falcon 40B使用的训练算力显著少于其他著名的同类模型,仅为OpenAI GPT-3的75%,DeepMind Chinchilla AI的40%,谷歌PaLM-62B的80%。


    为向研究人员和商业用户提供Falcon 40B LLM,支持该领域的创新和研究,TII为该模型权重访问提供了一个全面的开源包,为研究人员和中小企业提供了前所未有的访问权限。此外,TII还发起了一项研究项目征集,邀请科研人员提出创新想法,并利用该模型构建工程、医疗保健、可持续性、编码等领域的应用案例。TII以训练算力作为投资,使入选项目能够利用强大的计算资源来加速数据分析、复杂建模和探索发现。用户可通过FalconLLM.TII.ae访问Falcon AI模型或提交项目申请。目前Falcon LLM在基于开源Apache 2.0软件原则的许可下允许广泛的免费使用。    



            
访问量:231
主办单位:科学技术部国际合作司     地 址:北京市复兴路乙15号       邮 编:100826
版权所有    未经同意    不得转载
京ICP备05017536号