钞能力:阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜
(资料图片仅供参考)
IT之家 6 月 13 日消息,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所(TII)打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。
▲ 图源 阿联酋科技创新研究所(TII)
据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。
此外,团队还采用了“多重查询注意力”(Multiqery attention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。
阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。
IT之家注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT之家的小伙伴们可以在这里访问。
关键词:
相关新闻
- 钞能力:阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜
- 保价618 攀升热门电脑主机促销快来抢-全球视点
- 世界信息:2023(癸卯)年公祭伏羲大典6月22日甘肃天水举行 观古鉴今述伏羲故事
- 天天快看点丨阿迪达斯持续拥抱数字化转型,以先进的技术赋能创新减碳之路
- 特朗普抵达迈阿密将出庭 呼吁支持者出门抗议“我们已失去一切” 焦点短讯
- 一战成名,俄罗斯击毁“豹2”用的导弹很强吗?缺点非常致命! 世界今日报
- 宜宾泡菜坛 环球快报
- 世界快资讯:“潢川小龙虾”地理标志证明商标注册成功
- 淮南中北巴士招聘司机_淮南中北巴士_前沿资讯
- 全球快讯:permit sb to do还是doing(permit的ing形式怎么写)
- 高考成绩单怎么样才能查到_高考成绩单怎么打印
- 中考期间潍坊主城区部分路段交通管制-焦点精选
- 广联达接待多家机构投资者调研|世界时快讯
- 上海亚虹:6月9日公司高管徐志刚减持公司股份合计3万股
- 暖心!定州母子考场外相拥感动全网!他心仪的大学回应了→|视点
- 李红军在南昌县(小蓝经开区)调研在建工业项目-世界新要闻
- 美东蔬菜获得新一轮战略融资_世界热议
- 如何在盒子上系绳子_天天快报
- 美政府欲为监控法案“续命”:招致公众反对、议员声讨|环球新动态
- 多家国内禽业设备商于2023年畜博会中展出蛋鸡非笼养系统_天天滚动
- 世界今日讯!黄河滩区复垦地小麦飘香——山东最大黄河滩区居民迁建社区夏收见闻
- 世界讯息:三维坐标测量和数字虚拟分析系统中标结果公告
- 港珠澳大桥“朋友圈”扩大,珠海公路口岸累计进出口总值达6390亿元丨高质量发展调研行 全球聚看点
- 从“修路建桥”到“牵线搭桥”:云南小伙变身老挝侨领