在富岳超算上训练大模型 日本联合研究团队发布Fugaku-LLM
发布时间:2024-05-27 来源:互联网 点击:(3053) 【 字体:大 中 小 】
在富岳超算上训练大模型 日本联合研究团队发布Fugaku-LLM
IT之家消息,由多方企业和机构组成的日本联合研究团队昨日发布了Fugaku-LLM大模型。该模型的最大特色就是其是在Arm架构超算“富岳”上训练的。
Fugaku-LLM模型的开发于2023年5月启动,初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所(理研)。
而在2023年8月,另外三家合作方——名古屋大学、CyberAgent(也是游戏企业Cygames的母公司)和HPC-AI领域创企Kotoba Technologies也加入了该模型研发计划。
据悉,研究团队表示其充分挖掘了富岳超算的性能,将矩阵乘法的计算速度提高了6倍,通信速度也提升了3倍,证明大型纯CPU超算也可用于大模型训练。
Fugaku-LLM模型参数规模为13B,是日本国内最大的大型语言模型。
其使用了13824个富岳超算节点在3800亿个Token上进行训练,其训练资料中60%为日语,其他40%包括英语、数学、代码等部分。
该模型的研究团队宣称Fugaku-LLM模型可在交流中自然使用日语敬语等特殊表达。
具体到测试成绩上,该模型在日语MT-Bench模型基准测试上的平均得分为5.5,排在基于日本语料资源的开放模型首位,并在人文社科类别中得到了9.18的高分。
目前Fugaku-LLM模型已在GitHub和Hugging Face平台公开,外部研究人员和工程师可在遵守许可协议的前提下将该模型用于学术和商业目的。
猜你喜欢

第五届中国工业互联网大赛无锡赛站决赛举办
以“数字赋能 智创未来”为主题,由工业和信息化部、国务院国有资产监督管理委员会、中华全国工商业联合会等单位主办的第五届中国工业互联···

消息称《光环》和《战争机器》今年都要登陆PS5平台
今日早些时候,业内知情人士NateDrake报道称,Xbox主机独占游戏《光环:士官长合集》将于2025年登陆PS5平台。似乎另一···

索尼高管谈《星鸣特攻》失败:会继续专注在线服务游戏
近日SIE联席首席执行官赫尔曼·胡尔斯特(Herman Hulst)接受日媒Fami通采访,他谈到《星鸣特攻》的失败,以及Play···

浜口直树:《最终幻想7》重制版第三部开发非常顺利
据《最终幻想7》重制三部曲的监督浜口直树透露,该三部曲第三部的开发“进展顺利”。《FAMI通》推出了其年度年终专题,在这个专题中,···

网传:游戏大奖TGA2024将公布“重磅”消息
网传:游戏大奖TGA2024将公布“重磅”消息距离游戏大奖颁奖典礼还有不到一周的时间,这也意味着未来几天我们将看到一些游戏的新细节···

复旦教授称中国退休年龄还是太早,建议推行延迟退休制···
在当今这个快速发展的时代,退休年龄问题成了一个热门话题。复旦大学的一位教授彭希哲,这位在学术界有着丰富成就的资深教授,近日就提出了···

乐火影视推荐 《逃出白垩纪》


唐朝之后是哪个朝代 唐朝后的历史都有哪些朝代


中职与高职有何不同 学的东西一样吗


汽车钥匙丢了怎么找回,需要提供什么证件


教你8个穿衣搭配技巧


有这4个特征的女人,都会有一股“高级感”长相很一般,来看一下


2023高考报志愿能用手机吗 高考志愿填报注意事项有哪些


无锡有哪些工艺品推荐 什么是江苏无锡特产


大型客车是什么驾照


晚上在高速上开车,如何提醒后车关闭远光灯?第3个办法最有效果
