Sakana AI 和 Nvidia 通过跳过 80% 的无效计算，实现 30% 更快的 H100 推理-区块链文库

Sakana AI 和 Nvidia 已开源 T wELL，这是一种稀疏数据格式，可让 H100 GPU 在大型语言模型中跳过 80% 的无效计算，同时不牺牲准确性。该解决方案在 H100 上可实现最高 30% 更快的推理和 24% 更快的训练，并降低峰值内存使用。在对一个 1.5 十亿参数的模型进行测试时，通过训练期间的轻量级正则化，该方法将活跃神经元降至低于 2%，且在七个下游任务中没有出现性能下降。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复

THE END

区块链专题

Sakana AI 和 Nvidia 通过跳过 80% 的无效计算，实现 30% 更快的 H100 推理

平台公告

热门信息

狗狗币价格今日行情人民币 | DOGE币最新价格走势图

ARB币最新价格

今日萨尔瓦多科朗兑人民币汇率 – 100 SVC 兑换多少 CNY？

INJ兑英镑价格

RESOLV兑韩元价格

QNT兑日元价格

WBTC币目前人民币计价

SHIB币今日最新价格

ENA兑韩元价格

瑞波币最新价格

Doge币最新实时价格

狗狗币目前的价格

RAY最新价格

今日罗马尼亚列伊兑人民币汇率 – 100 RON 兑换多少 CNY？

CHZ币最新价格

比特币最新行情-比特币实时价格

CAKE兑台币价格

比特币最新价格行情

STRK兑英镑价格

DAI币最新价格