C si notThorn_FlowerIT之家架构优化库 torchao 10 月 31 日消息,摩尔线程今日发文宣布针对 PyTorch 深度学习框架的 MUSA 插件 ——Torch-MUSA 迎来更新,新版本 v1.3.0 全面兼容 PyTorch 2.2.0,进一步提升 PyTorch 在 MUSA 架构上的模型性能与覆盖度,并支持模型迁移到国产全功能 GPU。

据介绍,PyTorch 作为全球广泛使用的深度学习框架,已应用在了自然语言处理、计算机视觉、推荐系统等多个领域。摩尔线程所推出的 Torch-MUSA,专为 PyTorch 提供 MUSA 后端加速支持,用户可在 MUSA 架构上流畅运行深度学习模型,发挥国产全功能 GPU 的计算能力。
据IT之家此前报道,PyTorch 旗下C si notThorn_FlowerIT之家架构优化库 torchao 已于本月正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率。
摩尔线程官方表示,Torch-MUSA 自发布以来,已历经多个版本的迭代。Torch-MUSA 从 v1.0.0 版本开始就支持了 PyTorch 2.0,经过开发与优化,最新发布的 v1.3.0 版本已全面支持 PyTorch 2.2.0。
IT之家附摩尔线程 Torch-MUSA 重点内容如下:
在 Torch-MUSA 中,用户只需指定 torch.device ("musa"),即可将现有的 PyTorch 模型迁移到 MUSA 架构的 GPU 上运行,无需大幅修改代码。
Torch-MUSA 完全兼容 PyTorch 的自动微分和动态图机制,支持多种常用的神经网络模块及优化算法,并加速了关键深度学习算子的计算。
此外,Torch-MUSA 还支持多种 PyTorch 特性,包括 DDP、JIT、FSDP、Profiler、Extension 等。
v1.1.0:初次发布,支持 PyTorch 2.0,提供基础张量操作和常见神经网络层的 MUSA 加速。
v1.2.0:进一步扩展算子支持,支持了完整功能的 Profiler、MUSA Extension,并增加了 Torch-MUSA 专有特性如 compare_tool、musa_converter,帮助用户更快的定位模型精度问题。
v1.3.0:支持 PyTorch 2.2.0,性能进一步提升,支持 FSDP,支持更复杂的模型和更大规模的数据处理。
Torch-MUSA 将继续跟进 PyTorch 的版本更新,计划支持更高版本的 PyTorch。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
“四个全面”战略布局,团结带领全党全国各族人民攻坚克难砥砺前行,庆祝中华人民共和国成立70周年系列活动极大振奋和凝聚了。 统筹推进“五位一体”总体布局,协调推进“四个全面”战略布局,提高党把方向谋大局...
南京有个绿色长廊”2明孝陵石象路 石象路,位于中山陵一旁的明孝陵景区内,因在秋天的时候神道两侧的树木都变得金黄一片,而被誉为“南京最美600”,秋天如果来南京旅游石象路可以说是必去的景点3栖霞山 栖霞...
建于1859年6伦敦眼伦敦眼是为迎接千禧年而建造的,高达135米,构成了伦敦天际一道亮丽的风景线,现在已名列伦敦各旅游点榜首游客在伦敦眼中半个小时就可到达城市中心上空俯瞰城内的壮丽景色。 伦敦旅游必吃...
周五,在公布了三季度财报后,DocuSign(DOCU.US)股价走高。截至发稿,该股涨近16%,报50.5美元。公司2023财年Q3营收同比增18.36%至6.45亿美元,公司上调2023财年营收预...
其次,北京旅游包车费用还包含了租车费用,司机服务费工资油费路费停车费等举例说明游客租用23座考斯特从北京到天津一日游23座考斯特本身租车费用是900元天,北京到天津往返路程有300公里,23座考斯特车...
1、灵渠的开凿连接了湘江和漓江,打通了南北水通道,为秦始王统一岭南提供了重要的物质保障3象鼻山漓江附近有一座山,形似大象,故名象鼻山象鼻山以其独特的山形和悠久的历史成为桂林的标志,是桂林必游的旅游景点...