赋能本地 AI

内容摘要随着 AI推理对内存需求的不断增加和模型复杂度的持续提升,开发者们寻求能够本地处理这些需求的硬件,同时不牺牲性能和灵活性。从大型语言模型到生成式工作流,现代AI 负载需要具备强大计算能力和充足显存的GPU。为满足这一需求,AMD很高兴宣布即

随着 AI推理对内存需求的不断增加和模型复杂度的持续提升,开发者们寻求能够本地处理这些需求的硬件,同时不牺牲性能和灵活性。从大型语言模型到生成式工作流,现代AI 负载需要具备强大计算能力和充足显存的GPU。

为满足这一需求,AMD很高兴宣布即将推出搭载AMD Radeon AI PRO R9700 的工作站系统—这是其面向本地AI 开发和高吞吐推理的新型专业显卡。该显卡将于2025 年7 月23 日起,通过专注于定制高性能计算解决方案的精选AMD 硬件合作伙伴,提供预装的工作站系统。

突破内存瓶颈,性能再造新标杆

为加速中大型AI 模型在本地工作站上的运行,AMDRadeon AI PRO R9700 配备了32GB 高速GDDR6 显存、先进的RDNA™ 4 架构及对现代AI 数据类型的广泛支持。凭借64 个计算单元、128个第二代AI 加速器,以及对FP8、FP16和 INT8精度的支持,R9700提供强劲的TOPS 性能和处理复杂AI 任务所需的多样化能力。

凭借32GB高速显存,R9700可将大型模型完整加载于显存中,无需依赖系统内存,从而实现更快的推理速度、更高的吞吐量及更广泛的模型兼容性。在高令牌数的大型语言模型提示和指令微调模型等真实应用场景中,其性能可大幅提升。

专为AI专业人士打造

AMD Radeon AI PROR9700针对对硬件性能有极高要求的AI专业用户设计,特别擅长自然语言处理、文本生成图像、生成式设计等需要大型模型或高显存流水线的复杂任务。无论是进行大规模推理、本地微调,还是支持多模态工作流,RadeonAI PRO R9700均能提供充足的容量和速度,实现全程本地运算,提升性能、降低延迟,并增强数据安全性。

Radeon AI PRO R9700完全兼容AMDROCm开源软件平台,为开发者提供了强大且可扩展的AI与高性能计算环境。支持PyTorch、ONNXRuntime和TensorFlow等主流框架,ROCm使用户能够高效构建、测试和部署基于R9700的本地AI模型。32GB显存、RDNA4架构和ROCm6.4.1的结合,实现推理、微调及定制模型工作流的加速表现,使RadeonAI PRO R9700成为追求性能、灵活性和开放标准的AI专业人士的理想选择。

凭借紧凑的双槽设计、PCIe5.0接口及鼓风式散热方案,RadeonAI PROR9700支持多GPU工作站部署。不同于采用轴流风扇设计、通常难适配高密度系统的消费级显卡,R9700的鼓风设计确保高效的前至后气流,允许多张显卡在高性能紧凑环境中稳定运行,方便部署并行推理流水线、扩展多卡显存容量及支持更大规模并发模型负载,助力企业构建可靠、高吞吐的本地AI基础设施。

通过RadeonTest Drive亲身体验RadeonAI PRO R9700

有兴趣评估RadeonAI PRO R9700用于本地AI工作负载的开发者,即将能够通过RadeonTest Drive项目进行体验。该项目旨在帮助技术用户探索AMD支持AI的工作站GPU,提供基于AMDRadeon PRO GPU驱动、搭载ROCm6.4.1环境的高性能合作伙伴工作站的实操机会。无论是基准测试PyTorch等框架,还是评估本地大型语言模型推理,RadeonTestDrive都是快速、无风险的入门途径。即刻申请访问权限:www.amd.com/en/developer/resources/cloud-access.html

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: