EN CN
注册

【IC设计】AMD也要进军人工智能领域 终结英伟达一家独大优势

来源:InfoWorld       

据InfoWorld网站报道,目前,用于机器学习应用的显卡市场基本上是一家公司的天下:英伟达。

AMD是另外一家主流独立显卡厂商,市场份额达到30%,英伟达市场份额为70%。在机器学习领域,英伟达的领先优势可以用一个词来描述:一家独大。原因不仅仅是英伟达产品在所有支持显卡的云服务中占有压倒性优势,应用在机器学习中的显卡中间件大体上都是英伟达的CUDA(统一计算设备架构)。

AMD很早就制定了反击计划。除一直在开发在价格和性能上能与英伟达竞争的硬件产品外,它还在打造一个与厂商无关的显卡编程资源平台,使开发者在开发采用显卡的解决方案时能自由地选择AMD技术,而无需担忧软件支持。

AMD最近公布了实现这些目标的新措施。首先是一款新显卡产品——Radeon Vega(基于之前公布的新显卡架构);其次是新版开放源代码软件平台ROCm——使机器学习框架和其他应用能利用多种显卡的软件层。

这两个元素——硬件和软件,同等重要。对于AMD反击英伟达在机器学习领域的优势来说,两者缺一不可。

AMD新一代明星显卡:Vega

长期以来,AMD一直致力于提供性价比最高的产品,无论是处理器还是显卡(或长期以来传言中的二合一产品)。Vega——AMD的新一代显卡,目标不是成为英伟达Pascal系列显卡的高性价比替代品,而是完全击败Pascal。

InfoWorld 表示,AMD披露的早期跑分显示,Radeon Vega Frontier Edition显卡(一款专业级Vega显卡),在DeepBench中的跑分是英伟达Tesla P100显卡的1.38-1.51倍——与使用的英伟达驱动程序版本有关。

尽管跑分这种事儿不必过于认真,但如此大幅度的性能差距仍然给人留下深刻印象。重要的还有AMD产品的价格。Tesla P100零售价约为1.3万美元(约合人民币8.9万元),AMD尚未披露Vega Frontier价格。即使Vega Frontier价位与Tesla P100相当,它也还是很有吸引力的,符合AMD的总体商业策略。

AMD应对CUDA的技术:ROCm

对于AMD在机器学习领域获得优势更重要的不是在价格上击败英伟达,而是确保其硬件在常见机器学习应用中得到与英伟达至少同等程度的支持。

大体上,利用显卡进行加速的软件,都使用英伟达的CUDA库文件——只支持英伟达硬件。开放源代码的OpenCL库,在多种类型设备上提供与厂商无关的支持,但性能不如CUDA等专用解决方案。

AMD没有努力改进OpenCL,使之可以与CUDA媲美——这是一个由委员会推动的缓慢过程,而是打造自己的开放源代码显卡计算平台ROCm(Radeon开放计算平台)。AMD的理念是,ROCm为显卡——主要是AMD自家显卡,提供了一个与语言和硬件无关的中间件层,从理论上说适用于任何显卡。如果有需要,ROCm还可以通过OpenCL与显卡通讯,但也提供有直接与底层硬件通讯的渠道。

InfoWorld称,与OpenCL相比,ROCm能大幅提升机器学习应用的性能,这一点是毋庸置疑的。把Caffe框架移植到ROCm,速度比OpenCL版提升了约80%。另外,AMD还宣称,移植代码利用ROCm是一个高度自动化的过程,这是现有框架尝试ROCm的又一个“诱因”。对其他框架的支持——例如TensorFlow和MxNet,也在规划中。

AMD着眼于长远考虑

AMD心目中的最终目标并不复杂:创建一个环境,使其显卡在机器学习领域能替代英伟达产品。AMD可以通过以相当的价格提供性能相当甚至更高的硬件,确保现有的机器学习软件生态链能在其显卡上运行来实现其目标。

在某种程度上,移植软件是最简单的部分。移植软件基本上就是聘请足够多的编程人员,为最重要的开放源代码机器学习框架改写需要的代码,然后随着硬件和框架不断发展而更新代码。

对于AMD来说最困难的工作,可能是在大规模提供显卡的应用中取得立足之地。Amazon Web Services、Azure和Google Cloud Platform中的显卡都是英伟达产品。需求尚不支持其他显卡。但是,如果新一代机器学习软件更加独立于显卡,云服务提供商将失去一个不采用Vega或其后续产品的借口。

AMD引导其显卡在机器学习领域需求的任何计划都是大胆的。AMD要成功需要数年时间,因为它面对的是一个英伟达已经称霸多年的世界。

如需获取更多资讯,请关注全球半导体观察官网(www.dramx.com)或搜索微信公众账号(全球半导体观察)。