赛灵思:致力打造灵活应变、万物智能的世界

www73466com

2018-10-22

2108年10月16日,开发者大会在北京召开,本次大会有近千人参加,为广大软硬件、嵌入式开发者提供了一个面对面交流、学习、分享经验的机会。

赛灵思的专家团队以及华为、阿里巴巴、浪潮等数十家国内外领先企业的专家汇聚一堂,与广大开发者共同探讨行业趋势,分享设计经验,展示先进案例。

在本次大会上赛灵思产品与技术市场营销高级总监KirkSaban与赛灵思软件和IP产品部执行副总裁SalilRaje分别进行精彩主题演讲。 一、颠覆性的创新KirkSaban在大会上说道:“现在的世界是一个互联的世界,发展与创新的速度都是非常快的。

我们每天都在面对海量的数据,单一的计算架构已经不能应对如此大规模的数据,需要各种各样的计算架构彼此配合。 ”赛灵思产品与技术市场营销高级总监KirkSaban如今的开发者结构发生了变化,不单单有硬件开发者,也涌现了很多软件开发者。 但是并不是所有的软件开发者都熟悉硬件开发,他们需要有可以使其可以快速上手的平台与工具,也需要相应的能力来优化产品性能并用在不同的工作负载中。

那么如何来解决这个问题呢?过去有三个解决方案:CPU、固定功能的加速器(像ASSP和GPU)与FPGA。 但是就如今的技术发展程度来说,这三种解决方案或多或少的都存在不足,不能很好的应对各种各样的问题。 为此,KirkSaban向大家介绍了平台与其首款产品。

ACAP是可扩展性非常高的、软硬件都可编程的、高度集成的多核异构计算平台。 因为ACAP的出现,未来的计算拉开了序幕,首款ACAP产品Versal应运而生。

Versal具有异构处理能力,有多个不同类型的处理引擎,可以应对市场上多样的工作负载。

Versal有哪些特点呢?1、标量处理引擎。

Versal有双ARMCortex-A72应用处理器。 嵌入式处理来自于ARM,拥有高性能的同时又支持非常广泛的应用。

双ARMCortex-R5实时处理器,适用于对安全性要求非常高的应用,而且有一些步骤锁定功能可以进行平台管理。 2、灵活应变的硬件引擎。 灵活应变的硬件进行重新架构提高计算密度,能够支持客户内存层次结构,比如要求不同的内存层次结构高级机器学习和推断部署和实施。 3、智能引擎。

●DSP引擎,DSP的引擎在Versal架构当中能够实现高精度浮点和低时延,主要面向定制化数据路径的粒度控制。

●AI引擎,能够大大提高应用的AI推断能力,专为AI推断和高级信号处理工作负载而优化。

4、集成主机接口。 PCIeGen4x16,集成AXI-DMA。

还有实现服务器级CPU,提供无缝加速CCIX。

5、集成各种协议引擎。 包括100G多速率以太网,600G以太网和Interlaken,以及600G加密引擎(AES/IPSEC/MACSEC)6、集成RF信号链。

下一代GSPS直接射频采样ADC/DAC,集成DDC/DUC。 面向5G和DOCSIS的SD-FEC。 7、可编程的I/O界面。

支持传感器的MIPID-PHY大于3Gb/s;支持NAND和存储级存储器;包括LVDS和通用的I/O。 8、片上网络(NOC)。

本质上软件可编程,简单易用;高带宽、低时延;与软实现相比功率效率提升8倍,跨异构引擎仲裁。 9、此外还是可扩展的集成存储器控制器与范围最广泛的收发器。 在赛灵思开发者大会上,主要两个VersalPrime基础系列与AICore核心系列。

二、AI加速在赛灵思开发者大会上,SalilRaje先生进行了主题为“AI加速”的精彩演讲,激情描绘赛灵思灵活应变的新型器件将如何加速当今AI时代各种创新的整体应用,拥抱所有的开发者。 赛灵思软件和IP产品部执行副总裁SalilRajeSalilRaje谈到AI人工智能有两个阶段,训练和推断。

在训练的阶段要将海量的数据放到模型当中,然后微调模型减少误差。 海量的数据在这个阶段是至关重要的,相对而言延迟和功耗在训练阶段不是重要。

而在推断过程中,用到数据量比较少,在此阶段延迟是极其关键的,甚至会成为一种制约。

这是因为很多推断引擎都是实时响应的,响应速度至关重要,这样一来,功耗在这个阶段也就显得非常重要了。

在过去几年全球的关注点都集中在训练上,但是今后AI模型必须应用在云端和边缘的模型上,所以未来的模式更多的将是推断。 而赛灵思关注的就是推断。

那么推断这个模式将带来哪些挑战呢?第一是AI创新的速度。 第二,低时延、高通量和高性能的要求。

第三,低功耗。

最后同样是实现整体的应用加速。 那么赛灵思是怎么应对这些挑战的呢?SalilRaje认为只有灵活应变的硬件才能应对推断所面临的挑战,比如赛灵思的FPGA和ACAP。 灵活应变的硬件的优势在于:1、自定义数据流。 针对最先进的当前的网络与最先进的技术变化,可以重新实施而不需要重新更换芯片;2、自定义内存的层次结构。

可以用更多的片上内存而不是DDR;3、改善功耗和时延;4、自定义精度。 可以选择网络最合适的精度。 赛灵思开始创造的一个特定领域架构是DSA,这些DSA在FPGA或者ACAP器件上进行实施和部署,能够在自定义的数据流、自定义的内存层次结构和自定义精度三个维度上进行优化。 一旦在ACAP实施就可以将现有的网络转到DSA来实现AI模型。

而赛灵思收购了在DSA方面的领先企业——深鉴科技,深鉴科技有非常独特的技术,可以自定义数据流来适用大家所需要的网络。

此外,深鉴科技还有量化的技术,即可以自定义精度也可以重新训练,然后重新获得精度。

如DeephiLSTM与XDNN。 人工智能的革命已经开始了,在AI推断面前有很多的机会和挑战。

赛灵思的器件包括FPGA、ACAP等能够提供同步AI创新的速度、低时延的最佳性能、最佳功耗效果以及加速整体应用。

无论是AI专家还是AI新人,赛灵思都非常期待和大家共同合作,携手并进。