订阅高工机器人官方微信

【视点】赛灵思FPGA:如何让AI变现能力迅速增强?

2019-04-18 10:20 高工机器人网 阅读:9423
分享到:

摘要在过去的20多年技术发展过程中,我们经历了PC时代、互联网时代、移动互联网时代、AI时代,以及所面临的下一个时代——AI+IoT。

关于恶意转载本网原创文章,故意删除高工机器人字眼的严正声明

【文/潘敏瑶】在过去的20多年技术发展过程中,我们经历了PC时代、互联网时代、移动互联网时代、AI时代,以及所面临的下一个时代——AI+IoT。

在PC时代,基本上每个人或者每个家庭都开始有了电脑,有了互联网之后,人与人或者机器与机器之间的连接慢慢赋予能力。在过去十几年里,随着手机的普及,尤其智能手机的普及,第一次智能终端的数量超过全球人口的数量,每个人都有一个手机作为智能终端;现在,人人都在讨论AI,考虑AI怎么落地,大家也在思考未来10年、15年、20年的AI+IoT时代是什么样子。

赛灵思人工智能市场总监刘竞秀分析:“AI并不是某一个行业或者某一个产品,最终还是要落地在具体的场景、行业、需求上。AI最终会被所有需要做计算、做理解、做感知的设备、场景和服务提供本地的计算能力和云上的计算能力,本质上AI是通用能力,就像电、内燃机一样,它所赋能的并不是某一个特定行业狭窄的应用,而是可以促进众多行业的产业升级、产品迭代。但不同行业对AI的需求以及AI能做什么,不同的厂商、不同的客户会有不同的理解。”

在他看来,AI的核心是高性能计算,通常讲到计算就会想到CPU和GPU。CPU用于通用计算,GPU用于高性能计算。“从2012年开始,第三波人工智能起来,到现在人工智能发展迅速,但落地的场景和我们看到的回报还是低于大家的预期。”

人工智能落地的两个“剪刀差”

刘竞秀认为,有两个剪刀差阻碍了这个时间点人工智能的落地。第一个是需要处理的数据和计算芯片所能够提供的处理能力之间的剪刀差。

 image001.png

计算芯片工艺从过去28纳米、20纳米、 16纳米、14纳米进一步发展到10纳米、7纳米、5纳米、3纳米,摩尔定律使芯片性能增速越来越饱和。“大家看到技术的趋势,只有高端的消费类、迭代很快的产品,例如手机,才能支撑得起最先进工艺高昂的芯片迭代成本。”

至于芯片的发展趋势,无论从CPU、GPU到FPGA、ASIC,对于通用芯片来讲,它的好处是应用比较广泛、上手比较快,大公司如谷歌、阿里也在推出芯片,众多创业公司都在做各种各样的ASIC,希望在特定的定制领域提供一些场景和应用。

对这些特定的场景和应用,ASIC的性价比可能更高,所以技术发展的趋势一定是从CPU、GPU到FPGA,最后到ASIC。“所以在市场上有一个很重要的时间窗口,就是每个行业在需求成熟之前,在大家有能力、有信心去开ASIC把这个钱赚回来之前,大家不会去开ASIC,而且这时候又需要一个平台做初期的市场尝试或者在激烈的市场竞争中快速将创意变成现实, 赢得市场先机,这时候FPGA就是最好的计算平台产品。” 刘竞秀表示。

第二个剪刀差就是芯片设计生产的长周期和快速迭代的市场需求之间的差距。刘竞秀指出:“芯片不是靠钱就可以换时间的技术,最快也要一年半到两年才有可能走完一个完整的流程,从后端设计包括封测等等,这个一年到两年的时间窗口是任何人做ASIC都要经历的。”

目前许多AI公司的客户,很多情况下需求都非常紧迫,如这个月有一个项目,希望供应商下一个月就能出方案和产品。所以,第二个剪刀差就是快速变化、快速迭代的市场和ASIC开发周期漫长之间的差距。

商业模式发展趋势的两大关键因素

 image003.png

过去这几年,各种各样AI相关的主流应用场景,包括视频和图像相关应用,基于语音相关的应用。

首先,正规十大赌博网站安防监控系统在逐步增强,后来发现布置的摄像头越多就需要越多的人来看,导致警察大量的时间花在看视频上从而导致警力的不足,而AI恰好可以在这一个痛点上极大的提高警察系统的效率。“AI不需要准确地告诉你谁是坏人,只要告诉你今天有十个嫌疑人是坏人,只要看这十个人就好了。”

除了行业应用的安防监控,现在的高档写字楼、高档酒店,跟人脸识别相关的场景也越来越多,包括机场、火车站设置了大量无人值守的闸机。

第二类应用是随着最近几年有大量短视频的网站兴起,对于这样的公司,他们有个很重要的刚需,就是内容审查机制。“现在都是靠大量的人力来做,这是很有限的,而AI视频审查在可以缓解这方面的压力。非实时短视频业务相对比较容易做,但直播类的比较难。因此,大量的AI公司会基于文字、人脸识别、行为动作,提出审查机制的解决方案,促成不同场景、不同网络节点都在做相应的尝试和大量的部署。”

第三类应用与消费类相关,如无人值守超市。此外,还有与汽车相关的应用,如自动驾驶、无人驾驶,这些ECU(电子控制单元)最终都需要它具备一定的理解能力,辅助中央控制器做相应的判断和决策。

跟语音相关的应用就非常丰富了,如家里的聊天机器人、小度,包括手机里的siri,都是用AI做辅助的应用,但语音相关的应用本质上来说和视觉相关应用相比还不足够成熟,其关键因素是,视觉相关的应用,用CNA或者DNN做网络检测的应用,能够提供端到端解决方案的技术,对于语音应用,AI(例如LSTM)在语音应用里面,这样的网络模型只是不同语音模型中的一部分,有大量的前处理跟后处理的技术,跟AI没有关系。此外,可以发现语音聊天机器人能力有限,无论数字级多丰富,训练的网络多深,也没办法聊上二十句。

赛灵思方案:灵活应变万物互联的高性能计算平台

从赛灵思的角度来看,无论是万物互联还是大规模的超算,都是为给客户和市场提供快速部署的平台,目标是提供灵活应变万物互联的高性能计算平台。

秉持“数据中心优先,加速核心市场发展,驱动自适应的计算”的战略,赛灵思聚焦于汽车、通信领域、航空航天,传统工业控制、医疗等领域。

 image005.png

赛灵思下一代的Versal计算引擎,首先面对通信和人工智能高性能场景,定义了完全不一样的芯片价格,利用3D技术提供高性能的高带宽存储,提供计算和存储能力。

“人工智能的网络都是几十、几百层,几千万、上亿参数的快速运算和反复的读取,如果每一层的数据运算的结果都需要去读写的话,就会导致延时长、功耗大,所以目前主流做AI芯片的企业慢慢会提供尽可能大的存储空间,而3D的技术是最有效提供高性能面向存储的技术。同时,充分利用硬核处理器功能,支持AI场景的快速运算。”

从人工智能的解决方案来看,我们希望为客户提供端到端的解决方案,为客户提供不同层次的支持,从底层的硬件,中间各种各样的IP以及软件,应用层各种各样的神经网络模型,都可以提供给客户。

从行业的角度来看,赛灵思希望提供的是一个通用的AI解决方案,首先,在底层定义了自己的指令级和IP,这些高效的定制IP专门为人工智能做不同的算子,比如特殊编程,提供定向加速的IP,定向到相应的指令。此外,开发了工具,通过这些工具和SDK为客户提供了接口,客户调用的方案后,就可以支持不同行业不同场景的应用。

事实上,无论是人脸、车辆等都是不同的CNA,它们核心的算子都是一样的,就是网络架构和参数配置不一样,然后生成不同的指令,最终运行在不同的硬件平台上。

“FPGA很多场景应用非常高,代价是周期比较长,三个月、六个月到一年都可能,使用赛灵思现有的方案,最快几个小时就可以把新的网络部署在硬件上,把系统运行起来,这对人工智能的创业公司和合作伙伴来讲是最重要的,可以非常快地拿到一个原型机,用这些原型机去真正的场景做性能、功能的迭代、数据的收集,这样产品才能更快推向市场。”

赛灵思作为一家传统的FPGA芯片公司,现在已经慢慢走向另外一个维度,希望为客户提供的不单是一颗芯片,以及围绕芯片的PCB层面的参考设计,现在更希望的是帮客户提供基于芯片、IP加上工具,以及客户在真实场景中真实应用的算法,全套帮助客户提供参考设计,并免费提供给客户参考设计的神经网络,从而帮助客户更好的使用基于赛灵思FPGA的解决方案。


热门文章
  • 日排行
  • 周排行
  • 月排行
欢迎投稿

联系人:郑先生

Email:ly.zheng#gaogong123.com
发送邮件时用@替换#

电 话:0755-26981898-843