AI引擎“芯”未来 嘉楠科技首谈芯片研发
在2019世界人工智能大会期间的AI引擎“芯”未来峰会上,嘉楠科技显得有些与众不同。提到嘉楠科技在AI芯片的探索,就不能不提矿机。比特币带火了矿机,也为ASIC为代表的AI芯片提供了最初的实验场。
“你看无论是做制药还是基因工程,还是矿机,还是AI,核心其实是计算。我们这家公司就认为计算是改变世界的,能够从量变到质变地改变世界——从摩尔定律来说,随着计算力的提高,你原来不可能完成的任务,最终也会解决掉。”嘉楠科技CEO张楠赓说。
2016年是嘉楠科技第一代做到16纳米的芯片矿机,这让张楠赓和他的伙伴们非常兴奋,“那是个标志性的事件,整个行业现在走到了当时半导体制程的最前沿,因为当时最好就是16纳米。”张楠赓在接受第一财经专访时说。
兴奋了一段时间,理工男的思维再度占据上风:这个事如果拿来只做矿机比较可惜,还能用这个技术改变什么?
做AI芯片:云侧还是端侧
AI能做的事情可不少,从为新药研发提供算力,到做手机芯片都曾经是嘉楠科技的考虑方向,但最终这些选择都因“太不理智了”,而被放弃。“因为芯片的产量如果不达到一定规模,无论利润有多高都会亏,这是行业的现状”,落点最后还是回归到了计算本身。
当然,变化也在发生,计算性能的提高速度在放缓。曾经人们更换手机为了有着提速,但如今效果不再明显。当绝对性能上不去以后,人们把目光投向了架构上的变革。“AI其实是好多因素综合在一起,比如说原来算法是没有的,然后现在算法逐渐趋于解决,然后原来有了算法也没有用,因为没有计算力。”
那么AI芯片的方向是云还是端?
根据赛迪股份有限公司发布的《中国AI芯片产业发展白皮书》,按销售额来看,云端训练芯片占比51.5%,云端推断芯片为25.6%,终端推断芯片为18.7%,销售额分别为41.5亿元、20.7亿元和18.7亿元。
做云端比较成功的都是大公司,比如英伟达、英特尔、华为、阿里等等。规模不够大的公司走云端芯片之路则险象环生,“因为没有场景,你发现你的产品在和大公司竞争,你的优势在某些方面很大,比如说功耗可以很低,或者可以卖得便宜,但是这和成本低是两回事,对吧?”嘉楠科技最终选择了做端侧芯片。
张楠赓把选择端作为方向归结为“其实跟做矿机有关系,当时发现软件人员并不知道。一个算法固化到硬件里以后,能够带来多大程度的性能提升。这个大家心里没谱。矿机是一个极致,因为矿机是一个专用为计算的一个机制。”
他坚信,AI可以把计算能力推到一个难以企及的高度,并把关注点放在了端侧,一个他描述为“距离传感器一英寸的地方”。
“端侧应该是有潜力的,云也可以,以后肯定是一个端云结合的一个方向,这没有问题。以目前业界来看,大家对云和端的定义并不明确,行业仍处于早期。我跟业内这些人聊完以后,最后结论就是,我觉得你说的特别有道理,然后他觉得你说得也特别有道理,但是走着瞧,我不会因为你说了我就改,但是我觉得你说的很有道理。”
找场景:怎么卖芯片?
朴素,是张楠赓用来形容第一代产品勘智Kendryte(产品型号:K210)的关键词——“我们朴素地实现一个神经网络加速器,朴素地把这些我们的外侧加进去,我们很朴素,做一颗芯片人很少没几个人,然后做完以后去看一看当时的市场会对芯片有一个什么反应。 ”这款芯片定位于人工智能与边缘计算两个领域,主要用于IoT市场。第一代芯片的客户有系统集成商,也与高校有合作项目,涵盖了包括农业、智慧楼宇等垂直场景。
指望第一代的AI芯片商业化成功,当然不太现实,现实情况是面临着多番挑战。“我们没有人知道这种芯片该怎么卖,因为这是一个真的是一个端侧的纯AI的一颗芯片,它不是它的卖点,是AI而不是别的,你看别的芯片都是说我是一个什么芯片,然后我现在有了一个AI的功能,别的芯片有原来的场景,但这个不是,这是围绕着AI做一个芯片。”张楠赓说。
也正因此,他无意切割矿机业务和现在AI芯片的关系。他提到,在封装新技术的推广上,量大的矿机芯片成为了提升工艺的动能。与此同时,由于矿机行业是没有计划,晶圆制造厂不喜欢突发性的需求,就形成了业内对矿机厂商爱恨交织的情感。“矿机这个业务是现金的支持,我在计算这边的积累全是来自于矿机。”
怎么才能够让芯片卖出去以后还能够带来持续收入,甚至不仅仅依赖于芯片本身的收入?
他们经历了多番的尝试,最开始,把相关文档做成一本手册放到网上供开发者取用。第一财经在Github上查到了最初的文档,但这个项目并没有引起社区的广泛关注,“它对使用者的技术要求实在是太高了,你需要嵌入式编程,你需要懂AI,你需要模型需要训练,你要有数据……这是不可能的”。
嘉楠科技的强项显然不是算法和软件,却也硬着头皮从零做起,推出了相应的概念产品,一个月后的人脸识别的速度达到了“给别人看都不信的地步”。慢慢的,从卖芯片、算法、软件进而是硬件模块、OEM产品、后台……嘉楠科技摸索成了一套完整的系统方案。
嘉楠科技最早寻找的AI落地场景是让摄像头不用回传视频就能实现推理。举个例子,通过摄像头识别的门禁范围,WiFi会把多个摄像头连到一个控制的一个不需要过多计算能力的计算机上,通过WiFi传递哪些摄像头可以允许人通过的命令。在摄像头端就能把人脸信息的特征值做到大概只有一百多个字节,然后下发到允许通过的其他摄像头上,就完成了门禁的部署。这套系统的推理都全部都在摄像头里运行。类似地,这样的场景还有智能门锁、智能电网和新零售。
“我去深圳去跑这些客户和生产商的时候,他们也很惊讶,觉得很需要一个类似于这样的芯片,但是并没有。”张楠赓得出了两个结论,一个是AI芯片是特别有前途的;另一个是,整个设计技术链条太长了,芯片、设备、AI算法、软件和SAAS平台做下来快要利尽而亡,需要寻找深度的合作伙伴。
相比于知名友商对9个月速度迭代的要求,张楠赓把期限放宽在一年,同时表示,明年开始会分开路线,就是高端产品线和普通产品线,“我发现很多事其实不用那么高,计算能力稍微缩一缩,成本更低一些。”
(本文来源第一财经)