12月19—20日,由鹏城实验室和新一代人工智能产业技术创新战略联盟主办的“2021新一代人工智能院士高峰论坛暨启智开发者大会”在深圳举办,期间,华为技术有限公司承办的新一代人工智能院士高峰论坛昇腾人工智能应用专场于20日成功举行。深耕基础,厚植技术。近年来,华为昇腾以“硬件开放、软件开源、使能伙伴、发展人才”16字方针不断发展产业,携手各行各业的开发者们进行赋能升级,助推人工智能的应用落地。本次昇腾人工智能应用专场,华为更是邀请了多位昇腾技术专家,从一线的AI应用挑战出发,与开发者们研讨交流,共创机遇。
与开发者共成长,共筑AI技术生态
会上,华为昇腾生态首席专家张存燕以行业的人才培养为切入点,向大家分享了昇腾面向开发者们的offering发展战略,以及面向行业、高校、初创、个人不同类型开发者的权益和计划。张存燕介绍到,华为深耕根技术,一直致力于打破算力消耗的鸿沟。在昇腾基础软硬件平台上,昇腾一共打造了技术和商业两个生态。技术生态为科研机构、高校、企业、合作伙伴的研发人员提供技术支撑,加速科研创新;商业生态则注重与合作伙伴一起打造面向各行各业的解决方案,真正让AI走入到千行百业,赋能各个产业的智能化改造和智能化升级。
在这两个生态的带动下,昇腾希望打造一个人工智能的“黑土地”,合力为每位AI开发者及每个行业的应用开发者提供强大引擎,共同繁荣国内人工智能产业新生态。
构筑澎湃AI算力,CANN5.0性能再提升
在汹涌的AI时代浪潮中,人工智能技术领域无疑面临着重重困难和挑战。AI算力设施昂贵、专业人才稀缺,整个行业对计算效率和编程易用性的诉求愈发强烈。昇腾CANN运营总监田晓亮便从新计算范式出现、异构计算兴起和大集群等行业新挑战引导发问,介绍了CANN的基础架构及其适配场景。自2018年CANN1.0发布面世,经过三年发展,CANN在技术和生态上都已经有了长足的进步。在性能方面,CANN5.0通过软硬件结合优化,充分发挥了昇腾芯片的算力性能。这主要源自于多项关键技术的突破,如自动流水、算子深度融合、自适应梯度切分、智能计算调优带来的更高效的任务角度和切分策略。
在发展过程中,CANN还非常注重生态发展,通过社区运作,CANN不断创新优化,迭代出了新的产业、新的软件。回应开发者诉求、助力解决行业困境,CANN未来将持续在基础和关键技术上进行突破,“只有基础打得牢、根扎得深,才会有人工智能的繁荣发展”,田晓亮这样强调。
全场景AI计算框架,MindSpore超大模型训练落地实践
近段时间,中文大规模预训练语言模型层出不穷,已经成长到仅加载就需要TB级内存或显存的生态。昇思MindSpore架构师ZOMI酱就针对MindSpore超大模型训练的一些关键技术,进行了一些稍为“硬核”的内容分享。MindSpore在2020年3月份开始开源,到现在的1.5版本,总下载量已经接近100万。快速部署、灵活调试,现在的MindSpore已经能够支撑像鹏城盘古NLP、鹏城神农氨基酸序列生成、华为云NLP模型、紫东太初多模态模型这样的千亿大模型。对于大模型面临的“内存、性能、效率、调优”挑战,MindSpore则分别对应给出了图算融合、Scale out、集群调优等解决方案。
讲起核心技术,ZOMI酱表示,除了通过图的编译把多维度并行融合到框架,“多维度混合自动并行”是MindSpore做得比较好的地方。现今,MindSpore自动并行已经实现5维的并行方式,实现对超大规模的分布式训练及超大规模中文预训练模型的探索。
MxIndex:更快、更便捷、更友好的数据检索SDK
将物理世界中的非结构化数据,如图片、视频、音频通过AI模型转换为特征,是众多AI业务的核心逻辑。昇腾MindX技术专家李明举在给大家介绍数据检索的SDK时,就用简单的语言阐释了普通开发者如何用AI来解决生活中的问题。让AI从学术成果到产业落地,昇腾MindX总结了三座问题大山——算法开发难、应用开发难和业务部署难,而MindX的四个组件“MindX DL”“ MindX Edge”“MindX Zoo”和“MindX SDK”则对应这三座大山给出了解决方案。
“大数据”“区块链”“元宇宙”,各行各业的概念正潜移默化地改变着我们的生活,昇腾MindX SDK mxIndex更是将目光聚焦在了非结构化数据上。李明举提到,非结构化数据有着非常多潜在的发展空间,在推荐系统、数据挖掘等领域都有良好的发展前景。但同时,机遇与挑战并存,算法问题常常会演化成更大的工程问题,如何在如此多的技术之下去搭建业务,mxIndex在这里给出了答卷。“更快”——带来更高的QPS,更大的吞吐量和更大的底库数据规模;“更便捷”——昇腾拥有开源中最受欢迎的框架之一,而mxIndex在用户迁移上更是兼具了轻体量与便捷性两项优点;“更友好”——清晰操作、在线交流,在用户体验上,mxIndex拥有简明的接口定义,丰富详实的手册和活跃的社区支持。对于大规模特征检索或聚类的应用场景需求,mxIndex能够提供极简易用、高性能的API,助力昇腾AI处理器赋能各类应用。
Sedna,分布式协同AI框架
边缘AI在如今的工业互联网、智慧园区等场景已有着越来越多的应用,但同时还存在着诸多挑战,包括软硬件异构、边缘资源受损、边缘数据异构、边缘小样本和隐私安全等常见问题。会上,华为云边缘云创新Lab高级工程师普杰从应用的角度,向开发者们介绍了华为云在边缘计算尤其是边云协同AI领域的相关探索。
2018年,华为云开源了边缘计算平台项目KubeEdge。作为业界首个云原生的边缘计算平台,KubeEdge通过开放的社区治理连接云原生和边缘计算生态,旨在提供应用协同、资源协同以及数据协同和设备协同的统一标准。
在边缘计算场景中,AI应用需要面对个性化的边缘场景,资源碎片化、数据异构、小样本、数据隐私等问题急需解决。2020年底,KubeEdge社区成立了特别兴趣小组SIG AI,聚焦边缘AI相关的技术讨论、API定义、参考架构、开源实现等,使能AI应用在边缘更好的运行。
2021年初,华为云进一步开源了边云协同AI框架Sedna,基于KubeEdge,实现边与云的协同推理、增量学习、终身学习、联邦学习等核心边缘AI能力,能有效提升模型准确度,降低边缘资源的消耗,保护数据隐私和安全。
普杰提到,Sedna不是想做一个TensorFlow这样的框架,而是基于KubeEdge提供的边云协同的能力,支持现有的AI应用无缝地下沉到边缘,降低边云协同AI应用的构建和部署成本、提升模型的性能并保护数据隐私。
相比传统的公有云AI方式,分布式协同AI具备个性化的边缘场景、更低的响应延迟和更安全的数据隐私保护三大优点。在分布式协同AI领域的探索上,Sedna也遇到了资源碎片化、样本少的技术挑战,KubeEdge社区的特别兴趣小组SIG AI也因此成立。普杰提到,SIG AI不是想做一个TensorFlow这样的框架,而是基于KubeEdge这样的底座提供边缘协同的能力,支持现有的AI类应用,无缝地下沉到边缘,降低构建和部署成本、提升模型的性能并保护数据隐私。
现场实操,在线体验昇腾全栈AI魔力
当天下午,昇腾人工智能应用专场进行了丰富有趣的案例分享和在线实验。现场由昇腾CANN资深技术专家毛红朝、昇腾MindX研发专家陈航、昇思MindSpore资深技术专家xavier和昇腾CANN资深技术专家郑佳带领,为开发者们带来了“基于昇腾CANN的AI应用开发”、“使用MindX SDK开发智能质检应用”、“昇思MindSpore YOLO案例开发到部署介绍”和“基于昇腾CANN的模型迁移”四场实操课程。
共筑AI新高地,共赢智能新未来。伴随着惊喜有趣的现场抽奖环节,开发者们于实践中全方位感受华为面向“端、边、云”的全场景AI基础设施方案,在线体验来自昇腾的全栈AI魔力。
文章来源:南方网