分享好友 最新动态首页 最新动态分类 切换频道
边缘生成式AI面临哪些工程挑战?
2024-12-27 09:33

(本文编译自electronicdesign)

边缘生成式AI面临哪些工程挑战?

当大多数人想到人工智能(AI)时,他们通常能想到的是能够生成新文本、图像或语音内容的应用。像ChatGPT这样流行的文本应用(在几天内就吸引了超过100万用户)在市场上迅速崛起并被广泛采用。而手机用户则经常使用语音搜索功能。

这些应用有什么共同点呢?它们都依赖于云端来处理AI工作负载。尽管云端生成式AI的成本高昂,但其具有的几乎无限的内存能力和电力容量意味着基于云的应用将继续推动这些流行的生成式AI应用的发展。

然而,令许多设计工程师、嵌入式工程师和数据科学家更为担忧的是,边缘AI应用的爆炸式增长。在边缘设备上执行复杂的生成式AI任务带来了许多新的挑战,如:

  • 实时处理需求

  • 严格的成本要求

  • 有限的内存资源

  • 紧凑的空间要求

  • 强制性的功耗预算


01

挑战1:实时处理需求

AI云最大的缺点之一就是在数据的发送和接收过程中存在延迟。对于像ChatGPT这样的应用来说,这并不是问题,因为用户不会注意到这几秒钟的延迟,他们可以等待几秒钟来完成文本生成。然而,在许多边缘应用中,这种延迟是不可接受的。

例如,在自动驾驶汽车应用中,根据识别到的人和其他车辆等图像来进行转向和制动,做这些攸关生死的决定至关重要。等待与云端通信的延迟是完全不可接受的。边缘AI应用必须能够在数据被收集的边缘位置实时处理数据,以满足这些对时间敏感应用的要求。

02

挑战2:严格的成本要求

对于拥有庞大客户基础的公司而言,使用昂贵的云解决方案来处理其AI工作负载,从财务上而言是合理的。然而,在大多数边缘应用中,成本是一个关键因素,也是市场上打造具有竞争力产品的关键因素。在合理的成本范围内有效增加生成式AI功能,对AI设计师和数据科学家来说将是一个挑战。

例如,在智慧城市应用中,虽然希望为摄像头和电力监控系统增加高级功能,但这些功能必须保持在政府紧张的预算范围内。因此,云方案变得不切实际。低成本边缘AI处理是必需的。

03

挑战3:有限的内存资源

AI云的另一个优势是其具有几乎无限的内存容量,这对于处理像精确文本分析和生成所需的大型数据集特别有用。然而,边缘应用并没有这种奢侈的“条件”,因为它们的内存容量受到尺寸、成本和功耗的限制。在这种资源有限的情况下,如何以最大带宽、高效地利用内存对于边缘应用来说变得至关重要。

04

挑战4:紧凑的空间要求

数据中心位于宽敞的空间内,因此,这些AI应用不会像边缘设计那样经常遇到空间问题。无论是汽车设计中的有限仪表板下空间,还是航空航天应用中的尺寸和重量考虑,边缘设计通常都会遇到实施AI功能的空间限制。

这些设计必须满足对计算和内存资源的特定尺寸要求,以便在边缘高效地处理AI工作负载。

05

挑战5:强制性的功耗预算

功耗预算时基于边缘的设计所面临的最终挑战,可能也是最为关键的。AI云消耗了大量的电力,但由于其可以直接接入电源,所以最终可归结为电力成本。

在边缘AI应用中,电力可能很容易获得。然而,功耗仍然是一个关键因素,因为它在应用的总体成本中可能占比比较高。在电池供电的边缘AI应用中,功耗的重要性更为突出,因为高功耗设备会缩短产品的使用寿命,这成为了一个关键考量因素。

解决边缘AI设计挑战的解决方案

因此,问题就变成了:“工程师如何在实现所需功能的同时,应对这些挑战并开发出成功的边缘AI产品?”需要考虑的五个关键点如下:

01

认识到边缘GPU的局限性

GPU在AI云应用中具有许多优势,其特性与AI云应用的需求高度契合。GPU具有强大的处理能力,AI云应用可以充分利用这一优势,并且GPU能够很好地满足实时处理要求。

然而,在考虑将GPU用于边缘应用时,还需要审视使用GPU的弱点。GPU的成本高于AI加速器,通常高出5倍至10倍,因此它们无法满足边缘AI的成本要求。GPU通常应用于相当大的封装设备和大盒子中,往往无法满足边缘应用的尺寸要求。最后,GPU消耗的功率远高于典型的AI加速器,也很难实现功耗预算。

02

认识到完整软件解决方案的必要性

从历史角度来看,许多AI加速器开发者首先关注芯片设计,这是可以理解的。这仍然是高质量边缘AI解决方案的重要组成部分。然而,由于这些解决方案必须创建和修改软件以适应已经确定的芯片设计,因此它们可能无法充分利用高效AI处理的所有可能方面。

与过去工程设计公司中大多数设计师专注于硬件不同,现在软件工程师的数量远远超过了硬件设计师,这使得软件能力和易用性变得越来越重要。一个出色的整体AI解决方案需要软件开发,使芯片能够尽可能高效地处理AI模型。先设计软件,然后再设计芯片,这样可以得到最佳的AI解决方案。

03

轻松集成到现有系统

虽然一些AI设计可能要从头开始的,但更多时候,设计师们试图将AI功能集成到现有系统中。通过添加AI处理能力,这些现有系统可以在保持相同外观尺寸的同时,为终端用户提供更多功能。

能够与当前设计轻松集成的重要性不言而喻。因此,提供对广泛现有处理器的异构支持的AI解决方案将更容易将AI功能添加到现有设计中。

04

高效的神经网络处理

最终,AI解决方案的整体有效性取决于神经网络能否高效地正确处理AI工作负载。尽管在众多供应商的方案中进行筛选可能颇具挑战性,但了解AI解决方案“内核”的结构和能力至关重要。我们需要了解模型是如何处理的,实施了哪些创新来提高处理效率,以及对比特定模型的处理性能。

05

DRAM的容量和带宽

AI设计中一个经常被忽视的方面是解决方案能够有效利用内存的能力。一些加速器解决方案的片上内存有限或根本没有,这会降低AI处理能力。访问片外内存资源非常耗时,从而会显著增加延迟。

其他解决方案可能具备片上内存,但如果DRAM带宽不够高,访问内存的延迟也会限制AI处理能力。

寻找合适的边缘AI解决方案供应商

最新文章
精准关键词优化策略,提升推广效果,高效触达目标用户
深度解析关键词优化策略,助力精准触达目标用户。本文详细探讨关键词选择、布局和优化方法,助您提升推广效果,实现高效营销。掌握关键词优化技巧,让您的广告更精准地触达潜在客户。在的世界里,关键词优化是推广策略中不可或缺的一环,它
人工智能的新业务(以及与传统软件的区别)
原文:https://mp.weixin.qq.com/s/y-GpJsAeE1cdeTNiWE73DA 马丁·卡萨多 ( Martin Casado)和马特 ·伯恩斯坦 ( Matt Bornstein) 从技术上讲,人工智能似乎是软件的未来。 人工智能在一系列
强引百度蜘蛛池租,解锁搜索引擎优化的新篇章,最新百度强引蜘蛛
百度强引蜘蛛池租是一种新兴的搜索引擎优化技术,通过租赁蜘蛛池,可以快速提升网站在百度搜索引擎中的权重和排名。这种技术利用了搜索引擎对网站内容的抓取和索引机制,通过模拟用户访问行为,增加网站在搜索引擎中的曝光率和点击率。与传
机器学习十大经典算法之最小二乘法
最小二乘法概述最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于
四川女排阵容大变 从保级做起
■天府早报记者李玥林今天,2013-2014赛季全国女排联赛正式开幕,晚上7点半四川队客场挑战浙江队。相比于上赛季,川军今年称得上是“大变脸”。因此,本赛季四川队非常低调,球队的成绩目标仅仅定为“保级”。川女排阵容大变脸首先从教练组
构建高效便捷的模板化一站式解决方案
本方案提供一站式搭建模板,涵盖全面功能,助力企业高效便捷创建。通过个性化定制,实现业务拓展与品牌推广,助力企业实现数字化转型。综合搭建方案模板概览综合搭建详细步骤在互联网的迅猛发展中,企业和个人越来越认识到建设的重要性,一
零基础打造月入过万个人的实战指南
本攻略全面解析个人搭建,涵盖从零基础入门到月入过万的实用技巧。包括设计、内容创作、SEO优化、广告合作等环节,助你轻松实现盈利梦想。挑选合适的与域名推广与策略探索盈利途径随着互联网的迅猛发展,个人已成为一种新兴的模式,通过构
高端网站设计制作为什么那么贵?看完你就懂了!
2.大公司看重的是网站的设计,或是设计师的真正设计能力,在业内的核心圈子中,有些真正NB的设计师就是收费贵,而且还非常受欢迎,有很多同样的大公司抢着找他们做高端网站设计制作。同样的例子在时尚圈很常见。3.我们所认为的”贵“与大公
玻纤增强尼龙6的断裂研究
玻纤增强尼龙6的断裂研究 于杰 罗筑 何敏 谭红,贵州省材料技术**基地   张凯舟 张天水,贵州大学材料科学与冶金工程院 摘要: 通过对不同玻纤含量的玻纤增强尼龙复合材料(GFPA )的性能及断口形貌的研究,得出GFPA的宏观力学性能的变化可
电子电工专业国内大学排名 电气工程及其自动化专业的大学排名
电气工程一级学科主要培养:能够从事与电气工程有关的系统运行、自动控制、电力电子技术、信息处理、试验分析、研制开发、经济管理以及电子与计算机技术应逗汪用等领域工作的宽口径“复合型”高级工程技术人才。 包含五个二级学科:080801
相关文章
推荐文章
发表评论
0评