In-situ AI- 物联网的分散式雾运算

浏览量:677 点赞:107 收藏:306 2020-06-07

In-situ AI: 物聯網的分散式霧運算


随着物联网(Internet of Things, IoT)的普及,我们周遭布满各式各样的感测器与摄影机,带来生活便利之余也收集了大量资料,成为电脑探索物理世界的素材。如潮水般涌入的资料,更是深度学习发展的重要基础。以往这些资料会被传到云端,在云端进行分析处理。然而愈来愈大量的资料,使传输耗费的能源急遽增加,其中更伴随着隐私上的顾虑。此外,传统在伺服器进行的监督式学习模型,在应付型态各异的原始IoT资料上也显得笨拙。因此,若能在装置上进行初步的资料处理,从源头解决问题,除了能降低传输到云端的资料量,也能更有弹性地处理不同类型的资料。

去中心化分散式计算

物联网收集的资料具有两大特性:他们是动态(dynamic),且不具有标籤的(unlabeled)。当生物学家在野外装设监视器,捕捉野生动物的画面影像时,影像品质受到环境亮度、天气等变化影响,存在极多的变异量,收集的资料相当动态。当机器遇到未曾见过的资讯时,判读上难免有较大的误差。又因为人工标记的速度,永远赶不上指数成长的资料量,使得大量资料不具有标籤,不适用需要藉由目标答案进行训练的监督式学习。因此,若要充分利用大量原始的资料,势必得发展出一套以非监督式学习为基础,具有足够準确率的模型。

「In-Situ AI」这套运算架构,因应物联网资料的特性与使用情境,在资料收集处就地进行大部分的运算工作。不同于以往将资料全部传到「中央」的云端,再接收「中央」决策完回传的指令,In-Situ AI 发挥了去中心化的精神,善用地方资源、产生因地制宜的策略。其架构分为两大部分:运算中枢(Node)与云端(如图一)。云端有较高的运算能力,负责从大量的物联网资料进行非监督式学习,汲取重要的特徵。接着藉由迁移学习(transfer learning),让运算中枢的推理网路(inference network)认识这些特徵。如此在有限的标记资料下,推理网路也能对周遭世界具有一定程度的判读能力。实验结果显示,迁移学习学到的特徵,让推理网路预测的準确率提升30 %(达到近60 %),弥补标记资料不足的限制。

In-situ AI: 物联网的分散式雾运算

图一、以云端为中心(a)及分散式(b)运算架构 ( 译者自绘 )

面对动态的资料,运算中枢同时具有「诊断」功能,能找出判读错误的资讯。错误的原因很可能是因为先前学习时没有看过,因此诊断出来后会把这些资讯回传至云端,增加训练的素材、强化模型。当接收到的资料不用全部回传,只回传必要的资讯时,不仅有效最小化资料传输量(降低约 28 -71 %),也兼顾了蒐集新资料的功能。

此外,电脑还进行一种有趣的「拼图」学习法。首先我们将一张影像切成3 x 3格,并打散这9块局部影像,随机排列。接着,电脑要尝试找出正确的排列方式,将小图拼回原本的大图。若电脑能顺利辨识9张图的相对位置,也意味着他的深度学习模型已精于辨认物体的型态。相较于非监督式学习中,电脑要从没有答案可参考的资讯中自行寻找规律,「拼图」创造了一个可依循的正确答案,有助于提升辨识準确率。

速度与耗能

随着运算工作由云端平台转移到物联网装置,电力来源也从供应不绝的电源转为容量有限的电池,运算速度与能源使用上的平衡受到考验。若回顾装置运算中枢主要进行的两项工作,可发现「推断」在藉由影像辨识侦测物体、分类后,需即时产生反应,分秒必争。「诊断」筛选出需回传至云端的资料,在执行上较无急迫性,应多考虑能源使用的效率。因此,在「推断」工作不需要24小时持续运行的情境下,物联网装置通常採单核心运作模式,切割时间区间,交替执行两项工作。相对地,若「推断」工作需全年无休执行,则需採多工处理,同步进行。

那幺在有限的运算资源下,如何提升速度?辨识影像的神经网路中具有多层卷积层,若每到一层都要重新训练权重,虽然準确率可能最高,却相当费时。如果善用权重共享(shared weight)假设每个输出的结果权重相同,便可大幅减少训练模型时的参数[1][2]。优化的过程,便是寻找速度与準确率间的平衡,而实验结果显示,固定前三层的情形下(只训练conv4、conv5,以及后面整合特徵表现的全连接层),準确率虽从59 % 略降为 56 %,速度却能加快1.7 倍,提升应用价值。

从「云」到「雾」

事实上,2015年思科(CISCO)便提出了「雾运算(Fog Computing)」的概念,将云端的「云」延伸到物品实际所在的位置[3]。相较于云端运算平台,分散式的雾运算在地理上的分布较广,灵活度也较高,应用在串流媒体这类强调即时性的功能上,具有相当的优势。

值得一提的是,雾运算的兴起并非要取代云端运算。相反地,云端仍扮演重要的角色。在「In-Situ AI」的案例中,我们看到像是训练大量资料这类倚赖高效能的工作,依然是在云端执行。不同的是装置在收集到资料后,会先交由运算中枢的推理网路与诊断网路进行处理,只选取有较高利用价值的资料回传云端。因此,云端和雾运算可说是相辅相成,藉双向互动各发挥所长,一同打造崭新的物联网时代。

参考资料

上一篇: 下一篇:

相关推荐


申博太阳城_必赢贵宾会下载|提供生活服务|各类新闻资讯|网站地图 申博官网备用网址_申博私网出租 申博官网备用网址_申博138体育真人荷官