编译:骄阳
很快,地球上生成数据的设备将是人类的七倍,而且这个数字还在继续增长。调查公司Juniper Research的最新统计数据显示,到2022年,物联网传感器和设备的预计数量将从目前微不足道的210亿台增长到500多亿台,增幅为140%。
该研究的作者预测,边缘计算服务将成为这一增长的主要原因。研究发现,由于带宽需求的减少、应用程序响应速度加快以及数据安全性的提高,以及边缘计算的兴起对于扩大部署至关重要。Juniper Research预测,在2023年连接的460亿台工业和企业设备中,很大一部分将依赖边缘计算。
所有这些设备和连接的挑战是数据——并弄清楚如何将其集成到企业系统中,以及如何为企业带来价值。许多企业已经从一开始就在与传统基础设施相关联的关系数据库管理系统上构建了他们的信息技术,而这些基础设施并没有被设计或配备来吸收或管理物联网正在提供的大量连续数据流。许多高管认为,他们可以很容易接入物联网,并开始获得回报。然而,要做到这一点,还需要做很多工作。
最近的一篇文章中,国际应用系统分析研究所(IIASA)首席分析官 Bill Franks证实了这一点。也就是说,物联网数据看起来比实际情况更简单。Bill Franks说 :“大多数传感器以简单的格式输出数据——有时间戳、测量标识符(温度、压力等),然后是一个值。因此,你可以非常快速地从原始Feed转到准备好进行探索的数据集或表格”。
但是,企业的重要价值在哪里?它可能不在无休止的时间戳数据流中,而是在弹出的异常中。哪些异常是相关连的,哪些只是异常?正在传输的特定来源数据是否是机器使用和性能的精确指标?所有这些问题必须事先进行检查。Bill Franks提醒道:“不要让数据摄入的简单性欺骗了你”。
将会发生的事情是,企业将被无用的数据淹没和不堪重负——需要吞吐量、处理和某种存储,以及处理这些流程的专业知识。对于物联网数据,有必要确定实际对你的具体问题有意义的节奏,例如,温度传感器可以每毫秒读出一次读数,然而,在大多数情况下,以这种节奏接收数据有点多余了。由于存储额外数据的成本以及分析大量无用数据的成本和复杂性,这种过度消耗是有代价的。
一些关键考虑
为了充分利用物联网,Bill Franks建议考虑以下因素:
设置适当的节奏:确定什么节奏对你正在解决的问题有价值。如果你正在监控汽车发动机,那么每秒读数可能就足够了,或许可能每5、10或60秒读取一次就足够了。关键是你必须评估每一个指标,并通过一些实验确定你需要什么。然后,将数据过滤到适当的级别,否则,你将会被数据淹没,而有意义的模式将难以识别。
随着时间推移识别复杂的模式:在分析物联网数据时,我们通常对偏离正常值感兴趣,而不是预测预期值。在识别出什么是正常的之后,我们必须努力寻找重要的异常模式,然而,异常模式可能有多种演变方式。气温突然升高自然会引起人们的兴趣,但是,如果温度上升很小,或者持续很长一段时间,或者随着频率的增加而上升,会产生什么影响呢?识别这些基于时间的模式存在很多复杂性。
弄清楚如何处理交互:让我们假设你已经为你关心的每个指标确定了适当的节奏,以及对于每一个指标来说哪些模式是重要的。那么你又如何解释任何互动?问题在于,影响可能会有滞后,例如,温度可能会在压力上升之前就开始上升。为了确定各种传感器读数之间的相互作用,不仅需要进行复杂的分析,以确定哪些指标可能会相互作用,还要确定在什么时间范围内以及何时滞后。
解释错误和遗漏的读数:传感器并不总是可靠的,任何分析过程都必须建立制衡机制,以解决丢失的数据或出错的数据。你的分析流程必须包含识别可疑错误或传输差距的逻辑,并处理这些情况。
最重要的是,随着物联网生成数据量的增加,决策者需要坐下来构建系统和流程,以获得对其业务最重要的洞察力。这需要了解什么对企业来说很重要,以及什么是物联网数据或没有告诉我们。