中国物联网设备连接数在2016~2020年间,年同步增长率为46.1%,经历了高速增长,预计到2025年会达到80亿。
阿里云物联网平台的核心价值是帮助企业设备数字化、智能化,设备产生的海量数据与企业的业务数据融合之后会产生巨大的价值, 能够促进企业高效低成本地运营,进而提升整个社会生产效率。IoT在这波数字化浪潮中至关重要,让所有设备从孤立的变成有生命的智能设备。
互联网时代和移动互联网时代的本质都是人的在线化,物联网时代百亿规模设备的在线化和数字化将会对物理世界进行重塑, 尤其在5G网络的推动下会加速这个进程。
设备连接和管理服务属于物联网平台最基础的能力,帮助客户设备实现在线化、数字化,让客户不需关心物联网基础设施,完全聚焦在自己的核心业务上。
碎片化设备接入
针对碎片化的接入问题,通过不同的接入方式来适配不同的设备场景。
直连设备:对于广域网的设备,通过直连的方式直接上云。
局域网设备:通过不同的局域网协议接入边缘网关,有边缘网关转换协议、然后做数据处理,再通 过MQTT协议接入物联网平台。
LoRa设备:先接入LoRa网关,然后由LoRa网关通过MQTT协议接入阿里云物联网平台。
NB-IoT设备:只能接入电信平台,阿里云物联网平台通过云云对接的方式,先对接电信平台,然后把设备接入到阿里云物联网平台。
私有平台的设备:通过泛化接入的方式,把私有协议转成标准的MQTT协议,然后接入到阿里云物 联网平台。
通道复用:对于边缘网关,其下的子设备可以通过通道复用的方式上线和消息上下行通信,这类子 设备与直连设备的能力对等。
云网关: 针对采用了标准MQTT协议的设备,但自定义了设备身份信息和消息通信Topic的设备,通 过云网关接入方式解决身份和Topic的标准化。
海量设备的连接稳定性
1) 连接限流能力
从外部请求限流和内部资源限流两个维度设计的接入层限流。针对外部限流,有并发建连限流,单连接流量限流,背压机制(结合业务层消费能力和TCP滑动窗口机制来实现),节流机制(溢出包丢弃)。针对内部 资源限流,限制单进程、单应用的TCP Session数量,针对TCP缓存的内存限制,针对单应用的CPU使用限制。通过内、外资源的限流策略来防止连接层的雪崩,同时减少对下游系统的冲击。
2) 应用热更新能力
在网络代理发布时,会导致设备的TCP长连接断开,对于设备而言,需要重建连接,同时在建连的过程中消息不能到达。对于长连接断开,阿里云物联网平台支持了平滑迁移和缓慢下线的能力。通过老进程关闭 listen fd,新进程接管listen fd,老进程维持24小时,让设备重连后自动迁移到新进程。对于长时间不重连 的设备,通过缓慢下线的策略逐步使设备下线重连,减少同时大量设备下线对用户业务的影响。通过上述两 个策略配合使用,可减少网络代理发布时对设备连接的影响。
3) Session转移
网络代理层跟协议层之间采用了TCP长连接,在协议层发布时会导致TCP长连接断开,在协议层保存了本地 Session信息,如果当前发布机器的Session信息丢失,连接断开后需要设备重连才能恢复。针对上述情况, 阿里云物联网平台设计了Session转移功能,在协议层发布时,可以把TCP长连接和设备的Session信息转移 到其他未发布的机器上,此时协议层的发布可以做到对设备无感。
4) 快速容灾
为了解决单故障导致的全平台问题,阿里云物联网平台针对协议层、消息层部署了多个集群,同时会把不同的用户放到不同的集群里,当某个集群的协议层或者消息层出现系统异常的时候,网络代理层可以通过路由 能力和Session转移能力把设备的连接转移到不同的集群,从而保障单集群故障能快速恢复。
设备的网络质量
设备网络是连接稳定性的保障,阿里云物联网平台为了让设备的网络质量更好,采用了全球分发技术,不论设备在哪里生产和注册,都可以在设备接入前把设备分发到离设备最近的地域,然后利用阿里云物联网平台的国内外8大地域部署的能力,让设备就近快速接入。同时为了解决不同地域设备快速获取就近接入点地址,物联网平台采用了全球加速的技术,在设备就近接入后,又采用BGP网络来解决地域内的网络质量问题。
设备的安全性
IoT平台基于四层安全设计和离线安全分析结合来保障设备的安全性。
1) 安全防御层
借助阿里云的DDoS、高防等能力,防止SYN洪水攻击等,做到流量的有效清洗,可以防止1000Gbps以上的流量攻击。
2) 通道安全层
通过实现TLS、DTLS,X.509,ID2等安全加密技术,实现传输层的加密,防止数据在传输过程中 被篡改、伪造等,同时针对低功耗设备,提供PSK、SessionTicket等能力,解决TLS过程中的数 据传输量和网络RT的问题。
3) 身份安全
支持三种类型的设备身份,不同IoT场景可以使用不同的身份,保障每个设备都有唯一身份,同时对设备认证做了加签,防止身份的伪造。
4) 数据安全
按单元隔离不同集合的用户,然后再按用户维度和实例维度做更小粒度地隔离,保障数据在实例内、用户内、单元内闭环,做到每个用户只能看到自己的数据。
5) 离线数据分析
利用设备行为数据结合平台的AI能力,分析每个设备的安全性,针对安全等级低的设备做预警,并且跟平台安全层结合,针对攻击类设备实现自动拦截的能力。
更多内容,回复"白皮书" 获取PDF完整版。
往期推荐
☞ 中国云计算第一股关停 IoT云服务
☞ 2022年IoT平台趋势:私有化部署
☞ 国内MCU行业发展研究报告
☞ 2021年4G通信模组企业排行
☞ 艾瑞 2021中国 IoT物联网平台研究
☞ 云厂商的[IoT物联网平台]不香了吗?