热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ARM内核全解析,从ARM7,ARM9到CortexA7,A8,A9,A12,A15到CortexA53,A57,A72

以由高到低的方式来看,ARM处理器大体上可以排序为:Cortex-A72处理器、Cortex-A57处理器、Cortex-A53处理器、Cortex-

 

以由高到低的方式来看,ARM处理器大体上可以排序为:

Cortex-A72处理器、Cortex-A57处理器、Cortex-A53处理器、Cortex-A15处理器、Cortex-A12处理器、Cortex-A9处理器、Cortex-A8处理器、Cortex-A7处理器、Cortex-A5处理器、ARM11处理器、ARM9处理器、ARM7处理器

再往低的部分手机产品中基本已经不再使用,这里就不再介绍。

 


● Cortex-A72处理器

不久前,ARM发布了自己的下一代核心Cortex-A72,A72将会直接取代A57,定位高端市场。

 

http://www.eetop.cn/uploadfile/2015/08/3_2015082317002214kK0.png

 

Cortex-A72性能已达到PC级CPUARM从A15之后,执行大小核的架构,所谓的big.LITTLE,在低负载用小核心,高负载用大核心,平衡性能与功耗的矛盾。

而这一次,ARM只发布了一个大核心A72,与其配套的小核心依然是上一代的A53,没有进一步发展,虽然ARM此前已经宣称,A53将顺序执行架构做到了极致。但是我们不认为就没有可升级的余地。ARM不更新的原因,可能是在小核心上,A53的性能已经够了,进一步升级无意义。

在这个A72的大核心上,ARM表示,Cortex-A72是其性能最出色、最先进的处理器,构建在Cortex-A57的基础之上,性能可达Cortex-A15 3.5倍。不过,从架构图和规格表上看,A72和A57并没有本质的不同,仍旧最多四核心,一级二级的缓存容量都没变,只是做了一些细节调整,比较明显的变化是砍去了NEON SIMD引擎中的加密扩展功能,总线接口扩展到128bit。

所以,A72的性能提升可能来自于微架构的改进,譬如分支预测的效率等等。

A72号称性能比A15处理器提升3.5倍,在同样的工作负载下,功耗降低75%。搭配大小核心方案,功耗还能降低40%-60%看上去非常美好。

不过,我们要知道,按照ARM这种性能算法,A57比A15也有1.9倍的性能提升。那是建立在20nm对28nm工艺的基础之上的。同样,A72这个所谓3.5倍的性能提升,也是建立在16nmfinFET对28nm的工艺优势上。

实际上,ARM的A57在同频下相对于A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大约是1100分,1.7GHZ的A57跑specint2000是1250分。

按照ARM的比例,3.5倍的A72相比1.9倍的A57只提升了1.84倍,估计同频A72相对于A57大约也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000大约在1550分。

这个分数和苹果的A8处理器差不多,而A8是1.4GHZ,ARM这个下一代的A72核心,同频性能很可能还不如苹果的A8。

不过A8用在手机上只是双核心,而A72起步就是四核心,在频率上,A72号称能达到2.5GHZ,所以总体性能A72的处理器还是有优势的。不过等A72在2016年上市的时候,苹果A10可能都在路上了。

放到PC上去比较,A72大约还在酷睿2的等级,这个性能很不错,但是不能与主流的Intel i7去比较,移动距离桌面还有很远的距离。

多核心效率和内存性能大幅提升

 CoreLink CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,可以扩展到整个处理器的所有核心。

过去,ARM虽然支持多核心,但实际上是四个核心一个簇,簇内部是有侦听的,可以解决缓存一致性的问题,而簇之间是没有的,所以从四核心到八核心会有一定的性能下降。

而ARM提倡的大小核恰恰是八核心的,这次增加“探听过滤器”可以提升多核心的性能。

额外的开销少了,内存的性能也跟着提升,ARM宣称CoreLink CCI-500可以提升30%的内存性能。

在内存带宽上,CoreLink CCI-500提升到了四通道128-bit内存位宽。这让采用ARM公版设计的厂商可以支持更宽的内存带宽,进而支持更高分辨率的显示设备。

而过去,只有高通的处理器内存带宽比较高,因为高通不使用ARM的一致性互联架构,而是自己搞一套。而高通处理器的体验也一直比较好。

在核心支持上,最多支持的CPU簇也从2个增加到4个,每个簇可以支持四个处理器,这样算最多可以支持16个处理器,可以用于一些高性能领域。手机上因为功耗原因估计还会是8核心(大小四核心)作为主流。

对消费者来说,最实惠就是“探听过滤器”带来的效能提升和四通道128-bit内存位宽带来的体验提升。

目前,海思、联发科、瑞芯微等都已经购买了Cortex-A72的授权,预计2016年我们就能看到相关产品。怪兽即将来袭。

 

 


● Cortex-A57、A53处理器

   Cortex-A53、Cortex-A57两款处理器属于Cortex-A50系列,采用64位ARMv8架构。

  在A72发布之前, Cortex-A57是ARM最先进、性能最高的应用处理器,号称可在同样的功耗水平下达到当今顶级智能手机性能的三倍;而Cortex-A53是世界上能效最高、面积最小的64位处理器,同等性能下能效是当今高端智能手机的三倍。这两款处理器还可整合为ARM big.LITTLE(大小核心伴侣)处理器架构,根据运算需求在两者间进行切换,以结合高性能与高功耗效率的特点,两个处理器是独立运作的。

 

  应用案例:三星Exynos 5433,Marvell PXA1928,联发科MT6752,高通骁龙810等 


● Cortex-A15处理器架构解析

   ARM Cortex-A15处理器隶属于Cortex-A系列,基于ARMv7-A架构。

   Cortex-A15 MPCore处理器具有无序超标量管道,带有紧密耦合的低延迟2级高速缓存,该高速缓存的大小最高可达4MB。浮点和NEON媒体性能方面的其他改进使设备能够为消费者提供下一代用户体验,并为 Web 基础结构应用提供高性能计算。Cortex-A15处理器可以应用在智能手机、平板电脑、移动计算、高端数字家电、服务器和无线基础结构等设备上。

   理论上,Cortex-A15 MPCore处理器的移动配置所能提供的性能是当前的高级智能手机性能的五倍还多。在高级基础结构应用中,Cortex-A15 的运行速度最高可达2.5GHz,这将支持在不断降低功耗、散热和成本预算方面实现高度可伸缩的解决方案。

   应用案例:三星Exynos 5250。三星Exynos 5250芯片是首款A15芯片,应用在了最近发布的Chromebook和Nexus 10平板电脑上面。Exynos 5250的频率是1.7GHz,采用32纳米的HKMG工艺,配备了Mali-604 GPU,性能强大。另外据传三星下一代Galaxy S4将会搭载四核版的Exynos 5450芯片组,同样应用Cortex-A15内核。另外NVIDIA Tegra 4采用A15内核。

 


● Cortex-A12处理器架构解析

2013中旬,ARM 发布了全新的Cortex-A12处理器,在相同功耗下,Cortex-A12的性能上比Cortex-A9提升了40%,同时尺寸上也同样减小了30%。Cortex-A12也同样能够支持big.LITTLE技术,可以搭配Cortex-A7处理器进一步提升处理器的效能。

Cortex-A12架构图

ARM表示Cortex-A12处理器未来将应用于大量的智能手机以及平板产品,但更加侧重于中端产品。同时ARM也预计在2015年,这些中端产品在数量上将远超过旗舰级别的智能手机及与平板。


搭载Cortex-A12处理器的中端机在未来也将是非常有特点的产品,因为Cortex-A12能够支持虚拟化、AMD TrustZone技术,以及最大1TB的机身存储。这也就意味着未来搭载这一处理器的智能手机完全可以作为所谓的BYOD(Bring Your Own Device)设备使用,换句话说就是在作为自用手机的同时,还可以用作商务手机存储商务内容。

Mali-V500架构图

同时Cortex-A12也搭载了全新的Mali-T622绘图芯片与Mali-V500视频编解码IP解决方案,同样也是以节能为目标。这样看来,定位中端市场,低功耗小尺寸,Cortex-A12最终必然会取代Cortex-A9。

 

 


● Cortex-A9处理器架构解析

   ARM Cortex-A9处理器隶属于Cortex-A系列,基于ARMv7-A架构。

   Cortex-A9 处理器的设计旨在打造最先进的、高效率的、长度动态可变的、多指令执行超标量体系结构,提供采用乱序猜测方式执行的 8 阶段管道处理器,凭借范围广泛的消费类、网络、企业和移动应用中的前沿产品所需的功能,它可以提供史无前例的高性能和高能效。

   Cortex-A9 微体系结构既可用于可伸缩的多核处理器(Cortex-A9 MPCore多核处理器),也可用于更传统的处理器(Cortex-A9单核处理器)。可伸缩的多核处理器和单核处理器支持 16、32 或 64KB 4 路关联的 L1 高速缓存配置,对于可选的 L2 高速缓存控制器,最多支持 8MB 的 L2 高速缓存配置,它们具有极高的灵活性,均适用于特定应用领域和市场。

   应用案例:德州仪器OMAP 4430/4460、Tegra 2、Tegra 3、新岸线NS115、瑞芯微RK3066、联发科MT6577、三星 Exynos 4210、4412、华为K3V2等。另外高通APQ8064、MSM8960、苹果A6、A6X等都可以看做是在A9架构基础上的改良版本。

 


● Cortex-A8处理器架构解析

   ARM Cortex-A8处理器隶属于Cortex-A系列,基于ARMv7-A架构,是我们目前使用的单核手机中最为常见的产品。

   ARM Cortex-A8处理器是首款基于ARMv7体系结构的产品,能够将速度从600MHz提高到1GHz以上。Cortex-A8处理器可以满足需要在300mW以下运行的移动设备的功率优化要求;以及需要2000 Dhrystone MIPS的消费类应用领域的性能优化要求。

   Cortex-A8 高性能处理器目前已经非常成熟,从高端特色手机到上网本、DTV、打印机和汽车信息娱乐,Cortex-A8处理器都提供了可靠的高性能解决方案。

   应用案例:TI OMAP3系列、苹果A4处理器(iPhone 4)、三星S5PC110(三星I9000)、瑞芯微RK2918、联发科MT6575等。另外,高通的MSM8255、MSM7230等也可看做是A8的衍生版本。

 


● Cortex-A7处理器架构解析

   ARM Cortex-A7处理器隶属于Cortex-A系列,基于ARMv7-A架构,它的特点是在保证性能的基础上提供了出色的低功耗表现。

   Cortex-A7处理器的体系结构和功能集与Cortex-A15 处理器完全相同,不同这处在于,Cortex-A7 处理器的微体系结构侧重于提供最佳能效,因此这两种处理器可在big.LITTLE(大小核大小核心伴侣结构)配置中协同工作,从而提供高性能与超低功耗的终极组合。单个Cortex-A7处理器的能源效率是ARM Cortex-A8处理器的5倍,性能提升50%,而尺寸仅为后者的五分之一。

   作为独立处理器,Cortex-A7可以使2013-2014年期间低于100美元价格点的入门级智能手机与2010 年500美元的高端智能手机相媲美。这些入门级智能手机在发展中世界将重新定义连接和Internet使用。

   应用案例:全志Cortex-A7四核平板芯片,联发科的MT6589。

 


● Cortex-A5处理器架构解析

   ARM Cortex-A5处理器隶属于Cortex-A系列,基于ARMv7-A架构,是能效最高、成本低的处理器。

   Cortex-A5处理器可为现有ARM9和ARM11处理器设计提供很有价值的迁移途径,它可以获得比ARM1176JZ-S更好的性能,比ARM926EJ-S更好的功效和能效。另外,Cortex-A5处理器不仅在指令以及功能方面与更高性能的Cortex-A8、Cortex-A9和Cortex-A15处理器完全兼容,同时还保持与经典ARM处理器(包括ARM926EJ-S、ARM1176JZ-S和 ARM7TDMI)的向后应用程序兼容性。

   应用案例:高通MSM7227A/7627A、高通MSM8225/8625。

 

 


● ARM11系列处理器架构解析

   ARM11系列包括了ARM11MPCore处理器、ARM1176处理器、ARM1156处理器、ARM1136处理器,它们是基于ARMv6架构,分别针对不同应用领域。ARM1156处理器主要应用在高可靠性和实时嵌入式应用领域,与手机关联不大,此处略去介绍。

   ARM11 MPCore使用多核处理器结构,可实现从1个内核到4个内核的多核可扩展性,从而使具有单个宏的简单系统设计可以集成高达单个内核的4倍的性能。Cortex-A5处理器是ARM11MPCore的相关后续产品。

   ARM1176处理器主要应用在智能手机、数字电视和电子阅读器中,在这些领域得到广泛部署,它可提供媒体和浏览器功能、安全计算环境,在低成本设计的情况下性能高达1GHz。

   ARM1136处理器包含带媒体扩展的ARMv6 指令集、Thumb代码压缩技术以及可选的浮点协处理器。ARM1136是一个成熟的内核,作为一种应用处理器广泛部署在手机和消费类应用场合中。在采用 90G工艺时性能可达到600MHz以上,在面积为2平方毫米且采用65纳米工艺时可达到1GHz。

   应用案例:高通MSM7225(HTC G8)、MSM7227、Tegra APX 2500、博通BCM2727(诺基亚N8)、博通BCM2763(诺基亚PureView 808)、 Telechip 8902(平板电脑)。

 


● ARM9系列和ARM7系列处理器架构解析

   ARM9系列处理器系列包括ARM926EJ-S、ARM946E-S和 ARM968E-S处理器。其中前两者主要针对嵌入式实时应用,我们这里就主要针对ARM926EJ-S进行介绍。

   ARM926EJ-S基于ARMv5TE架构,作为入门级处理器,它支持各种操作系统,如Linux、Windows CE和Symbian。ARM926EJ-S 处理器已授权于全球100多家硅片供应商,并不断在众多产品和应用中得到成功部署,应用广泛。

   应用案例:TI OMAP 1710。诺基亚N73、诺基亚E65、三星SGH-i600等手机采用的都是该处理器。

 

 


● ARM7系列处理器

   ARM7系列处理器系列包括ARM7TDMI-S(ARMv4T架构)和ARM7EJ-S(ARMv5TEJ架构),最早在1994推出,相对上面产品来说已经显旧。虽然现在ARM7处理器系列仍用于某些简单的32位设备,但是更新的嵌入式设计正在越来越多地使用最新的ARM处理器,这些处理器在技术上比ARM 7系列有了显著改进。

 

   作为目前较旧的一个系列,ARM7处理器已经不建议继续在新品中使用。它究竟有多老呢?上面的Apple eMate 300使用的就是一款25MHz的ARM7处理器,够古老了吧?


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • 如何提高PHP编程技能及推荐高级教程
    本文介绍了如何提高PHP编程技能的方法,推荐了一些高级教程。学习任何一种编程语言都需要长期的坚持和不懈的努力,本文提醒读者要有足够的耐心和时间投入。通过实践操作学习,可以更好地理解和掌握PHP语言的特异性,特别是单引号和双引号的用法。同时,本文也指出了只走马观花看整体而不深入学习的学习方式无法真正掌握这门语言,建议读者要从整体来考虑局部,培养大局观。最后,本文提醒读者完成一个像模像样的网站需要付出更多的努力和实践。 ... [详细]
  • 在2022年,随着信息化时代的发展,手机市场上出现了越来越多的机型选择。如何挑选一部适合自己的手机成为了许多人的困扰。本文提供了一些配置及性价比较高的手机推荐,并总结了选择手机时需要考虑的因素,如性能、屏幕素质、拍照水平、充电续航、颜值质感等。不同人的需求不同,因此在预算范围内找到适合自己的手机才是最重要的。通过本文的指南和技巧,希望能够帮助读者节省选购手机的时间。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了软件测试知识点之数据库压力测试方法小结相关的知识,希望对你有一定的参考价值。 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
author-avatar
大开先生_615
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有