WO2025242009A1

WO2025242009A1 - 高速缓存性能评估方法、装置、电子设备及可读存储介质

Info

Publication number: WO2025242009A1
Application number: PCT/CN2025/095503
Authority: WO
Inventors: 刘宇航; 满洋; 陈泓佚
Original assignee: Beijing Institute Of Open Source Chip
Current assignee: Beijing Institute Of Open Source Chip
Priority date: 2024-05-21
Filing date: 2025-05-16
Publication date: 2025-11-27
Anticipated expiration: 2026-11-21
Also published as: CN118227446B; CN118227446A

Abstract

本申请实施例提供一种高速缓存性能评估方法、装置、电子设备及可读存储介质，涉及计算机技术领域，该方法包括：响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。

Description

高速缓存性能评估方法、装置、电子设备及可读存储介质

本申请要求在2024年5月21日提交中国专利局、申请号为202410634793.6、发明名称为“高速缓存性能评估方法、装置、电子设备及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种高速缓存性能评估方法、装置、电子设备及可读存储介质。

背景技术

随着计算机技术的发展，对中央处理器(Central Processing Unit，CPU)的设计要求也越来越高，因而需要对所设计的CPU的性能进行评估。

其中，高速缓存是CPU的重要组成部分，用于存储CPU需要经常访问的数据或指令，可以提高CPU的运行速度和运行效率。高速缓存的性能对CPU的性能具有较大的影响，因此，如何对高速缓存的性能进行评估成为了亟需解决的问题。

申请内容

本申请实施例提供一种高速缓存性能评估方法、装置、电子设备及可读存储介质，可以解决现有技术中如何对高速缓存的性能进行评估的问题。

为了解决上述问题，本申请实施例公开了一种高速缓存性能评估方法，所述方法包括：

响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；

基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。

另一方面，本申请实施例公开了一种高速缓存性能评估装置，所述装置包括：

获取模块，用于响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；

第一评估模块，用于基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。

再一方面，本申请实施例还公开了一种电子设备，所述电子设备包括处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放可执行指令，所述可执行指令使所述处理器执行前述的高速缓存性能评估方法。

本申请实施例还公开了一种可读存储介质，当所述可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述的高速缓存性能评估方法。

本申请实施例还公开了一种包含指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行前述的高速缓存性能评估方法。

本申请实施例包括以下优点：

本申请实施例提供了一种高速缓存性能评估方法，通过响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。这样，可以通过获取访存请求在高速缓存中的命中次数，可以实现对高速缓存的性能评估。同时，通过访存统计信息以及各访存请求的访存模式，可以从不同访存模式的维度对高速缓存的性能进行评估，实现多维度的评估，提高高速缓存性能评估的准确性和可解释性。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的一种高速缓存性能评估方法实施例的步骤流程图；

图2是本申请的一种命中次数的获取示意图；

图3是本申请的一种访存模式的获取示意图；

图4是本申请的一种统计结果示意图；

图5是本申请的又一种统计结果示意图；

图6是本申请的一种高速缓存性能评估装置实施例的结构框图；

图7是本申请示例提供的一种用于高速缓存性能评估的电子设备的结构框图。

具体实施例

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本领域技术人员应理解的是，在本申请的揭露中，术语“第一”、“第二”、“第三”、“第四”、“第五”等仅用于区分不同的结构，而不对具体结构的数量、连接关系等进行限定；另外“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系是基于附图所示的方位或位置关系，其仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此上述术语不能理解为对本申请的限制。

方法实施例

参照图1，示出了本申请的一种高速缓存性能评估方法实施例的步骤流程图，所述方法具体可以包括如下步骤：

步骤101、响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数。

步骤102、基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。

需要说明的是，针对上述步骤101～102，本申请中的高速缓存可以是具有缓存功能的缓存系统设计，其可以属于待评估的处理器，可以理解的，一个处理器通常包括不同功能的模块或系统，而为了评估处理器的功能，通常会对不同模块或系统分别进行评估，本申请实施例是对高速缓存系统的评估。可选地，本申请实施例可以应用于待评估的处理器上，也可以应用于处理器模拟器，例如，gem5，可以在gem5上搭建待评估的高速缓存，gem5是一个周期精确的处理器模拟器，其处理器核模拟是周期精确的，缓存系统的模拟可以以一定的频率，例如：每更新周期(模拟器中用于表示每秒更新多少次处理器状态的变量，TICK)进行一次模拟，也就是每经过一个时钟周期，获取一次访存统计结果。

其中，上述测试程序可以是预先构建的，可以是随机构建的，也可以是按照一定的测试要求构建的，本申请实施例对此不作限制。具体的，测试程序中可以包含多个不同的访存请求，各个访存请求的访存模式可以相同，也可以不同。另外，本申请实施例中的访存请求指的是加载指令(load)。

具体的，本申请实施例可以预先构建多个不同访存模式的访存请求，得到测试程序。其中，上述访存模式指的是访存请求的访存类型，访存类型可以包括步进访存、间接访存等。

本申请实施例在各访存请求进行访存操作时，可以先获取测试程序的访存统计信息。需要说明的是，访存统计信息至少包括各个访存请求在待评估的高速缓存中的命中次数。具体的，高速缓存指的是CPU与内存之间的存储器，其通常容量较小但速度很快。而处理器在执行访存请求时，往往会先从高速缓存中获取数据，在高速缓存中存在所需获取的数据时，表明该访存请求命中高速缓存，此时无需访问内存。相应地，在高速缓存中不存在所需获取的数据时，表明该访存请求未命中高速缓存，此时需要从内存中获取所需的数据。而CPU读取内存中的数据时，往往除了读取本次要加载的数据，还会预取部分数据到高速缓存中，这样CPU后续要读取的数据已经在高速缓存中，可以有效提升性能。进一步地，由于从高速缓存中获取数据的效率相较于从内存中获取数据的效率更高，因而访存请求命中高速缓存的次数越多，处理器执行访存请求的效率越高，也就是，高速缓存的性能越好，处理器性能越好，因此，本申请实施例可以通过获取测试程序的访存统计信息对高速缓存的性能进行评估。

其中，本申请实施例中的一个访存请求对应一个静态加载指令，测试程序执行的过程中，一个静态加载指令可以作为动态指令被执行多次。进一步地，本申请实施例中可以使一个访存请求执行多次，从而获取各访存请求在多次执行中，在高速缓存中的命中次数。

具体的，上述获取访存统计信息的操作可以通过处理器的性能计数器获取，处理器的性能计数器可以对处理器执行测试程序时的访存行为进行统计，可以统计不同访存请求在多次执行时，分别在高速缓存中的命中次数以及在内存中的命中次数，本申请实施例可以通过指定的软件工具(例如，性能分析工具perf)对性能计数器进行读取，得到各访存请求在高速缓存中的命中次数。进一步地，上述访存模式可以是在构建测试程序时，预先构建包含不同访存模式的访存请求的测试程序，进而保证各访存请求的访存模式已知。或者，本申请实施例中测试程序还可以是随机构建的，在得到访存统计信息之后，可以将各访存请求输出显示，使相关工作人员评估各访存请求的访存模式，从而通过接收相关工作人员的输入信息得到各个访存请求的访存模式。其中，本申请实施例中的访存操作可以是数据访问，也可以是指令访问。

可以理解的，访存请求在高速缓存中的命中次数越多，则高速缓存的性能越好。而对于同一高速缓存系统，其针对不同访存模式的访存请求的性能可能存在差异，因此，本申请实施例可以结合各个访存请求的访存模式对高速缓存的性能进行评估。具体的，本申请实施例可以预先划分不同的性能等级，并根据各访存请求在高速缓存中的命中次数以及各访存请求的访存模式确定高速缓存针对不同访存模式的性能等级。例如，可以使不同访存模式的不同的性能等级关联各自对应的在高速缓存中的命中次数的区间。其中，性能等级的高低可以用于表征性能的好坏。性能等级越高所关联的在高速缓存中的命中次数的区间的区间值越大。进一步地，还可以按照实际的访存需求为不同访存模式设置不同的权重系数，通过所得到的不同访存模式的性能等级进行加权计算，进而得到该待评估的高速缓存对应的性能等级。

进一步地，本申请实施例提供的方法可以应用于处理器，从而可以将上述不同的性能等级预先上传至该处理器中。

示例性地，以测试程序中存在访存请求A与访存请求B，且A的访存模式为间接访存，B的访存模式为步进访存为例，若访存统计信息中表示A在高速缓存中的命中次数为1850707次，在内存中的命中次数为3059次，且B在高速缓存中的命中次数为2584088次，在内存中的命中次数为645次，可以得到该高速缓存针对步进访存的访存性能较好，针对间接访存的访存性能较差。进一步地，可以根据预设的性能等级，进一步对待评估的高速缓存针对不同访存模式的性能进行划分。

本申请实施例提供的高速缓存性能评估方法，通过响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。这样，可以通过获取访存请求在高速缓存中的命中次数，可以实现对高速缓存的性能评估。同时，通过访存统计信息以及各访存请求的访存模式，可以从不同访存模式的维度对高速缓存的性能进行评估，实现多维度的评估，提高高速缓存性能评估的准确性和可解释性。

进一步地，本申请实施例基于命中次数以及访存请求的访存模式对高速缓存的性能进行评估，相较于采用高速缓存缺失率或者每个时钟周期执行的平均指令数(Instruction Per Cycle，IPC)等指标进行评估的方式，高速缓存缺失率只能反映高速缓存收到的访存请求中未命中的比例，其不能对缺失的时机进行定位，相同缺失率的程序片段可能由于缺失的时机不同而对IPC的影响不同，进而也无法确定对高速缓存的性能影响较大的程序片段。而IPC则对分支预测等因素较敏感，不能直接反映出高速缓存系统对内存访问的覆盖程度。而本申请实施例通过各访存请求的命中次数以及各访存请求的访存模式，可以从不同访存模式的维度对高速缓存的性能进行评估，实现多维度的评估，可以确定出对高速缓存的性能影响较大的访存模式，提高高速缓存性能评估的准确性。

在本申请的一种可选实施例中，所述待评估的高速缓存的存储层次包含至少两个层级；步骤101中响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息的操作，具体可以包括下述步骤：

响应于测试程序中的各访存请求的多次访存操作，获取各所述访存请求在各个层级的高速缓存中的命中次数，作为所述访存统计信息。

其中，上述层级指的是不同的存储层次(memory hierarchy)，在高速缓存的存储层次包含至少两个层级的情况下，该高速缓存为多层级缓存系统，而不同层级的高速缓存的速度不同，处理器往往会按照层级顺序依次访存不同层级的高速缓存，即，会先访问层级最高的高速缓存，也就是第一级高速缓存(L1缓存)获取所需获取的数据，在L1缓存命中时，则返回数据，在L1缓存中不存在时，再访问第二级高速缓存(L2缓存)，…，在层级最低的高速缓存，也就是最后一级高速缓存依然不命中时，则访问内存。同时，层级越高的高速缓存其容量往往较小且读取速度较快，相应地，若访存请求在层级较高的高速缓存中的命中次数越多，则表征高速缓存系统的性能较好，若访存请求在层级较低的高速缓存中的命中次数越多，则表征高速缓存系统的性能一般。

具体的，待评估的高速缓存的存储层次包含至少两个层级时，上述访存统计信息也可以通过性能计数器获取，性能计数器可以对访存请求在不同层级的缓存中的命中次数分别进行统计，可以得到存储层次中的命中次数分布。

进一步地，待评估的高速缓存包含至少两个层级的高速缓存时，本申请实施例中可以获取各个访存请求在各个层级的高速缓存中的命中次数，作为访存统计信息，这样，可以根据不同层级的高速缓存的命中次数，对高速缓存的性能实现更精确、更细化的评估。

可选地，上述获取各所述访存请求在各个层级的高速缓存中的命中次数的操作，本申请实施例具体可以包括如下步骤：

S11、为各所述访存请求设置多个命中计数器；不同命中计数器对应不同层级的高速缓存。

S12、对于各个所述访存请求的任一次访存操作，将所述访存请求封装为请求包，并在所述请求包中设置层级参数。

S13、在所述请求包从目标层级返回的过程中，每经过一个层级，则将所述请求包中的层级参数加1；所述目标层级为所述请求包命中的高速缓存所在的层级；

S14、基于所返回的请求包中的层级参数的数值确定所述访存请求的目标层级，并从所述访存请求所对应的命中计数器中，将所述目标层级对应的命中计数器加1；

S15、在满足评估条件的情况下，基于各访存请求对应的各个命中计数器的当前数值，获取各所述访存请求在各个层级的高速缓存中的命中次数。

具体的，针对上述步骤S11～S15，本申请实施例可以为各个访存请求分别设置多个命中计数器，不同命中计数器可以对应不同层级的高速缓存，从而各访存请求的各个命中计数器，可以分别对不同层级的高速缓存的命中次数进行统计。

其中，上述请求包指的是消息包(Message Packet)，将访存请求封装为请求包可以便于其在高速缓存的各个层级中传递。进一步地，本申请实施例还在请求包中设置了层级参数，该层级参数用于表征请求包所命中的高速缓存的层级。具体的，可以在请求包中创建一个变量作为层级参数。进一步地，在创建层级参数后，还可以设置其初始值为0。具体的，上述层级参数可以为整数型变量，当然也可以为浮点数型，本申请实施例对此不作限制。

进一步地，在请求包被发出后，其会先传递到L1缓存，若L1缓存中存在所需访问的目标数据，则会将目标数据添加至请求包之后，返回请求包，若L1缓存中不存在目标数据，则请求包会继续传递到L2缓存，直至访问到目标数据后，再从所命中的层级向上依次传递返回请求包。而本申请实施例中，在请求包从所命中的高速缓存所在的层级返回时，每经过一个层级，则将请求包中的层级参数加1，这样，可以通过层级参数确定请求包所命中的高速缓存所在的层级，便于命中计数器进行统计。

相应地，在得到返回后的请求包之后，可以根据层级参数的数值确定访存请求所命中的缓存所在的目标层级，从而可以将目标层级对应的命中计数器加1，实现对不同层级的命中次数的统计。

其中，上述评估条件可以是测试程序的执行次数达到预设次数阈值，或者测试程序的执行时间达到执行时间阈值，可以按照实际需求自行设置，本申请实施例对此不作限制。进一步地，在满足评估条件后，可以将各个访存请求对应的各个命中计数器的当前数值，确定为各访存请求在各个层级的缓存中的命中次数。

进一步地，本申请实施例中可以将各个访存请求的程序计数器(Program Counter，PC值)作为各访存请求的索引值，进而可以通过PC值区别不同访存请求对应的命中计数器，也就是将访存请求的PC值作为该访存请求对应的命中计数器的标识。相应地，在接收到返回的请求包后，可以基于请求包中所携带的访存请求的PC值，对所有访存请求对应的命中计数器进行索引，将标识与该PC值一致的命中计数器确定为该请求包对应的访存请求的命中计数器。

本申请实施例中，通过为各所述访存请求设置多个命中计数器；不同命中计数器对应不同层级的缓存；对于各个所述访存请求的任一次访存操作，将所述访存请求封装为请求包，并在所述请求包中设置层级参数；在所述请求包从目标层级返回的过程中，每经过一个层级，则将所述请求包中的层级参数加1；所述目标层级为所述请求包命中的缓存所在的层级；基于所返回的请求包中的层级参数的数值确定所述访存请求的目标层级，并从所述访存请求所对应的命中计数器中，将所述目标层级对应的命中计数器加1；在满足评估条件的情况下，基于各访存请求对应的各个命中计数器的当前数值，获取各所述访存请求在各个层级的缓存中的命中次数。这样，通过设置层级参数可以确定访存请求所命中的缓存的层级，同时，通过针对一个访存请求设置多个命中计数器，可以对该访存请求在不同层级的缓存中的命中次数进行分别统计。

示例性地，参照图2，示出了本申请的一种命中次数的获取示意图，图2中以高速缓存包含三个层级的高速缓存为例，分别为私有一级数据缓存、私有二级缓存以及共享三级缓存。处理器核心1可以执行测试程序，通过处理器中的性能计数器获取访存统计信息。其中，缓存队列指的是Load Store队列。其他核心指的是处理器核心1之外的处理器核心。

具体的，A处某一条访存请求(Load指令)完成地址计算并向高速缓存发出访存请求。访存请求被封装在消息包(Message Packet)中，并在高速缓存的各层次中传递。消息包中存放有元数据，元数据中可以包括层级参数d、缓存行的来源，缓存行对应的替换算法优先级等。根据图2，该消息包命中一级缓存，则其直接返回消息包，此时层级参数依然为0，表征该消息包的目标层级为一级缓存。消息包的元数据被记录在处理器性能模型的Load Store队列中。

B处一条Load指令对应的消息包从所命中的存储层级返回。根据图2，该消息包命中内存，则其返回消息包时，每经过一个层级，则将请求包中的层级参数加1，在其返回到缓存队列时，消息包中的层级参数为3，表征该消息包的目标层级为内存。C处一条Load指令被处理完成，此时可以根据Load Store队列中存储的元数据统计该访存指令在缓存系统中的响应情况。

如图2所示，性能计数器中可以包含5个表项，分别为程序计数器、一级缓存命中计数器、二级缓存命中计数器、三级缓存命中计数器一级内存访问计数，其中，程序计数器用于记录访存请求的PC值。如图2所示，其表示PC值为0xABC的访存请求在一级缓存中命中K次，在二级缓存中命中L次，在三级缓存中命中M次，在内存中命中N次。

进一步地，根据每个Load指令中，由各层级高速缓存返回的占比，可以反映高速缓存系统的效率。若某个访存请求由L3缓存或者由内存返回较多，那么这个访存请求所在的程序片段的IPC通常也较低。

可选地，上述访存统计信息中还包括各所述访存请求的索引值，上述获取所述测试程序的访存统计信息的操作之后，本申请实施例具体还可以包括如下步骤：

S21、基于各所述访存请求的索引值，将各索引值对应的源代码输出至信息显示界面。

S22、接收用户基于所述信息显示界面为各索引值对应的源代码所输入的各模式信息，并将各所述模式信息确定为各索引值对应的访存请求的访存模式。

其中，上述索引值指的是访存请求的PC值，对于一个静态指令，其PC值是唯一且固定的，因而本申请实施例可以通过PC值得到对应的访存请求的源代码，并将源代码输出至信息显示界面，供相关测试人员进行分析。具体的，可以通过addr2line获取各个PC值对应的源代码。其中，上述addr2line为调试信息读取工具，可以将一个程序计数器(Program Counter,PC)对应到源代码的某一行。

进一步地，本申请实施例可以将各索引值对应的源代码依次输出至信息显示界面显示，相关测试人员通过所显示的源代码进行分析得到其访存模式，用户可以将访存模式作为输入信息进行输入，进而本申请实施例通过接收用户所输入的模式信息确定源代码对应的访存模式即可。

示例性地，参照图3，示出了本申请的一种访存模式的获取示意图，其中，高级语言源文件指的是测试程序的源程序，编译器在编译阶段可以生成包含代码和数据段的二进制可执行文件以及调试信息(例如：DWARF格式的调试信息，Debugging With Arbitrary Record Formats，DWARF是一种调试信息文件格式，被许多编译器和调试器用来支持源码级调试)，该调试信息中可以包含源代码与PC值的映射。当测试程序在处理器上运行完毕后，可以得到一个性能计数器的统计结果(访存统计信息)。调试信息读取工具可以基于调试信息中的源代码与PC值的映射关系以及性能计数器的统计结果，读取到每个访存请求所对应的源代码，也就是高级语言代码。进而通过高级语言代码可以确定出各访存请求的访存模式。

进一步地，本申请实施例可以基于访存模式、访存统计信息中的各级高速缓存命中计数和各级高速缓存命中的占比，对高速缓存的性能或者优化算法的效果进行评估。

本申请实施例中，所述访存统计信息中还包括各所述访存请求的索引值；通过基于各所述访存请求的索引值，将各索引值对应的源代码输出至信息显示界面；接收用户基于所述信息显示界面为各索引值对应的源代码所输入的模式信息，并将所述模式信息确定为各索引值对应的访存请求的访存模式。这样，通过设置信息显示界面，通过接收用户的输入即可确定各访存请求对应的访存模式。

可选地，上述基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估的操作，本申请实施例具体可以包括如下步骤：

S31、针对各个所述访存请求，获取所述访存请求的访存模式所对应的参照命中次数。

S32、基于各所述访存请求的命中次数以及参照命中次数，对所述待评估的高速缓存的性能进行评估。

其中，上述参照命中次数可以是预先设置的，可以是各访存模式的访存请求在性能满足要求的高速缓存中的命中次数，从而本申请实施例可以通过不同访存模式的参照命中次数对待评估的高速缓存的性能进行评估。

具体的，针对任一访存请求，可以将参照命中次数作为性能阈值，在该访存请求的命中次数不小于该访存请求的访存模式所对应的参照命中次数的情况下，确定该待评估的高速缓存针对该访存模式的缓存性能满足要求。相应地，在该访存请求的命中次数小于该访存请求的访存模式所对应的参照命中次数的情况下，确定该待评估的高速缓存针对该访存模式的缓存性能不满足要求。

可选地，本申请实施例还可以预先设置不同层次的高速缓存的参照命中次数，可以是各访存模式的访存请求在性能满足要求的高速缓存的各层次中的命中次数。相应地，上述评估方式也可以结合不同层次的高速缓存中的命中次数以及参照命中次数进行。

本申请实施例通过针对各个所述访存请求，获取所述访存请求的访存模式所对应的参照命中次数；基于各所述访存请求的命中次数以及参照命中次数，对所述待评估的高速缓存的性能进行评估。通过设置参照命中次数，可以对高速缓存的性能进行有效评估。

可选地，本申请实施例具体还可以包括：

S41、采用第一优化算法对所述待评估的高速缓存进行优化，并基于优化后的高速缓存重新执行所述获取所述测试程序的访存统计信息的操作，得到第二访存统计信息，以及，将优化前的高速缓存对应的访存统计信息作为第一访存统计信息；所述第二访存统计信息包括各所述访存请求在优化后的高速缓存中的命中次数以及各所述访存请求在命中所述优化后的高速缓存时，所述第一优化算法的优化状态。

S42、基于所述第一访存统计信息、所述第二访存统计信息以及各访存请求的访存模式，对所述第一优化算法的优化效果进行评估。

针对上述步骤S41～S42，上述第一优化算法指的是对高速缓存的优化技术，可以是任一预取器、预取技术、预取算法或替换策略等，可以按照实际需求选择上述第一优化算法，本申请实施例对此不作限制。可以理解的，上述第一优化算法可以对高速缓存的性能进行优化，而不同的优化算法的优化效果不同，本申请实施例可以对第一优化算法的优化效果进行评估。

具体的，本申请实施例针对第一优化算法的优化效果，可以从不同访存模式的角度进行评估。具体的，针对任一访存请求的访存模式，可以从第一访存统计信息中获取该访存请求的命中次数，作为第一次数，以及，从第二访存统计信息中获取该访存请求的命中次数，作为第二次数，若第二次数大于第一次数，则表明该第一优化算法可以提高高速缓存对该访存模式的处理效率，进一步地，若第二次数大于第一次数，且两者差值大于预设阈值，则表明该第一优化算法可以大大提高高速缓存对该访存模式的处理效率，其优化效果较好。

示例性地，参照图4，示出了本申请的一种统计结果示意图，如图4所示，其示出了6个访存请求，其PC值分别为0x119fa，0x119fe，0x119ea，0x119f0，0x119f8，0x119f4，每个PC值所在的行对应该PC值对应的访存请求分别在一级缓存、二级缓存、三级缓存以及内存中的命中次数。以0x119fa和0x119fe的访存模式为间接访存，其他请求为步进访存为例，可以看出，0x119fa和0x119fe相较于其他访存请求在三级缓存以及内存中的命中次数较多，可知该高速缓存针对间接访存模式的性能较差，针对步进访存模式的性能较好。

又一示例性地，参照图5，示出了本申请的又一种统计结果示意图，如图5所示，图5为对高速缓存采用某一硬件预取技术优化后的统计结果，可以看到该硬件预取技术能够增加间接访存0x119fa和0x119fe在一级缓存中的命中次数，减少在二级缓存以下的层级中的命中次数，能够有效提高高速缓存系统对间接访存模式的处理效率。

另外，此统计结果还反映了该预取技术仍有改进空间。该预取技术使用步进访存预测器和间接访存识别技术来处理一级间接访存的预取。理想情况下，间接访存指令从一级缓存中返回的数量应与其依赖的步进型访存相近。而实际结果中间接访存从一级缓存中返回的数量仍少于其依赖的步进型访存。因此，可以得出该预取技术仍有改进空间的结论。

同时，该预取技术应用后，测试程序的IPC并没有上升，原因可能是处理器核内部其他模块的原因，如分支预测等。如果采用现有技术仅使用IPC对该预取技术进行评估的方式，将会得到该预取技术无用的结论。而本申请实施例根据命中次数以及访存模式进行评估，可以看到一级缓存命中次数增多时，发送到二级缓存的请求数量也相应减少，从而二级缓存的命中率才出现下降，如果仅使用缓存命中率对该技术进行评估，则不能得到直观结果，或者得到该技术降低了二级缓存命中率的错误结论，评估效果较差。

本申请通过结合访存模式和每条访存指令在缓存系统中的效果，能够解决传统方法评估预取器、替换算法等缓存优化机制的困难，以及评估效果较差的问题。

进一步，本申请实施例还可以在上述消息包的元数据中记录每级缓存命中的原因，可以是采用预取技术1预取后命中、预取技术2预取后命中或者之前曾访问过该地址等。进一步地，还可以在元数据中记录每级缓存未命中的原因，例如：预取器未覆盖的首次访问、预取器覆盖但未及时取回、由于容量原因被换出缓存、由于冲突原因被换出缓存等。进而可以根据元数据对高速缓存以及优化算法进行更进一步的细化评估。

进一步地，上述第二访存统计信息可以包括各访存请求在命中优化后的高速缓存时，第一优化算法的优化状态。其中，优化状态指的是优化算法的优化参数，不同优化算法的优化参数不同，示例性地，在第一优化算法为替换算法的情况下，上述优化状态可以是最近最少使用替换算法的最近最少使用距离(Least Recently Used，LRU)或者是重引用间隔预测替换算法(Re-Reference Interval Prediction，RRIP)所预测的重引用间隔等。具体的，上述优化状态可以通过对优化算法的优化参数的当前值进行读取得到。

本申请实施例通过采用第一优化算法对所述待评估的高速缓存进行优化，并基于优化后的高速缓存重新执行所述获取所述测试程序的访存统计信息的操作，得到第二访存统计信息，以及，将优化前的高速缓存对应的访存统计信息作为第一访存统计信息；基于所述第一访存统计信息、所述第二访存统计信息以及各访存请求的访存模式，对所述第一优化算法的优化效果进行评估。这样，可以实现对第一优化算法的有效评估。

可选地，本申请实施例具体还可以包括：

S51、采用第二优化算法对所述优化后的高速缓存进行优化，并重新执行所述获取所述测试程序的访存统计信息的操作，得到第三访存统计信息；所述第三访存统计信息包括各所述访存请求在命中优化后的高速缓存时，所述第一优化算法的优化状态以及第二优化算法的优化状态。

S52、基于所述第二访存统计信息以及所述第三访存统计信息，对所述第一优化算法以及所述第二优化算法的优化效果进行评估。

其中，上述第二优化算法指的也是对高速缓存的优化技术，可以是与第一优化算法不同的任一预取器、预取技术、预取算法或替换策略等，可以按照实际需求选择上述第二优化算法，本申请实施例对此不作限制。

具体的，由于在一些情况下，一个高速缓存系统可能同时采用两种或两种以上的优化技术，此时不同优化技术的效果可能互相叠加，也可能互相抵消导致缓存效果更差。示例性地，若一种硬件预取技术和一种替换策略在单独与基线对比时均能够对计算机系统性能作出有效的优化，但是当两种方法同时使用时，可能因为硬件预取增加了访存流量，以及比正常读取数据提前了访问时机，不符合替换算法设计时的假设，导致同时使用二者时的效果可能不如任一个方法单独使用时。

在此基础上，本申请实施例在采用第一优化算法对高速缓存进行优化之后，还采用第二优化算法对高速缓存进行进一步优化，此时该高速缓存同时应用了第一优化算法以及第二优化算法，此时本申请实施例针对同时应用第一优化算法以及第二优化算法的优化后的高速缓存，可以采用测试程序进行多次访问操作，获取第三访存统计信息，第三访存统计信息中可以包括各个访存请求在命中高速缓存时，第一优化算法的优化状态以及第二算法的优化状态。

进一步地，本申请实施例可以通过第二访存统计信息以及第三访存统计信息，对第一优化算法以及第二优化算法整体的优化效果进行评估。具体可以通过第二访存统计信息中的优化状态，与第三访存统计信息中第一优化算法的优化状态进行比较，若第三访存统计信息中第一优化算法的优化状态变差，则可以得到同时应用第一优化算法以及第二优化算法的优化效果较差。

示例性地，以第一优化算法为替换算法，第二优化算法为硬件预取技术为例，如加入硬件预取技术前，某访存请求由替换算法预测的重引用间隔(优化状态)都较长，但是加入硬件预取后，该访存指令被预测的重引用间隔变短，由此则可以评估出替换算法受预取影响导致两者的综合优化效果不佳。

综上，本申请实施例提供了一种高速缓存性能评估方法，通过响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。这样，可以通过获取访存请求在高速缓存中的命中次数，可以实现对高速缓存的性能评估。同时，通过访存统计信息以及各访存请求的访存模式，可以从不同访存模式的维度对高速缓存的性能进行评估，实现多维度的评估，提高高速缓存性能评估的准确性。

进一步地，本申请实施例基于命中次数以及访存请求的访存模式对高速缓存的性能进行评估，相较于采用高速缓存缺失率或者每个时钟周期执行的平均指令数(Instruction Per Cycle，IPC)等指标进行评估的方式，高速缓存缺失率只能反映高速缓存收到的访存请求中未命中的比例，其不能对缺失的时机进行定位，相同缺失率的程序片段可能由于缺失的时机不同而对IPC的影响不同，进而也无法确定对高速缓存的性能影响较大的程序片段。而IPC则对分支预测等因素较敏感，不能直接反映出高速缓存系统对内存访问的覆盖程度。而本申请实施例通过各访存请求的命中次数以及各访存请求的访存模式，可以从不同访存模式的维度对高速缓存的性能进行评估，实现多维度的评估，可以确定出对高速缓存的性能影响较大的访存模式，提高高速缓存性能评估的准确性和可解释性。

进一步地，本申请实施例还可以对高速缓存系统的设计优化提供依据，还可以对优化算法的改进提供依据。本申请实施例可以辅助硬件缓存系统的设计，可以在模拟器或仿真环境下也可以便捷地使用。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本申请实施例所必须的。

装置实施例

参照图6，示出了本申请的一种高速缓存性能评估装置实施例的结构框图，所述装置20具体可以包括：

获取模块201，用于响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；

第一评估模块202，用于基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。

可选地，所述待评估的高速缓存的存储层次包含至少两个层级；所述获取模块201具体用于：

可选地，所述获取模块201，包括：

设置子模块，用于为各所述访存请求设置多个命中计数器；不同命中计数器对应不同层级的高速缓存；

封装子模块，用于对于各个所述访存请求的任一次访存操作，将所述访存请求封装为请求包，并在所述请求包中设置层级参数；

参数子模块，用于在所述请求包从目标层级返回的过程中，每经过一个层级，则将所述请求包中的层级参数加1；所述目标层级为所述请求包命中的高速缓存所在的层级；

确定子模块，用于基于所返回的请求包中的层级参数的数值确定所述访存请求的目标层级，并从所述访存请求所对应的命中计数器中，将所述目标层级对应的命中计数器加1；

次数获取子模块，用于在满足评估条件的情况下，基于各访存请求对应的各个命中计数器的当前数值，获取各所述访存请求在各个层级的高速缓存中的命中次数。

可选地，所述访存统计信息中还包括各所述访存请求的索引值；所述装置还包括：

输出模块，用于基于各所述访存请求的索引值，将各索引值对应的源代码输出至信息显示界面；

接收模块，用于接收用户基于所述信息显示界面为各索引值对应的源代码所输入的模式信息，并将所述模式信息确定为各索引值对应的访存请求的访存模式。

可选地，所述第一评估模块，包括：

参照获取子模块，用于针对各个所述访存请求，获取所述访存请求的访存模式所对应的参照命中次数；

评估子模块，用于基于各所述访存请求的命中次数以及参照命中次数，对所述待评估的高速缓存的性能进行评估。

可选地，所述装置还包括：

第一优化模块，用于采用第一优化算法对所述待评估的高速缓存进行优化，并基于优化后的高速缓存重新执行所述获取所述测试程序的访存统计信息的操作，得到第二访存统计信息，以及，将优化前的高速缓存对应的访存统计信息作为第一访存统计信息；所述第二访存统计信息包括各所述访存请求在优化后的高速缓存中的命中次数以及各所述访存请求在命中所述优化后的高速缓存时，所述第一优化算法的优化状态；

第二评估模块，用于基于所述第一访存统计信息、所述第二访存统计信息以及各访存请求的访存模式，对所述第一优化算法的优化效果进行评估。

可选地，所述装置还包括：

第二优化模块，用于采用第二优化算法对所述优化后的高速缓存进行优化，并重新执行所述获取所述测试程序的访存统计信息的操作，得到第三访存统计信息；所述第三访存统计信息包括各所述访存请求在命中优化后的高速缓存时，所述第一优化算法的优化状态以及第二优化算法的优化状态；

第三评估模块，用于基于所述第二访存统计信息以及所述第三访存统计信息，对所述第一优化算法以及所述第二优化算法的优化效果进行评估。

综上，本申请实施例提供了一种高速缓存性能评估装置，通过响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。这样，可以通过获取访存请求在高速缓存中的命中次数，可以实现对高速缓存的性能评估。同时，通过访存统计信息以及各访存请求的访存模式，可以从不同访存模式的维度对高速缓存的性能进行评估，实现多维度的评估，提高高速缓存性能评估的准确性。

对于系统实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的高速缓存性能评估装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本申请实施例还提供了一种电子设备，包括：处理器、用于存储处理器可执行指令的存储器，其中，处理器被配置为执行上述高速缓存性能评估方法。

参照图7，是本申请实施例提供的电子设备的结构示意图。如图7所示，所述电子设备包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行前述实施例的高速缓存性能评估方法。

需要说明的是，本申请实施例中的电子设备包括移动电子设备和非移动电子设备。

所述处理器可以是CPU(Central Processing Unit，中央处理器)，通用处理器、DSP(Digital Signal Processor，数字信号处理器)，ASIC(Application Specific Integrated Circuit，专用集成电路)，FPGA(Field Programmble Gate Array，现场可编程门阵列)或者其他可编辑器件、晶体管逻辑器件、硬件部件或者其任意组合。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

所述通信总线可包括一通路，在存储器和通信接口之间传送信息。通信总线可以是PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(Extended Industry Standard Architecture，扩展工业标准结构)总线等。所述通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条线表示，但并不表示仅有一根总线或一种类型的总线。

所述存储器可以是ROM(Read Only内存，只读内存)或可存储静态信息和指令的其他类型的静态存储设备、RAM(Random Access，随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM(Electrically Erasable Programmable Read Only，电可擦可编程只读内存)、CD-ROM(Compact Disa Read Only，只读光盘)、磁带、软盘和光数据存储设备等。

本申请实施例还提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备(服务器或者终端)的处理器执行时，使得处理器能够执行图1所示的高速缓存性能评估方法。

本申请实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行图1所示的高速缓存性能评估方法。

本申请实施例还提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述高速缓存性能评估方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

本领域内的技术人员应明白，本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本申请实施例可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以预测方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

可以理解的是，本公开实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，模块、单元、子单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processor，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本公开所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本公开实施例所述功能的模块(例如过程、函数等)来实现本公开实施例所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，本申请实施例中获取各种数据相关过程，都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

Claims

一种高速缓存性能评估方法，其中，所述方法包括：

响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；

基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。
根据权利要求1所述的方法，其中，所述待评估的高速缓存的存储层次包含至少两个层级；所述响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息，包括：

响应于测试程序中的各访存请求的多次访存操作，获取各所述访存请求在各个层级的高速缓存中的命中次数，作为所述访存统计信息。
根据权利要求2所述的方法，其中，所述获取各所述访存请求在各个层级的高速缓存中的命中次数，包括：

为各所述访存请求设置多个命中计数器；不同命中计数器对应不同层级的高速缓存；

对于各个所述访存请求的任一次访存操作，将所述访存请求封装为请求包，并在所述请求包中设置层级参数；

在所述请求包从目标层级返回的过程中，每经过一个层级，则将所述请求包中的层级参数加1；所述目标层级为所述请求包命中的高速缓存所在的层级；

基于所返回的请求包中的层级参数的数值确定所述访存请求的目标层级，并从所述访存请求所对应的命中计数器中，将所述目标层级对应的命中计数器加1；

在满足评估条件的情况下，基于各访存请求对应的各个命中计数器的当前数值，获取各所述访存请求在各个层级的高速缓存中的命中次数。
根据权利要求1所述的方法，其中，所述访存统计信息中还包括各所述访存请求的索引值；所述获取所述测试程序的访存统计信息之后，所述方法还包括：

基于各所述访存请求的索引值，将各索引值对应的源代码输出至信息显示界面；

接收用户基于所述信息显示界面为各索引值对应的源代码所输入的模式信息，并将所述模式信息确定为各索引值对应的访存请求的访存模式。
根据权利要求1所述的方法，其中，所述基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估，包括：

针对各个所述访存请求，获取所述访存请求的访存模式所对应的参照命中次数；

基于各所述访存请求的命中次数以及参照命中次数，对所述待评估的高速缓存的性能进行评估。
根据权利要求1-5任一项所述的方法，其中，所述方法还包括：

采用第一优化算法对所述待评估的高速缓存进行优化，并基于优化后的高速缓存重新执行所述获取所述测试程序的访存统计信息的操作，得到第二访存统计信息，以及，将优化前的高速缓存对应的访存统计信息作为第一访存统计信息；所述第二访存统计信息包括各所述访存请求在优化后的高速缓存中的命中次数以及各所述访存请求在命中所述优化后的高速缓存时，所述第一优化算法的优化状态；

基于所述第一访存统计信息、所述第二访存统计信息以及各访存请求的访存模式，对所述第一优化算法的优化效果进行评估。
根据权利要求6所述的方法，其中，所述方法还包括：

采用第二优化算法对所述优化后的高速缓存进行优化，并重新执行所述获取所述测试程序的访存统计信息的操作，得到第三访存统计信息；所述第三访存统计信息包括各所述访存请求在命中优化后的高速缓存时，所述第一优化算法的优化状态以及第二优化算法的优化状态；

基于所述第二访存统计信息以及所述第三访存统计信息，对所述第一优化算法以及所述第二优化算法的优化效果进行评估。
根据权利要求1所述的方法，其中，所述方法还包括：

根据预设的性能等级，对所述待评估的高速缓存针对不同访存模式的性能进行划分。
根据权利要求1-5任一项所述的方法，其中，所述高速缓存包括：具有缓存功能的缓存系统。
一种高速缓存性能评估装置，其中，所述装置包括：

获取模块，用于响应于测试程序中的各访存请求的多次访存操作，获取所述测试程序的访存统计信息；所述访存统计信息至少包括各所述访存请求在待评估的高速缓存中的命中次数；

第一评估模块，用于基于所述访存统计信息以及各所述访存请求的访存模式，对所述待评估的高速缓存的性能进行评估。
根据权利要求10所述的装置，其中，所述待评估的高速缓存的存储层次包含至少两个层级；所述获取模块201用于：

响应于测试程序中的各访存请求的多次访存操作，获取各所述访存请求在各个层级的高速缓存中的命中次数，作为所述访存统计信息。
根据权利要求10所述的装置，其中，所述获取模块，包括：

设置子模块，用于为各所述访存请求设置多个命中计数器；不同命中计数器对应不同层级的高速缓存；

封装子模块，用于对于各个所述访存请求的任一次访存操作，将所述访存请求封装为请求包，并在所述请求包中设置层级参数；

参数子模块，用于在所述请求包从目标层级返回的过程中，每经过一个层级，则将所述请求包中的层级参数加1；所述目标层级为所述请求包命中的高速缓存所在的层级；

确定子模块，用于基于所返回的请求包中的层级参数的数值确定所述访存请求的目标层级，并从所述访存请求所对应的命中计数器中，将所述目标层级对应的命中计数器加1；

次数获取子模块，用于在满足评估条件的情况下，基于各访存请求对应的各个命中计数器的当前数值，获取各所述访存请求在各个层级的高速缓存中的命中次数。
根据权利要求10所述的装置，其中，所述访存统计信息中还包括各所述访存请求的索引值；所述装置还包括：

输出模块，用于基于各所述访存请求的索引值，将各索引值对应的源代码输出至信息显示界面；

接收模块，用于接收用户基于所述信息显示界面为各索引值对应的源代码所输入的模式信息，并将所述模式信息确定为各索引值对应的访存请求的访存模式。
根据权利要求10所述的装置，其中，所述第一评估模块，包括：

参照获取子模块，用于针对各个所述访存请求，获取所述访存请求的访存模式所对应的参照命中次数；

评估子模块，用于基于各所述访存请求的命中次数以及参照命中次数，对所述待评估的高速缓存的性能进行评估。
根据权利要求10至14任一项所述的装置，其中，所述装置还包括：

第一优化模块，用于采用第一优化算法对所述待评估的高速缓存进行优化，并基于优化后的高速缓存重新执行所述获取所述测试程序的访存统计信息的操作，得到第二访存统计信息，以及，将优化前的高速缓存对应的访存统计信息作为第一访存统计信息；所述第二访存统计信息包括各所述访存请求在优化后的高速缓存中的命中次数以及各所述访存请求在命中所述优化后的高速缓存时，所述第一优化算法的优化状态；

第二评估模块，用于基于所述第一访存统计信息、所述第二访存统计信息以及各访存请求的访存模式，对所述第一优化算法的优化效果进行评估。
根据权利要求15所述的装置，其中，所述装置还包括：

第二优化模块，用于采用第二优化算法对所述优化后的高速缓存进行优化，并重新执行所述获取所述测试程序的访存统计信息的操作，得到第三访存统计信息；所述第三访存统计信息包括各所述访存请求在命中优化后的高速缓存时，所述第一优化算法的优化状态以及第二优化算法的优化状态；

第三评估模块，用于基于所述第二访存统计信息以及所述第三访存统计信息，对所述第一优化算法以及所述第二优化算法的优化效果进行评估。
一种电子设备，其中，所述电子设备包括处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放可执行指令，所述可执行指令使所述处理器执行如权利要求1至9中任一项所述的高速缓存性能评估方法。
一种可读存储介质，其中，当所述可读存储介质中的指令由电子设备的处理器执行时，使得所述处理器能够执行如权利要求1至9中任一项所述的高速缓存性能评估方法。
一种芯片，其中，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如权利要求1至9中任一项所述的高速缓存性能评估方法。
一种同步控制装置/设备，其中，包括所述装置/设备(被配置成)用于执行如权利要求1至9中任一项所述的高速缓存性能评估方法。