谷动谷力

 找回密码
 立即注册
查看: 1242|回复: 0
打印 上一主题 下一主题
收起左侧

看看你的MCU能跑多少分?极简教程教你测试MCU性能!

[复制链接]
跳转到指定楼层
楼主
发表于 2023-8-23 13:49:17 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
看看你的MCU能跑多少分?极简教程教你测试MCU性能!


提起MCU性能测试,最著名的就是CoreMark和Dhrystone。CoreMark以每秒迭代次数作为性能评价,而Dhrystone的DMIPS与Dhrystone标准相关。
本文讨论CoreMark,我们先来看看MCU厂家是如何宣传自家产品性能的。
NXP i.MX RT1170,CoreMark:6468 ;ST STM32H747/757 CoreMark:3224
01 揭开神秘面纱:CoreMark是什么?为什么它可以作为MCU的性能指标?这个数是怎么计算出来的?

CoreMark是衡量嵌入式系统中微控制器性能的基准。通过包含列表处理(查找和排序)、矩阵处理(常见的矩阵操作)、状态机(确定输入流是否包含有效数字)和CRC(循环冗余校验)等算法的测试给出性能评价。

需要下载的软件包是免费开源的,大家可以在官方网站找到:EEMBC’s CoreMark®,网页截图如下。部分朋友无法直接下载的,文末进入“阅读原文”也提供下载好的软件包。


02
作业不难:怎么将CoreMark移植到自己的MCU上?运行CoreMark需要哪些外设支持?

51单片机也可以跑CoreMark的,所以硬件上不用担心。运行CoreMark,需要定时器提供计时功能,还需要一种向外部打印消息的手段。一个比较简单的方法是,调用stdio.h中定义的printf()函数,将其重定向到串口。现以使用STM32CubeIDE将CoreMark移植到STM32G071为例进行说明。

● Step1:复制必要文件到目标工程。现已准备好目标MCU的软件工程,其文件结构如下图右侧所示。从CoreMark官网获得软件包,软件包解压后文件结构如下图左侧所示。在右侧软件工程中新建文件夹CoreMark,将左侧绿色框中,core_list_join.c、core_main.c、core_matrix.c、core_state.c、core_util.c、coremark.h等文件放到CoreMark文件夹里。打开左侧simple文件夹,将core_portme.c复制到Src文件夹中,将core_portme.h复制到Inc文件夹中。

(彩色高亮标记与图中颜色标记对应,共5个步骤)
● Step2:由于core_main.c文件已定义了main()函数,该main()函数执行时调用core_portme.c中的portable_init()函数作为MCU初始化接口,因此需要将MCU工程中原main.c文件MCU初始化代码移动到到portable_init()函数里并删除原有main.c文件。以STM32CubeIDE工程为例,需要移动SystemClock_Config和一堆MX_开头的初始化函数(注意相关结构体、函数原型与函数实现要一起移动)。
● Step3:CoreMark的分数最终表示为Iterations/Sec,也就是每秒迭代数,而Sec和系统Ticks相关。用过RTOS的朋友应该对这个概念很熟悉,考虑文字不太好解释,直接看core_portme.c里这个宏定义
#define EE_TICKS_PER_SEC    1000

● 这里我定义每秒1000个Tick,每个Tick时长1ms,对应定时器每1ms触发一次中断。使用一个计数变量,定时器进入中断一次,该变量值+1;对该变量值/1000即可求得定时器运行时长,也就是上文的Sec。所以,EE_TICKS_PER_SEC并非一定要设置为1000,和定时器中断频率对应即可。与定时相关的函数有以下三个。
void start_time(void);//启动计时器;
void stop_time(void);//停止计时器;
CORE_TICKS get_time(void);//获取计时器的计数值。

● 在start_time()里实现定时器启动功能,在stop_time()里实现定时器停止功能,在get_time()中获取中断计数值。数据类型“CORE_TICKS ”实际上就是“unsigned long”。为方便操作,推荐将计数变量设置为全局变量,这样可以通过extern关键字直接访问。此处以TIM1为例,代码如下:
//计数变量
unsigned long time_ms_ticks=0;

//定时器启动
void start_time(void)
{
  (&htim1)->State = HAL_TIM_STATE_BUSY;
  __HAL_TIM_ENABLE(&htim1);
  __HAL_TIM_ENABLE_IT(&htim1, TIM_IT_UPDATE);
}

//定时器停止
void stop_time(void)
{
  __HAL_TIM_DISABLE_IT(&htim1, TIM_IT_UPDATE);
  __HAL_TIM_DISABLE(&htim1);
  (&htim1)->State = HAL_TIM_STATE_READY;
}

//获取中断计数值
CORE_TICKS get_time(void)
{
  return time_ms_ticks;
}

//中断处理函数
extern unsigned long time_ms_ticks;
void TIM1_BRK_UP_TRG_COM_IRQHandler(void)
{
  HAL_TIM_IRQHandler(&htim1);
  time_ms_ticks=time_ms_ticks+1;
}

● 注释部分不使用的代码。以下代码位于core_portme.c中,需要注释掉:
//#define NSECS_PER_SEC              CLOCKS_PER_SEC
//#define CORETIMETYPE               clock_t
//#define GETMYTIME(_t)              (*_t = clock())
//#define MYTIMEDIFF(fin, ini)       ((fin) - (ini))
//#define TIMER_RES_DIVIDER          1
//#define SAMPLE_TIME_IMPLEMENTATION 1

//static CORETIMETYPE start_time_val, stop_time_val;

● CoreMark要求的最短测试时间为10s,若测试时间低于10s则会报错,见下图:


● 为获得有效的测试结果,需修改core_portme.c中关于ITERATIONS的设置,官方代码中ITERATIONS没有定义:
volatile ee_s32 seed4_volatile = ITERATIONS;

● 此处使用STM32G071,主频64MHz。经测试ITERATIONS修改为1200左右即可。
volatile ee_s32 seed4_volatile = 1200;

● Step4:打印测试结果时,编译器优化等级和调试等级也可以打印出来。这类信息可在core_portme.h中通过宏COMPILER_FLAGS修改。这里我使用-Ofast优化,调试等级-g3,修改如下:
#ifndef COMPILER_FLAGS
#define COMPILER_FLAGS "-Ofast -g3"
#endif

● 重定向printf到串口,可参考以下代码(以STM32 LPUART1为例),根据IDE不同可能需要添加float类型支持:
__io_putchar (int ch)
{
  HAL_UART_Transmit (&hlpuart1, (uint8_t*) &ch, 1, 0x0F);
  return ch;
}

● Step5:移植完成!编译程序下载运行,得到跑分结果:


STM32G071RB,64MHz,108.9分!

通常使用最高主频和-Ofast优化可以获取最大分数,欢迎大家把自己的跑分放到评论区。

另外,如果有需要下载文件、代码,以及更多内容的小伙伴,请点击底部“阅读原文”进行查看

声明:本文系21ic论坛网友Litthins原创,如需转载,请注明出处。

+10
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|深圳市光明谷科技有限公司|光明谷商城|Sunshine Silicon Corpporation ( 粤ICP备14060730号|Sitemap

GMT+8, 2024-12-28 00:01 , Processed in 0.175585 second(s), 43 queries .

Powered by Discuz! X3.2 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表