InteractiveGovernor调频策略

本文基于eval_target_freq分析InteractiveGovernor如何根据cpu负载变化来实现调频策略。

1. InteractiveGovernor的运转和原理框图

1.1 InteractiveGovernor的运作框图
InteractiveGovernor调频策略
(1)linux进程管理和调度框架会在合适的时机调用irq_work_queue去enqueue governor的irq_work,这个irq_work会计算是否需要变频,如果需要变频,那么会唤醒实时进程speedchange_task进行变频。
(2)speedchange_task会通过cpufreq核心层提供的通用接口调用driver实现的具体变频接口执行变频。

1.2 InteractiveGovernor的原理框图
InteractiveGovernor调频策略
总的来讲就是在上层软件决策需要调频并且把这个信息传递到governor的时候,governor会计算当前的CPU负载(cpu_load),然后根据当前CPU负载计算一个新的CPU运行频率(new_freq),最后根据new_freq决策是否需要唤醒speedchange_task来执行调频。所以调频策略由eval_target_freq具体实现,下面具体来分析这个函数。

2. 根据cputime计算CPU负载

2.1 update_load更新CPU时间
主要更新两次调频之间当前CPU的idle time以及active time和当前频率的乘积,这些信息用于计算CPU负载。
InteractiveGovernor调频策略
该函数返回now,同时更新icpu的相关成员。
(1)get_cpu_idle_time计算总的idle time:
InteractiveGovernor调频策略
首先获取当前CPU总的idle_time,如果io_busy是0(我们的项目中是这种情况),也就是把iowait也当做idle,那么就把当前CPU的iowait time也加到idle_time里面去。所以该函数即是计算当前cpu上总的idletime+iowaittime,单位是us,并且保存当前时间。
(2)记录本次更新的两个时间信息
icpu->time_in_idle = now_idle:本次更新的时候,当前cpu上累积的总的idle time(包含iowait time)。
icpu->time_in_idle_timestamp = now:本次更新的时间(意指什么时候做的负载更新)。
这里需要注意的是这两个时间信息会在每次成功变频之后的CPUFREQ_POSTCHANGE通知里面调用update_load再更新一次。
(3)计算两个局部时间变量
InteractiveGovernor调频策略
delta_idle表示上一次成功变频或者申请变频评估负载到本次申请变频评估负载的时候当前CPU经历的idle time。
delta_time表示上一次成功变频或者申请变频评估负载到本次申请变频评估负载的时候当前CPU经历的wall time。
(4)计算active time
InteractiveGovernor调频策略
active_time表示上一次成功变频或者申请变频评估负载到本次申请变频评估负载的时候当前CPU经历的active time。
(5)计算cputime_speedadj
InteractiveGovernor调频策略
cputime_speedadj表示上一次成功变频或者申请变频评估负载到本次申请变频评估负载的时候当前CPU经历的active time对当前频率的乘积。cputime_speedadj会在每次申请变频之后都被置零:
InteractiveGovernor调频策略
同时更新的还有time_in_idle、time_in_idle_timestamp以及cputime_speedadj_timestamp这些时间信息。
综上,update_load的目的是计算上次调频到本次调频之间,频率对当前cpu active time的时间乘积cputime_speedadj,这个值越大,代表CPU loading越重。
另外,update_load会更新cpu idle time进而计算cputime_speedadj,每次eval_target_freq完成之后也会调用slack_timer_resched更新cpu idle time以及清零cputime_speedadj。最终变频完成之后也会在notifier中调用update_load更新cpu idle time。这些操作都是为了能准确计算两次变频之间的cputime_speedadj。

2.2 计算CPU负载
(1)计算两次调频的时间差,也就是cputime_speedadj从0 增加到icpu->cputime_speedadj的时间,如果这段时间不足1us,那么直接返回:
InteractiveGovernor调频策略
(2)计算CPU在两次调频之间的平均负载:
InteractiveGovernor调频策略
带入update_load中计算出的cputime_speedadj化简之后得到:
*cpu_load=(active_time/delta_time)100
也就是说两次调频之间的CPU负载完全取决于这段时间CPU的active_time,CPU负载即是两次调频之间CPU处于active状态的时间百分比,比如两次调频之间CPU处于active的时间占总时间的95%,我们就说这段时间的CPU负载时95。
loadadjfreq=cpu_load*policy->cur
loadadjfreq是后面计算新频率的关键参数,它是cpu loading和cpu频率的乘积。可以视作cpu负载。

3. 根据CPU负载loadadjfreq计算新频率

InteractiveGovernor调频策略
这里我们只分析依赖CPU负载的部分,关于boost的部分我们暂不分析。这里我们先明确如下几个控制参数:
tunables->go_hispeed_load:
CPU负载阈值参数,默认是95,可重写。
tunables->hispeed_freq:
高频的阈值参数,默认是1G,可重写。
loadadjfreq = (unsigned int)cputime_speedadj * 100
两次调频之间CPU实时负载和当前频率的乘积。
3.1 CPU负载在95以上
(1)如果当前频率小于1G,那么直接把新频率设置成1G。
(2)如果当前频率不小于1G,那么传入loadadjfreq调用choose_freq计算新频率,其实也就是根据新的CPU负载算出一个大于1G的频率。
3.2 CPU负载在95以下
这个时候直接传入loadadjfreq调用choose_freq算出一个新的频率。如果算出的新频率大于1G并且当前运行频率小于1G,那么直接把新频率设置成1G。
3.3 根据CPU实时负载计算新频率
这个任务由函数choose_freq完成:
InteractiveGovernor调频策略
其中loadadjfreq = (active_time /delta_time)* icpu->ipolicy->policy->cur 100,也就是cpu_load policy->cur。我们在该函数中增加trace来感受运行情况:
InteractiveGovernor调频策略
当cpu运行在100MHz的时候,cpu loading从2->13->8->27变化的时候,choose_freq的返回值仍然是100M,当cpu loading 上升到64的时候,choose_freq返回了250M,表示需要升频。当cpu loading在250M降到6的时候,choose_freq返回了100M,表示要降频了。
下面分析choose_freq的计算逻辑。整个计算在一个do{…}while(freq!=prevfreq)中,也就是说只要计算后的频率和计算前的频率不相等,那么一直循环,除非在循环中break。事实上一定会找到一个新频率而break的。
(1)根据当前运行的频率计算一个目标负载
InteractiveGovernor调频策略
InteractiveGovernor调频策略
InteractiveGovernor调频策略
根据代码逻辑:如果cpu当前的运行频率在900MHz以上那么cpu的目标负载是70,如果cpu当前的运行频率在900MHz以下那么cpu的目标负载应该是50。
(2)根据实时频率负载和目标负载计算一个目标频率
InteractiveGovernor调频策略
目标频率是:
*loadadjfreq/tl=(cpu_load/tl)policy->cur
也就是说目标频率是当前频率乘以一个比例因子β,β=cpu_load/target_load。
如果cpu当前运行频率在900MHz以上,此时tl=70,这个时候如果cpu负载在70以上,算出来的新频率会比当前频率大,表示需要升频。如果cpu负载在70以下,算出来的频率会比当前频率小,表示需要降频。
如果cpu当前运行频率在900MHz以下,此时tl=50,这个时候如果cpu负载在50以上,算出来的新频率会比当前频率大,表示需要升频。如果cpu负载在50以下,算出来的频率会比当前频率小,表示需要降频。

以上应该是Interactive Governor变频算法的核心。
以上根据目标频率查表得到的是频率的index,还需要根据index在policy->freq_table中得到真正的频率freq。紧接着后面有一个对频率的补充处理,我们暂不考虑。

4. 根据新频率判断是否需要调频

上面根据cpu当前负载/当前频率/目标负载已经算得目标频率:
*new_freq=(cpu_load/tl)policy->cur
下面面根据这个新的频率以及现场的综合因素判断是否需要执行下面的调频操作。
4.1 高频升频的延时检查
InteractiveGovernor调频策略
InteractiveGovernor调频策略
先明确相关调频因子的含义:
tunables->hispeed_freq:高频线值,默认1G,可重写。
icpu->pol_hispeed_val_time:最高频的cpu的变频时间。
InteractiveGovernor调频策略
InteractiveGovernor调频策略
分析:如果是高频(不低于1G)的升频,我们需要确认目前运行最高频的cpu上次变频到现在时间间隔是否超过20ms,如果不足20ms,那么直接退出本次变频。如果超过20ms,那么再进行后续检查。
4.2 icpu->floor_freq调频检查
InteractiveGovernor调频策略
这里需要满足80ms的延时间隔。
4.3 icpu->target_freq调频检查
InteractiveGovernor调频策略
这里如果新频率和上一次设置的频率相等,那么不用调频直接返回。