Skip to content

Latest commit

 

History

History
104 lines (66 loc) · 5.26 KB

intel_pstate.md

File metadata and controls

104 lines (66 loc) · 5.26 KB

P-state

本段落为Balancing Power and Performance in the Linux Kernel概要摘录

P-state是CPU频率和操作点电压的结合。

处理器性能和主频是直接相关的。增加主频可以增加处理器性。反之,即哪个低主频则降低性能。如果将主频减半,计算任务就会降低一半速度。不过,如果降低主频,但是增加CPU使用率并且降低idle时间百分比,则会影响电池使用时间。

引入P-state的两个主要原因是:降低尖峰时热能负载,以及降低能耗。

Linux内核的能耗和性能平衡

idle的不同级别

  • runtime idle
  • suspended
  • off

激活电源管理

  • CPU激活电源管理(cpufreq) - P-states 或 DVFS
  • 设备激活电源管理 - 一些设备支持PCIe ASPM
  • GPU则自我管理

选择正确的p-state

  • 调节器(Governors)反映了用户策略决定:
    • intel_pstate只支持powersaveperformance策略,其他驱动支持更多策略。
    • intel_pstate是一个调节器,并且hw驱动是一个整体,所以传统上这个governor是和hw驱动隔离的。
  • intel_pstate "performance" 策略总是选择最高的p-state
    • 完全不考虑节能
  • intel_pstate "powersave" 策略尝试平衡性能和节能
  • intel_pstate驱动监视使用率并能够决定何时增加或减少p-state。这个方式和其他governors类似。

p-state划分

  • P0 - P1 是 turbo范围
  • P1 - Pn 是 保证范围(操作系统可见的状态)
  • Pn - LFM 是 温度控制范围

p-state划分

P-state的硬件协作

  • 共享相同电压域的CPU核心对一个p-state投票
  • 每个CPU核心的最高p-state赢得投票
  • APERF/MPERF必须用于查看哪个p-state被批准

acpi_cpufreq已经被废弃

P-state的操作系统限制

  • 能力/使用率不足以决定何时伸缩
  • 采样率可能导致不正确的使用计算
  • 伸缩性的收益不明确

硬件P-state(HWP)

Intel Speed Shift Technology (HWP)

  • 最有效的主频是运行时计算(Pe) - 基于系统和负载
  • EPP表示Energy Performance Perference(能源执行性能优先) - 将决定如何强化算法(Pa) - 基于系统,负载,OS
  • 算法将在Pa和Pe之间操作

HWP即 Hardware P-State

HWP

HWP MSR

HWP capabilities MSR

Linux实现

  • intel_pstate驱动检查CPU flag
  • 默认所有白名单CPU都激活
  • 只支持自动模式
  • 没有EPP输出
  • Min和Max pstate是通过min和max perf_pct sysfs文件获取

Intel P-State驱动

本段落翻译自内核intel_pstate驱动说明文档cpu-freq/intel-pstate.txt,解释了Balancing Power and Performance in the Linux Kernel详细信息。

理解cpufreq core governors(cpufreq核心调节器)和策略对于讨论Intel P-state驱动非常重要。基于一个cpufreq驱动提供给cpufreq核心的回调(callback),支持一下两种驱动:

  • target_index()回调:这种模式下,驱动使用cpufreq core简单提供了最小和最大主频限制以及一个附加的target_index()接口来设置当前主频。cpufreq子系统有一系列伸缩策略(performancepowersaveondemand等)。基于所使用的governor调节器,cpufreq core将使用target_index()回调来转换到值指定主频。
  • setpolicy()回调:这种模式下,驱动不提供target_index()回调,所以cpufreq核心不能请求一个特定频率的转换。驱动提供最小和最大频率限制,然后回调设置一个策略。这个调节器策略在cpufreq sysfs系统中被称为"scaling governor"。cpufreq核心可以请求驱动来操作两个策略之一:performancepowersave。驱动基于这两个策略的选择来决定使用的频率以确定最小和最大主频限制。

Intel P-State驱动程序属于后一类,它实现了setpolicy()回调。

启动激活Intel P-State

Intel Turbo boost和p-State

参考