30f3490978
- Add new cpufreq driver for the MediaTek MT6779 platform called mediatek-hw along with corresponding DT bindings (Hector.Yuan). - Add DCVS interrupt support to the qcom-cpufreq-hw driver (Thara Gopinath). - Make the qcom-cpufreq-hw driver set the dvfs_possible_from_any_cpu policy flag (Taniya Das). - Blocklist more Qualcomm platforms in cpufreq-dt-platdev (Bjorn Andersson). - Make the vexpress cpufreq driver set the CPUFREQ_IS_COOLING_DEV flag (Viresh Kumar). - Add new cpufreq driver callback to allow drivers to register with the Energy Model in a consistent way and make several drivers use it (Viresh Kumar). - Change the remaining users of the .ready() cpufreq driver callback to move the code from it elsewhere and drop it from the cpufreq core (Viresh Kumar). - Revert recent intel_pstate change adding HWP guaranteed performance change notification support to it that led to problems, because the notification in question is triggered prematurely on some systems (Rafael Wysocki). - Convert the OPP DT bindings to DT schema and clean them up while at it (Rob Herring). -----BEGIN PGP SIGNATURE----- iQJGBAABCAAwFiEE4fcc61cGeeHD/fCwgsRv/nhiVHEFAmE41VgSHHJqd0Byand5 c29ja2kubmV0AAoJEILEb/54YlRxCN4P+gMjMrrZmuU6gZsbbvpDlaBhCd2Xq3TD xR/DMDi7znkh3TUX3uwL+xnr+k0krIH0jBIeUQUE7NeNIoT6wgbjJ4Ty5rFq76qB AODmmZ4vO7lmnupSyqUQbHfYohDmyICSKiStf8UOEj1o+jSWNmrgUYUv0tDtDUH+ Cn0vByah8gJAnoZX8Y8BM1jmRc3YoNHWpvtTQIhIBPkVZ//+NOKvDZvwUUPZFb+M 1PzMSfX7WsIDiUrUHpdvtZsoBniaMk0WS1EqVBRvEprqUXad1eHF19yuhtLxeUPH 8xh/7o8kYzjqVJvs7blTT8DztxRDScWHeGKSVdwoEJupbCwc5R3qfGaD6PWyhI1x 9R5Swsp64nLptTCwH7ZmgdJbC9IqN3cz1Nadd5v2Q2wr21KvZnj7zI2ijkPKGnZo kqYQHghqnDkGPFVjdls/RKUXGCQIXZFQb+FeuyCvpVlz9Ol8+DnTYtgFjjc6VcU1 kApIqsE8V8GQEyzmm/OIAf6xtsA+mEUUh3Qds16KNCwBCRglC8I6v5IWnBc8PEJz a+wtwjx+tyKSSlAMEvcDNtrWVN+3JNrwCFG+Q+QjMrwLiAgACrtJZ6e6PmLj9sZv FPbZM8rzbzN7Zqd7XVNY37KHjqNs7zzDScAnATTUCKThp8ijDgtmG3ZhExmOPayc 74aQLham4TBO =WSpr -----END PGP SIGNATURE----- Merge tag 'pm-5.15-rc1-2' of git://git.kernel.org/pub/scm/linux/kernel/git/rafael/linux-pm Pull more power management updates from Rafael Wysocki: "These are mostly ARM cpufreq driver updates, including one new MediaTek driver that has just passed all of the reviews, with the addition of a revert of a recent intel_pstate commit, some core cpufreq changes and a DT-related update of the operating performance points (OPP) support code. Specifics: - Add new cpufreq driver for the MediaTek MT6779 platform called mediatek-hw along with corresponding DT bindings (Hector.Yuan). - Add DCVS interrupt support to the qcom-cpufreq-hw driver (Thara Gopinath). - Make the qcom-cpufreq-hw driver set the dvfs_possible_from_any_cpu policy flag (Taniya Das). - Blocklist more Qualcomm platforms in cpufreq-dt-platdev (Bjorn Andersson). - Make the vexpress cpufreq driver set the CPUFREQ_IS_COOLING_DEV flag (Viresh Kumar). - Add new cpufreq driver callback to allow drivers to register with the Energy Model in a consistent way and make several drivers use it (Viresh Kumar). - Change the remaining users of the .ready() cpufreq driver callback to move the code from it elsewhere and drop it from the cpufreq core (Viresh Kumar). - Revert recent intel_pstate change adding HWP guaranteed performance change notification support to it that led to problems, because the notification in question is triggered prematurely on some systems (Rafael Wysocki). - Convert the OPP DT bindings to DT schema and clean them up while at it (Rob Herring)" * tag 'pm-5.15-rc1-2' of git://git.kernel.org/pub/scm/linux/kernel/git/rafael/linux-pm: (23 commits) Revert "cpufreq: intel_pstate: Process HWP Guaranteed change notification" cpufreq: mediatek-hw: Add support for CPUFREQ HW cpufreq: Add of_perf_domain_get_sharing_cpumask dt-bindings: cpufreq: add bindings for MediaTek cpufreq HW cpufreq: Remove ready() callback cpufreq: sh: Remove sh_cpufreq_cpu_ready() cpufreq: acpi: Remove acpi_cpufreq_cpu_ready() cpufreq: qcom-hw: Set dvfs_possible_from_any_cpu cpufreq driver flag cpufreq: blocklist more Qualcomm platforms in cpufreq-dt-platdev cpufreq: qcom-cpufreq-hw: Add dcvs interrupt support cpufreq: scmi: Use .register_em() to register with energy model cpufreq: vexpress: Use .register_em() to register with energy model cpufreq: scpi: Use .register_em() to register with energy model dt-bindings: opp: Convert to DT schema dt-bindings: Clean-up OPP binding node names in examples ARM: dts: omap: Drop references to opp.txt cpufreq: qcom-cpufreq-hw: Use .register_em() to register with energy model cpufreq: omap: Use .register_em() to register with energy model cpufreq: mediatek: Use .register_em() to register with energy model cpufreq: imx6q: Use .register_em() to register with energy model ...
255 lines
10 KiB
ReStructuredText
255 lines
10 KiB
ReStructuredText
.. SPDX-License-Identifier: GPL-2.0
|
||
|
||
.. include:: ../disclaimer-zh_CN.rst
|
||
|
||
:Original: Documentation/cpu-freq/cpu-drivers.rst
|
||
|
||
:翻译:
|
||
|
||
司延腾 Yanteng Si <siyanteng@loongson.cn>
|
||
|
||
.. _cn_cpu-drivers.rst:
|
||
|
||
=======================================
|
||
如何实现一个新的CPUFreq处理器驱动程序?
|
||
=======================================
|
||
|
||
作者:
|
||
|
||
|
||
- Dominik Brodowski <linux@brodo.de>
|
||
- Rafael J. Wysocki <rafael.j.wysocki@intel.com>
|
||
- Viresh Kumar <viresh.kumar@linaro.org>
|
||
|
||
.. Contents
|
||
|
||
1. 怎么做?
|
||
1.1 初始化
|
||
1.2 Per-CPU 初始化
|
||
1.3 验证
|
||
1.4 target/target_index 或 setpolicy?
|
||
1.5 target/target_index
|
||
1.6 setpolicy
|
||
1.7 get_intermediate 与 target_intermediate
|
||
2. 频率表助手
|
||
|
||
|
||
|
||
1. 怎么做?
|
||
===========
|
||
|
||
如此,你刚刚得到了一个全新的CPU/芯片组及其数据手册,并希望为这个CPU/芯片组添加cpufreq
|
||
支持?很好,这里有一些至关重要的提示:
|
||
|
||
|
||
1.1 初始化
|
||
----------
|
||
|
||
首先,在__initcall_level_7 (module_init())或更靠后的函数中检查这个内核是否
|
||
运行在正确的CPU和正确的芯片组上。如果是,则使用cpufreq_register_driver()向
|
||
CPUfreq核心层注册一个cpufreq_driver结构体。
|
||
|
||
结构体cpufreq_driver应该包含什么成员?
|
||
|
||
.name - 驱动的名字。
|
||
|
||
.init - 一个指向per-policy初始化函数的指针。
|
||
|
||
.verify - 一个指向"verification"函数的指针。
|
||
|
||
.setpolicy 或 .fast_switch 或 .target 或 .target_index - 差异见
|
||
下文。
|
||
|
||
并且可选择
|
||
|
||
.flags - cpufreq核的提示。
|
||
|
||
.driver_data - cpufreq驱动程序的特定数据。
|
||
|
||
.get_intermediate 和 target_intermediate - 用于在改变CPU频率时切换到稳定
|
||
的频率。
|
||
|
||
.get - 返回CPU的当前频率。
|
||
|
||
.bios_limit - 返回HW/BIOS对CPU的最大频率限制值。
|
||
|
||
.exit - 一个指向per-policy清理函数的指针,该函数在cpu热插拔过程的CPU_POST_DEAD
|
||
阶段被调用。
|
||
|
||
.suspend - 一个指向per-policy暂停函数的指针,该函数在关中断且在该策略的调节器停止
|
||
后被调用。
|
||
|
||
.resume - 一个指向per-policy恢复函数的指针,该函数在关中断且在调节器再一次开始前被
|
||
调用。
|
||
|
||
.attr - 一个指向NULL结尾的"struct freq_attr"列表的指针,该函数允许导出值到
|
||
sysfs。
|
||
|
||
.boost_enabled - 如果设置,则启用提升(boost)频率。
|
||
|
||
.set_boost - 一个指向per-policy函数的指针,该函数用来开启/关闭提升(boost)频率功能。
|
||
|
||
|
||
1.2 Per-CPU 初始化
|
||
------------------
|
||
|
||
每当一个新的CPU被注册到设备模型中,或者在cpufreq驱动注册自己之后,如果此CPU的cpufreq策
|
||
略不存在,则会调用per-policy的初始化函数cpufreq_driver.init。请注意,.init()和.exit()程序
|
||
只对策略调用一次,而不是对策略管理的每个CPU调用一次。它需要一个 ``struct cpufreq_policy
|
||
*policy`` 作为参数。现在该怎么做呢?
|
||
|
||
如果有必要,请在你的CPU上激活CPUfreq功能支持。
|
||
|
||
然后,驱动程序必须填写以下数值:
|
||
|
||
+-----------------------------------+--------------------------------------+
|
||
|policy->cpuinfo.min_freq 和 | |
|
||
|policy->cpuinfo.max_freq | 该CPU支持的最低和最高频率(kHz) |
|
||
| | |
|
||
| | |
|
||
+-----------------------------------+--------------------------------------+
|
||
|policy->cpuinfo.transition_latency | |
|
||
| | CPU在两个频率之间切换所需的时间,以 |
|
||
| | 纳秒为单位(如适用,否则指定 |
|
||
| | CPUFREQ_ETERNAL) |
|
||
+-----------------------------------+--------------------------------------+
|
||
|policy->cur | 该CPU当前的工作频率(如适用) |
|
||
| | |
|
||
+-----------------------------------+--------------------------------------+
|
||
|policy->min, | |
|
||
|policy->max, | |
|
||
|policy->policy and, if necessary, | |
|
||
|policy->governor | 必须包含该cpu的 “默认策略”。稍后 |
|
||
| | 会用这些值调用 |
|
||
| | cpufreq_driver.verify and either |
|
||
| | cpufreq_driver.setpolicy or |
|
||
| | cpufreq_driver.target/target_index |
|
||
| | |
|
||
+-----------------------------------+--------------------------------------+
|
||
|policy->cpus | 用与这个CPU一起做DVFS的(在线+离线) |
|
||
| | CPU(即与它共享时钟/电压轨)的掩码更新 |
|
||
| | 这个 |
|
||
| | |
|
||
+-----------------------------------+--------------------------------------+
|
||
|
||
对于设置其中的一些值(cpuinfo.min[max]_freq, policy->min[max]),频率表助手可能会有帮
|
||
助。关于它们的更多信息,请参见第2节。
|
||
|
||
|
||
1.3 验证
|
||
--------
|
||
|
||
当用户决定设置一个新的策略(由 “policy,governor,min,max组成”)时,必须对这个策略进行验证,
|
||
以便纠正不兼容的值。为了验证这些值,cpufreq_verify_within_limits(``struct cpufreq_policy
|
||
*policy``, ``unsigned int min_freq``, ``unsigned int max_freq``)函数可能会有帮助。
|
||
关于频率表助手的详细内容请参见第2节。
|
||
|
||
您需要确保至少有一个有效频率(或工作范围)在 policy->min 和 policy->max 范围内。如果有必
|
||
要,先增加policy->max,只有在没有办法的情况下,才减少policy->min。
|
||
|
||
|
||
1.4 target 或 target_index 或 setpolicy 或 fast_switch?
|
||
-------------------------------------------------------
|
||
|
||
大多数cpufreq驱动甚至大多数cpu频率升降算法只允许将CPU频率设置为预定义的固定值。对于这些,你
|
||
可以使用->target(),->target_index()或->fast_switch()回调。
|
||
|
||
有些cpufreq功能的处理器可以自己在某些限制之间切换频率。这些应使用->setpolicy()回调。
|
||
|
||
|
||
1.5. target/target_index
|
||
------------------------
|
||
|
||
target_index调用有两个参数:``struct cpufreq_policy * policy``和``unsigned int``
|
||
索引(于列出的频率表)。
|
||
|
||
当调用这里时,CPUfreq驱动必须设置新的频率。实际频率必须由freq_table[index].frequency决定。
|
||
|
||
它应该总是在错误的情况下恢复到之前的频率(即policy->restore_freq),即使我们之前切换到中间频率。
|
||
|
||
已弃用
|
||
----------
|
||
目标调用有三个参数。``struct cpufreq_policy * policy``, unsigned int target_frequency,
|
||
unsigned int relation.
|
||
|
||
CPUfreq驱动在调用这里时必须设置新的频率。实际的频率必须使用以下规则来确定。
|
||
|
||
- 紧跟 "目标频率"。
|
||
- policy->min <= new_freq <= policy->max (这必须是有效的!!!)
|
||
- 如果 relation==CPUFREQ_REL_L,尝试选择一个高于或等于 target_freq 的 new_freq。("L代表
|
||
最低,但不能低于")
|
||
- 如果 relation==CPUFREQ_REL_H,尝试选择一个低于或等于 target_freq 的 new_freq。("H代表
|
||
最高,但不能高于")
|
||
|
||
这里,频率表助手可能会帮助你--详见第2节。
|
||
|
||
1.6. fast_switch
|
||
----------------
|
||
|
||
这个函数用于从调度器的上下文进行频率切换。并非所有的驱动都要实现它,因为不允许在这个回调中睡眠。这
|
||
个回调必须经过高度优化,以尽可能快地进行切换。
|
||
|
||
这个函数有两个参数: ``struct cpufreq_policy *policy`` 和 ``unsigned int target_frequency``。
|
||
|
||
|
||
1.7 setpolicy
|
||
-------------
|
||
|
||
setpolicy调用只需要一个``struct cpufreq_policy * policy``作为参数。需要将处理器内或芯片组内动态频
|
||
率切换的下限设置为policy->min,上限设置为policy->max,如果支持的话,当policy->policy为
|
||
CPUFREQ_POLICY_PERFORMANCE时选择面向性能的设置,当CPUFREQ_POLICY_POWERSAVE时选择面向省电的设置。
|
||
也可以查看drivers/cpufreq/longrun.c中的参考实现。
|
||
|
||
1.8 get_intermediate 和 target_intermediate
|
||
--------------------------------------------
|
||
|
||
仅适用于 target_index() 和 CPUFREQ_ASYNC_NOTIFICATION 未设置的驱动。
|
||
|
||
get_intermediate应该返回一个平台想要切换到的稳定的中间频率,target_intermediate()应该将CPU设置为
|
||
该频率,然后再跳转到'index'对应的频率。核心会负责发送通知,驱动不必在target_intermediate()或
|
||
target_index()中处理。
|
||
|
||
在驱动程序不想因为某个目标频率切换到中间频率的情况下,它们可以从get_intermediate()中返回'0'。在这种情况
|
||
下,核心将直接调用->target_index()。
|
||
|
||
注意:->target_index()应该在失败的情况下恢复到policy->restore_freq,因为core会为此发送通知。
|
||
|
||
|
||
2. 频率表助手
|
||
=============
|
||
|
||
由于大多数cpufreq处理器只允许被设置为几个特定的频率,因此,一个带有一些函数的 “频率表”可能会辅助处理器驱动
|
||
程序的一些工作。这样的 "频率表" 由一个cpufreq_frequency_table条目构成的数组组成,"driver_data" 中包
|
||
含了驱动程序的具体数值,"frequency" 中包含了相应的频率,并设置了标志。在表的最后,需要添加一个
|
||
cpufreq_frequency_table条目,频率设置为CPUFREQ_TABLE_END。而如果想跳过表中的一个条目,则将频率设置为
|
||
CPUFREQ_ENTRY_INVALID。这些条目不需要按照任何特定的顺序排序,但如果它们是cpufreq 核心会对它们进行快速的DVFS,
|
||
因为搜索最佳匹配会更快。
|
||
|
||
如果策略在其policy->freq_table字段中包含一个有效的指针,cpufreq表就会被核心自动验证。
|
||
|
||
cpufreq_frequency_table_verify()保证至少有一个有效的频率在policy->min和policy->max范围内,并且所有其他
|
||
标准都被满足。这对->verify调用很有帮助。
|
||
|
||
cpufreq_frequency_table_target()是对应于->target阶段的频率表助手。只要把数值传递给这个函数,这个函数就会返
|
||
回包含CPU要设置的频率的频率表条目。
|
||
|
||
以下宏可以作为cpufreq_frequency_table的迭代器。
|
||
|
||
cpufreq_for_each_entry(pos, table) - 遍历频率表的所有条目。
|
||
|
||
cpufreq_for_each_valid_entry(pos, table) - 该函数遍历所有条目,不包括CPUFREQ_ENTRY_INVALID频率。
|
||
使用参数 "pos"-一个``cpufreq_frequency_table * `` 作为循环变量,使用参数 "table"-作为你想迭代
|
||
的``cpufreq_frequency_table * `` 。
|
||
|
||
例如::
|
||
|
||
struct cpufreq_frequency_table *pos, *driver_freq_table;
|
||
|
||
cpufreq_for_each_entry(pos, driver_freq_table) {
|
||
/* Do something with pos */
|
||
pos->frequency = ...
|
||
}
|
||
|
||
如果你需要在driver_freq_table中处理pos的位置,不要减去指针,因为它的代价相当高。相反,使用宏
|
||
cpufreq_for_each_entry_idx() 和 cpufreq_for_each_valid_entry_idx() 。
|