evox.algorithms.so.es_variants.ars

模块内容

ARS

ARS算法的实现。

API

class evox.algorithms.so.es_variants.ars.ARS(pop_size: int, center_init: torch.Tensor, elite_ratio: float = 0.1, lr: float = 0.05, sigma: float = 0.03, optimizer: Literal[adam] | None = None, device: torch.device | None = None)[源代码]

基础: evox.core.Algorithm

ARS算法的实现。

参考文献:Simple random search provides a competitive approach to reinforcement learning (https://arxiv.org/pdf/1803.07055.pdf)

这段代码受到了 evosax 中算法实现的启发或使用了其实现。有关 evosax 的更多信息,请访问以下网址:GitHub 链接:https://github.com/RobertTLange/evosax

初始化

使用给定参数初始化ARS算法。

参数:
  • pop_size -- 种群大小。

  • center_init -- 种群的初始中心。必须是一个一维张量。

  • elite_ratio -- 精英种群的比例。默认为 0.1。

  • lr -- 优化器的学习率。默认值为 0.05。

  • sigma -- 噪声的标准差。默认为 0.03。

  • optimizer -- 使用的优化器(optimizer)。 默认情况下为 None。 仅 support "adam" 或 None。

  • device -- 设备的使用者(设备用于存放张量的硬件)。默认为 None。

step()[源代码]

执行 ARS 算法的单步操作。

record_step()[源代码]