go top

value function approximation

  • 价值函数逼近:在强化学习中,一种用于估计状态或状态-动作对的价值的方法,通常使用函数逼近器(如神经网络)来表示价值函数。

网络释义专业释义

  值函数估计

... 三、从马尔可夫决策过程到强化学习(from Markov Decision Process to Reinforce Learning) 四、值函数估计Value function approximation) 五、策略搜索(Policy Search) ...

基于6个网页-相关网页

  值函数逼近

值函数逼近

基于1个网页-相关网页

短语

vector-value function rational approximation 向量值函数有理逼近

Approximation Value Function 近似价值函数

  • 值函数逼近 - 引用次数:1

    参考来源 - 神经网络增强学习的梯度算法研究 in C

·2,447,543篇论文数据,部分数据来源于NoteExpress

双语例句

  • An appropriate selection of basis function directly in?uences the learning performance of a policy iteration method during the value function approximation.

    算法先渐进方法进行多序列比对,然后通过迭代策略利用上一轮多序列比对结果修正指导树,产生新一轮比对。

    youdao

  • An appropriate selection of basis function directly in? Uences the learning performance of a policy iteration method during the value function approximation.

    策略迭代强化学习方法函数逼近过程中函数合理选择直接影响方法的性能

    youdao

  • At paraxial approximation the maximum of the matching function is increasing with increased divergence Angle. For different brightness of pumping light, the optimum value of the Angle is obtained.

    发现近似下匹配函数最大值浦光发散增大而增大,在考虑到像散的影响后,得到泵浦光发散角的参考值。

    youdao

更多双语例句
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定