浔海省钱快报
  • 搜淘宝
  • 搜京东
  • 搜唯品会
微信扫一扫

关注微信公众号
查券更方便


深度强化学习 理解强化学习的基本设计 基于策略迭代方法求解网格世界的代码 机策略梯度与REINFORCE算法 算法中减少方差的方法
深度强化学习 理解强化学习的基本设计 基于策略迭代方法求解网格世界的代码 机策略梯度与REINFORCE算法 算法中减少方差的方法
73.3元¥73.3
活动结束时间:01-01 08:00 累计销量 :

手机淘宝扫码领券购买

  • 商品详情
  • 特别推荐
原价¥11.93万
7.9
原价¥149.9600
49.9
原价¥27.9600
17.9
原价¥6287000
598
原价¥119.7400
49.7
原价¥10.673000
9.67
原价¥3482万
328
原价¥33.92万
28.9
原价¥53.91000
19.9
原价¥179.9200
79.9