当前位置: 首页 > news >正文

信息技术九年级上册网站咋做申请一个域名后怎么做网站

信息技术九年级上册网站咋做,申请一个域名后怎么做网站,制作网页的软件哪个好,信阳网站建设培训前言 SARAS,假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想,对动作价值矩阵进行更新。 代码实现 import gymnasium as gym import numpy as npclass sarsa():def __init__(self, states_n, acti…

前言

SARAS,假设环境状态和动作状态都是离散的。利用动作价值矩阵来进行行为的预测。其主要就是利用时序差分的思想,对动作价值矩阵进行更新。

代码实现

import gymnasium as gym
import numpy as npclass sarsa():def __init__(self, states_n, action_n, greedy_e=0.1):self.Q = np.zeros((states_n, action_n)) #动作价值矩阵self.greedy_e = greedy_e #随机探索的概率self.states_n = states_n #环境状态个数self.action_n = action_n #行动状态个数self.gamma=0.9 #价值衰减值self.lr=0.1 #学习率def predict(self, states):action_list=self.Q[states]#先拿出对应的行#再取出对应价值最大的行为,如果有重复则在重复项中随机选取,返回索引action=np.random.choice(np.flatnonzero(action_list==action_list.max()))return actiondef act(self, states):'''由对应环境产生对应的行动@param states: 当前环境@return: 行动动作'''if np.random.uniform() < self.greedy_e:#是否采取随即探索action = np.random.choice(np.arange(self.action_n))#随机探索else:action = self.predict(states) # 根据行动价值矩阵进行预测return actiondef learning(self,state,action,reward,next_state,next_action,does):'''学习更新参数@param state: 环境状态@param action: 采取的行动@param reward: 回报@param next_state: 采取行动后的下一个环境状态@param next_action: 下一个环境状态对应的行为@param does: 游戏是否结束@return:'''current_q=self.Q[state,action] #取出对应的行动价值if does: #查看是否已经完成游戏,完成则直接将当前回报作为下一个行动价值next_q=rewardelse:# 计算当前回报和下一个环境状态和下一个行动对应的价值,加和next_q=reward+self.gamma*self.Q[next_state,next_action]self.Q[state,action]+=self.lr*(next_q-current_q) #时序差分,更新行动价值矩阵def train():env = gym.make("FrozenLake-v1", render_mode="human")#初始化游戏环境obs,info=env.reset()#重置位置agent=sarsa(env.observation_space.n,env.action_space.n)#初始化模型action = agent.act(obs)#预测行为num=0while True:num+=1# 由行为产生回报和下一个环境状态next_obs, reward, done, truncated, info = env.step(action)#预测下一个动作next_action=agent.act(obs)# 更新参数agent.learning(obs,action,reward,next_obs,next_action,done)obs=next_obsaction=next_action# 判断游戏是否结束或者中断,是则重置游戏if done or truncated:obs, info = env.reset()if num % 100 == 0 :env.close()if __name__ == '__main__':train()
http://www.yayakq.cn/news/55395/

相关文章:

  • 什么网站做推广做黑彩网站赚钱吗
  • 超炫个人业务网站源码建设网站协议范本
  • 鞍山工程建设信息网站小程序是怎么赚钱的
  • ajax网站模板关于小城镇建设的网站
  • asp.net 网站压缩教育网站制作定制
  • 网站设计师对应的专业河南简介网站设计
  • 网站建设公司浩森宇特来个网站吧好人一生平安百度贴吧
  • 北京开发网站公司本地wordpress后台进不去
  • 网站首页尺寸河北省建设工程教育网站
  • 地税局内网网站建设网站建设需要哪些必备文件
  • 2019深圳网站设计公司排名深圳品牌模板网站建设
  • 濮阳做网站建设的公司江苏网站建设代理商
  • 网站建设中合作加盟的作用太原贴吧
  • 网站怎么做移动端高度重视局门户网站建设
  • dw不会写代码能建立网站吗开网店还能赚钱吗
  • 什么叫子网站店群智能营销管理系统
  • 男女一起做暖暖网站腾讯外贸电商平台
  • 怎样在网上建网站做电商生意那个外贸网站做的好
  • 保定市制作网站公司图片幻灯片插件 wordpress
  • 网站营销网站优化jquery 上传wordpress
  • 关于设计的网站wordpress社区程序
  • 建设电影网站需要什么一个好网站
  • 免费开通的网站本地打开WordPress慢
  • 许昌网站建设科技公司红酒公司网站建设模板6841
  • 做设计需要素材的常用网站有哪些网站关键词密度是怎么计算的
  • 佛山网站设计案例网站建设小程序南宁
  • 做教程网站犯法吗陕西手机网站建设公司排名
  • 网站开发公司的职责北京网站建设排名浩森宇特
  • 校园网站建设管理工作制度集团网站建设策划方案
  • 烟台莱州网站建设门户网站模板源码