当前位置: 首页 > news >正文

宁波网站推广优化黄冈网站推广平台

宁波网站推广优化,黄冈网站推广平台,淘宝店铺推广方法,重庆市建设医院网站最近在跑深度学习模型,发现Embedding随机性太强导致模型结果有出入,因此考虑固定初始随机向量,既提前训练好词/字向量,不多说上代码!! 1、利用gensim训练字向量(词向量自行修改) #…

       最近在跑深度学习模型,发现Embedding随机性太强导致模型结果有出入,因此考虑固定初始随机向量,既提前训练好词/字向量,不多说上代码!!

1、利用gensim训练字向量(词向量自行修改)

# 得到每一行的数据 []
datas = open('data/word.txt', 'r', encoding='gbk').read().split("\n")
# 得到一行的单个字 [[],...,[]]
word_datas = [[i for i in data if i != " "] for data in datas] 
model = Word2Vec(word_datas,  # 需要训练的文本vector_size=10,   # 词向量的维度window=2,  # 句子中当前单词和预测单词之间的最大距离min_count=1,  # 忽略总频率低于此的所有单词 出现的频率小于 			min_count 不用作词向量workers=8,  # 使用这些工作线程来训练模型(使用多核机器进行更快的训练)sg=0,  # 训练方法 1:skip-gram 0;CBOW。epochs=10  # 语料库上的迭代次数)

2、保存模型或者字向量

#字向量保存
model.wv.save_word2vec_format('word_data.vector',   # 保存路径binary=False  # 如果为 True,则数据将以二进制 word2vec 格式保存,否则将以纯文本格式保存)
#模型保存
model.save('word.model')

3、nn.Embedding读取gensim模型

model = gensim.models.Word2Vec.load('./word.model')
weights = torch.FloatTensor(model.wv.vectors)
embedding = nn.Embedding.from_pretrained(weights)
embedding.requires_grad = False

       这里懒了,拷贝别人的图,debug就可以看看,简单理解下就是有X个字,就有X行,然后每个字用Y个数字表示,就是Y列,上图X=4799,Y=10。

在这里插入图片描述

*也许看了上面你依然会一脸懵(别着急,下面给你举个例子)

4、案例

import gensim
import torch
import torch.nn as nnmodel = gensim.models.Word2Vec.load('./word.model')
weights = torch.FloatTensor(model.wv.vectors)embedding = nn.Embedding.from_pretrained(weights)
embedding.requires_grad = False #训练时候不训练向量query = '天氣'
query_id = torch.tensor(model.wv.vocab['天氣'].index)#下面只是查询,具体的根据你自己的训练即可
gensim_vector = torch.tensor(model[query])
embedding_vector = embedding(query_id)print(gensim_vector==embedding_vector)#首先將 Gensim 的預訓練模型讀取進來,並將其向量轉換成 PyTorch 所需要的資料格式 Tensor,當作 nn.Embedding() 的初始值。
#這裡有個小細節:如果並不打算在模型訓練過程中一併訓練 nn.Emedding(),要記得將其設定為 requires_grad = False。
http://www.yayakq.cn/news/690962/

相关文章:

  • 网站开发样板旅游品牌推广方案
  • 网站制作要钱吗美工是做什么的
  • 网站备案幕布照如何做广州seo顾问
  • 电子商务网站规划建设方案山西大学物理电子工程学院研招网
  • 通讯设备 技术支持 东莞网站建设花生壳 建设网站
  • 做照片视频的网站wordpress app 加载慢
  • 视频网站怎么做算法开服网站源码
  • 怎么查网站是否被k除了百度指数还有哪些指数
  • 枫泾网站建设南昌网站建设_南昌做网站公司
  • 网站建设网络公司手机网站模板 html
  • 网站seo方案建设目标wordpress导航栏制作
  • 建站设计网站广州网站设计成功柚米
  • 阿里云建站wordpress做网站建设公司哪家好?
  • 建交易网站需要多少钱天津注册公司网站
  • 青岛专业网站营销网络品牌营销策划的概念
  • 鲜花加盟网站建设怎么做监测网站的浏览量
  • 站酷网官网登录最好的关键词排名优化软件
  • 做宣传册的公司杭州seo排名公司
  • 七牛云cdn加速wordpress优化公司组织结构
  • 国内的优秀设计网站海南建设网站公司
  • 2008iis里没加域名 网站指向还在百度地图的精准定位功能
  • 做网站背景图怎么插青岛做优化网站哪家好
  • 中国建设网官方网站硅灰建设银行网站功能介绍
  • 怎么查看网站点击量网站开发前台实训
  • 北京网站定制建设178网站建设
  • 阿里云市场网站建设简历个人主页
  • 商务网站建设中存在的问题整人做我女朋友网站
  • zzzcms建站系统网站做查赚钱
  • 网站做商标在那类手机wap网站建设多少钱
  • pc 移动网站 模板怎么找项目