当前位置: 首页 > news >正文

中国机械加工网站官网微信商店小程序怎么弄

中国机械加工网站官网,微信商店小程序怎么弄,什么软件能自己做网站,seo排名啥意思把原始语料中的每个句子通过截断和填充,转换成一个固定长度的句子,并将所有数据整理成mini-batch,用于训练模型,下面代码参照paddle官方 # 库文件导入 # encodingutf8 import re import random import requests import numpy as n…

把原始语料中的每个句子通过截断和填充,转换成一个固定长度的句子,并将所有数据整理成mini-batch,用于训练模型,下面代码参照paddle官方


# 库文件导入
# encoding=utf8
import re
import random
import requests
import numpy as np
import paddle
from paddle.nn import Embedding
import paddle.nn.functional as F
from paddle.nn import LSTM, Embedding, Dropout, Linear
import os
import jieba
import paddle.fluidimport build_dict
import convert_corpus_to_id
import data_preprocess
import load_comment# 编写一个迭代器,每次调用这个迭代器都会返回一个新的batch,用于训练或者预测
def build_batch(word2id_dict, corpus, batch_size, epoch_num, max_seq_len, shuffle = True, drop_last = True):# 模型将会接受的两个输入:# 1. 一个形状为[batch_size, max_seq_len]的张量,sentence_batch,代表了一个mini-batch的句子。# 2. 一个形状为[batch_size, 1]的张量,sentence_label_batch,每个元素都是非0即1,代表了每个句子的情感类别(正向或者负向)sentence_batch = []sentence_label_batch = []for _ in range(epoch_num): #每个epoch前都shuffle一下数据,有助于提高模型训练的效果#但是对于预测任务,不要做数据shuffleif shuffle:random.shuffle(corpus)for sentence, sentence_label in corpus:sentence_sample = sentence[:min(max_seq_len, len(sentence))]if len(sentence_sample) < max_seq_len:for _ in range(max_seq_len - len(sentence_sample)):sentence_sample.append(word2id_dict['[pad]'])sentence_sample = [[word_id] for word_id in sentence_sample]sentence_batch.append(sentence_sample)sentence_label_batch.append([sentence_label])if len(sentence_batch) == batch_size:yield np.array(sentence_batch).astype("int64"), np.array(sentence_label_batch).astype("int64")sentence_batch = []sentence_label_batch = []if not drop_last and len(sentence_batch) > 0: # 控制样本数量不能被批次整除时的行为,若为真则丢弃最后一批样本yield np.array(sentence_batch).astype("int64"), np.array(sentence_label_batch).astype("int64")train_corpus =  load_comment.load_comment(True)
train_corpus = data_preprocess.data_preprocess(train_corpus)
word2id_freq, word2id_dict = build_dict.build_dict(train_corpus)
train_corpus = convert_corpus_to_id.convert_corpus_to_id(train_corpus, word2id_dict)for batch_id, batch in enumerate(build_batch(word2id_dict, train_corpus, batch_size=3, epoch_num=3, max_seq_len=40)): # 此处train_corpus输入的是covert_corpus_to_id之后的内容print(batch)break```
http://www.yayakq.cn/news/578898/

相关文章:

  • 网站 文件 上传wordpress多菜单
  • 湘潭网站建设 搜搜磐石网络php网站开发实例教程案例
  • 国外的包装设计网站wordpress中文站
  • 个人网站用什么建站程序怎么用织梦模板做网站
  • 深圳建设网站费用明细旅游网站系统建设
  • 企业网站优化官网韩语网站建设
  • 怎样学习网站建设南京专业制作网站
  • 做冠县梨园网站怎么做框架网站建设
  • wordpress 4.7优化wordpress优化方法
  • 北京建设投标网站华为商城官网
  • 服装网站建设公司有哪些网站建设外文版要求
  • 做装修业务呢有多少网站wordpress api 授权
  • 中成网站建设国外开发网站
  • 通州网站网站建设辽宁建设工程信息网怎么入库
  • 手机网站开发合同十种网络营销的方法
  • 网站使用字体查询建设规范的网站
  • 上海住房和城乡建设部网站官网win2008sr怎么用iis做网站
  • 长沙网站建设公司wordpress新手入门教程
  • 2018外贸网站排名腾讯云主机安装wordpress
  • 湖北公司网站建设多少钱手机网站开发需要哪些技术
  • 网站设计公司佛山网页制作图
  • 重庆网站建设外包公司哪家好php中英文网站模板
  • 国外 图片网站在线图片编辑文字
  • pc网站建设是什么意思网站伪静态好还是静态好
  • 网站建设龙岗如何用c语言做钓鱼网站
  • 什么网站做烘干设备好百度快照优化排名推广
  • 贵州省交通建设集团网站做园区门户网站的需求分析
  • 网站建设丶金手指下拉14网站建设感谢信
  • 精通网站建设工资多少钱软件开发专业好就业吗
  • 官方网站的域名百度词条优化