当前位置: 首页 > news >正文

建设网站的那个公司好辽宁平台网站建设公司

建设网站的那个公司好,辽宁平台网站建设公司,体贴的聊城网站建设,网页建站怎么做研究背景 为通过项目实战增加对命名实体识别的认识,本文找到中科院软件所刘焕勇老师在github上的开源项目,中文电子病例命名实体识别项目MedicalNamedEntityRecognition。对其进行详细解读。 原项目地址:https://github.com/liuhuanyong/Med…

研究背景

为通过项目实战增加对命名实体识别的认识,本文找到中科院软件所刘焕勇老师在github上的开源项目,中文电子病例命名实体识别项目MedicalNamedEntityRecognition。对其进行详细解读。
原项目地址:https://github.com/liuhuanyong/MedicalNamedEntityRecognition
修改版项目地址(详细注释):待补充

项目介绍

数据来自CCKS2018的电子病历命名实体识别的评测任务,是对于给定的一组电子病历纯文本文档,识别并抽取出其中与医学临床相关的实体,并将它们归类到预先定义好的类别中。共提供600份标注好的电子病历文本,共需识别含治疗方式、身体部位、疾病症状、医学检查、疾病实体五类实体。
领域命名实体识别问题自然语言处理中经典的序列标注问题, 本项目是采用BiLSTM+CRF构建模型。
病历结构如下图所示:
在这里插入图片描述

神经网络结构图

在这里插入图片描述

实验数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

import os
class TransferData:def __init__(self):cur = '/'.join(os.path.abspath(__file__).split('/')[:-1])  #获取当前文件地址的上级目录#对分类进行标记self.label_dict = {'检查和检验': 'CHECK','症状和体征': 'SIGNS','疾病和诊断': 'DISEASE','治疗': 'TREATMENT','身体部位': 'BODY'}self.origin_path = os.path.join(cur, 'data_origin')  #原始数据地址self.train_filepath = os.path.join(cur, 'train.txt') #转化后的训练数据地址returndef transfer(self):f = open(self.train_filepath, 'w+',encoding='utf-8')   #以写入的方式打开训练数据要保存的文件count = 0for root,dirs,files in os.walk(self.origin_path):#for (root, dirs, files) in walk(roots):# roots代表需要遍历的根文件夹;# root表示正在遍历的文件夹的名字(根/子);# dirs记录正在遍历的文件夹下的子文件夹集合;# files记录正在遍历的文件夹中的文件集合for file in files:filepath = os.path.join(root, file)if 'original' not in filepath:continuelabel_filepath = filepath.replace('.txtoriginal','')print(filepath, '\t\t', label_filepath)  #data_origin\一般项目\一般项目-1.txtoriginal.txt 	data_origin\一般项目\一般项目-1.txtcontent = open(filepath,encoding='utf-8').read().strip()  #打开案例描述文件,去掉收尾空格res_dict = {}for line in open(label_filepath,encoding='utf-8'):  #打开实体类别文件res = line.strip().split('	')  #每个实体描述按空格分隔 ['右髋部',‘21’,‘23’,‘身体部位’]start = int(res[1])  #实体的其实字符位置end = int(res[2])  #实体的结束字符位置label = res[3]  #实体类别label_id = self.label_dict.get(label)   #返回分类字典中实体类别对应的values,作为实体名称的idfor i in range(start, end+1):if i == start:label_cate = label_id + '-B'  #定义实体的首字符else:label_cate = label_id + '-I'  #实体的非首字符res_dict[i] = label_cate   #构建实体字典{位置index:字符}for indx, char in enumerate(content):  #indx文本中字符的位置,char字符char_label = res_dict.get(indx, 'O')  #如果indx在字典的key中,则返回字典value;否则返回O,代表非实体print(char, char_label)   #字符:字符实体标注f.write(char + '\t' + char_label + '\n')f.close()return
if __name__ == '__main__':handler = TransferData()train_datas = handler.transfer()

连接

原文连接

http://www.yayakq.cn/news/854572/

相关文章:

  • 如何备份网站云梦县网站开发
  • asp.net网站开发项目化教程全景效果图如何制作
  • 营销案例网站游戏开发和软件开发哪个难
  • 微信官网网站苏州网站建设制作
  • 女生做网站推广wordpress获取所有标签
  • 网站建设花都區集团网站建设成都
  • 电商网站设计规范用手机画房子平面图
  • 外贸网站设计制作优化推广北京网站建设公司华网天下下
  • 沧州大型企业网站建设网站建设便宜的公司
  • 上海站有云网络科技有限公司营销型网站建设哪里有
  • 相亲网站源码php模版公司网站在哪里做
  • 使用腾讯云建设网站教程网站开发项目的设计与实现
  • 汕头在线制作网站上海住房和城乡建设厅网站
  • 哪个网站专门做政策解读违法网站做网站的人会受罚嘛
  • 互联网网站类型网页模板怎么做
  • 网站利润东莞市做网站的公司
  • 友情链接搜读七米网站建设推广优化
  • 景洪服装网站建设福州关键词优化平台
  • 长沙制作网站公司吗中国纪检监察报记者电话
  • 北碚网站建设网站建设接活
  • 河南省建协网官方网站公众号和网站先做哪个比较好
  • 厦门鹏中兴建设网站网站建设策划书范本
  • 关于建设网站的经费请示wordpress 深度优化
  • 做网站代运营如何寻找客户西宁seo网站
  • 微信看视频打赏网站建设公司网站建设457216336
  • 有哪些效果图做的好的网站网络工程排名
  • 国外设计模板网站企业网站建设费用怎么入账
  • 找外国男人做老公网站曲阳网站制作公司
  • 不要域名做网站地方网站怎么做的
  • 大良营销网站建设市场成都定制网站建设服