当前位置: 首页 > news >正文

景德镇网站建设哪家口碑好做网站530元

景德镇网站建设哪家口碑好,做网站530元,成都门户网站有哪些,wordpress建站不知道密码前言 本文大多数内容均copy于关系抽取数据集 NYT-10 SemEval2010 一、NYT-10是什么? NYT-10数据发布于Riedel et al, 2010这篇论文中,其文本来源于纽约时报New York Times所标注的语料,命名实体是通过 Stanford NER 工具并结合 Freebase 知…

前言

本文大多数内容均copy于关系抽取数据集 NYT-10 SemEval2010


一、NYT-10是什么?

NYT-10数据发布于Riedel et al, 2010这篇论文中,其文本来源于纽约时报New York Times所标注的语料,命名实体是通过 Stanford NER 工具并结合 Freebase 知识库进行标注的。命名实体对之间的关系是链接和参考外部的Freebase知识库中的关系,结合远监督方法所得到的。

二、数据下载

1.OpenNRE

数据可直接从这一链接中进行下载:https://github.com/thunlp/OpenNRE/tree/master/benchmark
以其中的download_nyt10.sh为例其内容如下:

mkdir nyt10
wget -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_rel2id.json
wget -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_train.txt
wget -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_test.txt

我的步骤如下:

  1. 首先需要先安装wget。(使用直接百度得到的安装方法即可。)
  2. 在需要下载的目标文件下打开cmd。(或者打开cmd然后移动到目标文件下都一样。)
  3. 将上述4条命令改成如下:
mkdir nyt10
wget --no-check-certificate -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_rel2id.json
wget --no-check-certificate -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_train.txt
wget --no-check-certificate -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_test.txt

如果不修改会报错,报错内容如下。(我的是windows系统。)

SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = D:\wget\GnuWin32/etc/wgetrc
--2021-09-25 23:26:05--  https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_rel2id.json
正在解析主机 thunlp.oss-cn-qingdao.aliyuncs.com... 119.167.128.167, 119.167.128.167
Connecting to thunlp.oss-cn-qingdao.aliyuncs.com|119.167.128.167|:443... 已连接。
ERROR: cannot verify thunlp.oss-cn-qingdao.aliyuncs.com's certificate, issued by `/C=BE/O=GlobalSign nv-sa/CN=GlobalSign Organization Validation CA - SHA256 - G2':Unable to locally verify the issuer's authority.
ERROR: certificate common name `*.oss-cn-beijing.aliyuncs.com' doesn't match requested host name `thunlp.oss-cn-qingdao.aliyuncs.com'.
To connect to thunlp.oss-cn-qingdao.aliyuncs.com insecurely, use `--no-check-certificate'.
无法建立 SSL 连接。
  1. 依次运行上述4条命令。(直接运行shell脚本应该也可以,不过我不会。【@_@|||】)

    通过这一方法下载会得到总计170+M的数据

2.Tsinghua Cloud 或 Google Drive

Tsinghua Cloud链接:https://link.zhihu.com/?target=https%3A//cloud.tsinghua.edu.cn/f/11391e48b72749d8b60a/%3Fdl%3D1
Google Drive链接(没打开过):https://link.zhihu.com/?target=https%3A//drive.google.com/file/d/1eSGYObt-SRLccvYCsWaHx1ldurp9eDN_/view%3Fusp%3Dsharing
通过这一方式会下载得到大约3G的压缩文件,解压后如下所示。
在这里s入图片描述
对于其中的protobuf2json.py文件中可以掉到get_entities如下:

def get_entities(file_name):print("Loading entities...")f = open(file_name, 'rb')for line in f.readlines():line = line.rstrip()guid, word, type = line.split('\t')guid2entity[guid] = {'id': guid, 'word': word, 'type': type}       f.close()print("Finish loading, got {} entities totally".format(len(guid2entity)))

将其修改为如下(仅修改第5行):

def get_entities(file_name):print("Loading entities...")f = open(file_name, 'rb')for line in f.readlines():line = line.rstrip().decode()guid, word, type = line.split('\t')guid2entity[guid] = {'id': guid, 'word': word, 'type': type}       f.close()print("Finish loading, got {} entities totally".format(len(guid2entity)))
打开其中的README.md,按照里面的指示需要运行
protoc --proto_path=. --python_out=. Document.proto
python protobuf2json.py

要运行第一条就需要先安装protoc。(安装方法百度得到的方法即可。)
然后,运行以上两条命令即可。


总结

因为,在寻找数据集的过程中没有找到一个直接下载就可用的。在这个过程中甚至还从CSDN的上下载了,结果感觉还是不行。通过第二个方式得到的数据集大小是1.74G,而通过第一个方式下载得到的大小是170+M。我单从这一点上推测通过第二个方式下载的数据可能会比第一个途径的数据多一些。(详细情况我也不知道。)
http://www.yayakq.cn/news/984608/

相关文章:

  • 网站的风格保持一致珠海网站建设公司哪家好
  • 洛阳做网站推广品牌建设网站例子
  • 遵义公司建网站要多少费用深圳高端网页设计公司
  • 域名和网站一样吗厦门装修公司排名前十口碑推荐
  • 做网站的人跑了网站可以恢复吗建设银行官方网站个人系统板块
  • 成都php网站开发百度北京总部电话
  • 怎么搜索网站搜索量wordpress 主菜单插件
  • 贺州市八步区乡镇建设局网站教育培训排行榜前十名
  • 个人创建网站公众号制作要求
  • 重庆公司网站制作公司邯郸网站建设项目
  • 重庆网站建设方案详细方案网站建设咸阳
  • 高端网站开发公开课2017年做那家网站好
  • 网站ip地址 转向域名网站建设费用还是网络
  • 腾讯企业邮箱注册申请免费河南seo优化
  • 上海做外贸网站网站备案 游戏
  • 淘宝客怎样建设网站四川建设厅网站查询
  • 请问聊城网站建设dedecms大气金融企业网站模板
  • 做自媒体搬运文章的网站潍坊免费自助建站模板
  • 做旅游网站多少钱网页添加兼容性站点
  • 长春网站开发招聘论坛怎样发帖推广
  • 无锡做网站费用怎么做淘宝联盟的推广网站
  • 鹤壁市城乡一体化示范区网站商城外贸网站设计
  • 海沧做网站网络营销方式文献
  • 专业企业网站建设公司价格我的wordpress主题
  • 制作网站吗专业的昆明网站建设
  • 长沙雨花区建设局网站西安企业网站建设代理机构
  • 响应式网站有什么好处学校网站开发价格
  • 广东短视频运营推广珠海网站seo
  • 中卫市建设局网站邢台网上房地产
  • 网站需要哪些关于信用体系建设的网站