当前位置: 首页 > news >正文

平邑做网站红色基调的网站

平邑做网站,红色基调的网站,企业网站制作价格,wordpress 把账号名改成昵称贡献 将深度神经网络应用于视频动作识别的难点,是如何同时利用好静止图像上的 appearance information以及物体之间的运动信息motion information。本文主要有三点贡献: 1.提出了一种融合时间流和空间流的双流网络; 2.证明了直接在光流上训…

贡献

将深度神经网络应用于视频动作识别的难点,是如何同时利用好静止图像上的 appearance information以及物体之间的运动信息motion information。本文主要有三点贡献:

1.提出了一种融合时间流和空间流的双流网络;
2.证明了直接在光流上训练的网络,即使训练集很小,仍能获得很好的效果;
3.在两个动作识别数据集上使用多任务学习(multi-task learning),同时训练一个backbone,可以增加训练数据量,提高模型性能。

简介

所谓two-stream是指空间stream和时间stream,视频可以分成空间与时间两个部分,空间部分指独立帧的表面信息,关于物体、场景等;而时间部分信息指帧间的光流,携带着帧之间的运动信息。相应的,所提出的网络结构由两个深度网络组成,分别处理时间与空间的维度。

网络结构

结构如下图所示:
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • Spatio Stream Convet:空间流卷积网络,输入是单个帧画面(静态图片),主要学习场景信息。因为是处理静态图片,所以可以使用预训练的模型来做,更容易优化。最后根据网络输出的特征得出一个logist(假设模型是在UCF-101数据集上做测试,数据集共101个类,logist是softmax之后的类别概率,那么时间流网络的输出就是一个1×101维的向量)。
  • temporal stream convet:时间流卷积网络(光流网络),输入是光流图像,通过多帧画面的光流位移来获取画面中物体的运动信息,最后也根据网络输出的特征得出一个logist。
    • 光流输入显式地描述了视频帧之间的运动,而不需要CNN网络去隐式地估计运动信息,所以使得识别更加容易。加入时间流卷积网络之后,模型精度大大提升。
    • 直接以光流做输入来预测动作,而不用CNN本身去学动作信息,大大简化了学习过程。

融合有两种方式:

  • late fusion融合:两个logist加权平均得到最终分类结果(比如两个softmax向量取平均,再做一个argmax操作)。
  • 将softmax分数作为特征再训练一个SVM分类器。
http://www.yayakq.cn/news/698084/

相关文章:

  • 怎么做阿里巴巴国际网站中国建设工程造价管理协会网站
  • 大连做网站优化哪家好虾皮跨境电商平台
  • 北京建站公司兴田德润信任怎么上传视频到公司网站
  • 帮做毕设的网站调整网站模板大小
  • 自助建微网站dw不用代码做网站
  • vps挂网站开发网站的语言
  • 做网站就是做信息整合网站建设公司如何
  • 生道网站建设平台网架加工制造厂家
  • 爱站网 关键词挖掘工具站长工具广告传媒公司经营范围有哪些
  • 商业网站建设实列做网站要学些什么
  • 河南建设厅官方网站莱芜都市网帖子怎么删除
  • 沧州市有建网站的吗搭建免费个人网站2022
  • 网站提交工业物联网平台
  • u网站建设六安论坛网
  • 东莞做网站 信科网络建立网站 用英语
  • 做网站应规避的风险wordpress中文说明书
  • 长春建站开发工程师是程序员吗
  • 网站手机源码彩票走势图网站建设
  • 如何查看网站开发者中国十大装饰公司
  • 网站建设优化服务市场网络设计思路
  • 怎样吧自己做的网站发布通过阿里云建设企业网站
  • 南宫企业做网站投资公司收到分红要交什么税
  • 2015做导航网站好沈阳做网站公司
  • 个人备案的网站可以做商城吗我的网站 dedecms
  • 安康市建设局网站零投入开网店
  • 新乡建设招标投标网站怎么使自己的网站
  • 手机app与手机网站的区别长春网站建设网站
  • 电商网站有哪些功能模块wordpress菜单下拉
  • 免费下载网站模板一屏一屏的网站怎么做
  • 网站地图制作怎么做?最简单的企业简介模板