当前位置: 首页 > news >正文

培训制作网站wordpress打开xml-rpc

培训制作网站,wordpress打开xml-rpc,seo包括哪些方面,本网站建设《FACTS About Building Retrieval Augmented Generation-based Chatbots》是2024年7月英伟达的团队发表的基于RAG的聊天机器人构建的文章。 这篇论文在待读列表很长时间了,一直没有读,看题目以为FACTS是总结的一些事实经验,阅读过才发现FAC…

《FACTS About Building Retrieval Augmented Generation-based Chatbots》是2024年7月英伟达的团队发表的基于RAG的聊天机器人构建的文章。

这篇论文在待读列表很长时间了,一直没有读,看题目以为FACTS是总结的一些事实经验,阅读过才发现FACTS是论文定义的RAG-based chatbots的五个维度:freshness (F), architectures(A), cost economics of LLMs ©, testing (T), security (S)的缩写。

论文说在英伟达内部用RAG和LLM构建三个chatbot,如论文表1所示。基于这些chatbot构建经验总结了一套方法论。

WeChatWorkScreenshot_1bf27dc6-5e87-4a96-addf-8593ed4dfa88

这两年RAG很火,但是构建好一个基于RAG的聊天机器人并不是件易事,要考虑RAG流程的工程化、微调LLM、prompt engineering、保证召回知识的相关性和准确性、文件访问控制、生成精确的回复并包括参考资料以及保护个人敏感信息等等。因此论文总结了如论文图1和图4所示的15个RAG流程中的控制点(吐槽一下论文中所有的图片都不够清晰)。

WeChatWorkScreenshot_f1c8dca0-c689-4e46-ba88-df89ab7a4676

WeChatWorkScreenshot_df3e2325-9290-4239-8857-59f0fd689f43

为了避免在公司内部重复地开发一些构建chatbot需要的功能如安全、护栏等,开发了如论文图7所示可插拔架构的模块化平台NVbot。平台支持domain-specific, enterprise-wide, copilot三种不同的chatbot变体。

WeChatWorkScreenshot_6eb677ed-10da-4b80-b69c-10c611d2203b

一些论文提到的细节:

  • 为了提高检索相关度:进行了Metadata增强、查询改写、使用grid-search方法来寻找合适chunk大小、测试不同的chunk rerank策略等;使用混合搜索(Lexical search+向量搜索)。
  • 对于一些复杂问题,比如“compare the revenue of NVIDIA from Q1 through Q4 of FY2024 and provide an analytical commentary on the key contributing factors that led to the changes in revenues during this time”,要使用agent或multi-agent架构才能回答出来,论文使用了如图2所示的将一个问题拆成多个问题的agent方式。

fa

  • 微调Llama3-70B后在保持可接受的延迟下可得到挺不错的答案质量

WeChatWorkScreenshot_8c4682ee-175d-47f8-9dfe-5e38b1ce9439

  • Unstructured.io等专门从PDF中提取结构化内容的工具有助于解析和分块非结构文化。如果文档的结构固定比如SEC相关的文档,使用section-level的分割,用section title和subheading来分割并将它们加入到chunk的上下文有助于提升检索相关性。
  • 使用RAGOps/LLMOps监控工具来监控RAG流程,使用如Ragas等评估框架。
  • 用内部LLM Gateway来统一管理使用的商用LLM API,可以简化LLM使用、订阅和数据跟踪的安全审计。
  • 包含安全测试、prompt修改测试、反馈回路等用来测试chatbot的手段。
  • chatbots的数据访问有Access Control Lists (ACLs),用Nemo Guardrail对输入和输出进行处理。

总结:这篇论文介绍了基于RAG的chatbot的五个维度,论文按照这五个维度列举了一些经验,可以对照看看有哪些自己在开发过程中没有考虑过的点,不过总体来讲论文在详细实现上讨论的不够多。

http://www.yayakq.cn/news/102213/

相关文章:

  • 公司建设网站的意义wordpress同步新浪博客
  • phpmysql网站开发视频mt7620a做网站
  • 建设部职业资格注册网站礼品公司网站建设
  • wordpress 企业网站模板珠海香洲区会变黄码吗
  • 济源网站优化百度竞价多少钱一个点击
  • 票务网站做酒店推荐的目的wordpress新闻编辑器
  • 集团型网站建设厦门网站建设维护
  • 网站设计费报价表建设股票网站
  • 南京网站设计工作室高校网络架构
  • 专业的网站优化chrome不安全的网站设置
  • 公司做网站费用怎么记账公司网站怎么做优化
  • 垂直类网站怎么做移动端网站开发哪家好
  • 网站建设公司能赚钱吗flask和wordpress
  • 佛山新网站建设方案miya1173跳转接口
  • 官网网站开发设计类网站开发策划书
  • 公司网站有什么作用智能魔方网站
  • 珠海市住房建设局网站爬取wordpress文章
  • 东莞制作网站公司哪家好网站建设分金手指排名十
  • 四团网站建设免费行情软件下载入口
  • 我要建网站吉林省建设通官方网站
  • 视觉网络网站wordpress后台登录logo
  • 织梦修改网站背景颜色江西省赣州市天气预报
  • 建设项目环保验收网站毕业设计用PHP做旅游网站
  • 做行业导航网站网站备案安全吗
  • 建设银行网站公告开发一个网站多少钱?
  • 成都网站建设哪家专业北京网络营销培训
  • 无锡网站建设mkdns中小型网站建设如何
  • 网站的目的和意义零度业务网站
  • 孟村网站建设网站源码怎样弄成网站
  • 专注网站建设怎么样wordpress文章上传视频