【RAG 去噪】引入 NLI 模型来为 RAG 去噪

论文:Making Retrieval-Augmented Language Models Robust to Irrelevant Context

⭐⭐⭐

ICLR 2024, arXiv:2310.01558

Code: github.com/oriyor/ret-robust

论文速读

这篇论文引入 NLI(Natural Language Inference)模型来判定 retrieved doc 是否需要用于辅助 LLM 回答。

NLI 模型用于判定一个 hypothesis 与 premise 的关系如下三者之一:“蕴含(entailed)”、“中立(neutral)”、“矛盾(contradicted)”。具体到 RAG 中,question + LLM answer 作为 premise,retrieved doc 作为 hypothesis,由 NLI 模型判定两者是否是 entailed

  • 是的话,就辅助 LLM 再次生成 answer 作为最终答案
  • 不是的话,就使用标准的 LLM,防止无关上下文来分散 LLM 的注意力

该论文的工作,NLI 模型使用的是 BART-large

这其实这篇论文的假设是有问题的,以底座模型的答案作为基准来衡量检索信息是否是噪声,那其实把 RAG 通过检索召回额外信息增加 LLM 本身缺乏的知识的这部分的能力也损失了。这种假设在底座本身就能回答的问题上额外增加了相关召回信息,可能会让底座的答案更加详细精准。但是底座本身不能回答或者回答错误的部分,那基于底座的答案去做噪声判断会让让模型错上加错

此外,该论文工作还尝试训练一个健壮的用于 RAG 的 LLM。因为作者认为,原生的 LLM 由于其没有在 retrieved passages 上做训练,所以它对噪音上下文很脆弱是可以预料的。为此,作者特意收集一批带有噪音文档的数据来对 LLM 做 SFT,数据的收集其实就是将检索到的 top-1 和排名较低的文档共同作为 retrieved context。这种做法其实就是在训练样本中强行引入噪声,让模型学习识别噪声的能力,当引入噪声信息时能够基于底座本身具有的知识正确作答

实验结果

通过实验发现,论文提出的采用 NLI 来识别无关文档的方法,由于其假设有点问题,导致其底座模型在本身信息缺失的情况西,做降低 RAG 的性能,因为它把与底座答案不一致的正确信息都过滤了。

另外,使用含有噪音检索上下文的数据来对底座模型做 SFT 之后,即便加入不相关的召回信息都可以让 RAG 模型变好,这说明引入噪声做 SFT 的方式可以有助于帮助 RAG 模型在一定程度上去除噪声带来的影响。

反思

  • 在实际业务落地上可以借鉴引入随机噪声的思想,在 sft 阶段不仅只加入最相关的召回结果,同时以一定的比例加入随机召回信息作为噪声,可以提升模型识别噪声的能力,在线上推理阶段,如果 top 的召回信息是不相关的错误信息,模型有一定的识别能力。
  • 我们其实可以在 RAG 的过程中增加判断召回文档是否相关,以及结合相关文档给出正确答案这样的 cot 任务,这样输出的内容不会过长,不会带来额外的线上推理耗时,同时也能一定程度上缓解 RAG 检索信息存在噪声的问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/632067.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【全开源】云界旅游微信小程序(源码搭建/上线/运营/售后/维护更新)

开启您的云端旅行新体验 一、引言 在快节奏的现代生活中,旅行成为了人们放松身心、探索世界的重要方式。让您的旅行更加便捷、高效,打造了云界旅游小程序,带您领略云端旅行的无限魅力。 二、小程序功能概览 云界旅游小程序集成了丰富的旅游…

SIP-7041 20W SIP广播网络有源音箱 校园广播20W木质SIP音箱

SIP-7041 20W SIP广播网络有源音箱 校园广播20W木质SIP音箱 一、描述 SIP-7041 20W SIP广播网络有源音箱 支持标准SIP协议 SIP-7041是我司的一款壁挂式网络有源音箱,具有10/100M以太网接口,可将网络音源通过自带的功放和喇叭输出播放,可达到…

二三维战场仿真系统

收费工具,白嫖党勿扰 收费金额1万元 1 概述 给某个公司做了一个战场仿真系统,该公司给了5W的辛苦费。现在把相关功能部分提取出来,给需要的同学。 2 功能说明 战场仿真系统,分为三个部分: 服务器,用来发…

澳鹏Appen入选大模型产业链基础层图谱及案例研究

近日,由亿欧、上海市人工智能行业协会(SAIA)主办的2024全球开发者大会“百模大战”商业发展讲坛成功举办。作为全球开发者大会的平行技术论坛之一,本场论坛聚焦大模型产业,分析大模型赛道的竞争格局,洞悉大…

visual studio snippet常用注释片段

Visual Studio 2022 添加自定义代码片段_vs2022 代码片段-CSDN博客 dclass.snippet: <?xml version"1.0" encoding"utf-8"?> <CodeSnippets xmlns"http://schemas.microsoft.com/VisualStudio/2005/CodeSnippet"> …

Hello, GPT-4o!

2024年5月13日&#xff0c;OpenAI 在官网正式发布了最新的旗舰模型 GPT-4o 它是一个 多模态模型&#xff0c;可以实时推理音频、视频和文本。 * 发布会完整版视频回顾&#xff1a;https://www.youtube.com/watch?vDQacCB9tDaw GPT-4o&#xff08;“o”代表“omni”&#xff0c…

haddoop三大核心组件

hadoop三大核心组件分别是hdfs、mapreduce和yarn。 1、hdfs&#xff1a;即分布式文件系统&#xff0c;用于存储hadoop集群中的大量数据。具有高容错性&#xff0c;可跨多个数据节点存储数据&#xff0c;并提供高吞吐量的数据访问&#xff1b; 2、mapreduce&#xff1a;用于大…

Python代码:一、HelloWorld

1、题目&#xff1a; 将字符串 Hello World! 存储到变量str中&#xff0c;再使用print语句将其打印出来。 2、代码 import sys str Hello World ! print(str)3、在sublime运行的结果

IT行业的现状与未来发展趋势:重塑生活与工作的无限可能

随着科技的飞速发展&#xff0c;IT行业已经逐渐从幕后走到台前&#xff0c;成为推动全球经济和社会发展的核心动力。从云计算的普及、大数据的崛起&#xff0c;到人工智能的爆发&#xff0c;再到物联网、5G通信和区块链技术的日新月异&#xff0c;这些技术不仅正在深刻改变着我…

2024年抖店保证金交多少?保证金常见问题解答,一文解决你所有疑惑

大家好&#xff0c;我是电商花花 新手如果想要开抖音小店&#xff0c;有一个大坑是必须要避开的。 就是我们店铺开通之后&#xff0c;我们一定要交保证金&#xff0c;如果不交&#xff0c;那就是0元开店。 很多新手听别人说做抖音小店可以0元开店&#xff0c;不用缴纳保证金就…

案例 | 澳鹏自动驾驶标注方案入选虎嗅智库行业报告

随着自动驾驶技术发展及方案演进&#xff0c;市场对于数据标注的数量和质量的需求都呈现指数级增长。传统的手工标注已不能满足标注需求&#xff0c;自动标注伴随大模型的发展应运而生。 在这一背景下&#xff0c;虎嗅智库发布《自动驾驶数据标注技术落地洞察》&#xff0c;并…

Nginx part3 创建一个https的网站

目录 HTTPS 公钥和密钥 加密解密方式&#xff1a; https搭建步骤 强调一下 1、准备环境 2、配置文件 3、制作证书 4、进行设置 HTTPS 啥是https&#xff0c;根据百度&#xff1a;HTTPS &#xff08;全称&#xff1a;Hypertext Transfer Protocol Secure&#xff09;&a…

8B10B编码(高速收发器五)

1、8B10B解决的问题 8B10B编码是1983年IBM公司提出的传输编码标准&#xff0c;通常用于高速收发器中&#xff0c;常见的JESD204B、SATA等接口协议&#xff0c;使用查表就可以实现编码和解码。 在这些高速收发器的接收端需要通过CDR技术去恢复时钟与数据的相位关系&#xff0c;在…

10个必备功能跨境电商ERP开发全指南

跨境电商平台开发是当前电商行业的热门话题。随着全球贸易的不断发展&#xff0c;企业越来越关注并重视跨境电商ERP系统的开发和应用。在本文中&#xff0c;我们将深入探讨跨境电商ERP开发的必备功能&#xff0c;为您呈现全面的指南。 1. 跨境订单管理 跨境电商平台需要具备全…

RT-Thread的 FAL 组件_使用笔记

RT-Thread的FAL分区表组件 1、FAL介绍 FAL (Flash Abstraction Layer) Flash 抽象层&#xff0c;是对 Flash 及基于 Flash 的分区进行管理、操作的抽象层&#xff0c;对上层统一了 Flash 及 分区操作的 API (框架图如下所示)&#xff0c;并具有以下特性&#xff1a; 1.1 FAL目…

CSP备考---2023大湾区比赛易错题

解析 9.D无向图公式&#xff1a;有向图公式&#xff1a;本题考察无向图&#xff0c;故 12.D公式&#xff1a; 14.B有三种情况&#xff1a;1男2女、2男1女、3女。 17.错 因为12300400000超过了int的范围 18.错 21.D 23.对 25.A 26.D代入程序 31.C 33.C 36.D 37.A …

四川古力未来科技抖音小店:科技赋能,购物新体验!

在当下这个数字化飞速发展的时代&#xff0c;电商行业早已成为了人们日常生活中不可或缺的一部分。而抖音小店作为电商领域的一匹黑马&#xff0c;正以其独特的优势和魅力&#xff0c;吸引着越来越多的消费者。今天&#xff0c;我们就来一起探讨一下四川古力未来科技抖音小店的…

2024 年 11 款顶级Android数据恢复软件的主要功能

Android 设备上的数据丢失可能是一种令人痛苦的体验&#xff0c;通常会导致不可替代的信息瞬间消失。 可能会发生意外删除、系统崩溃或格式错误&#xff0c;关键数据的丢失可能会扰乱日常工作并影响您的工作效率。 幸运的是&#xff0c;技术进步带来了几种恢复解决方案&#…

单片机烧录程序时“DTR的低电平复位,RTS高电平进入bootloader”有关的串口Modem联络信号

烧录程序时常见DTR和RTS引脚 参考&#xff0c;参考视频 因为常常使用的都是串口下载程序&#xff0c;常用的芯片CH340系列&#xff0c;下图中标红的引脚是MODEM联络信号&#xff0c;其中常见的DTR和RTS就是常见的串口Modem网络输出信号&#xff0c;也就是通过烧录软件控制的接…