Adaptive
图片框架自适应RAG通过判断问题的复杂性来自动选择使用哪种RAG策略,作者将问题划分为三类,如上图的C部分,•开放领域问答,这类任务通常涉及两个模块,一个检索器和一个阅读器,随着具有千亿参数的超强推理能力的LLMs的出现,LLMs和检索器之......
VideoAgent基于大语言模型的视频QA系统 斯坦福大学
架构图片上图是VideoAgent的概览图,VideoAgent通过搜索、聚合视频信息来完成长视频QA,整个系统包括一个核心LLM、VLM,视觉大语言模型,和CLIP工具,作者受到人类理解长视频的启发,提出了VideoAgent,通过基于A......
共1页 2条