LLM集中爆发的一周 卷疯了! Open
开源大模型领域热闹非凡的一周,各种开源,PaperAgent进行了概括,端侧、Code、RAG、Agent、Reflection,反思纠正,、MoE,你关注的都在这里了,ReflectionLlama3.170B开源ReflectionLl......
RAG RAU 对检索增强型语言模型 RALM 进行全面 深入综述
大型语言模型,LLMs,在自然语言处理,NLP,领域促进了重大进展,但它们也面临着诸如幻觉和需要特定领域知识等挑战,为了缓解这些问题,最近的一些方法将从外部资源检索到的信息与LLMs相结合,显著提高了它们在NLP任务中的表现,但是缺乏对检索......
RAG新范式MemLong 用于长文本生成的记忆增强检索
传统的注意力机制由于时间和空间复杂度的二次方增长,以及在生成过程中键值缓存的内存消耗不断增加,限制了模型处理长文本的能力,相关的解决方案包括减少计算复杂度、改进记忆选择和引入检索增强语言建模,检索增强生成,RAG,和MemLong的记忆检索......
超级Agent 像人一样操控电脑!
Anthropic深夜发布重大更新,升级版Claude3.5Sonnet、新型号Claude3.5Haiku以及超级Agent,computeruse,新的ComputerUse可能是迄今为止最先进的AIAgent之一,它可以像人类一样使用......
ToolGen! 忘记Tool检索 拥抱全新Agent
传统大模型工具调用的方法依赖于将工具描述作为上下文输入,这受到上下文长度的限制,并需要单独的、通常效率低下的检索机制,之前基于检索的方法与ToolGen之间的比较,以前的方法使用检索器根据相似性匹配检索相关工具,这些工具进一步被放入提示中供......
o1推理扩展的风吹到了RAG 性能飙升58.9%!
以往的研究主要集中在通过增加检索文档的数量或长度来扩展检索增强生成,RAG,中检索到的知识,然而,仅增加知识量而不提供进一步的指导存在一定的局限性,为此,GoogleDeepMind研究了RAG在推理计算扩展,InferenceScalin......
多阶段对比学习 多专家CLIP实现细粒度多模态表征学习
今天给大家介绍一篇港中文、上海AILab等机构联合发表的CLIP优化工作,构建了基于多专家网络的MoE模型,实现更细粒度的视觉表征器训练,提升下游多模态大模型论文标题,CLIPMOE,TOWARDSBUILDINGMIXTUREOFEXPE......
Model 在时间序列中的应用 一文总结扩散模型 Diffusion
扩散模型是目前生成式AI中的最核心模块,在Sora、DALLE、Imagen等生成式AI大模型中都取得了广泛的应用,与此同时,扩散模型也被越来越多的应用到了时间序列中,这篇文章给大家介绍了扩散模型的基本思路,以及几篇扩散模型用于时间序列的典......
排序模型一定要尝试的特征交叉技巧 多场景验证有效
今天给大家介绍两篇经典的工作,这两篇工作都是针对推荐系统中排序模型的优化,方法有一些相似之处,都是利用门控网络对底层特征进行交叉,最关键的在于,这类方法已经在很多真实业务场景中被验证效果显著,非常值得还没有应用这类方法的同学进行尝试,1.M......
KDD24大厂推荐系统优化工作总结
今天这篇文章给大家介绍几篇KDD2024中,大厂在推荐系统领域的优化工作,论文来自爱彼迎、腾讯、快手、美团等公司,设计多目标建模、多样性、搜索意图建模、rankingloss等问题,1.爱彼迎,多目标建模和模型蒸馏论文标题,Multiobj......