训练模拟人形机器人的五种强化学习技术大PK
本文将使用五篇新发表的强化学习论文中介绍的五种算法,DDPG、SAC、PPO、I2A和决策转换器,来训练模拟人形机器人互相打斗并对训练结果进行排名,简介我想起了最近的一个老电视节目,Battlebots,,并想对这个节目进行进一步的改造,因......
GPU和CPU如何混合训练 大模型训练的GPU联手CPU显存优化分析方法
随着深度学习模型复杂度和数据集规模的增大,计算效率成为了不可忽视的问题,GPU凭借强大的并行计算能力,成为深度学习加速的标配,然而,由于服务器的显存非常有限,随着训练样本越来越大,显存连一个样本都容不下的现象频频发生,除了升级硬件,烧钱,、......
轻松拿捏多计划选择! Agent Planning大揭秘
在人工智能的世界里,我们经常面临一个挑战,如何让机器像人类一样,面对复杂任务时,能够生成多种可能的解决方案,并从中选择最优的计划呢,这正是&,ldquo,多计划选择&,rdquo,MultiPlanSelecti......
memory大揭秘 Agent 记忆从哪儿来
嘿,大家好!这里是一个专注于AI智能体的频道!今天开始我们来详细看看智能体的大脑&,mdash,&,mdash,记忆模块的内部,主要从三个方面来扒一扒,记忆从哪儿来,记忆长啥样,以及怎么用记忆,今天我们主要聊聊记......
五个超级容易上手的AI项目
提升AI技能,动手实践是最有效的途径,很多人都执着于&,ldquo,新技术怎么用&,rdquo,,其实应该多想想&,ldquo,我能解决什么问题&,rdquo,这样做,你的技术就能变成......
大模型RAG系统的4层境界! 微软新综述
今天分享这篇很干的文章!通过对RAG系统的用户Query进行难度区分,进而可以将系统划分为4个等级,RetrievalAugmentedGeneration,RAG,andBeyond,AComprehensiveSurveyonHowto......
AI诗人来了!斯坦福和微软联手 用大型语言模型优化诗歌创作
探索大型语言模型,LLMs,在文本空间优化问题中的潜力在现代人工智能的研究与应用中,大型语言模型,LargeLanguageModels,简称LLMs,已经显示出其在处理复杂语言任务中的强大能力,从生成文本、理解文档到执行代码,LLMs的应......
一篇大模型Agent最新综述
嘿,大家好!这里是一个专注于AI智能体的频道最近这2篇综述有点撞车了,不是纯正的Agent综述,可以了解一下最新的应用测的Agent发展情况!现实中的Agent系统会面临很多的挑战,常见的有以下几点,感知模块的探索不足,当前研究中对LLMb......
RAG技术性能提升之文档分块策略方案
在人工智能领域,尤其是大型语言模型,LLM,的应用中,检索增强生成,RetrievalAugmentedGeneration,RAG,技术正变得越来越重要,RAG技术通过结合检索和生成能力,为模型提供了丰富的外部知识源,从而生成更准确、更符......
改进RAG管道检索文档质量的五种方法
RAG可以利用外部信息提升大型语言模型的性能,其性能依赖于检索文档的质量,除了标准检索方法之外,还有4种方法可以提高所检索文档的质量,检索增强生成,RAG,是利用外部信息定制大型语言模型的重要技术之一,但是,RAG的性能取决于检索到的文档的......