排序
必须为孩子存下来的提示词 像玩黑神话游戏一样学习
正如飞行员、医生、卡车司机和运动员通过在低风险环境中练习技能而提升表现,学生在被赋予探索、犯错并调整策略的机会时,也能更有效地学习,角色扮演情境,即学生扮演特定角色并尝试解决商业问题,提供了丰富的实践机会,这样的情境为学生提供了一个无风险的......
LLM 长序列 训练的 Sample Packing Attention 问题及优化
一、背景之前看过部分MegatronLM的源码,也详细分析过对应的Dataset和DataLoader,想当然的认为在LLM预训练时会使用DocumentLevel的Mask,也就是常说的SamplePacking技术,最近我们在做长序列训......
Adaptive
图片框架自适应RAG通过判断问题的复杂性来自动选择使用哪种RAG策略,作者将问题划分为三类,如上图的C部分,•开放领域问答,这类任务通常涉及两个模块,一个检索器和一个阅读器,随着具有千亿参数的超强推理能力的LLMs的出现,LLMs和检索器之......
挑战机器学习建模流程 打破数据壁垒 数据科学家或将被取代 MetaGPT推出全新工作
01研究背景目前,由大型语言模型,LLM,驱动的智能体已经证明了它们在处理复杂任务方面的显著潜力,此外,通过赋予LLM代码执行能力来提升其问题解决能力正逐渐成为一种趋势,这一点已经通过CodeInterpreter[1]、OpenInter......
文本直接生成多视角3D图像 Meta推出创新模型
随着扩散模型的不断创新,文生图领域出现了Midjourney、StableDiffusion、DALLE3等一系列知名产品,但在文本生成多视角3D图像方面一直存在诸多技术难点,Meta和德国慕尼黑工业大学的研究人员联合开发了创新模型&......
能解释图像和文本数据 300亿参数!苹果推出多模态大模型MM1
在过去的一年里,LLM因其先进的AI能力而备受关注,值得注意的是,苹果,Apple,公司却缺席了,目前,苹果公司正在谈判将谷歌的Gemini人工智能引擎植入iPhone,而苹果一直致力于开发下一代LLM,一种可以解释图像和文本数据的LLM,......
解锁大模型的 打草稿 白话EAGLE2 技术
实时了解业内动态,论文是最好的桥梁,专栏精选论文重点解读热点论文,围绕着行业实践和工程量产,若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读,而最新科技,Mamba,xLSTM,KAN,则提供了大模型领域......
从学生到大师 的传奇 看哭了! Hinton 的诺奖之旅与 AI
在这个风起云涌的AI时代,一个令人惊叹的场景正在上演,曾经的&,quot,学生&,quot,正在赶超&,quot,老师&,quot,2024年,当AI技术在诺贝尔物理学奖和化学奖上大放......
RAGChecker RAG 一个精细化评估和诊断 系统的创新框架 显著超越RAGAS
RAG应用已经是当下利用大模型能力的典型应用代表,也获得了极大的推广,各种提升RAG性能的技术层出不穷,然而,如何全面、准确地评估RAG系统一直是一个挑战,传统评估方法存在诸多局限性,无法有效评估长文本回复、难以区分检索和生成模块的错误来源......
2D头像生成3D虚拟人开视频会 谷歌新作让人难绷
开视频远程会议的时候,很多人都不喜欢打开摄像头,即使开了,在界面上大家也都被框在不同的窗口里,虽然这种形式操作起来很方便,但总是缺乏点临场感,最近,谷歌提出了一项研究旨在解决这个问题,这个名叫ChatDirector的技术可以使用静态的2D......