去其形而留其意 AI架构系列
最近很多的咨询都在问我相同的问题,如何将LLM集成到垂直领域的业务场景,这里提到的场景当然这些场景不再是生成式应用,而是较为专业的领域,我翻了一篇三月份的论文,以这篇论文来回答读者的问题,其实就是要将LLM去其形,而留其意,LLM的主要战场......
1.5开源来袭 Jamba前生今世
AI21服务于企业,为企业构建基础模型和AI系统以加速GenAI在生产中的使用,AI21成立于2017年,已从NVIDIA、Intel、Google等公司共筹集了3.36亿美元,它是最早将生成式AI推向大众的公司之一,借助AI21平台,企业......
深入注意力机制 LLM基础模型系列
大模型技术论文不断,每个月总会新增上千篇,本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产,若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型新阅读,而最新科技,Mamba,xLS......
在消费级GPU上奔跑的 瘦子 WordLlama
DavidMiller表示该模型的目标很明确,弥合尖端AI研究和实际应用之间的差距,他认识到,许多现有NLP模型需要大量的计算资源,并且通常局限于专有系统,从而限制了它们的可访问性,作为回应,WordLlama被设计为既轻量级又高效,使更广......
颠覆传统OCR轻松搞定复杂PDF的工具
LLM辅助OCR项目是一个先进的系统,旨在显著提高光学字符识别,OCR,输出的质量,通过利用尖端的自然语言处理技术和大型语言模型,LLM,,将原始OCR文本转换为高度准确、格式良好且可读的文档成为可能,本篇文章将介绍一款在github上拥有......
轻松定制Markdown切分 RAG文本切分LV3
上篇文章我们介绍了借助LLM和OCR将文档转换成markdown的方法,颠覆传统OCR轻松搞定复杂PDF的工具,本篇文章将介绍如何对markdown进行有效切分,之前介绍了文本切分五个层级,本文方法是第三个层次,Level1,Cha......
支持大模型流式输出的JSON提取工具
在我们日常处理大模型的输出时,经常希望输出的结果为结构化的,例如输出json格式,,这样有助于我们进行结果的后处理,但是在模型输出超过限制和流式输出时就会遇到问题了,由于答案没完全输出,转json就存在问题,大型语言模型,LLMs,产生结构......
RAG高级优化 检索后处理模块成竹在胸
通过上文的方法RAG高级优化,一文看尽query的转换之路,我们召回了一些相关片段,本文我们将介绍在将召回片段送入大模型之前的一些优化手段,它们能帮助大模型更好的理解上下文知识,给出最佳的回答,LongtextReorderCont......
RAG高级优化 检索策略探讨Fusion HyDE安排上 含代码
传统的检索方法通常依赖于对query进行语义理解,基于向量,或关键字匹配,BM25,,这两种方法都有其优点和缺点,融合检索、HyDE和RAGFusion可以创建一个更健壮和准确的检索系统,本文将介绍三种优化方法,Fusionretrieva......
RAG 长上下文 Google 我全都要! 还是
嘿,大家好!这里是一个专注于AI智能体的频道!最近,深度学习和人工智能领域的大牛们在arXiv上发表了一篇有趣的研究,标题挺长的,检索增强生成或长上下文大型语言模型,全面研究和混合方法,今天分享一篇由GoogleDeepMind和密歇根大学......