去其形而留其意 AI架构系列

去其形而留其意 AI架构系列

最近很多的咨询都在问我相同的问题,如何将LLM集成到垂直领域的业务场景,这里提到的场景当然这些场景不再是生成式应用,而是较为专业的领域,我翻了一篇三月份的论文,以这篇论文来回答读者的问题,其实就是要将LLM去其形,而留其意,LLM的主要战场......
admigg 11-15
305 288 561
1.5开源来袭 Jamba前生今世

1.5开源来袭 Jamba前生今世

AI21服务于企业,为企业构建基础模型和AI系统以加速GenAI在生产中的使用,AI21成立于2017年,已从NVIDIA、Intel、Google等公司共筹集了3.36亿美元,它是最早将生成式AI推向大众的公司之一,借助AI21平台,企业......
admigg 11-15
286 564 849
深入注意力机制 LLM基础模型系列

深入注意力机制 LLM基础模型系列

大模型技术论文不断,每个月总会新增上千篇,本专栏​​精选论文​​​重点解读,主题还是围绕着行业实践和工程量产,若在某个环节出现卡点,可以回到​​大模型必备腔调​​​或者​​LLM背后的基础模型​​​新阅读,而​​最新科技,Mamba,xLS......
admigg 11-15
128 676 232
在消费级GPU上奔跑的 瘦子 WordLlama

在消费级GPU上奔跑的 瘦子 WordLlama

DavidMiller表示该模型的目标很明确,弥合尖端AI研究和实际应用之间的差距,他认识到,许多现有NLP模型需要大量的计算资源,并且通常局限于专有系统,从而限制了它们的可访问性,作为回应,WordLlama被设计为既轻量级又高效,使更广......
admigg 11-15
343 260 318
颠覆传统OCR轻松搞定复杂PDF的工具

颠覆传统OCR轻松搞定复杂PDF的工具

LLM辅助OCR项目是一个先进的系统,旨在显著提高光学字符识别,OCR,输出的质量,通过利用尖端的自然语言处理技术和大型语言模型,LLM,,将原始OCR文本转换为高度准确、格式良好且可读的文档成为可能,本篇文章将介绍一款在github上拥有......
admigg 11-15
579 375 352
轻松定制Markdown切分 RAG文本切分LV3

轻松定制Markdown切分 RAG文本切分LV3

上篇文章我们介绍了借助LLM和OCR将文档转换成markdown的方法,​​颠覆传统OCR轻松搞定复杂PDF的工具​​,本篇文章将介绍如何对markdown进行有效切分,之前介绍了文本切分五个层级,本文方法是第三个层次,Level1,Cha......
admigg 11-15
433 686 707
支持大模型流式输出的JSON提取工具

支持大模型流式输出的JSON提取工具

在我们日常处理大模型的输出时,经常希望输出的结果为结构化的,例如输出json格式,,这样有助于我们进行结果的后处理,但是在模型输出超过限制和流式输出时就会遇到问题了,由于答案没完全输出,转json就存在问题,大型语言模型,LLMs,产生结构......
admigg 11-15
226 119 589
RAG高级优化 检索后处理模块成竹在胸

RAG高级优化 检索后处理模块成竹在胸

通过上文的方法​​RAG高级优化,一文看尽query的转换之路​​,我们召回了一些相关片段,本文我们将介绍在将召回片段送入大模型之前的一些优化手段,它们能帮助大模型更好的理解上下文知识,给出最佳的回答,LongtextReorderCont......
admigg 11-15
566 239 334
RAG高级优化 检索策略探讨Fusion HyDE安排上 含代码

RAG高级优化 检索策略探讨Fusion HyDE安排上 含代码

传统的检索方法通常依赖于对query进行语义理解,基于向量,或关键字匹配,BM25,,这两种方法都有其优点和缺点,融合检索、HyDE和RAGFusion可以创建一个更健壮和准确的检索系统,本文将介绍三种优化方法,Fusionretrieva......
admigg 11-15
562 565 269
RAG 长上下文 Google 我全都要! 还是

RAG 长上下文 Google 我全都要! 还是

嘿,大家好!这里是一个专注于AI智能体的频道!最近,深度学习和人工智能领域的大牛们在arXiv上发表了一篇有趣的研究,标题挺长的,检索增强生成或长上下文大型语言模型,全面研究和混合方法,今天分享一篇由GoogleDeepMind和密歇根大学......
admigg 11-15
922 144 453