从零实现大模型
传统RAGLLM预训练和微调一般都是基于公开的互联网数据,不可能包含公司内部私有数据,如果你问有关某公司的运营情况,直接基于模型参数生成的回答可能和胡说八道没什么两样,RAG,RetrievalAugmentedGeneration,的思想......
如何选择适合企业需求的大语言模型
LLM正在推动各行各业的突破和效率,在选择一种模型时,企业应该考虑预期的应用、速度、安全、成本、语言和易用性,虽然与其他人工智能,AI,技术相比,生成式AI比较新,但它已经被用于支持从审查求职者到诊断和推荐疾病治疗的一系列任务,IDC预测,......
embedding模型 Microsoft 利用LLM本身训练SoTA
大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做......
2023 EMNLP
一、概述Title,PromptMix,AClassBoundaryAugmentationMethodforLargeLanguageModelDistillationURL,https,arxiv.orgabs2310.14192......
EMNLP 利用LLM合成数据训练模型有哪些坑 2023
大家好,我是HxShine今天我们将介绍EMNLP2023的一篇大模型,LLMs,生成文本分类任务合成数据的文章,标题是,SyntheticDataGenerationwithLargeLanguageModelsforTextClassi......
一种利用LLM提升多轮会话检索的效果的方案 LLM4CS
大家好,我是HxShine今天分享一篇人大的文章,大型语言模型知道您的会话上下文搜索意图,LargeLanguageModelsKnowYourContextualSearchIntent,APromptingFrameworkforCon......
embedding模型 利用LLM本身训练SoTA
大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做......
综述
大家好,我是刘聪NLP,大模型已经展现出了较强的文本生成能力,但随着使用场景变得越加复杂和严格,除了避免生成误导或不当言论内容外,往往还希望可以满足用户的特殊需求,而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时,保证文本符......
LLM实践系列
经过了数据收集、筛选、去重,马上就可以开始训练实验了,但是在实验之前,我们还需要先获取一个语言模型的基石,分词器,Tokenizer,Tokenizer的作用是对一条文本数据进行切分、词表映射,得到这条文本的token序列,用开源Token......
2024年大模型LLM还有哪些可研究的方向 听听大佬怎么说
2024年大模型LLM还有哪些可研究的方向,前言纯属brainstorm,欢迎大家一起探讨,想到哪里说到哪里,有遗漏的点欢迎大家在评论区中指出,个人认为现在LLM能做的点还很多,这个行业距离饱和还有一段距离,这里通过&,ldq......