百货
-
综述 面向大语言模型的检索增强生成 技术 RAG
同济大学王昊奋研究员团队联合复旦大学熊赟教授团队发布检索增强生成,RAG,综述,从核心范式,关键技术到未来发展趋势对RAG进行了全面梳理,这份工作为研究人员绘制了一幅清晰的RAG技术发展蓝图,指出了未来的研究探索方向,同时,为开发者提供了参考,帮助辨识不同技术的优缺点,并指导如何在多样化的应用场景中...
-
开源工具AnythingLLM全解析及实操指南 打造智能私有知识库 RAG企业级解决方案
在数据安全和隐私保护日益受到重视的背景下,私有化部署大模型的需求日益增长,MintplexLabsInc.推出的开源项目AnythingLLM,为个人和企业提供了一种安全、高效且可定制的解决方案,该工具基于RAG,Retrieval,AugmentedGeneration,模型,允许用户将本地文档转...
-
RAG之PDF文件中多种格式数据解析实践
RAG检索增强生成由2部分构成,一是离线对异构的数据进行数据工程处理成知识,并存储在知识库中,二是基于用户的提问进行知识库的检索增强,如下图所示,其中最关键的一个环节是PDF格式的文件如何提取成知识,下面详细剖析,1、PDF文件中文本数据如何提取,能够处理文本提取的Python库有多个,其中较为知名...
-
阿里达摩院最新多模态大模型介绍 多项图文任务取得SOTA效果
这篇文章给大家介绍一下阿里发表的多模态大模型工作mPLUG,Owl,共2篇文章,建立在前序图像表征对齐预训练大语言模型的思路,提出了不同的参数训练方式、多模态解耦映射等优化方法,在多项任务取得了SOTA效果,相关论文,mPLUG,OwlLanguageModelswithMultimodalitym...
-
排序模型一定要尝试的特征交叉技巧 多场景验证有效
今天给大家介绍两篇经典的工作,这两篇工作都是针对推荐系统中排序模型的优化,方法有一些相似之处,都是利用门控网络对底层特征进行交叉,最关键的在于,这类方法已经在很多真实业务场景中被验证效果显著,非常值得还没有应用这类方法的同学进行尝试,论文标题,MaskNet,IntroducingFeature,W...
-
FoundTS 时间序列预测基础模型的全面统一测评基准
今天给大家介绍一篇华东师范大学联合丹麦奥尔堡大学和松鼠AI发布的时间序列模型统一评测基准FoundTS,这是一个针对时间序列预测基础模型的基准测评框架,旨在利用不同领域和特征的数据集对不同的时间序列预测基础模型进行全面、公平的测评,该论文在统一评测结果的基础上,分析了现有时序预测基础模型的优缺点,并...
-
适用各类数据集 上下文长度首次扩展至千级别 统一时序预测模型 清华大学最新发布
今天给大家介绍一篇清华大学的时间序列预测最新工作,提出了统一的Transformer时序预测模型,能同时处理单变量和多变量时序预测,并将时序预测的上下文长度首次扩充到千级别,论文标题,TIMER,XL,LONG,CONTEXTTRANSFORMERSFORUNIFIEDTIMESERIESFOREC...
-
检索后处理模块成竹在胸 RAG高级优化
通过上文的方法RAG高级优化,一文看尽query的转换之路,我们召回了一些相关片段,本文我们将介绍在将召回片段送入大模型之前的一些优化手段,它们能帮助大模型更好的理解上下文知识,给出最佳的回答,Long,textReorder根据论文LostintheMiddle,HowLanguageMo...
-
颠覆传统OCR轻松搞定复杂PDF的工具
LLM辅助OCR项目是一个先进的系统,旨在显著提高光学字符识别,OCR,输出的质量,通过利用尖端的自然语言处理技术和大型语言模型,LLM,,将原始OCR文本转换为高度准确、格式良好且可读的文档成为可能,本篇文章将介绍一款在github上拥有1.7kstar的开源实现工具LLM,AidedOCR,本项...
-
含代码 RAG高级优化 检索策略探讨Fusion HyDE安排上
传统的检索方法通常依赖于对query进行语义理解,基于向量,或关键字匹配,BM25,,这两种方法都有其优点和缺点,融合检索、HyDE和RAG,Fusion可以创建一个更健壮和准确的检索系统,本文将介绍三种优化方法,高级RAG技术介绍FusionRetrieval融合检索是一种强大的文档搜索方法,它结...
-
简单策略解决CTR模型训练一轮过拟合问题
今天这篇文章给大家介绍一下推荐系统中预估模型的one,epoch问题,以及相应的解法,主要来源于两项工作,一个是由阿里发表的论文TowardsUnderstandingtheOverfittingPhenomenonofDeepClick,ThroughRatePredictionModels,20...
-
彻底改变交互的九大基于语音的生成式AI助手
译者,布加迪审校,重楼基于语音的生成式AI助手正在悄然改变我们与技术交互的方式,取得了微妙而又重大的进步,这些AI助手不再只是响应命令,而是变得更直观简单、更有同理心,还能够理解复杂的人类情感和环境,虽然进展似乎是渐进式的,但AI助手的功能在迅速增强,本文深入介绍了几款领先的基于语音的生成式AI助手...
-
生成式AI 的爆发元年
2023年4月,距离chatGPT的正式发布已经过去了四个多月,距离NewBing的发布过去了两个月,而GPT4同样也已经发布了一个月,各式各样围绕chatGPT或者说LLM模型的生态、社区、工作不断涌现,对GithubTrending榜单一直关注的人可能早就注意到,围绕chatGPT的各种包装库以...
-
第一个多模态MoE Aria
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、Aria,第一个多模态,文本,代码,图像,视频,MoE论文标题,Aria,AnOpenMultimodalNativeMixture,of,ExpertsModel论文链接,https,arxiv.or...
-
如何让LLM学会试错
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、如何让LLM学会试错2、LLM竟然学会了自我反省,它真的有自我意识吗,1、如何让LLM学会试错你有没有想过,为什么人工智能经常会犯愚蠢的错误,原因可能让你意外,因为我们一直在教它做一个完美主义者!最新研...