百货
-
RAG是否仍然必要 在长上下文LLM的时代
一、结论写在前面论文标题,InDefenseofRAGintheEraofLong,ContextLanguageModels论文链接,https,arxiv.org,pdf,2409.01666克服早期生成式大型语言模型,LLMs,的有限上下文限制,检索增强生成,RAG,在过去一直是基于上...
-
LLM超长上下文查询
在大型语言模型,LLM,的应用中,有几个场景需要以结构化的方式呈现数据,其中信息提取和查询分析是两个典型的例子,我们最近通过更新的文档和一个专门的代码仓库强调了信息提取的重要性,对于查询分析,我们同样更新了相关文档,在这些场景中,数据字段可能包括字符串、布尔值、整数等多种类型,而在这些类型中,处理高...
-
基于指令的细粒度图像编辑数据集 万样本 数据才是AIGC的王道!UltraEdit
一、概述UltraEdit是一种大规模的、自动生成的数据集,专门用于基于指令的图像编辑,该数据集包含了约万个编辑样本,覆盖了750,000个独特的指令,涵盖了9种以上的编辑类型,UltraEdit的核心优势在于其利用大型语言模型,LLMs,的创造力和人类评估者提供的上下文编辑示例,提供了更广泛的编辑...
-
解锁虚拟现实中的幻觉问题 3D语言模型的新突破
随着人工智能技术的飞速发展,3D语言模型,3D,LLMs,已成为研究的热点,它们在理解和生成语言指令方面展现出了巨大的潜力,这些模型不仅能够处理文本信息,还能理解和操作三维空间中的物体,这对于发展能够与物理世界互动的智能系统至关重要,3D语言模型的核心在于其能够将语言与三维场景紧密结合,传统的大型语...
-
能解释图像和文本数据 300亿参数!苹果推出多模态大模型MM1
在过去的一年里,LLM因其先进的AI能力而备受关注,值得注意的是,苹果,Apple,公司却缺席了,目前,苹果公司正在谈判将谷歌的Gemini人工智能引擎植入iPhone,而苹果一直致力于开发下一代LLM,一种可以解释图像和文本数据的LLM,近日,苹果的计算机科学家和工程师团队开发了一种LLM模型,声...
-
Lumina
近年来,随着扩散模型在生成任务中的广泛应用,它们已经成为了生成式人工智能领域的重要组成部分,从StableDiffusion到Sora,这些模型在生成真实图像和视频方面取得了显著成功,标志着从经典U,Net架构向基于Transformer的扩散主干架构的转变,最新的进展是Lumina,T2X系列模型...
-
视频生成模型 新的 Meta Movie SOTA Gen
一、背景前段时间Meta发布了对标OpenAISORA和快手可灵的视频生成模型MovieGen,这里我们进行相关的技术解读,本文主要聚焦在其图像和视频生成模型部分,进行详细介绍;然后对视频个性化、编辑和音频生成进行简单概述,对应的论文,MovieGen,ACastofMediaFoundationM...
-
StaR 显著提升模型复杂推理 用少量推理数据让模型学会通用推理能力
今天分享GoogleResearch的一篇文章,可能OpenAIo1也采用了类似的技术,标题是STaR,BootstrappingReasoningWithReasoning,这篇文章提出了一种利用语言模型自我生成推理的技术,称为,Self,TaughtReasoner,STaR,该技术通过迭代地利...
-
T
AIAgent,智能体,作为大模型的重要应用模式,能够通过使用外部工具来执行复杂任务,完成多步骤的工作流程,为了能全面评估模型的工具使用能力,司南及合作伙伴团队推出了T,Eval评测基准,相关成果论文已被ACL2024主会录用,查看原文,https,arxiv.org,abs,2312.14033...
-
大模型也要私人定制 最新综述带你解锁AI的个性化服务
1、大模型也要私人定制,最新综述带你解锁AI的个性化服务人工智能正在飞速发展,ChatGPT等大语言模型已经成为我们生活中的万能助手,但你是否想过,如果AI助手能够真正理解你的个性特征,为你提供量身定制的服务,会是什么样的体验,最新发表的一篇综述论文,首次系统地梳理了大语言模型个性化这一前沿研究领域...
-
解读AI大模型 从了解token开始
什么是Transformer,Transformer是一种新颖的神经网络架构,它在2017年由Google的研究人员提出,用于解决机器翻译等自然语言处理的任务,Transformer的特点是,它完全摒弃了传统的循环神经网络,RNN,和卷积神经网络,CNN,,而是采用了一种称为自注意力机制,Self,...
-
PC应该具备5大特征 联想杨元庆称真正意义的AI 大模型不是AI的尽头
2023年,消费电子市场仍处于低点,手机、PC均表现不佳,不过,年底的一波回暖,让行业在2024年看到了希望,多家研究机构也都给出了重回正增长的预期,不仅如此,AI技术与设备的融合,也进一步加快了终端的迭代,激起新一轮换机潮,IDC预计,2024年中国市场上搭载AI功能终端设备将超70%,AI终端占...
-
技术报告 DeepMind推出Gemma 我们一起聊聊Google 2
引言,大规模语言模型的发展与挑战近年来,大规模语言模型,LLMs,在语言理解、生成和推理方面展现出了强大的能力,随着模型规模的不断扩大,新的能力也逐渐显现,最新的大型模型不仅在推理基准测试上达到了前所未有的性能,还展示了多模态和多语言的能力,甚至能处理超过1M个令牌的上下文长度,尽管小规模模型的性能...
-
为什么需要多模态大模型 什么是多模态大模型
多模态大模型,就是支持多种数据格式的模型,很多人都听说过多模态,也知道多模态大模型,但如果让你介绍一下什么是多模态大模型,它有什么优点和缺点,以及为什么需要多模态,这时可能就有点傻眼了,从应用角度来说,垂直应用的大模型才应该是未来的趋势,那么为什么还要研究多模态大模型呢,今天我们就来了解一下什么是多...
-
还有一些常用的网站 个人关于人工智能技术学习的心得与方法
学习大模型技术是有方法的,千万不要只知道埋头工作,学习人工智能技术也有一段时间了,虽然说也算不上什么成果,但对人工智能技术也算有了一个初步的认识,以及一些个人的学习过程与心得,而今天就来简单介绍一下个人学习人工智能技术的一些书籍,网站和心得;因为人工智能技术有不同的实现方式,所以今天所说的人工智能特...