百货
-
Sora的狂欢 世界模型和AGI
Sora是OpenAI发布的一款视频生成模型,采用了DiffusionTransformer架构,旨在实现高保真度和视频图像的前后一致性,其突出之处在于能够生成逼真流畅的视频内容,令人惊叹不已,Sora一经推出便在极短的时间内迅速引起了科技界和社会各界的关注,同时也引发了关于AI技术发展和产业变革的...
-
一文彻底搞懂大模型实战
大语言模型角色扮演利用大型语言模型,LLM,来模仿和扮演各种角色,这种技术通过提示或微调模型,使其能够展示出特定的性格知识背景和行为模式,从而在与用户交互时呈现出不同的角色形象接下来分两部分,基本概念、实战方法,AutoGen,,一起来深入了解大模型实战,角色扮演,一、基本概念什么是角色扮演,通过特...
-
人类如何通过机器智能增强认知过程和行为
计算逻辑以各种形式出现,就像其他类型的逻辑一样,本文将重点介绍计算逻辑中的溯因逻辑编程,ALP,方法,并将论证ALP代理框架,它将ALP集成到代理的操作周期中,为解释性推理和规范性推理提供了一个具有说服力的模型,ALP代理框架作为一个解释性模型,它以生产系统为例;而作为一种规范性模型,它不仅包括经典...
-
如何编写出色的生成式AI提示
生成式人工智能,GenAI,已经成为一种提高生产力和处理日常任务的强大工具,这种工具可以根据收到的输入创建新的内容,包括文本、图像甚至代码,虽然这种工具大有潜力,但有效地发掘它们的力量却需要一种特定的技能,即编写优秀提示的能力,提示是我们赋予AI工具的指令,以指导它们的输出,可以把提示看作是现代版的...
-
估计 绘图大总结 的人都没试过! Kimi 80%
最近在写技术方案的时候,发现了Kimi可以完成程序员所需的大部分图形,包括流程图、时序图、状态图等等,使用之后直接让我的工作效率起飞,只需将内容或数据丢给Kimi生成即可,再也不用傻乎乎的画图了,总的来说还是使用Mermaid语言来完成,接下来看看它能为我们生成哪些图形,饼状图饼状图算是我们日常工作...
-
360AI 我真的哭死 浏览器不再耍流氓 当 好好用
最近周鸿祎大佬的消息频出,至从开始搞流量之后,各种蹭热点,在他的AI公开课上,他着重推荐了360AI浏览器这款产品,在过去的3月份,360AI浏览器也成功登顶AI产品榜,成为新品增速榜第一名,带大家一起看看,与传统浏览器有什么不同,登录到360AI浏览器官网即可下载,https,browser.36...
-
GPTs 好消息 无法创建! 可以免费使用了!坏消息 只能使用
今天OpenAI又向所有用户正式开放GPTs使用,免费用户也可以白嫖GPTs了,但是跟GPT,4o一样会受到限制,目前我的免费账号还没被灰度,无法测试限制次数是多少,白嫖GPT,4o大家应该都享受到了,我的免费账号晚上测试了一下感觉GPT,4o次数限制还是挺宽松的,每三小时可以发送大约50条消息,对...
-
这里有两个悖论 杨立昆等语出惊人 我们应该恐惧AGI
编辑,伊风,现存的机器显然并不比人类更强大,马也比我们强壮得多,速度也比我们快,但没有人感受到马的威胁,但AI并不是这样,我们现在还缺乏对具有人类水平智能的AI系统的蓝图规划,我们要阻止科学向一个方向或另一个方向发展是不可行的,未来的AI系统必须是目标驱动且可控的,这些强烈的观点,是图灵奖获得者杨立...
-
视觉文本视频生成最强方案!Text
文章链接,https,arxiv.org,pdf,2406.17777github链接,laulampaul.github.io,text,animator.html视频生成在游戏、电子商务和广告等各行业中都是一个具有挑战性但至关重要的任务,在文本到视频,T2V,生成领域中,有效地在生成的视频中视觉...
-
RAG技术性能提升之文档分块策略方案
在人工智能领域,尤其是大型语言模型,LLM,的应用中,检索增强生成,Retrieval,AugmentedGeneration,RAG,技术正变得越来越重要,RAG技术通过结合检索和生成能力,为模型提供了丰富的外部知识源,从而生成更准确、更符合上下文的答案,本文将深入探讨RAG技术中的文档分块策略,...
-
改进RAG管道检索文档质量的五种方法
RAG可以利用外部信息提升大型语言模型的性能,其性能依赖于检索文档的质量,除了标准检索方法之外,还有4种方法可以提高所检索文档的质量,检索增强生成,RAG,是利用外部信息定制大型语言模型的重要技术之一,但是,RAG的性能取决于检索到的文档的质量,除了在RAG管道中使用的标准检索方法之外,还有这4种技...
-
文档概要索引 简单提升检索性能的新选择
今天介绍了一种全新的LlamaIndex数据结构,文档摘要索引,将描述它如何比传统语义搜索提供更好的检索性能,并通过一个示例进行了演示,背景大型语言模型,LLM,的核心用例之一是针对自己的数据进行问答,为此,我们将LLM与,检索,模型配对,该模型可以对知识语料库执行信息检索,并使用LLM对检索到的文...
-
LLM集中爆发的一周 Open 卷疯了!
开源大模型领域热闹非凡的一周,各种开源,PaperAgent进行了概括,端侧、Code、RAG、Agent、Reflection,反思纠正,、MoE,你关注的都在这里了,ReflectionLlama,3.1,70B开源ReflectionLlama,3.170B是世界上顶尖的OpenLLM,通过反...
-
Mistral 谷歌& AI发布TIPS 具有空间意识的文本
文章链接,https,arxiv.org,pdf,2410.16512亮点直击具有空间意识的文本图像预训练,TIPS是一种通用的图像,文本编码器模型,可有效用于密集和全局理解,用于纯视觉或视觉语言任务,整体应用流程见下图,总结速览解决的问题现有的图像,文本表示学习模型通常缺乏空间意识,难以直接用于密...
-
OPPO& AI联合发布一致且高效的3D场景编辑方法 港理工& Stability
文章链接,https,arxiv.org,pdf,2406.17396项目链接,https,lslrh.github.io,syncnoise.github.io,今天和大家一起学习港理工、OPPO和StabilityAI联合发的一篇关于3D场景编辑的工作,主打一个一致且高效,视频demo非常赞,可...