科技

OpenAI 大模型史 AGI 2027 OpenAI联合创始人John RLHF Schulman ...

的离职，OpenAI首席架构师和著名强化学习，ReinforcementLearning，或RL，专家JohnSchulman博士成为OpenAI现存最主要具有技术背景的创始人，最近，Schulman博士接受了著名的科技播客主持人DwarkeshPatel的专访，他解密了OpenAI大模型发展史，介...

2024-11-15 947

科技

AI 工作流的演进与前景 Agent 吴恩达深度剖析

AIAgent作为具备感知环境、做出决策和执行动作能力的智能实体，正在成为人工智能领域的关键发展动向，随着大型语言模型，LLM，技术的持续进步，AIAgent的潜力正被逐步揭示，它们不仅能够完成基于指令的任务，还能表现出更高水平的自主性和主动性，在最近的红杉AIAscent2024活动中，人工智能领...

2024-11-15 914

科技

o1推理扩展的风吹到了RAG 性能飙升58.9%！

以往的研究主要集中在通过增加检索文档的数量或长度来扩展检索增强生成，RAG，中检索到的知识，然而，仅增加知识量而不提供进一步的指导存在一定的局限性，为此，GoogleDeepMind研究了RAG在推理计算扩展，InferenceScaling，情况下的性能，特别是当上下文很长时，通过应用最优配置，在...

2024-11-14 683

数码资讯

你的LoRA需要更新了！科大讯飞等提出MiLoRA 新颖且高效的LoRA变体

论文链接，https，arxiv.org，pdf，2410.18035低秩适应，LoRA，及其专家混合，MOE，变体是非常有效的参数高效微调，PEFT，方法，然而，由于在Transformer层中添加了LoRA模块和MOErouters，这些方法在多租户环境中引入了显著的延迟，为了解决这个问题，本文...

2024-11-14 996

科技

自回归生成最新SOTA！首次超越扩散模型和非自回归Transformer模型！字节开源RAR

文章链接，https，arxiv.org，pdf，2411.00776项目链接，https，yucornetto.github.io，projects，rar.html代码&amp，模型链接，https，github.com，bytedance，1d，tokenizer亮点直击总结速览解决的...

2024-11-14 483

数码资讯

而是实时企业数据管道！这家公司做到了 RAG真正的难点不是向量数据库

编辑，言征出品，技术栈，微信号，blog51cto，企业部署GenAI需要RAG，而RAG需要向量数据库，向量数据库已经成为企业部署人工智能的核心要素，但这还远远不够，企业级别的RAG要复杂得多，1.向量数据库并非真正的难点克里斯·拉蒂默，ChrisLatimer，是初创公司Vectorize的首席...

2024-11-14 636

科技

常见几种大语言模型压缩技术分析详解

大型语言模型，LLM，在自然语言处理任务中取得了显著的成功，但同时也面临着模型过大、计算需求过高的问题，为了解决这些问题，模型压缩技术应运而生，旨在减小模型大小、降低计算复杂度并提升运行效率，本文将对LLM压缩技术进行详细的分析，包括剪枝、知识蒸馏和量化等关键技术，并结合实际应用案例进行分析，一、剪...

2024-11-14 811

数码资讯

LangFriend 一款能记住你的日记应用

本文经翻译并二次整理自LangFriend，aJournalwithLong，TermMemory一文，讲述了LangChain在模型记忆功能方面进行的一次深入的应用实战，并推出了具备记忆能力的日记应用，LangFriend，我们深信，记忆功能将是大型语言模型，LLM，系统中最具潜力的一部分，生成性...

2024-11-14 800

科技

ShareGPT4V作者团队又一力作！百万高质量视频

继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来，LUMA、Gen，3Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力，文生视频、图生视频的新前沿不断被扩展令大家惊喜不已，抱有期待，最近，来自中国科学技术大学、北京大学、上海AILab等团队的研究人...

2024-11-14 500

科技

AI新思考的草莓模型浴火重生

这个模型肯定比我更擅长解决AP数学考试，而且我在大学时辅修数学，，OpenAI的首席研究官鲍勃·麦格鲁，BobMcGrew，告诉我，他说，OpenAI还根据国际数学奥林匹克竞赛的资格考试对o1进行了测试，虽然GPT，4o只正确解决了13%的问题，但o1的得分为83%，OpenAI发布名为o1新模型，...

2024-11-14 761

数码资讯

NVIDIA ViT篇外 Llama

大家也许会很好奇为什么在ViT章节插入了NVIDIALlama，3.1，Minitron4B，ViT因为应用场景的特殊性所以都寄希望于高效率的模型，因此各种针对大参数模型的提炼和优化技术层出不穷，而NVIDIALlama，3.1，Minitron则复现了这些系列的教科书实验，对于一些基本的术语，可以...

2024-11-14 464

数码资讯

引入数学主题树基准来全面评估LLMs LLMs并非智能思考者

摘要，大型语言模型，LLMs，在数学推理方面展示了令人印象深刻的能力，然而，尽管取得了这些成就，当前的评估主要限于特定的数学主题，尚不清楚LLMs是否真正参与了推理，为了解决这些问题，我们提出了数学主题树，MaTT，基准，一个具有挑战性和结构化的基准，涵盖了广泛的数学科目，提供了1958个问题，每个...

2024-11-14 949

数码资讯

期刊自然上海交通大学与上海人工智能研究所联合推出医学多语言模型

随着大型语言模型，LLMs，的快速发展，医学领域的应用也取得了显著进展，但是大多数现有的医学语言模型主要集中在英语语言环境中，限制了其在非英语国家和地区的应用潜力，为了填补这一空白，来自上海交大和上海人工智能实验室的研究团队研发了一个开源的、多语言的医学语言模型，旨在为全球多语言用户提供高质量的医学...

2024-11-14 737

科技

Agent四大范式

什么是智能体AgentAutonomousagents又被称为智能体Agent，能够通过感知周围环境、进行规划以及执行动作来完成既定任务，在这些能力中，规划尤为重要，它涉及到复杂的理解、推理和决策制定，大语言模型出现以前，我们一般通过规则的方法，或者强化学习的方法来实现，但是这两种方法各有弊端，近几...

2024-11-14 541

科技

五个简单好用的本地运行大模型的方法

出品，技术栈，微信号，blog51cto，像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用，但可能并不总是希望的问题或敏感数据由外部应用程序处理，在平台上尤其如此，在这些平台上，你的互动可能会被人类审查，并以其他方式用于帮助训练未来的模型，一种解决方案是下载一个大型语言模型，...

2024-11-14 415

科技

联系我们