科技

引入数学主题树基准来全面评估LLMs LLMs并非智能思考者

摘要，大型语言模型，LLMs，在数学推理方面展示了令人印象深刻的能力，然而，尽管取得了这些成就，当前的评估主要限于特定的数学主题，尚不清楚LLMs是否真正参与了推理，为了解决这些问题，我们提出了数学主题树，MaTT，基准，一个具有挑战性和结构化的基准，涵盖了广泛的数学科目，提供了1958个问题，每个...

2024-11-14 949

数码资讯

期刊自然上海交通大学与上海人工智能研究所联合推出医学多语言模型

随着大型语言模型，LLMs，的快速发展，医学领域的应用也取得了显著进展，但是大多数现有的医学语言模型主要集中在英语语言环境中，限制了其在非英语国家和地区的应用潜力，为了填补这一空白，来自上海交大和上海人工智能实验室的研究团队研发了一个开源的、多语言的医学语言模型，旨在为全球多语言用户提供高质量的医学...

2024-11-14 737

科技

Agent四大范式

什么是智能体AgentAutonomousagents又被称为智能体Agent，能够通过感知周围环境、进行规划以及执行动作来完成既定任务，在这些能力中，规划尤为重要，它涉及到复杂的理解、推理和决策制定，大语言模型出现以前，我们一般通过规则的方法，或者强化学习的方法来实现，但是这两种方法各有弊端，近几...

2024-11-14 541

科技

五个简单好用的本地运行大模型的方法

出品，技术栈，微信号，blog51cto，像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用，但可能并不总是希望的问题或敏感数据由外部应用程序处理，在平台上尤其如此，在这些平台上，你的互动可能会被人类审查，并以其他方式用于帮助训练未来的模型，一种解决方案是下载一个大型语言模型，...

2024-11-14 415

数码资讯

AI新动能数字人三大特征八大场景

随着元宇宙概念的火爆也一同带动了数字人市场的快速升温，据计算全球平均每天都会诞生一个数字人，数字人正成为一股潮流，涌入人们的日常生活——会，捉妖，的虚拟美妆达人柳夜熙，抖音出道三天点赞即超百万，一夜之间成为国内虚拟偶像界的，顶流，；在江苏卫视跨年演唱会上，昔日歌后邓丽君，重返，舞台，与歌手周深同台对...

2024-11-14 813

科技

有哪些特征类型什么是生成式AI

生成式AI是人类一种人工智能技术，可以生成各种类型的内容，包括文本、图像、音频和合成数据，那么什么是人工智能，人工智能和机器学习之间的区别是什么，有哪些技术特征，人工智能是一门学科，是计算机科学的一个分支，研究智能代理的创建，这些智能代理是可以推理、学习和自主行动的系统，从本质上讲，人工智能与构建像...

2024-11-14 368

数码资讯

一文彻底搞懂GPT

GPT，3是一个具有1750亿个参数的自回归语言模型，比任何以前的非稀疏语言模型多10倍，对于所有任务，GPT，3均无需任何梯度更新或微调即可应用，任务和少样本演示完全通过与模型的文本交互来指定，可以生成新闻文章样本，而人类评估者很难将这些样本与人类撰写的文章区分开来，接下来分为四部分，摘要、引言、...

2024-11-14 907

数码资讯

Transformer动画讲解

一、GPT的核心是TransformerGPT，GenerativePre，trainedTransformer，是一种基于单向Transformer解码器的预训练语言模型，它通过在大规模语料库上的无监督学习来捕捉语言的统计规律，从而具备强大的文本生成能力，在GPT，GenerativePre，tr...

2024-11-14 481

科技

Arcee AI发布SuperNova 超级新星降临

01引言在人工智能，AI，的世界里，大型语言模型已经成为解决复杂任务、提升决策过程的重要工具，但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战，ArceeAI直面这些挑战，推出了SuperNova，Medius——一款旨在保持大型模型高质量输出的同时，克服其局限性的小语言模型，02Su...

2024-11-14 402

科技

利用agent自动生成论文idea 再也不用担心做科研没有思路了 ResearchAgent

大家好，我是HxShine今天分享微软的一篇文章，ResearchAgent，IterativeResearchIdeaGenerationoverScientificLiteraturewithLargeLanguageModels，传统的科学研究过程包括新研究想法的提出和通过精心设计的实验来验证...

2024-11-14 523

数码资讯

Thought TOT of Tree

今天分享一篇普林斯顿大学的一篇文章，TreeofThoughts，DeliberateProblemSolvingwithLargeLanguageModels[1]，思维之树，用大型语言模型解决复杂问题，这篇工作还是非常有借鉴意义的，OpenAI的AndrejKarpathy，前TeslaAI高级...

2024-11-14 897

数码资讯

利用LLM本身训练SoTA Microsoft embedding模型

大家好，我是HxShine今天分享一篇Microsoft公司的一篇文章，Title，ImprovingTextEmbeddingswithLargeLanguageModels，使用大型语言模型改善文本嵌入，这篇文章探索了直接利用LLM来做embedding模型，其只需要利用合成数据和少于1000次...

2024-11-14 677

数码资讯

利用LLM本身训练SoTA embedding模型

大家好，我是HxShine今天分享一篇Microsoft公司的一篇文章，Title，ImprovingTextEmbeddingswithLargeLanguageModels，使用大型语言模型改善文本嵌入，这篇文章探索了直接利用LLM来做embedding模型，其只需要利用合成数据和少于1000次...

2024-11-14 336

科技

LLama2详细解读

一、概述Llama2，OpenFoundationandFine，TunedChatModels论文地址，Llama2，OpenFoundationandFine，TunedChatModels代码，https，github.com，facebookresearch，llama官网，ht...

2024-11-14 979

科技

个性化在CTR预估中的经典方法和效果对比一文总结特征增强&amp

在CTR预估中，主流都采用特征embedding，MLP的方式，其中特征非常关键，然而对于相同的特征，在不同的样本中，表征是相同的，这种方式输入到下游模型，会限制模型的表达能力，为了解决这个问题，CTR预估领域提出了一系列相关工作，被称为特征增强模块，特征增强模块根据不同的样本，对embedding...

2024-11-14 707

科技

联系我们