科技
-
AI新动能 数字人三大特征八大场景
随着元宇宙概念的火爆也一同带动了数字人市场的快速升温,据计算全球平均每天都会诞生一个数字人,数字人正成为一股潮流,涌入人们的日常生活——会,捉妖,的虚拟美妆达人柳夜熙,抖音出道三天点赞即超百万,一夜之间成为国内虚拟偶像界的,顶流,;在江苏卫视跨年演唱会上,昔日歌后邓丽君,重返,舞台,与歌手周深同台对...
-
有哪些特征类型 什么是生成式AI
生成式AI是人类一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据,那么什么是人工智能,人工智能和机器学习之间的区别是什么,有哪些技术特征,人工智能是一门学科,是计算机科学的一个分支,研究智能代理的创建,这些智能代理是可以推理、学习和自主行动的系统,从本质上讲,人工智能与构建像...
-
一文彻底搞懂GPT
GPT,3是一个具有1750亿个参数的自回归语言模型,比任何以前的非稀疏语言模型多10倍,对于所有任务,GPT,3均无需任何梯度更新或微调即可应用,任务和少样本演示完全通过与模型的文本交互来指定,可以生成新闻文章样本,而人类评估者很难将这些样本与人类撰写的文章区分开来,接下来分为四部分,摘要、引言、...
-
Transformer动画讲解
一、GPT的核心是TransformerGPT,GenerativePre,trainedTransformer,是一种基于单向Transformer解码器的预训练语言模型,它通过在大规模语料库上的无监督学习来捕捉语言的统计规律,从而具备强大的文本生成能力,在GPT,GenerativePre,tr...
-
Arcee AI发布SuperNova 超级新星降临
01引言在人工智能,AI,的世界里,大型语言模型已经成为解决复杂任务、提升决策过程的重要工具,但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战,ArceeAI直面这些挑战,推出了SuperNova,Medius——一款旨在保持大型模型高质量输出的同时,克服其局限性的小语言模型,02Su...
-
利用agent自动生成论文idea 再也不用担心做科研没有思路了 ResearchAgent
大家好,我是HxShine今天分享微软的一篇文章,ResearchAgent,IterativeResearchIdeaGenerationoverScientificLiteraturewithLargeLanguageModels,传统的科学研究过程包括新研究想法的提出和通过精心设计的实验来验证...
-
Thought TOT of Tree
今天分享一篇普林斯顿大学的一篇文章,TreeofThoughts,DeliberateProblemSolvingwithLargeLanguageModels[1],思维之树,用大型语言模型解决复杂问题,这篇工作还是非常有借鉴意义的,OpenAI的AndrejKarpathy,前TeslaAI高级...
-
利用LLM本身训练SoTA Microsoft embedding模型
大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做embedding模型,其只需要利用合成数据和少于1000次...
-
利用LLM本身训练SoTA embedding模型
大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做embedding模型,其只需要利用合成数据和少于1000次...
-
LLama2详细解读
一、概述Llama2,OpenFoundationandFine,TunedChatModels论文地址,Llama2,OpenFoundationandFine,TunedChatModels代码,https,github.com,facebookresearch,llama官网,ht...
-
个性化在CTR预估中的经典方法和效果对比 一文总结特征增强&
在CTR预估中,主流都采用特征embedding,MLP的方式,其中特征非常关键,然而对于相同的特征,在不同的样本中,表征是相同的,这种方式输入到下游模型,会限制模型的表达能力,为了解决这个问题,CTR预估领域提出了一系列相关工作,被称为特征增强模块,特征增强模块根据不同的样本,对embedding...
-
一文汇总 长周期时序预测有哪些优化点
长周期时序预测核心问题长周期时间序列预测,指的是预测窗口较长一类时间序列预测问题,一般来说,预测长度在50个点以上,就可以认为是长周期时间序列预测问题,同时,预测长度的增加,会使得模型需要引入更长的历史序列,才能实现更好的预测,相比短周期时序预测,长周期时序预测主要面临的挑战有以下几个方面,长周期历...
-
深入探索GPT在情感驱动决策中的表现 从合作游戏中洞察AI决策 GPT的情感逻辑
情感在人类决策中扮演着核心角色,它影响他们的选择、行为乃至生活的方方面面,当这一复杂的人类特质与LLMs相遇时,他们如何确保这些模型能够准确地反映出情感的影响,这不仅是技术上的挑战,更是对模型设计哲学的深刻考量,6月6日发表于学术平台arXiv热门论文,THEGOOD,THEBAD,ANDTHEHU...
-
KVSharer 共享 KV Cache 基于不相似性实现跨层
一、背景本文中我们介绍一种最新的KVCache共享论文KVSharer,与之前常见的层内共享不同,KVSharer主要关注跨层共享,并且是整个层的共享,对应的论文,[2410.18517]KVSharer,EfficientInferenceviaLayer,WiseDissimilarKVCach...
-
Mixture
嘿,大家好!这里是一个专注于AI智能体的频道!首先,让我们来聊聊LLM,这些模型通过在海量数据集上预训练,已经展现出了惊人的能力,无论是理解还是生成自然语言,它们都能做得很好,但问题来了,这些模型的规模和训练成本都很高,这让它们在实际应用中有点不切实际,这时候,MoA登场了!MoA通过利用多个LLM...