模型_第16页_坚曼百货商行

利用LLM合成数据训练模型有哪些坑 EMNLP 2023

大家好，我是HxShine今天我们将介绍EMNLP2023的一篇大模型，LLMs，生成文本分类任务合成数据的文章，标题是，Synthetic&gt，实际落地中，高质量训练数据的收集和筛选既耗费时间又成本昂贵，研究人员探索使用LLMs生成合成数据作为替代方法，然而，LLMs生成的合成数据在支持...

2024-11-14 124

生活科普

EMNLP 2023

一、概述PromptMix，AClassBoundaryAugmentationMethodforLargeLanguageModelDistillationhttps，arxiv.org，abs，2310.14192代码，https，github.com，servicenow，prom...

2024-11-14 761

娱乐

一文总结扩散模型 Diffusion 在时间序列中的应用 Model

扩散模型是目前生成式AI中的最核心模块，在Sora、DALL，E、Imagen等生成式AI大模型中都取得了广泛的应用，与此同时，扩散模型也被越来越多的应用到了时间序列中，这篇文章给大家介绍了扩散模型的基本思路，以及几篇扩散模型用于时间序列的典型工作，带你理解扩散模型在时间序列中的应用原理，扩散模型建...

2024-11-14 389

玩具模型

FoundTS 时间序列预测基础模型的全面统一测评基准

今天给大家介绍一篇华东师范大学联合丹麦奥尔堡大学和松鼠AI发布的时间序列模型统一评测基准FoundTS，这是一个针对时间序列预测基础模型的基准测评框架，旨在利用不同领域和特征的数据集对不同的时间序列预测基础模型进行全面、公平的测评，该论文在统一评测结果的基础上，分析了现有时序预测基础模型的优缺点，并...

2024-11-14 606

科技

个性化在CTR预估中的经典方法和效果对比一文总结特征增强&amp

在CTR预估中，主流都采用特征embedding，MLP的方式，其中特征非常关键，然而对于相同的特征，在不同的样本中，表征是相同的，这种方式输入到下游模型，会限制模型的表达能力，为了解决这个问题，CTR预估领域提出了一系列相关工作，被称为特征增强模块，特征增强模块根据不同的样本，对embedding...

2024-11-14 707

包包服装

如何让LLM学会试错

大模型领域的发展日新月异，每天都有许多有趣的论文值得深入品读，下面是本期觉得比较有意思的论文，1、如何让LLM学会试错2、LLM竟然学会了自我反省，它真的有自我意识吗，1、如何让LLM学会试错你有没有想过，为什么人工智能经常会犯愚蠢的错误，原因可能让你意外，因为我们一直在教它做一个完美主义者！最新研...

2024-11-14 167

百货快讯

LLMs 理论应用与机遇方法 MLLMs等领域的模型合并

一、结论写在前面论文标题，ModelMerginginLLMs，MLLMs，andBeyond，Methods，Theories，ApplicationsandOpportunities论文链接，https，arxiv.org，pdf，2408.07666项目链接，https，gith...

2024-11-14 606

生活资讯

LLM训练的隐秘危机 1%的合成数据或致模型崩溃

1、LLM训练的隐秘危机，1%的合成数据或致模型崩溃在LLM快速发展的今天，一个令人担忧的现象正悄然出现——模型崩溃，研究发现，即便在训练数据中仅包含1%的合成数据，也可能导致LLM模型性能严重下降，无论如何增加训练数据量都无法提升效果，更令人意外的是，增加模型规模这一当前广泛采用的方法，非但不能缓...

2024-11-14 639

娱乐八卦

效果预训练&amp OLMoE 开源的MoE语言模型

论文标题，OLMoE，OpenMixture，of，ExpertsLanguageModels论文链接，https，arxiv.org，pdf，2409.02060Weights，https，hf.co，allenai，OLMoE，1B，7B，0924Data，https，hf....

2024-11-14 533

娱乐

o1复制之旅有点燃 327个样本打破常规这个OpenAI

1、327个样本打破常规，这个OpenAIo1复制之旅有点燃人工智能领域最近又掀起一阵波澜——OpenAI发布了令人瞩目的O1模型，然而，这个模型的具体细节却如同蒙着面纱一般神秘，面对这种情况，一群研究者决定开启了一场别开生面的O1复制之旅，试图揭开这层面纱，最引人注目的是，研究团队提出了一个创新的...

2024-11-14 643

包包服装

大模型的泡沫什么时候破灭

作者，沈旸出品，技术栈，微信号，blog51cto，对于技术泡沫，大家可能最熟悉的就是Gartner的技术成熟度曲线图，过去几年确实出现了许多备受关注的技术，例如云计算、大数据、区块链和元宇宙，新技术让人激动，但很多企业在跟进这些技术时往往犹豫不决，担心不下注未来会被淘汰，也担心投入巨大但方向错误，...

2024-11-14 379

资讯

3不开源 AlphaFold 统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘——不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型，模型名为，由阿里云飞天实验室生物智能计算团队打造，相比AlphaFold3因未开源...

2024-11-14 141

包包服装

让大模型不再巨无霸这是一份最新的大模型参数高效微调综述

近期，大语言模型、文生图模型等大规模AI模型迅猛发展，在这种形势下，如何适应瞬息万变的需求，快速适配大模型至各类下游任务，成为了一个重要的挑战，受限于计算资源，传统的全参数微调方法可能会显得力不从心，因此需要探索更高效的微调策略，上述挑战催生了参数高效微调，PEFT，技术在近期的快速发展，为了全面总...

2024-11-14 256

生活资讯

探索LLM时代利用可解释性的10种策略 XAI有什么用

你是否也好奇，在大模型时代，可解释性人工智能技术，XAI，有怎样的使用价值，近日，来自佐治亚大学、新泽西理工学院、弗吉尼亚大学、维克森林大学、和腾讯AILab的研究者联合发布了解释性技术在大语言模型，LLM，上的可用性综述，提出了，UsableXAI，的概念，并探讨了10种在大模型时代提高XAI实际...

2024-11-14 951

百货

多智能体大模型协作中的角色不一致性一致性虚构性和模仿性

多智能体AI系统近年来在模拟集体决策和增强聊天机器人文化敏感性方面展现出巨大的潜力，这些系统通过模拟多种社会文化身份的AI代理，能够在科学研究和实际应用中提供宝贵的洞察，例如在行为实验中，多智能体系统可以模拟人类群体互动，帮助研究人员理解群体决策的动态，此外，在聊天机器人应用中，加入多样化的群体讨论...

2024-11-14 217

包含"模型"标签的文章

利用LLM合成数据训练模型有哪些坑 EMNLP 2023

EMNLP 2023

一文总结扩散模型 Diffusion 在时间序列中的应用 Model

FoundTS 时间序列预测基础模型的全面统一测评基准

个性化在CTR预估中的经典方法和效果对比一文总结特征增强&amp

如何让LLM学会试错

LLMs 理论应用与机遇方法 MLLMs等领域的模型合并

LLM训练的隐秘危机 1%的合成数据或致模型崩溃

效果预训练&amp OLMoE 开源的MoE语言模型

o1复制之旅有点燃 327个样本打破常规这个OpenAI

大模型的泡沫什么时候破灭

3不开源 AlphaFold 统一生物语言大模型阿里云先开了！

让大模型不再巨无霸这是一份最新的大模型参数高效微调综述

探索LLM时代利用可解释性的10种策略 XAI有什么用

多智能体大模型协作中的角色不一致性一致性虚构性和模仿性

联系我们