机器之心报道,在模型大爆炸的时代,由谷歌在,AttentionIsAllYouNeed,中提出的Transformer架构已成为主流AI模型的核心机制,由麻省理工计算机科学和人工智能实验室孵化的初创公司LiquidAI正走出一条不同寻常的道路,他们宣称目标是探索超越生成式预训练Transformer,GPT,基础模型的方法,并推出了其...。
更新时间:2024-10-02 05:02:02
摘要,本文介绍了上海交通大学和上海人工智能实验室智慧医疗联合团队在医疗语言大模型领域的最新进展,针对当前大语言模型在处理非英语问题时效果不佳的问题,该团队通过构建多语言医疗语料库MMedC、开发全面的多语言医疗问答评测标准MMedBench以及推出全新的基座模型MMed,Llama3,取得了显著的研究成果,该团队所构建的语料库包含多种...。
更新时间:2024-09-29 21:21:38
机器之心报道今天凌晨,机器之心编辑部见证了一个科技圈的大新闻,被誉为,真·OpenAI,的Meta团队在年度大会MetaConnect2024上,对旗下人工智能模型LLama进行了重大更新,这一次,无论是在学术界还是产业界,都引起了广泛的关注和热议,Meta推出了新一代LLama模型——LLama11B和90B,这两款模型的最大亮点是...。
更新时间:2024-09-26 16:58:04
标题,指令调优的隐式学习与语言模型的适应性调整正文,机器之心报道编辑,杜伟、陈近年来,指令调优,InstructionTuning,作为优化技术中的新星备受关注,通过对模型的输入进行微调,使其更好地适应特定任务,指令调优显著提升了语言模型的性能,先前的研究已经表明,指令调优的样本效率相当高,仅需大约1000个指令,响应对或精心制作的提...。
更新时间:2024-09-26 16:56:18