2024-03-24

 

 

  • 摘要: 本文研究了在K-12级科学教育中使用大型语言模型(LLMs)对短答案评分及解释。研究采用GPT-4结合少量样本学习和活跃学习,通过人机协作提供有意义的评估反馈。

 

 

  • 摘要: 研究评估多模态大型语言模型(MLLMs)在视觉数学问题解答中的能力。通过创建MathVerse基准,收集并转换2,612个含图表的数学题,提出链式思考评估策略,深入分析MLLMs的理解和推理过程。

 

 

  • 摘要: 本文综述了高效微调大型模型的方法。介绍了各种参数高效微调(PEFT)算法,分析了它们的性能和计算成本,并探讨了减少PEFT计算成本的技术。

 

 

  • 摘要: 本研究旨在个性化视觉语言模型(VLMs),通过外部概念头学习用户特定概念,实现个性化图像标题生成和视觉问答。

 

 

  • 摘要: PSALM通过引入掩码解码器和输入模式,扩展了大型多模态模型(LMM),解决图像分割任务。支持多数据集联合训练,提升了模型性能和任务泛化能力,在多个基准测试中取得优异成绩,并展现出对未见任务的零样本能力。

 

 

  • 摘要: 本文旨在评估基于多选题数据训练的大型语言模型在医学科目分类中的效能。通过深度神经网络,我们的MQ Sequence-BERT方法在MedMCQA数据集上超越了最新成果,开发集和测试集的准确率分别达到0.68和0.60。

 

 

  • 摘要: 本研究提出了RAmBLA框架,用以评估在生物医学领域中作为助手的大型语言模型(LLMs)的可靠性。通过设计模拟真实用户互动的任务,采用语义相似度评估LLMs的表现。

 

 

  • 摘要: 谷歌引领了一场AI发展的革命性转变,实现了大型语言模型(LLMs)之间的社会学习。这一进步受到人类社会学习方式的启发,标志着AI技术在模仿人类学习行为方面迈出了重要一步。

 

 

  • 摘要: 本文提出了‘语义解码’新视角,将大型语言模型(LLMs)视为语义处理器,通过优化语义空间内的交互来构建高效输出,探讨了在语义令牌空间内的优化潜力。

 

 

  • 摘要: 本文提出了一种基于熵的动态温度(EDT)采样方法,通过动态选择温度参数,有效平衡了大型语言模型生成任务的质量和多样性,并在不同基准测试中显示出显著优势。

 

 

  • 摘要: 本文提出Cobra模型,将Mamba语言模型扩展到视觉模态,通过线性计算复杂度提升多模态大型语言模型的效率。Cobra在保持竞争性能的同时,参数量仅为LLaVA的43%,并将代码开源。

 

 

  • 摘要: RankPrompt在人工智能领域取得革命性进展,通过自主评估机制显著提高了大型语言模型(LLMs)的准确性和效率。这标志着对人工智能精细化追求的又一重要里程碑。

 

 

  • 摘要: 清华大学联合微软开发的LLMLingua-2大型语言模型采用了任务不可知技术,通过数据蒸馏和提示压缩方法,实现了在处理语言任务时的高效率。该模型的创新方法重新定义了大型语言模型的运行效率,对未来的自然语言处理技术发展具有重要意义。

 

 

  • 摘要: HyperGAI的研究人员开发了Hyper Pretrained Transformers(HPT),这是一种全新的多模态语言模型。HPT能够处理不同类型的数据,为处理和理解多种形式的信息提供了强大的支持,标志着在人工智能领域的一大进步。

 

 

  • 摘要: 《npj Precision Oncology》一文报道,自2022年以来,人工智能(AI)技术在大型语言模型和多模态基础模型方面取得了巨大进步,这对肿瘤学领域产生了深远影响。这些进展为精准肿瘤治疗提供了新的工具和方法,有望改善癌症患者的治疗效果和生活质量。

 

 

  • 摘要: 谷歌的研究人员提出,通过采用直接推理而非预翻译的方式,可以提升大型语言模型的性能。他们认为,直接处理原始语言数据,而不是先将其翻译成中间语言,有助于模型更准确地理解和生成文本。

 

 

  • 摘要: 据最新消息,谷歌正准备推出一个名为Gemini的巨型语言模型(LLM)。尽管如此,人工智能产业目前正面临一个趋势转变,即从大型生成性AI模型向更小型、更精简的模型过渡。这一变化可能意味着像Gemini这样的巨型模型将变得较为罕见。

 

 

  • 摘要: 近日,Fairly Trained宣布推出具有里程碑意义的大型语言模型KL3M。这是首个获得“Licensed Model (L) Certification”认证的语言模型,标志着AI领域的一个重要进展。KL3M的推出预示着语言模型的发展进入了一个全新的、经过公正训练认证的时代。

 

 

  • 摘要: LLM4Decompile项目发布了一系列开源的大型语言模型,专注于提高反编译代码的可执行性和可重编译性。这意味着该模型能够将编译后的机器代码更准确地转换回源代码,有助于软件开发和安全分析等领域的工作。

 

 

  • 摘要: 乐天集团作为其AI化倡议的一部分,发布了针对日语优化的开放式大型语言模型(LLMs)。这些高性能的语言模型旨在实现在各个领域中广泛应用人工智能技术,推动技术进步和创新。

 

 

  • 摘要: Butternut AI是首款AI网站生成器,只需输入商业名称和关键词,即可快速打造定制化、响应式、内置SEO的多页面网站。

 

 

  • 摘要: SEO AI Writer是一款自动化工具,能通过分析谷歌搜索结果来创建博客内容。它能够制定结构化大纲,整合关键词以优化文章,并生成相关图片,提高内容的SEO友好度。

 

 

  • 摘要: Claros是一款AI购物助手,旨在快速帮助用户在线找到更好的产品。该工具能够省去长时间的购物研究,提供比其他市场更加相关的商品推荐。

 

 

  • 摘要: Alfred 5.5更新发布,新增Grid、Text、Image和PDF视图,使搜索结果更加直观生动。此版本重磅整合了ChatGPT与DALL-E,极大丰富了用户体验。

 

 

  • 摘要: Legitt AI合同生成器是一款AI驱动的工具,能够在几秒内快速起草合同。该工具支持针对特定用例和需求的定制训练,提高合同制作的效率和准确性。

 

 

  • 摘要: DataDepot是一款先进的AI研究工具,旨在帮助用户通过自然语言快速找到信息,并整合多家领先数据供应商的数据集,实时获取新见解。

 

 

  • 摘要: QuizWizard AI能将视频、文章或谷歌文档一键转化为互动式AI测验。轻松嵌入网站,提升用户参与度,转化为邮件订阅者。

 

 

  • 摘要: Devika是一款开源AI软件工程师,能理解人类指令,研究信息并编写代码。它是Cognition AI的Devin的竞争对手,使用Python语言编写。

 

 

  • 摘要: Lightning-AI项目旨在通过Thunder源码编译器,实现PyTorch模型的快速加速。它支持多种硬件执行器同时使用,使用Python语言编写。

 

 

  • 摘要: Unit-Mesh是一款AI编程向导,支持多语言,能自动生成代码,辅助修复bug。它还能自定义提示,并具备开发、测试、文档自动化功能。该项目使用Kotlin语言编写。

 

 

  • 摘要: Janhq项目是ChatGPT的开源替代品,能够完全离线运行在个人电脑上。该项目使用TypeScript语言编写,旨在提供一个不依赖互联网的智能对话体验。

 

 

  • 摘要: dotnet-smartcomponents项目旨在为.NET应用程序提供全面的人工智能功能。该项目实验性地集成了端到端AI特性,虽然未标明编写语言,但专为.NET环境设计。

 

 

  • 摘要: SakanaAI是一个Github上的AI趋势项目,专注于利用进化算法优化模型合并策略。该项目使用Python语言编写,旨在通过自动化搜索最佳合并方案,提高模型性能。

发表回复

后才能键入