每周AI和自然语言处理新闻-2023年6月12日

用强化学习发现更快的排序算法,LlamaIndex获得资金支持。

ChatGPT中文站
Image from Midjourney

这是由NLPlanet为您挑选的有关NLP和AI的每周文章、指南和新闻!

? 网络新闻

  • AlphaDev 发现了更快的排序算法。AlphaDev 是一个使用增强学习的 AI 系统,它通过从头开始选择计算机汇编指令来开发更快的排序算法,以对数据进行整理。新的算法对于较短序列可以快达 70%,并集成到 LLVM libc++ 标准库中。
  • 为LLMs构建数据框架。LlamaIndex已经获得了850万美元的种子融资,并开发出一套工具包,可以将用户数据与LLMs集成,从而创建出知识密集型的LLM应用程序,如搜索引擎、聊天机器人和分析助手。该项目在Github上拥有16K个星标、20K个Twitter关注者和200K个月度下载量,以及6K个活跃的Discord用户,其表现令人印象深刻。
  • Bard在逻辑和推理方面越来越进步。谷歌将先进的语言模型与传统代码相结合,以增强Bard的推理和数学能力。这种新的隐式代码执行方法将其准确性提高了30%。
  • ChatGPT登陆iPad,添加对Siri和Shortcuts的支持。OpenAI的最新应用更新允许iPad用户使用Siri和Shortcuts与ChatGPT交互,为其提供定制化的快捷方式, 以实现免提操作。苹果公司已更新其应用商店规则,以防止提交ChatGPT克隆应用。
  • RedPajama 7B现已上市,指导模型在HELM基准测试中表现优于所有开放的7B模型。推出新的RedPajama-INCITE模型,针对少样本任务进行了优化,表现优于HELM基准测试中类似的模型。该项目分析了与先前模型的差异,并融合了社区反馈意见。该模型可供AI专业人士使用,遵循Apache 2.0许可证。
  • 生成式 AI 学习路径,由 Google 提供。Google 最新开设的生成式 AI 学习路径覆盖了从大型语言模型到在 Google Cloud 上部署解决方案的所有内容,包括课程内容涵盖负责任的 AI、图像生成、高级主题以及一项任务探索在 Vertex AI 中使用生成式 AI Explorer。
  • 日本全力以赴:版权不适用于人工智能训练。日本宣布不再强制执行用于人工智能训练的数据版权,允许不受干扰地进行人工智能研究并与西方进行竞争。

? 来自网络的指南

  • ? 打开LLM排行榜。开放式LLM排行榜允许研究人员提交变压器模型进行GPU集群上的自动评估,以跟踪大型语言模型和聊天机器人的进展。排行榜在各种任务上测试这些模型,包括科学问题、推理、多任务准确度和真实答案。这是一个有用的资源,可帮助您保持最新状态并比较LLM和聊天机器人模型。
  • AI 创业公司易于被复制吗? AI 创业公司面临激烈竞争,投资者担心它们在高度饱和的市场中区分自己的能力。风险投资家寻求网络效应和专有数据集,投资于成功的 AI 初创企业,这些企业能够快速获得发展势头。
  • 人工智能是否会毁掉股票行业?以数据为基础的角度来看。人工智能生成的图像正在改变股票行业,令一些机构像Adobe Stock的收益增长,但并不是所有机构都接受它们。目前还不太可能全面确定人工智能生成内容的影响,因为存在未知变数,而专业的人工智能工程师也很稀缺。
  • GPT 最佳实践。这份关于 GPT 最佳实践的指南讨论了有效使用 GPT 的策略和战术。它强调提供上下文和细节对于帮助 GPT 产生更好的结果的重要性,并建议策略,比如分解复杂任务和衡量性能。
  • 为什么人工智能会拯救世界。本文讨论了人工智能如何有潜力彻底改变各个领域,包括编程、医学、法律和艺术。虽然有担忧它的负面影响,但是如果发展得道德和安全,它的好处大于风险。人工智能可以增强人类智慧,帮助我们在各种活动领域中取得更好的成果,同时成为每个人的人工智能导师,最大限度地发挥他们的潜力。

? 有趣的论文和代码库

  • 视频-LLaMA:一种针对视频理解的指令优化视听语言模型。视频-LLaMA是一种新的用于视频理解的语言模型,建立在BLIP-2和MiniGPT-4之上。它由视听语言组件和音频语言组件构成,可以通过协助自动字幕、搜索和导航来提高视频可访问性。
  • 精细化人类反馈可为语言模型训练提供更好的奖励。本文将精细化 RLHF 介绍为一种改善语言模型输出质量的解决方案,提供明确的训练信号和为特定需求量身定制的详细奖励。该方法比传统方法实现了更好的性能。
  • 逐步学习GPT-4复杂解释痕迹的奥卡鲸。奥卡鲸是一个拥有130亿模型的项目,通过模仿学习提高AI模型的能力,在复杂推理基准测试中表现优异。它在LSAT、GMAT、SAT和GRE等专业和学术考试中也表现良好。
  • 简单可控的音乐生成。MUSIC GEN是一种单一的语言模型,它可以根据文本描述或旋律特征生成高质量音乐,并允许对输出进行控制。与以前的模型相比,它实现了卓越的质量,并使用了一种非监督的旋律调节技术来遵循特定的和谐和旋律结构。
  • 全局跟踪一次性跟踪一切。OmniMotion是一种新的运动估计方法,超越了传统的光流和粒子视频跟踪方法。它利用全局一致的运动表示来确保准确跟踪,估计每个像素的全长运动轨迹,并对相机和物体运动进行建模。在TAP-Vid基准测试和真实世界的镜头下,它在数量和质量上都表现优异。

感谢阅读!如果您想学习更多关于NLP的知识,请记得关注NLPlanet。您可以在LinkedIn,Twitter,Medium和我们的Discord服务器上找到我们!

2023-10-20 16:51:32 AI中文站翻译自原文