2025-05-12 17:41:47 热点 834
如果最近的用于言模发展有任何迹象,Facebook对更广泛的图像开发社区的承诺仍然如此强大。继1月开放图像处理库Spectrum,和语去年年底自然语言处理建模框架PyText以及11月人工智能强化学习平台Horizon之后,开源框架Facebook的深度人工智能研究部门今天宣布Pythia,一个模块化的学习型即插即用框架使数据科学家能够快速构建,复制和基准AI模型,用于言模现在可以在GitHub上免费获得。图像
正如Facebook在一篇博文中解释的和语那样,Pythia--它是开源框架在公司的PyTorch机器学习框架之上构建的 - 主要用于视觉和语言任务,例如回答与视觉数据相关的深度问题并自动生成图像标题。它结合了Facebook AI Research在人工智能竞赛中的学习型顶级参赛作品,如LoRRA,一个同时赢得VQA挑战2018和Vizwiz Challenge 2018的视觉和语言模型,它能够展示以前最先进的AI系统如何实现顶级基准测试结果并将其性能与新模型的性能进行比较。
Pythia还支持分布式培训和各种数据集,以及自定义损失,指标,调度和优化器。存在并考虑了具有常用视觉和语言层实现的模块,以及对分布式培训的支持; 内置语料库,包括VQA,VizWiz,TextVQA和VisualDialog; 和多任务处理等功能,可以一起训练多个语料库。
Facebook表示,它将扩展Pythia的初始开源版本,包括即将推出的工具,任务,数据集和参考模型。
“Pythia平滑了进入不断增长的视觉和语言子领域的过程,并使研究人员能够专注于更快的原型设计和实验。我们的目标是通过提高这些模型和结果的可重复性来加速进步,“Facebook在博客文章中写道。“这将使社区更容易在成功的系统上进行构建和基准测试。我们希望消除一些障碍将使研究人员能够更快地为人们和智能机器开发新的交流方式。这项工作还应该帮助研究人员开发自适应人工智能,将多种理解融合到更基于情境的多模式理解中。“
Pythia的首次亮相是在Facebook在旧金山举行的F8开发者峰会期间推出PyTorch 1.1几周之后,该峰会增加了对谷歌TensorBoard及其即时(JIT)编译器性能改进的支持。去年秋天GitHub的2018年Octoverse报告将PyTorch命名为GitHub上最受欢迎的开源项目之一,全球有超过3100万开发人员。
残疾人“两项补贴”标准再提标
崩坏星穹铁道七只机关鸟位置:详细攻略及分布
魔法觉醒黄油饮品爱好者彩蛋 7.9 位置分享及获取攻略
梦幻新诛仙山庄繁荣度提升攻略:具体方法有哪些?
国家医保局印发《长期护理保险失能等级评估机构定点管理办法》
脑力风暴 148 关怎么过 brainiton?通关攻略大揭秘
原神雪山密室及 3 个匣子位置全解析及获取技巧
萌宠娃娃机电脑版下载地址及安装说明:详细指南
全国先进工作者王帅 :躬耕杏坛三十载 甘做教育燃灯者
妈妈把我锁在家里了第 21 关怎么过?全关卡图文通关攻略大全
光遇 5.21 任务攻略详解 2022:如何高效完成任务?
OmegaStrikers射门传球守门怎么踢球?技巧与攻略大揭秘
国家医保局:医保药品耗材追溯信息查询功能上线
迷你西游真武大帝怎么获得?获取攻略大揭秘
德玛西亚皇子出装:如何搭配装备提升战斗力?
骑士精神 2 格挡使用注意什么?格挡使用注意事项分享
中消协发布《中国消费者权益保护状况年度报告(2023)》:新型消费领域消费者权益保护制度供给仍显不足
摩尔庄园手游6 月 30 日神奇密码及介绍
梦幻西游手游司药御侍助战如何?助战分析大揭秘
暖暖环游世界系列任务怎么完成?详细攻略大揭秘
我市一季度经济运行起步有力开局良好_
全民奇迹恶魔广场怎么玩?恶魔广场攻略(上):详细步骤解析
梦幻西游神狗与神猴哪个好?神狗与神猴选择推荐
光与夜之恋险境挑战关卡 2 怎么过?通关攻略大揭秘