• GluonCV 0.7:下一代主干网络ResNeSt

    自从2012年ImageNet比赛冠军AlexNet推出以来,预训练的图像分类神经网络通常会被用于处理其他下游任务如目标检测,语义分割,实例分割或姿态估计。因为这类网络由各种任务共享,我们一般称其为“主干网络”。 尽管最近有大量的新型主干网络涌现,在ImageNet的分类精度上也取得了长足进步,但大部分最新的下游任务的研究依然在使用ResNet。ResNet虽然发表于2015年,但仍能经久不...

  • AWS AI全面助力视频理解,GluonCV 0.6轻松复现前沿模型

    视频理解是近几年非常流行的研究方向,因为视频是最接近于人眼的真实输入,分析时间序列上的图像变化有助于我们开发更强的计算机视觉。而在视频理解领域,最具代表性的研究方向就是动作识别。区别于以往的大部分图像任务,动作识别的主体是动作,而不是物体,比如唱,跳,rap,篮球。 所以动作识别功能可以为我们做些什么呢?现在大部分手机相册都会自动标注照片,把图片分为家庭,自拍,庆祝等等类别,方便查找。...

  • GluonCV v0.5:15个新模型

    在用心听取用户反馈后,我们如愿在 GluonCV 0.5版带来如下的新特性: 新任务:视频人体行为识别 新模型:MobileNetV3-Large(Top-1 accuracy: 75.3)和 MobileNetV3-Small(Top-1 accuracy: 67.7) 新模型:更多 INT8 量化的语义分割模型 新模型:用于姿态估计的 AlphaPose 模型 新...

  • GluonNLP v0.7.1——BERT新装上阵

    GluonNLP [7] 再次升级!我们的0.7版本提供了在大型语料库上进行了预训练的BERT Base模型,其性能可与原论文中提供的BERT Large模型媲美。其他亮点包括在不同专业领域语料库上训练后的BERT、新模型(ERNIE、GPT-2、ESIM等)以及更多数据集。完整的发布文档请猛击这里。 自从BERT进入NLP领域,整个NLP社区涌现了许多用于特定数据集和特定场景的BERT变...

  • 神经网络推理加速之模型量化

    1. 引言 在深度学习中,推理是指将一个预先训练好的神经网络模型部署到实际业务场景中,如图像分类、物体检测、在线翻译等。由于推理直接面向用户,因此推理性能至关重要,尤其对于企业级产品而言更是如此。 衡量推理性能的重要指标包括延迟(latency)和吞吐量(throughput)。延迟是指完成一次预测所需的时间,吞吐量是指单位时间内处理数据的数量。低延迟和高吞吐量能够保证良好的用户体验和工...

  • 预知未来——Gluon时间序列工具包(GluonTS)

    我们很高兴地在此宣布Gluon Time Series(GluonTS)正式开源了!GluonTS是一个由亚马逊的科学家们开发的,用于构建、评估以及比较基于深度学习的时间序列模型的python工具包。GluonTS基于Apache MXNet的Gluon接口,为搭建时间序列模型提供更简洁高效的组件。本文将介绍GluonTS工具包的关键功能,并演示如何应用GluonTS来解决时间序列预测问题。...

  • GluonCV v0.4:更多更快

    GluonCV 0.3 版提供大量超越原论文精度的模型。0.4 版在此基础上引入了: 新应用:全新的人体关键点检测模型 更快的部署:新增 Int8 部署和经济适用型的删减版 ResNet(Pruned ResNet)系列 更强的预训练模型:ResNext, SE_ResNext 模型系列(各种 80%~81+% 准确度的 ImageNet 预训练模型) 支持 FPN 的 ...

  • GluonNLP v0.6:让可复现的BERT模型走到你身边

    BERT 模型正在自然语言处理领域大杀特杀!例如,BERT 模型在包含9种任务的 GLUE 基准测试上将得分从 72.7 提高到了 80.5 ——这是最新的重大突破 [6]。 虽然 BERT 模型很好很强大,GluonNLP 小分队却没有找到任何开源代码能够同时: 提供可扩展的GPU预训练 复现各种任务上的结果 支持模型输出和部署 为了解决以上所有的痛点,GluonNLP...