Skip to content

Latest commit

 

History

History
512 lines (469 loc) · 58.1 KB

README_CN.md

File metadata and controls

512 lines (469 loc) · 58.1 KB

MindSpore Logo

欢迎来到MindSpore ModelZoo

MindSpore models仓中提供了不同任务领域,经典的SOTA模型实现和端到端解决方案。目的是方便MindSpore用户更加方便的利用MindSpore进行研究和产品开发。

为了让开发者更好地体验MindSpore框架优势,我们将陆续增加更多的典型网络和相关预训练模型。如果您对ModelZoo有任何需求,请通过GiteeMindSpore与我们联系,我们将及时处理。

目录 描述
official • 官方维护,随MindSpore版本迭代更新,保证版本出口网络的精度效果
• 推荐写法,使用最新的MindSpore接口和推荐使用的特性,在保证代码可读性的基础上,有更快的性能表现
• 有详细的网络信息和说明文档,包含但不限于模型说明,数据集使用,规格支持,精度性能数据,网络checkpoint文件,MindIR文件等
research • 历史支持,测试验收通过的模型,在README里标明支持的MindSpore版本
• 按需维护,内容不会随版本迭代更新,只会适配对应的接口变更,由MindSpore开发人员进行维护支持,按需进行维护升级
• 提供较为详细的网络信息和说明文档,包含但不限于模型说明,数据集使用,规格支持,精度数据,网络checkpoint文件,MindIR文件等
community • 生态开发者贡献模型,按需进行维护升级,在README里说明支持的MindSpore版本
• 不强制提供模型文件
  • 使用最新MindSpore API的SOTA模型

  • MindSpore优势

  • 官方维护和支持

目录

官方网络

领域 子领域 网络 Ascend GPU CPU
语音 声纹识别 ecapa_tdnn
语音 语音合成 lpcnet
语音 语音合成 melgan
语音 语音合成 tacotron2
图神经网络 文本分类 bgcf
图神经网络 文本分类 gat
图神经网络 文本分类 gcn
推荐 推荐系统 naml
推荐 推荐系统 ncf
推荐 推荐系统 tbnet
图像 图像分类 alexnet
图像 图像去噪 brdnet
图像 目标检测 centerface
图像 图像分类 cnn_direction_model
图像 文本识别 cnnctc
图像 文本识别 crnn
图像 文本识别 crnn_seq2seq_ocr
图像 图像分类 cspdarknet53
图像 目标检测 ctpn
图像 目标检测 darknet53
图像 语义分割 deeplabv3
图像 文本检测 deeptext
图像 图像分类 densenet100
图像 图像分类 densenet121
图像 深度估计 depthnet
图像 图像去噪 dncnn
图像 图像分类 dpn
图像 文本检测 east
图像 图像分类 efficientnet
图像 图像分类 erfnet
图像 文本识别 essay-recogination
图像 目标检测 FasterRCNN_Inception_Resnetv2
图像 目标检测 FasterRCNN_ResNetV1.5_50
图像 目标检测 FasterRCNN_ResNetV1_101
图像 目标检测 FasterRCNN_ResNetV1_152
图像 目标检测 FasterRCNN_ResNetV1_50
图像 语义分割 fastscnn
图像 语义分割 FCN8s
图像 图像分类 googlenet
图像 图像分类 inceptionv3
图像 图像分类 inceptionv4
图像 图像去噪 LearningToSeeInTheDark
图像 图像分类 lenet
图像 目标检测 maskrcnn_resnet50
图像 目标检测 maskrcnn_mobilenetv1
图像 人群计数 MCNN
图像 图像分类 mobilenetv1
图像 图像分类 mobilenetv2
图像 图像分类 mobilenetv3
图像 图像分类 nasnet
图像 图像质量评估 nima
图像 点云模型 octsqueeze
图像 关键点检测 openpose
图像 缺陷检测 patchcore
图像 相机重定位 posenet
图像 视频预测学习 predrnn++
图像 文本检测 psenet
图像 姿态估计 pvnet
图像 光流估计 pwcnet
图像 图像超分 RDN
图像 图像分类 resnet101
图像 图像分类 resnet152
图像 图像分类 resnet18
图像 图像分类 resnet34
图像 图像分类 resnet50
图像 图像分类 resnet50_thor
图像 图像分类 resnext101
图像 图像分类 resnext50
图像 目标检测 retinaface_resnet50
图像 目标检测 retinanet
图像 图像分类 se_resnext50
图像 图像抠图 semantic_human_matting
图像 图像分类 se-resnet50
图像 图像分类 shufflenetv1
图像 图像分类 shufflenetv2
图像 图像分类 simclr
图像 关键点检测 simple_pose
图像 目标检测 sphereface
图像 图像分类 squeezenet
图像 图像分类 SqueezeNet_Residual
图像 图像超分 srcnn
图像 目标检测 ssd_mobilenet-v1-fpn
图像 目标检测 ssd_mobilenet-v2
图像 目标检测 ssd-resnet50-fpn
图像 目标检测 ssd-vgg16
图像 缺陷检测 ssim-ae
图像 图像分类 tinydarknet
图像 语义分割 UNet_nested
图像 语义分割 unet2d
图像 语义分割 unet3d
图像 图像分类 vgg16
图像 图像分类 vit
图像 文本识别 warpctc
图像 图像分类 xception
图像 目标检测 yolov3_darknet53
图像 目标检测 yolov3_resnet18
图像 目标检测 yolov4
图像 目标检测 yolov5s
推荐 点击率预测 deep_and_cross
推荐 点击率预测 deepfm
推荐 点击率预测 fibinet
推荐 点击率预测 wide_and_deep
推荐 点击率预测 wide_and_deep_multitable
文本 自然语言理解 bert_base
文本 自然语言理解 bert_bilstm_crf
文本 自然语言理解 bert_finetuning
文本 自然语言理解 bert_large
文本 自然语言理解 bert_nezha
文本 自然语言理解 cpm
文本 对话 dgu
文本 对话 duconv
文本 情绪分类 emotect
文本 自然语言理解 ernie
文本 自然语言理解 fasttext
文本 自然语言理解 gnmt_v2
文本 自然语言理解 gpt3
文本 自然语言理解 gru
文本 情绪分类 lstm
文本 自然语言理解 mass
文本 预训练 pangu_alpha
文本 自然语言理解 textcnn
文本 自然语言理解 tinybert
文本 自然语言理解 transformer
视频 目标追踪 ADNet
视频 视频分类 c3d
视频 目标追踪 Deepsort

研究网络

领域 子领域 网络 Ascend GPU CPU
3D 三维重建 cmr
3D 三维重建 DecoMR
3D 三维重建 DeepLM
3D 三维重建 eppmvsnet
3D 三维物体检测 pointpillars
语音 语音识别 ctcmodel
语音 语音识别 deepspeech2
语音 语音唤醒 dscnn
语音 语音合成 FastSpeech
语音 语音标注 fcn-4
语音 语音识别 jasper
语音 语音合成 wavenet
图神经网络 图分类 dgcn
图神经网络 文本分类 hypertext
图神经网络 图分类 sdne
图神经网络 社会和信息网络 sgcn
图神经网络 文本分类 textrcnn
高性能计算 高性能计算 deepbsde
高性能计算 高性能计算 molecular_dynamics
高性能计算 高性能计算 ocean_model
高性能计算 高性能计算 pafnucy
高性能计算 高性能计算 pfnn
高性能计算 高性能计算 pinns
图像 图像分类 3D_DenseNet
图像 语义分割 3dcnn
图像 语义分割 adelaide_ea
图像 文本检测 advanced_east
图像 风格转移 aecrnet
图像 重新识别 AlignedReID
图像 重新识别 AlignedReID++
图像 姿态估计 AlphaPose
图像 风格转移 APDrawingGAN
图像 风格转移 ArbitraryStyleTransfer
图像 目标检测 arcface
图像 关键点检测 ArtTrack
图像 风格转移 AttGAN
图像 图像分类 augvit
图像 图像分类 autoaugment
图像 语义分割 Auto-DeepLab
图像 神经架构搜索 AutoSlim
图像 图像分类 AVA_cifar
图像 图像分类 AVA_hpa
图像 图像分类 cait
图像 目标检测 CascadeRCNN
图像 图像分类 CBAM
图像 图像分类 cct
图像 关键点检测 centernet
图像 关键点检测 centernet_det
图像 关键点检测 centernet_resnet101
图像 关键点检测 centernet_resnet50_v1
图像 图像生成 CGAN
图像 图像分类 convnext
图像 图像超分 csd
图像 图像生成 CTSDG
图像 风格转移 CycleGAN
图像 图像超分 DBPN
图像 图像超分 DBPN_GAN
图像 图像生成 dcgan
图像 重新识别 DDAG
图像 语义分割 DDM
图像 语义分割 DDRNet
图像 目标检测 DeepID
图像 语义分割 deeplabv3plus
图像 图像检索 delf
图像 零样本学习 dem
图像 目标检测 detr
图像 语义分割 dgcnet_res101
图像 实例分割 dlinknet
图像 图像去噪 DnCNN
图像 图像分类 dnet_nas
图像 图像分类 DRNet
图像 图像超分 EDSR
图像 目标检测 EfficientDet_d0
图像 图像分类 efficientnet-b0
图像 图像分类 efficientnet-b1
图像 图像分类 efficientnet-b2
图像 图像分类 efficientnet-b3
图像 图像分类 efficientnetv2
图像 显著性检测 EGnet
图像 语义分割 E-NET
图像 图像超分 esr_ea
图像 图像超分 ESRGAN
图像 图像分类 FaceAttribute
图像 目标检测 faceboxes
图像 目标检测 FaceDetection
图像 人脸识别 FaceNet
图像 图像分类 FaceQualityAssessment
图像 目标检测 FaceRecognition
图像 目标检测 FaceRecognitionForTracking
图像 目标检测 faster_rcnn_dcn
图像 图像抠图 FCANet
图像 图像分类 FDA-BNN
图像 图像分类 fishnet99
图像 光流估计 flownet2
图像 图像生成 gan
图像 图像分类 GENet_Res50
图像 图像分类 ghostnet
图像 图像分类 ghostnet_d
图像 图像分类 glore_res200
图像 图像分类 glore_res50
图像 图像分类 hardnet
图像 边缘检测 hed
图像 图像生成 HiFaceGAN
图像 图像分类 HourNAS
图像 图像分类 HRNetW48_cls
图像 语义分割 HRNetW48_seg
图像 图像分类 ibnnet
图像 语义分割 ICNet
图像 图像分类 inception_resnet_v2
图像 图像分类 Inceptionv2
图像 图像抠图 IndexNet
图像 图像生成 IPT
图像 图像超分 IRN
图像 图像分类 ISyNet
图像 图像分类 ivpf
图像 图像去噪 LearningToSeeInTheDark
图像 元学习 LEO
图像 目标检测 LightCNN
图像 图像超分 lite-hrnet
图像 图像分类 lresnet100e_ir
图像 目标检测 m2det
图像 自编码 mae
图像 元学习 MAML
图像 文本识别 ManiDP
图像 人脸识别 MaskedFaceRecognition
图像 元学习 meta-baseline
图像 重新识别 MGN
图像 深度估计 midas
图像 图像去噪 MIMO-UNet
图像 图像分类 mnasnet
图像 图像分类 mobilenetv3_large
图像 图像分类 mobilenetV3_small_x1_0
图像 图像分类 MultiTaskNet
图像 重新识别 MVD
图像 目标检测 nas-fpn
图像 图像去噪 Neighbor2Neighbor
图像 图像分类 NFNet
图像 图像质量评估 nima_vgg16
图像 语义分割 nnUNet
图像 图像分类 ntsnet
图像 语义分割 OCRNet
图像 重新识别 osnet
图像 显著性检测 PAGENet
图像 图像检索 pcb
图像 图像检索 pcb
图像 图像检索 pcb_rpp
图像 图像分类 PDarts
图像 图像生成 PGAN
图像 图像生成 Pix2Pix
图像 图像超分 Pix2PixHD
图像 图像分类 pnasnet
图像 点云模型 pointnet
图像 点云模型 pointnet2
图像 图像分类 PoseEstNet
图像 图像分类 ProtoNet
图像 图像分类 proxylessnas
图像 语义分割 PSPNet
图像 显著性检测 ras
图像 图像超分 RCAN
图像 目标检测 rcnn
图像 图像超分 REDNet30
图像 目标检测 RefineDet
图像 语义分割 RefineNet
图像 重新识别 ReIDStrongBaseline
图像 图像分类 relationnet
图像 图像分类 renas
图像 语义分割 repvgg
图像 语义分割 res2net_deeplabv3
图像 目标检测 res2net_faster_rcnn
图像 目标检测 res2net_yolov3
图像 图像分类 res2net101
图像 图像分类 res2net152
图像 图像分类 res2net50
图像 图像分类 ResNeSt50
图像 图像分类 resnet50_adv_pruning
图像 图像分类 resnet50_bam
图像 图像分类 ResNet50-Quadruplet
图像 图像分类 ResNet50-Triplet
图像 图像分类 ResnetV2_101
图像 图像分类 ResnetV2_152
图像 图像分类 ResnetV2_50
图像 图像分类 resnetv2_50_frn
图像 图像分类 resnext152_64x4d
图像 目标检测 retinaface_mobilenet0.25
图像 目标检测 retinanet_resnet101
图像 目标检测 retinanet_resnet152
图像 目标检测 rfcn
图像 图像分类 SE_ResNeXt50
图像 图像分类 senet_resnet101
图像 图像分类 senet_resnet50
图像 图像分类 se-res2net50
图像 图像分类 S-GhostNet
图像 姿态估计 simple_baselines
图像 图像生成 SinGAN
图像 图像分类 single_path_nas
图像 图像分类 sknet
图像 图像分类 snn_mlp
图像 目标检测 Spnas
图像 图像分类 SPPNet
图像 图像分类 squeezenet
图像 图像超分 sr_ea
图像 图像超分 SRGAN
图像 图像分类 ssc_resnet50
图像 目标检测 ssd_ghostnet
图像 目标检测 ssd_inception_v2
图像 目标检测 ssd_inceptionv2
图像 目标检测 ssd_mobilenetV2
图像 目标检测 ssd_mobilenetV2_FPNlite
图像 目标检测 ssd_resnet_34
图像 目标检测 ssd_resnet34
图像 目标检测 ssd_resnet50
图像 姿态估计 StackedHourglass
图像 图像生成 StarGAN
图像 图像生成 STGAN
图像 交通预测 stgcn
图像 图像分类 stpm
图像 图像分类 swin_transformer
图像 时间定位 tall
图像 图像分类 TCN
图像 文本检测 textfusenet
图像 交通预测 tgcn
图像 图像分类 tinynet
图像 图像分类 TNT
图像 目标检测 u2net
图像 图像生成 U-GAT-IT
图像 语义分割 UNet3+
图像 重新识别 VehicleNet
图像 图像分类 vgg19
图像 图像分类 ViG
图像 图像分类 vit_cifar
图像 语义分割 vnet
图像 图像分类 wave_mlp
图像 图像超分 wdsr
图像 图像生成 wgan
图像 图像分类 wideresnet
图像 实例分割 Yolact++
图像 目标检测 yolov3_tiny
图像 目标检测 yolox
多模态 多模态 opt
多模态 多模态 TokenFusion
多模态 多模态 wukong
推荐 点击率预测 autodis
推荐 点击率预测 DIEN
推荐 点击率预测 dlrm
推荐 点击率预测 EDCN
推荐 点击率预测 Fat-DeepFFM
推荐 点击率预测 mmoe
文本 自然语言理解 albert
文本 情绪分类 atae_lstm
文本 对话 dam
文本 语言模型 gpt2
文本 知识图嵌入 hake
文本 自然语言理解 ktnet
文本 命名实体识别 lstm_crf
文本 自然语言理解 luke
文本 知识图嵌入 rotate
文本 情绪分类 senta
文本 机器翻译 seq2seq
文本 词嵌入 skipgram
文本 机器翻译 speech_transformer
文本 预训练 ternarybert
文本 自然语言理解 tprr
文本 自然语言理解 transformer_xl
文本 知识图嵌入 transX
视频 视频分类 AttentionCluster
视频 其他 DYR
视频 视频分类 ecolite
视频 目标追踪 fairmot
视频 视频分类 I3D
视频 目标追踪 JDE
视频 视频分割 OSVOS
视频 视频分类 r2plus1d
视频 视频超分 rbpn
视频 视频分类 resnet3d
视频 目标追踪 SiamFC
视频 目标追踪 siamRPN
视频 视频分类 slowfast
视频 视频分类 stnet
视频 目标追踪 tracktor
视频 目标追踪 tracktor++
视频 视频分类 trn
视频 视频分类 tsm
视频 视频分类 tsn

Process finished with exit code 0

公告

2021.9.15 models独立建仓

models仓库由原mindspore仓库的model_zoo目录独立分离而来,新仓库不继承历史commit记录,如果需要查找历史提2021.9.15之前的提交,请到mindspore仓库进行查询。

关联站点

这里是MindSpore框架提供的可以运行于包括Ascend/GPU/CPU/移动设备等多种设备的模型库。

相应的专属于Ascend平台的多框架模型可以参考昇腾ModelZoo以及对应的代码仓

MindSpore相关的预训练模型可以在MindSpore hub下载中心.

免责声明

MindSpore仅提供下载和预处理公共数据集的脚本。我们不拥有这些数据集,也不对它们的质量负责或维护。请确保您具有在数据集许可下使用该数据集的权限。在这些数据集上训练的模型仅用于非商业研究和教学目的。

致数据集拥有者:如果您不希望将数据集包含在MindSpore中,或者希望以任何方式对其进行更新,我们将根据要求删除或更新所有公共内容。请通过GitHub或Gitee与我们联系。非常感谢您对这个社区的理解和贡献。

MindSpore已获得Apache 2.0许可,请参见LICENSE文件。

许可证

Apache 2.0许可证

FAQ

想要获取更多关于MindSpore框架使用本身的FAQ问题的,可以参考官网FAQ

  • Q: 直接使用models下的模型出现内存不足错误,例如Failed to alloc memory pool memory, 该怎么处理?

    A: 直接使用models下的模型出现内存不足的典型原因是由于运行模式(PYNATIVE_MODE)、运行环境配置、License控制(AI-TOKEN)的不同造成的:

    • PYNATIVE_MODE通常比GRAPH_MODE使用更多内存,尤其是在需要进行反向传播计算的训练图中,当前有2种方法可以尝试解决该问题。 方法1:你可以尝试使用一些更小的batch size; 方法2:添加context.set_context(mempool_block_size="XXGB"),其中,“XX”当前最大有效值可设置为“31”。 如果将方法1与方法2结合使用,效果会更好。
    • 运行环境由于NPU的核数、内存等配置不同也会产生类似问题。
    • License控制(AI-TOKEN)的不同档位会造成执行过程中内存开销不同,也可以尝试使用一些更小的batch size。
  • Q: 一些网络运行中报错接口不存在,例如cannot import,该怎么处理?

    A: 优先检查一下获取网络脚本的分支,与所使用的MindSpore版本是否一致,部分新分支中的模型脚本会使用一些新版本MindSpore才支持的接口,从而在使用老版本MindSpore时会发生报错.

  • Q: 一些模型描述中提到的RANK_TABLE_FILE文件,是什么?

    A: RANK_TABLE_FILE是一个Ascend环境上用于指定分布式集群信息的文件,更多信息可以参考生成工具hccl_toos分布式并行训练教程

  • Q: 在windows环境上要怎么运行网络脚本?

    A: 多数模型都是使用bash作为启动脚本,在Windows环境上无法直接使用bash命令,你可以考虑直接运行python命令而不是bash启动脚本 ,如果你确实想需要使用bash脚本,你可以考虑使用以下几种方法来运行模型:

    1. 使用虚拟环境,可以构造一个linux的虚拟机或docker容器,然后在虚拟环境中运行脚本
    2. 使用WSL,可以开启Windows的linux子系统来在Windows系统中运行linux,然后再WSL中运行脚本。
    3. 使用Windows Bash,需要获取一个可以直接在Windows上运行bash的环境,常见的选择是cygwingit bash
    4. 跳过bash脚本,直接调用python程序。
  • Q: 网络在310推理时出现编译失败,报错信息指向gflags,例如undefined reference to 'google::FlagRegisterer::FlagRegisterer',该怎么处理?

    A: 优先检查一下环境GCC版本和gflags版本是否匹配,可以参考官方链接安装对应的GCC版本,gflags安装gflags。你需要保证所使用的组件之间是ABI兼容的,更多信息可以参考_GLIBCXX_USE_CXX11_ABI

  • Q: 在Mac系统上加载mindrecord格式的数据集出错,例如Invalid file, failed to open files for reading mindrecord files.,该怎么处理?

    A: 优先使用ulimit -a检查系统限制,如果file descriptors数量为256(默认值),需要使用ulimit -n 1024将其设置为1024(或者更大的值)。之后再检查文件是否损坏或者被修改。

  • Q: 我在多台服务器构成的大集群上进行训练,但是得到的精度比预期要低,该怎么办?

    A: 当前模型库中的大部分模型只在单机内进行过验证,最大使用8卡进行训练。由于MindSpore训练时指定的batch_size是单卡的,所以当单机8卡升级到多机时,会导致全局的global_batch_size变大,这就导致需要针对当前多机场景的global_batch_size进行重新调参优化。