MindSpore models仓中提供了不同任务领域,经典的SOTA模型实现和端到端解决方案。目的是方便MindSpore用户更加方便的利用MindSpore进行研究和产品开发。
为了让开发者更好地体验MindSpore框架优势,我们将陆续增加更多的典型网络和相关预训练模型。如果您对ModelZoo有任何需求,请通过Gitee或MindSpore与我们联系,我们将及时处理。
目录 | 描述 |
---|---|
official | • 官方维护,随MindSpore版本迭代更新,保证版本出口网络的精度效果 • 推荐写法,使用最新的MindSpore接口和推荐使用的特性,在保证代码可读性的基础上,有更快的性能表现 • 有详细的网络信息和说明文档,包含但不限于模型说明,数据集使用,规格支持,精度性能数据,网络checkpoint文件,MindIR文件等 |
research | • 历史支持,测试验收通过的模型,在README里标明支持的MindSpore版本 • 按需维护,内容不会随版本迭代更新,只会适配对应的接口变更,由MindSpore开发人员进行维护支持,按需进行维护升级 • 提供较为详细的网络信息和说明文档,包含但不限于模型说明,数据集使用,规格支持,精度数据,网络checkpoint文件,MindIR文件等 |
community | • 生态开发者贡献模型,按需进行维护升级,在README里说明支持的MindSpore版本 • 不强制提供模型文件 |
-
使用最新MindSpore API的SOTA模型
-
MindSpore优势
-
官方维护和支持
领域 | 子领域 | 网络 | Ascend | GPU | CPU |
---|---|---|---|---|---|
语音 | 声纹识别 | ecapa_tdnn | ✅ | ||
语音 | 语音合成 | lpcnet | ✅ | ✅ | |
语音 | 语音合成 | melgan | ✅ | ✅ | |
语音 | 语音合成 | tacotron2 | ✅ | ||
图神经网络 | 文本分类 | bgcf | ✅ | ✅ | |
图神经网络 | 文本分类 | gat | ✅ | ✅ | |
图神经网络 | 文本分类 | gcn | ✅ | ✅ | |
推荐 | 推荐系统 | naml | ✅ | ✅ | |
推荐 | 推荐系统 | ncf | ✅ | ✅ | |
推荐 | 推荐系统 | tbnet | ✅ | ✅ | |
图像 | 图像分类 | alexnet | ✅ | ✅ | |
图像 | 图像去噪 | brdnet | ✅ | ||
图像 | 目标检测 | centerface | ✅ | ✅ | ✅ |
图像 | 图像分类 | cnn_direction_model | ✅ | ✅ | |
图像 | 文本识别 | cnnctc | ✅ | ✅ | ✅ |
图像 | 文本识别 | crnn | ✅ | ✅ | ✅ |
图像 | 文本识别 | crnn_seq2seq_ocr | ✅ | ||
图像 | 图像分类 | cspdarknet53 | ✅ | ||
图像 | 目标检测 | ctpn | ✅ | ✅ | |
图像 | 目标检测 | darknet53 | ✅ | ||
图像 | 语义分割 | deeplabv3 | ✅ | ✅ | ✅ |
图像 | 文本检测 | deeptext | ✅ | ✅ | |
图像 | 图像分类 | densenet100 | ✅ | ✅ | |
图像 | 图像分类 | densenet121 | ✅ | ✅ | |
图像 | 深度估计 | depthnet | ✅ | ||
图像 | 图像去噪 | dncnn | ✅ | ||
图像 | 图像分类 | dpn | ✅ | ✅ | |
图像 | 文本检测 | east | ✅ | ✅ | |
图像 | 图像分类 | efficientnet | ✅ | ✅ | |
图像 | 图像分类 | erfnet | ✅ | ✅ | |
图像 | 文本识别 | essay-recogination | ✅ | ||
图像 | 目标检测 | FasterRCNN_Inception_Resnetv2 | ✅ | ✅ | |
图像 | 目标检测 | FasterRCNN_ResNetV1.5_50 | ✅ | ✅ | |
图像 | 目标检测 | FasterRCNN_ResNetV1_101 | ✅ | ✅ | |
图像 | 目标检测 | FasterRCNN_ResNetV1_152 | ✅ | ✅ | |
图像 | 目标检测 | FasterRCNN_ResNetV1_50 | ✅ | ✅ | |
图像 | 语义分割 | fastscnn | ✅ | ||
图像 | 语义分割 | FCN8s | ✅ | ✅ | |
图像 | 图像分类 | googlenet | ✅ | ✅ | |
图像 | 图像分类 | inceptionv3 | ✅ | ✅ | ✅ |
图像 | 图像分类 | inceptionv4 | ✅ | ✅ | ✅ |
图像 | 图像去噪 | LearningToSeeInTheDark | ✅ | ||
图像 | 图像分类 | lenet | ✅ | ✅ | ✅ |
图像 | 目标检测 | maskrcnn_resnet50 | ✅ | ✅ | |
图像 | 目标检测 | maskrcnn_mobilenetv1 | ✅ | ✅ | ✅ |
图像 | 人群计数 | MCNN | ✅ | ✅ | |
图像 | 图像分类 | mobilenetv1 | ✅ | ✅ | |
图像 | 图像分类 | mobilenetv2 | ✅ | ✅ | ✅ |
图像 | 图像分类 | mobilenetv3 | ✅ | ✅ | ✅ |
图像 | 图像分类 | nasnet | ✅ | ✅ | |
图像 | 图像质量评估 | nima | ✅ | ✅ | |
图像 | 点云模型 | octsqueeze | ✅ | ✅ | |
图像 | 关键点检测 | openpose | ✅ | ||
图像 | 缺陷检测 | patchcore | ✅ | ✅ | |
图像 | 相机重定位 | posenet | ✅ | ✅ | |
图像 | 视频预测学习 | predrnn++ | ✅ | ||
图像 | 文本检测 | psenet | ✅ | ✅ | |
图像 | 姿态估计 | pvnet | ✅ | ||
图像 | 光流估计 | pwcnet | ✅ | ✅ | |
图像 | 图像超分 | RDN | ✅ | ✅ | |
图像 | 图像分类 | resnet101 | ✅ | ✅ | ✅ |
图像 | 图像分类 | resnet152 | ✅ | ✅ | ✅ |
图像 | 图像分类 | resnet18 | ✅ | ✅ | ✅ |
图像 | 图像分类 | resnet34 | ✅ | ✅ | ✅ |
图像 | 图像分类 | resnet50 | ✅ | ✅ | ✅ |
图像 | 图像分类 | resnet50_thor | ✅ | ✅ | |
图像 | 图像分类 | resnext101 | ✅ | ✅ | |
图像 | 图像分类 | resnext50 | ✅ | ✅ | |
图像 | 目标检测 | retinaface_resnet50 | ✅ | ||
图像 | 目标检测 | retinanet | ✅ | ✅ | |
图像 | 图像分类 | se_resnext50 | ✅ | ||
图像 | 图像抠图 | semantic_human_matting | ✅ | ||
图像 | 图像分类 | se-resnet50 | ✅ | ✅ | ✅ |
图像 | 图像分类 | shufflenetv1 | ✅ | ✅ | ✅ |
图像 | 图像分类 | shufflenetv2 | ✅ | ✅ | ✅ |
图像 | 图像分类 | simclr | ✅ | ✅ | |
图像 | 关键点检测 | simple_pose | ✅ | ✅ | |
图像 | 目标检测 | sphereface | ✅ | ✅ | |
图像 | 图像分类 | squeezenet | ✅ | ✅ | |
图像 | 图像分类 | SqueezeNet_Residual | ✅ | ✅ | |
图像 | 图像超分 | srcnn | ✅ | ✅ | |
图像 | 目标检测 | ssd_mobilenet-v1-fpn | ✅ | ✅ | ✅ |
图像 | 目标检测 | ssd_mobilenet-v2 | ✅ | ✅ | ✅ |
图像 | 目标检测 | ssd-resnet50-fpn | ✅ | ✅ | ✅ |
图像 | 目标检测 | ssd-vgg16 | ✅ | ✅ | ✅ |
图像 | 缺陷检测 | ssim-ae | ✅ | ||
图像 | 图像分类 | tinydarknet | ✅ | ✅ | ✅ |
图像 | 语义分割 | UNet_nested | ✅ | ✅ | |
图像 | 语义分割 | unet2d | ✅ | ✅ | |
图像 | 语义分割 | unet3d | ✅ | ✅ | |
图像 | 图像分类 | vgg16 | ✅ | ✅ | ✅ |
图像 | 图像分类 | vit | ✅ | ✅ | |
图像 | 文本识别 | warpctc | ✅ | ✅ | |
图像 | 图像分类 | xception | ✅ | ✅ | |
图像 | 目标检测 | yolov3_darknet53 | ✅ | ✅ | |
图像 | 目标检测 | yolov3_resnet18 | ✅ | ||
图像 | 目标检测 | yolov4 | ✅ | ||
图像 | 目标检测 | yolov5s | ✅ | ✅ | |
推荐 | 点击率预测 | deep_and_cross | ✅ | ||
推荐 | 点击率预测 | deepfm | ✅ | ✅ | |
推荐 | 点击率预测 | fibinet | ✅ | ||
推荐 | 点击率预测 | wide_and_deep | ✅ | ✅ | |
推荐 | 点击率预测 | wide_and_deep_multitable | ✅ | ✅ | |
文本 | 自然语言理解 | bert_base | ✅ | ✅ | |
文本 | 自然语言理解 | bert_bilstm_crf | ✅ | ✅ | |
文本 | 自然语言理解 | bert_finetuning | ✅ | ✅ | |
文本 | 自然语言理解 | bert_large | ✅ | ||
文本 | 自然语言理解 | bert_nezha | ✅ | ✅ | |
文本 | 自然语言理解 | cpm | ✅ | ✅ | |
文本 | 对话 | dgu | ✅ | ✅ | |
文本 | 对话 | duconv | ✅ | ✅ | |
文本 | 情绪分类 | emotect | ✅ | ✅ | |
文本 | 自然语言理解 | ernie | ✅ | ✅ | |
文本 | 自然语言理解 | fasttext | ✅ | ✅ | |
文本 | 自然语言理解 | gnmt_v2 | ✅ | ✅ | |
文本 | 自然语言理解 | gpt3 | ✅ | ||
文本 | 自然语言理解 | gru | ✅ | ✅ | |
文本 | 情绪分类 | lstm | ✅ | ✅ | |
文本 | 自然语言理解 | mass | ✅ | ✅ | |
文本 | 预训练 | pangu_alpha | ✅ | ✅ | |
文本 | 自然语言理解 | textcnn | ✅ | ✅ | |
文本 | 自然语言理解 | tinybert | ✅ | ✅ | |
文本 | 自然语言理解 | transformer | ✅ | ✅ | |
视频 | 目标追踪 | ADNet | ✅ | ||
视频 | 视频分类 | c3d | ✅ | ✅ | |
视频 | 目标追踪 | Deepsort | ✅ | ✅ |
领域 | 子领域 | 网络 | Ascend | GPU | CPU |
---|---|---|---|---|---|
3D | 三维重建 | cmr | ✅ | ||
3D | 三维重建 | DecoMR | ✅ | ||
3D | 三维重建 | DeepLM | ✅ | ||
3D | 三维重建 | eppmvsnet | ✅ | ||
3D | 三维物体检测 | pointpillars | ✅ | ✅ | |
语音 | 语音识别 | ctcmodel | ✅ | ||
语音 | 语音识别 | deepspeech2 | ✅ | ||
语音 | 语音唤醒 | dscnn | ✅ | ✅ | |
语音 | 语音合成 | FastSpeech | ✅ | ||
语音 | 语音标注 | fcn-4 | ✅ | ✅ | |
语音 | 语音识别 | jasper | ✅ | ✅ | |
语音 | 语音合成 | wavenet | ✅ | ✅ | |
图神经网络 | 图分类 | dgcn | ✅ | ||
图神经网络 | 文本分类 | hypertext | ✅ | ✅ | |
图神经网络 | 图分类 | sdne | ✅ | ||
图神经网络 | 社会和信息网络 | sgcn | ✅ | ✅ | |
图神经网络 | 文本分类 | textrcnn | ✅ | ✅ | |
高性能计算 | 高性能计算 | deepbsde | ✅ | ||
高性能计算 | 高性能计算 | molecular_dynamics | ✅ | ||
高性能计算 | 高性能计算 | ocean_model | ✅ | ||
高性能计算 | 高性能计算 | pafnucy | ✅ | ✅ | |
高性能计算 | 高性能计算 | pfnn | ✅ | ||
高性能计算 | 高性能计算 | pinns | ✅ | ||
图像 | 图像分类 | 3D_DenseNet | ✅ | ✅ | |
图像 | 语义分割 | 3dcnn | ✅ | ✅ | |
图像 | 语义分割 | adelaide_ea | ✅ | ||
图像 | 文本检测 | advanced_east | ✅ | ✅ | |
图像 | 风格转移 | aecrnet | ✅ | ✅ | |
图像 | 重新识别 | AlignedReID | ✅ | ||
图像 | 重新识别 | AlignedReID++ | ✅ | ✅ | |
图像 | 姿态估计 | AlphaPose | ✅ | ||
图像 | 风格转移 | APDrawingGAN | ✅ | ✅ | |
图像 | 风格转移 | ArbitraryStyleTransfer | ✅ | ✅ | |
图像 | 目标检测 | arcface | ✅ | ✅ | |
图像 | 关键点检测 | ArtTrack | ✅ | ||
图像 | 风格转移 | AttGAN | ✅ | ✅ | |
图像 | 图像分类 | augvit | ✅ | ||
图像 | 图像分类 | autoaugment | ✅ | ✅ | |
图像 | 语义分割 | Auto-DeepLab | ✅ | ||
图像 | 神经架构搜索 | AutoSlim | ✅ | ✅ | |
图像 | 图像分类 | AVA_cifar | ✅ | ✅ | |
图像 | 图像分类 | AVA_hpa | ✅ | ✅ | |
图像 | 图像分类 | cait | ✅ | ✅ | |
图像 | 目标检测 | CascadeRCNN | ✅ | ✅ | |
图像 | 图像分类 | CBAM | ✅ | ||
图像 | 图像分类 | cct | ✅ | ✅ | |
图像 | 关键点检测 | centernet | ✅ | ✅ | |
图像 | 关键点检测 | centernet_det | ✅ | ||
图像 | 关键点检测 | centernet_resnet101 | ✅ | ✅ | |
图像 | 关键点检测 | centernet_resnet50_v1 | ✅ | ||
图像 | 图像生成 | CGAN | ✅ | ✅ | |
图像 | 图像分类 | convnext | ✅ | ✅ | |
图像 | 图像超分 | csd | ✅ | ✅ | |
图像 | 图像生成 | CTSDG | ✅ | ||
图像 | 风格转移 | CycleGAN | ✅ | ✅ | |
图像 | 图像超分 | DBPN | ✅ | ||
图像 | 图像超分 | DBPN_GAN | ✅ | ||
图像 | 图像生成 | dcgan | ✅ | ✅ | |
图像 | 重新识别 | DDAG | ✅ | ✅ | |
图像 | 语义分割 | DDM | ✅ | ||
图像 | 语义分割 | DDRNet | ✅ | ✅ | |
图像 | 目标检测 | DeepID | ✅ | ✅ | |
图像 | 语义分割 | deeplabv3plus | ✅ | ✅ | |
图像 | 图像检索 | delf | ✅ | ||
图像 | 零样本学习 | dem | ✅ | ✅ | |
图像 | 目标检测 | detr | ✅ | ✅ | |
图像 | 语义分割 | dgcnet_res101 | ✅ | ||
图像 | 实例分割 | dlinknet | ✅ | ||
图像 | 图像去噪 | DnCNN | ✅ | ||
图像 | 图像分类 | dnet_nas | ✅ | ||
图像 | 图像分类 | DRNet | ✅ | ✅ | |
图像 | 图像超分 | EDSR | ✅ | ||
图像 | 目标检测 | EfficientDet_d0 | ✅ | ||
图像 | 图像分类 | efficientnet-b0 | ✅ | ||
图像 | 图像分类 | efficientnet-b1 | ✅ | ||
图像 | 图像分类 | efficientnet-b2 | ✅ | ✅ | |
图像 | 图像分类 | efficientnet-b3 | ✅ | ✅ | |
图像 | 图像分类 | efficientnetv2 | ✅ | ||
图像 | 显著性检测 | EGnet | ✅ | ✅ | |
图像 | 语义分割 | E-NET | ✅ | ✅ | |
图像 | 图像超分 | esr_ea | ✅ | ✅ | |
图像 | 图像超分 | ESRGAN | ✅ | ✅ | |
图像 | 图像分类 | FaceAttribute | ✅ | ✅ | |
图像 | 目标检测 | faceboxes | ✅ | ||
图像 | 目标检测 | FaceDetection | ✅ | ✅ | |
图像 | 人脸识别 | FaceNet | ✅ | ✅ | |
图像 | 图像分类 | FaceQualityAssessment | ✅ | ✅ | ✅ |
图像 | 目标检测 | FaceRecognition | ✅ | ✅ | |
图像 | 目标检测 | FaceRecognitionForTracking | ✅ | ✅ | ✅ |
图像 | 目标检测 | faster_rcnn_dcn | ✅ | ✅ | |
图像 | 图像抠图 | FCANet | ✅ | ||
图像 | 图像分类 | FDA-BNN | ✅ | ✅ | |
图像 | 图像分类 | fishnet99 | ✅ | ✅ | |
图像 | 光流估计 | flownet2 | ✅ | ||
图像 | 图像生成 | gan | ✅ | ✅ | |
图像 | 图像分类 | GENet_Res50 | ✅ | ||
图像 | 图像分类 | ghostnet | ✅ | ||
图像 | 图像分类 | ghostnet_d | ✅ | ✅ | |
图像 | 图像分类 | glore_res200 | ✅ | ✅ | |
图像 | 图像分类 | glore_res50 | ✅ | ✅ | |
图像 | 图像分类 | hardnet | ✅ | ✅ | |
图像 | 边缘检测 | hed | ✅ | ✅ | |
图像 | 图像生成 | HiFaceGAN | ✅ | ||
图像 | 图像分类 | HourNAS | ✅ | ||
图像 | 图像分类 | HRNetW48_cls | ✅ | ✅ | |
图像 | 语义分割 | HRNetW48_seg | ✅ | ||
图像 | 图像分类 | ibnnet | ✅ | ✅ | |
图像 | 语义分割 | ICNet | ✅ | ||
图像 | 图像分类 | inception_resnet_v2 | ✅ | ✅ | |
图像 | 图像分类 | Inceptionv2 | ✅ | ✅ | |
图像 | 图像抠图 | IndexNet | ✅ | ||
图像 | 图像生成 | IPT | ✅ | ||
图像 | 图像超分 | IRN | ✅ | ✅ | |
图像 | 图像分类 | ISyNet | ✅ | ✅ | |
图像 | 图像分类 | ivpf | ✅ | ||
图像 | 图像去噪 | LearningToSeeInTheDark | ✅ | ||
图像 | 元学习 | LEO | ✅ | ✅ | |
图像 | 目标检测 | LightCNN | ✅ | ✅ | ✅ |
图像 | 图像超分 | lite-hrnet | ✅ | ||
图像 | 图像分类 | lresnet100e_ir | ✅ | ||
图像 | 目标检测 | m2det | ✅ | ||
图像 | 自编码 | mae | ✅ | ✅ | |
图像 | 元学习 | MAML | ✅ | ✅ | |
图像 | 文本识别 | ManiDP | ✅ | ||
图像 | 人脸识别 | MaskedFaceRecognition | ✅ | ||
图像 | 元学习 | meta-baseline | ✅ | ✅ | |
图像 | 重新识别 | MGN | ✅ | ✅ | |
图像 | 深度估计 | midas | ✅ | ✅ | |
图像 | 图像去噪 | MIMO-UNet | ✅ | ||
图像 | 图像分类 | mnasnet | ✅ | ✅ | |
图像 | 图像分类 | mobilenetv3_large | ✅ | ✅ | |
图像 | 图像分类 | mobilenetV3_small_x1_0 | ✅ | ✅ | ✅ |
图像 | 图像分类 | MultiTaskNet | ✅ | ✅ | |
图像 | 重新识别 | MVD | ✅ | ✅ | |
图像 | 目标检测 | nas-fpn | ✅ | ||
图像 | 图像去噪 | Neighbor2Neighbor | ✅ | ✅ | |
图像 | 图像分类 | NFNet | ✅ | ✅ | |
图像 | 图像质量评估 | nima_vgg16 | ✅ | ||
图像 | 语义分割 | nnUNet | ✅ | ✅ | |
图像 | 图像分类 | ntsnet | ✅ | ✅ | |
图像 | 语义分割 | OCRNet | ✅ | ✅ | |
图像 | 重新识别 | osnet | ✅ | ✅ | |
图像 | 显著性检测 | PAGENet | ✅ | ✅ | |
图像 | 图像检索 | pcb | ✅ | ||
图像 | 图像检索 | pcb | ✅ | ||
图像 | 图像检索 | pcb_rpp | ✅ | ||
图像 | 图像分类 | PDarts | ✅ | ✅ | |
图像 | 图像生成 | PGAN | ✅ | ✅ | |
图像 | 图像生成 | Pix2Pix | ✅ | ✅ | |
图像 | 图像超分 | Pix2PixHD | ✅ | ||
图像 | 图像分类 | pnasnet | ✅ | ✅ | |
图像 | 点云模型 | pointnet | ✅ | ✅ | |
图像 | 点云模型 | pointnet2 | ✅ | ✅ | |
图像 | 图像分类 | PoseEstNet | ✅ | ✅ | |
图像 | 图像分类 | ProtoNet | ✅ | ✅ | |
图像 | 图像分类 | proxylessnas | ✅ | ✅ | |
图像 | 语义分割 | PSPNet | ✅ | ||
图像 | 显著性检测 | ras | ✅ | ✅ | |
图像 | 图像超分 | RCAN | ✅ | ||
图像 | 目标检测 | rcnn | ✅ | ✅ | |
图像 | 图像超分 | REDNet30 | ✅ | ✅ | |
图像 | 目标检测 | RefineDet | ✅ | ✅ | |
图像 | 语义分割 | RefineNet | ✅ | ✅ | |
图像 | 重新识别 | ReIDStrongBaseline | ✅ | ✅ | |
图像 | 图像分类 | relationnet | ✅ | ✅ | |
图像 | 图像分类 | renas | ✅ | ✅ | ✅ |
图像 | 语义分割 | repvgg | ✅ | ✅ | |
图像 | 语义分割 | res2net_deeplabv3 | ✅ | ✅ | |
图像 | 目标检测 | res2net_faster_rcnn | ✅ | ✅ | |
图像 | 目标检测 | res2net_yolov3 | ✅ | ✅ | |
图像 | 图像分类 | res2net101 | ✅ | ✅ | |
图像 | 图像分类 | res2net152 | ✅ | ✅ | |
图像 | 图像分类 | res2net50 | ✅ | ✅ | |
图像 | 图像分类 | ResNeSt50 | ✅ | ✅ | |
图像 | 图像分类 | resnet50_adv_pruning | ✅ | ✅ | |
图像 | 图像分类 | resnet50_bam | ✅ | ✅ | |
图像 | 图像分类 | ResNet50-Quadruplet | ✅ | ✅ | |
图像 | 图像分类 | ResNet50-Triplet | ✅ | ✅ | |
图像 | 图像分类 | ResnetV2_101 | ✅ | ✅ | |
图像 | 图像分类 | ResnetV2_152 | ✅ | ✅ | |
图像 | 图像分类 | ResnetV2_50 | ✅ | ✅ | |
图像 | 图像分类 | resnetv2_50_frn | ✅ | ✅ | |
图像 | 图像分类 | resnext152_64x4d | ✅ | ✅ | |
图像 | 目标检测 | retinaface_mobilenet0.25 | ✅ | ✅ | |
图像 | 目标检测 | retinanet_resnet101 | ✅ | ✅ | |
图像 | 目标检测 | retinanet_resnet152 | ✅ | ✅ | |
图像 | 目标检测 | rfcn | ✅ | ||
图像 | 图像分类 | SE_ResNeXt50 | ✅ | ||
图像 | 图像分类 | senet_resnet101 | ✅ | ✅ | ✅ |
图像 | 图像分类 | senet_resnet50 | ✅ | ✅ | ✅ |
图像 | 图像分类 | se-res2net50 | ✅ | ✅ | |
图像 | 图像分类 | S-GhostNet | ✅ | ||
图像 | 姿态估计 | simple_baselines | ✅ | ✅ | |
图像 | 图像生成 | SinGAN | ✅ | ||
图像 | 图像分类 | single_path_nas | ✅ | ✅ | |
图像 | 图像分类 | sknet | ✅ | ✅ | ✅ |
图像 | 图像分类 | snn_mlp | ✅ | ||
图像 | 目标检测 | Spnas | ✅ | ||
图像 | 图像分类 | SPPNet | ✅ | ✅ | |
图像 | 图像分类 | squeezenet | ✅ | ✅ | |
图像 | 图像超分 | sr_ea | ✅ | ||
图像 | 图像超分 | SRGAN | ✅ | ✅ | |
图像 | 图像分类 | ssc_resnet50 | ✅ | ✅ | |
图像 | 目标检测 | ssd_ghostnet | ✅ | ✅ | ✅ |
图像 | 目标检测 | ssd_inception_v2 | ✅ | ✅ | |
图像 | 目标检测 | ssd_inceptionv2 | ✅ | ||
图像 | 目标检测 | ssd_mobilenetV2 | ✅ | ✅ | ✅ |
图像 | 目标检测 | ssd_mobilenetV2_FPNlite | ✅ | ✅ | ✅ |
图像 | 目标检测 | ssd_resnet_34 | ✅ | ||
图像 | 目标检测 | ssd_resnet34 | ✅ | ✅ | |
图像 | 目标检测 | ssd_resnet50 | ✅ | ||
图像 | 姿态估计 | StackedHourglass | ✅ | ||
图像 | 图像生成 | StarGAN | ✅ | ✅ | |
图像 | 图像生成 | STGAN | ✅ | ✅ | |
图像 | 交通预测 | stgcn | ✅ | ✅ | |
图像 | 图像分类 | stpm | ✅ | ✅ | |
图像 | 图像分类 | swin_transformer | ✅ | ✅ | |
图像 | 时间定位 | tall | ✅ | ||
图像 | 图像分类 | TCN | ✅ | ✅ | |
图像 | 文本检测 | textfusenet | ✅ | ||
图像 | 交通预测 | tgcn | ✅ | ✅ | |
图像 | 图像分类 | tinynet | ✅ | ||
图像 | 图像分类 | TNT | ✅ | ✅ | |
图像 | 目标检测 | u2net | ✅ | ✅ | |
图像 | 图像生成 | U-GAT-IT | ✅ | ✅ | |
图像 | 语义分割 | UNet3+ | ✅ | ✅ | |
图像 | 重新识别 | VehicleNet | ✅ | ||
图像 | 图像分类 | vgg19 | ✅ | ✅ | |
图像 | 图像分类 | ViG | ✅ | ✅ | |
图像 | 图像分类 | vit_cifar | ✅ | ✅ | |
图像 | 语义分割 | vnet | ✅ | ✅ | |
图像 | 图像分类 | wave_mlp | ✅ | ✅ | |
图像 | 图像超分 | wdsr | ✅ | ✅ | |
图像 | 图像生成 | wgan | ✅ | ||
图像 | 图像分类 | wideresnet | ✅ | ✅ | |
图像 | 实例分割 | Yolact++ | ✅ | ||
图像 | 目标检测 | yolov3_tiny | ✅ | ✅ | |
图像 | 目标检测 | yolox | ✅ | ||
多模态 | 多模态 | opt | ✅ | ✅ | |
多模态 | 多模态 | TokenFusion | ✅ | ✅ | |
多模态 | 多模态 | wukong | ✅ | ||
推荐 | 点击率预测 | autodis | ✅ | ✅ | |
推荐 | 点击率预测 | DIEN | ✅ | ✅ | |
推荐 | 点击率预测 | dlrm | ✅ | ✅ | |
推荐 | 点击率预测 | EDCN | ✅ | ✅ | |
推荐 | 点击率预测 | Fat-DeepFFM | ✅ | ✅ | |
推荐 | 点击率预测 | mmoe | ✅ | ✅ | |
文本 | 自然语言理解 | albert | ✅ | ✅ | |
文本 | 情绪分类 | atae_lstm | ✅ | ✅ | |
文本 | 对话 | dam | ✅ | ||
文本 | 语言模型 | gpt2 | ✅ | ||
文本 | 知识图嵌入 | hake | ✅ | ||
文本 | 自然语言理解 | ktnet | ✅ | ✅ | |
文本 | 命名实体识别 | lstm_crf | ✅ | ||
文本 | 自然语言理解 | luke | ✅ | ✅ | |
文本 | 知识图嵌入 | rotate | ✅ | ✅ | |
文本 | 情绪分类 | senta | ✅ | ✅ | |
文本 | 机器翻译 | seq2seq | ✅ | ||
文本 | 词嵌入 | skipgram | ✅ | ✅ | |
文本 | 机器翻译 | speech_transformer | ✅ | ||
文本 | 预训练 | ternarybert | ✅ | ✅ | |
文本 | 自然语言理解 | tprr | ✅ | ||
文本 | 自然语言理解 | transformer_xl | ✅ | ✅ | |
文本 | 知识图嵌入 | transX | ✅ | ||
视频 | 视频分类 | AttentionCluster | ✅ | ✅ | |
视频 | 其他 | DYR | ✅ | ||
视频 | 视频分类 | ecolite | ✅ | ||
视频 | 目标追踪 | fairmot | ✅ | ✅ | |
视频 | 视频分类 | I3D | ✅ | ||
视频 | 目标追踪 | JDE | ✅ | ||
视频 | 视频分割 | OSVOS | ✅ | ||
视频 | 视频分类 | r2plus1d | ✅ | ✅ | |
视频 | 视频超分 | rbpn | ✅ | ||
视频 | 视频分类 | resnet3d | ✅ | ||
视频 | 目标追踪 | SiamFC | ✅ | ||
视频 | 目标追踪 | siamRPN | ✅ | ✅ | |
视频 | 视频分类 | slowfast | ✅ | ✅ | |
视频 | 视频分类 | stnet | ✅ | ||
视频 | 目标追踪 | tracktor | ✅ | ||
视频 | 目标追踪 | tracktor++ | ✅ | ✅ | |
视频 | 视频分类 | trn | ✅ | ||
视频 | 视频分类 | tsm | ✅ | ✅ | |
视频 | 视频分类 | tsn | ✅ | ✅ |
Process finished with exit code 0
models
仓库由原mindspore仓库的model_zoo目录独立分离而来,新仓库不继承历史commit记录,如果需要查找历史提2021.9.15之前的提交,请到mindspore仓库进行查询。
这里是MindSpore框架提供的可以运行于包括Ascend/GPU/CPU/移动设备等多种设备的模型库。
相应的专属于Ascend平台的多框架模型可以参考昇腾ModelZoo以及对应的代码仓。
MindSpore相关的预训练模型可以在MindSpore hub或下载中心.
MindSpore仅提供下载和预处理公共数据集的脚本。我们不拥有这些数据集,也不对它们的质量负责或维护。请确保您具有在数据集许可下使用该数据集的权限。在这些数据集上训练的模型仅用于非商业研究和教学目的。
致数据集拥有者:如果您不希望将数据集包含在MindSpore中,或者希望以任何方式对其进行更新,我们将根据要求删除或更新所有公共内容。请通过GitHub或Gitee与我们联系。非常感谢您对这个社区的理解和贡献。
MindSpore已获得Apache 2.0许可,请参见LICENSE文件。
想要获取更多关于MindSpore
框架使用本身的FAQ问题的,可以参考官网FAQ
-
Q: 直接使用models下的模型出现内存不足错误,例如Failed to alloc memory pool memory, 该怎么处理?
A: 直接使用models下的模型出现内存不足的典型原因是由于运行模式(
PYNATIVE_MODE
)、运行环境配置、License控制(AI-TOKEN)的不同造成的:PYNATIVE_MODE
通常比GRAPH_MODE
使用更多内存,尤其是在需要进行反向传播计算的训练图中,当前有2种方法可以尝试解决该问题。 方法1:你可以尝试使用一些更小的batch size; 方法2:添加context.set_context(mempool_block_size="XXGB"),其中,“XX”当前最大有效值可设置为“31”。 如果将方法1与方法2结合使用,效果会更好。- 运行环境由于NPU的核数、内存等配置不同也会产生类似问题。
- License控制(AI-TOKEN)的不同档位会造成执行过程中内存开销不同,也可以尝试使用一些更小的batch size。
-
Q: 一些网络运行中报错接口不存在,例如cannot import,该怎么处理?
A: 优先检查一下获取网络脚本的分支,与所使用的MindSpore版本是否一致,部分新分支中的模型脚本会使用一些新版本MindSpore才支持的接口,从而在使用老版本MindSpore时会发生报错.
-
Q: 一些模型描述中提到的RANK_TABLE_FILE文件,是什么?
A: RANK_TABLE_FILE是一个Ascend环境上用于指定分布式集群信息的文件,更多信息可以参考生成工具hccl_toos和分布式并行训练教程
-
Q: 在windows环境上要怎么运行网络脚本?
A: 多数模型都是使用bash作为启动脚本,在Windows环境上无法直接使用bash命令,你可以考虑直接运行python命令而不是bash启动脚本 ,如果你确实想需要使用bash脚本,你可以考虑使用以下几种方法来运行模型:
-
Q: 网络在310推理时出现编译失败,报错信息指向gflags,例如undefined reference to 'google::FlagRegisterer::FlagRegisterer',该怎么处理?
A: 优先检查一下环境GCC版本和gflags版本是否匹配,可以参考官方链接安装对应的GCC版本,gflags安装gflags。你需要保证所使用的组件之间是ABI兼容的,更多信息可以参考_GLIBCXX_USE_CXX11_ABI
-
Q: 在Mac系统上加载mindrecord格式的数据集出错,例如Invalid file, failed to open files for reading mindrecord files.,该怎么处理?
A: 优先使用ulimit -a检查系统限制,如果file descriptors数量为256(默认值),需要使用ulimit -n 1024将其设置为1024(或者更大的值)。之后再检查文件是否损坏或者被修改。
-
Q: 我在多台服务器构成的大集群上进行训练,但是得到的精度比预期要低,该怎么办?
A: 当前模型库中的大部分模型只在单机内进行过验证,最大使用8卡进行训练。由于MindSpore训练时指定的
batch_size
是单卡的,所以当单机8卡升级到多机时,会导致全局的global_batch_size
变大,这就导致需要针对当前多机场景的global_batch_size
进行重新调参优化。