项目要求¶
要求:参考三个选题(手写体数字识别、人脸识别、猫狗识别),可以结合大创的项目。不可以选择百度 AIStudio 上原封不动的项目,必须有所修改,或者修改模型结构,或者修改数据集。否则,20 分的项目,最多得 10 分。
项目内容¶
手写体数字识别属于典型的图像多分类问题
实践平台:百度AI实训平台-AI Studio
实践流程:
-
准备数据
-
配置网络
- 定义网络
- 定义损失函数
- 定义优化算法
- 训练网络
- 模型评估
- 模型预测
实验要求:
-
按实践流程调通程序
-
采用MNIST数据集,原数据集中只有黑底白字,在原数据集中增加白底黑字的数字图像,即:使得系统也能识别白底黑字的数字图像。
-
撰写实验报告
-
将调通的程序发布到百度AI实训平台-AI Studio上,将实验报告提交到指定的助教邮箱。
评分¶
实验报告评分标准(10分):每组组员的分数相同¶
-
实验最终准确率(占2分):按准确率高低的排序给分。
-
实验尝试的模型(占3分):使用2个及以上经典卷积网络(如VGG等)的,得3分,使用1个经典CNN的得2分,未使用经典CNN的得1分。
-
实验调参(占2分):对学习率、优化器、模型的深度和宽度(隐层中神经元的数目)、激活函数等,进行过10次及以上尝试者,得2分;只进行少于10次尝试者得1—1.5分。
-
实验数据分析(占3分):以图表的形式展示实验结果,在此基础上进行深入讨论者,得3分;讨论内容肤浅者,得1--2分。
2. 项目展示与答辩评分标准(10分)¶
总分 | 最好的 accuracy(或 Precision 和 Recall) | 演示功能正确 | 超时 | 阐述清晰 | 回答问题正确 |
---|---|---|---|---|---|
10 | 2 | 3 | 2 | 2 | 1 |
其中,超时不包括提问环节,超时和最好的 accuracy(或 Precision 和 Recall)全组统一。
-
每组答辩时长 15 分钟,不需要制作 PPT,每人陈述 3 分钟,即自述 12 分钟。组员分工介绍以下内容:
-
项目思路
-
数据集规模,训练集、(验证集)、测试集的样本分配
-
模型的网络结构:几层卷积层、几个卷积、卷积大小、激活函数、损失函数、池化层、全连接层、输出层几个神经元
- 超参个数、如何设置的(学习率等)
- 训练模型的过程、训练时长
- 是否修改了网络结构,怎么修改的
- 尝试了几个模型,对比结果的结论是什么
-
展示运行结果
-
回答问题 3 分钟(覆盖课堂讲授的理论和实践内容),每人回答一个问题。
-
每组组员的得分不同,取决于个人在“阐述清晰”、“回答问题正确”、“演示功能正确”环节的表现。
-
必须弄清楚 CNN 术语含义,尤其在分组答辩时,要用对术语,否则我的问题,你可能答不到点子上,也会浪费时间。
-
若连老师所提的问题都听不懂,或弄错术语的含义,直接扣分。
-
3.专题研究报告提交要求¶
- 将上述专题研究报告的word文档以邮件附件的形式提交给助教(期末公布邮箱 )。
- 专题研究报告命名为:AI-组号-题目;邮件主题必须为:AI报告-组号-题目,否则无效。截止日期为6月17日12点。
- 提交此报告,不加分,但迟交或不交,扣分。
- 迟交1天(晚24小时内)扣2分;
- 迟交2天(晚48小时内)扣5分;
- 迟交3天(晚72小时内)扣10分;
- 3天后(超过72小时)视同未提交,即专题研究环节计0分。