还剩8页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
江苏省高等学校大学生创新创业训练计划项目申报表(创新训练项目)推荐学校(盖章)基于深度学习的报刊项目名称要素识别问题的研究口重点项目项目类型一般项目J匚校企合作基金项一1所属一级学科名称08工学所属重点领域项目负责人王君丞联系电话指导教师业宁联系电话申报日期江苏省教育厅制二O二一年四月填表说明
一、申报表要按照要求逐项认真填写,填写内容必须实事求是表述准确严谨空缺项要填“无”
二、格式要求表格中的字体采用小四号宋体,单倍行距;需签字部分由相关人员以黑色钢笔或签字笔签名
三、项目类型为重点项目、一般项目和校企合作基金项目等
四、项目来源
1.“A”为学生自主选题,来源于自己对课题的长期积累与兴趣;“B”为学生来源于教师科研项目选题;“C”为学生承担社会、企业委托项目选题
2.“来源项目名称”和I“来源项目类别”栏限“B”和“C”的项目填写;”来源项目类别”栏填写“863项目”、“973项目”、“国家自然科学基金项目”、“省级自然科学基金项目”、“教师横向科研项目”、“企业委托项目”、“社会委托项目”以及其他项目本不识
五、所属重点领域省级重点项目选填,如果属于重点领域的则填报具体包括10类泛终端芯片及操作系统应用开发、重大应用关键软件、云计算和大数据、人工智能、无人驾驶、新能源与储能技术、生物技术与生物育种、绿色环保与固废资源化、第五代通信技术和新一代IP网络通信技术、社会事业与文化传承
六、表格栏高不够可增加
七、填报者须注意页面的排版项目名称基于深度学习的报刊要素识别问题的研究项目所属二级08工学0809计算机类项目所属一级学科学科项目项目类型()重点项目(J)一般项目()校企合作基金项目简所介属重点领域(省级重点项目选填)(限200字)来源项目名称来源项目类别A BC项目来源V项目实施时间起始时间2021年6月完成时间2022年5月数字化档案浪潮已经席卷世界各国,例如报刊的数字化,对报刊版面进行分析与识别,这对报刊文件的数字化分类和管理具有重大意义然而由于报刊复杂的布局,和其包含的一些复杂因素,例如不同的语言,图形,图片,标题等,使其成为一个具有挑战性的问题我们预计提出一个基于深度学习框架的方案,构建报刊相关数据集,建立模型,对报刊的主要内容(正文,标题,作者等)进行分割识别在研究过程中,对模型进行优化,研究在不同的分析规模之间建立更深的联系并更好地传播特征,解决报刊局部特征不明显等问题,对模型进行压缩,丢弃无用参数,同时缓解过拟合问题,以提高报刊要素的识别率和准确率姓名年级学号所在院系/专业联系电话邮箱计算机科学与技申主王君丞19术请持人人计算机科学与技尹光春19或术申计算机科学与技请熊毅19团成术队员南乐林业大学信息科学技术学院指姓名业宁单位第一指导P导南京林业大学信息科学技术学院教师年龄54术职务院党委书记,南京林业大学信息教学院教授、硕士生导师业宁院长现任硕士生导师,主要研究方向为生物信息学、数据挖掘、机器学习、算法复杂性分析获得“青蓝工程”中青年学术带头人,第8批六大人才高峰(电子信息类)科研成果丰硕,每年发表多篇计算机主要成果相关学术论文(SCL EI检索),参与多项国家级科研项目与课题第二指导姓名单位教师年龄术职务主要成果
一、申请理由(包括自身具备的知识条件、自己的特长、兴趣、已有的实践创新成果等)尹光春大学生英语四级、六级2019-2020南京林大优秀学生2020大英竞赛三等奖熊毅蓝桥杯省级二等奖2019-2020南京林大优秀学生王君丞大学生英语四级、六级2019-2020南京林大优秀学生对于神经网络与深度学习有较大兴趣,正在积极学习相关内容,希望通过项目的驱动式学习积累更多知识和研究成果
二、项目方案具体内容包括
1、项目研究背景(国内外的研究现状及研究意义、项目已有的基础,与本项目有关的研究积累和已取得的成绩,已具备的条件,尚缺少的条件及方法等)国内外研究现状及意义由于报刊的复杂布局以及报刊的样式差异巨大,对于报刊要素的识别是一件具有挑战性的工作回顾过去对于报布局的识别,页面分割和区域识别被认为侧重于一些物理类别,例如文本,图像,图形,分隔符
[1],在基于深度学习的方法兴起以来,卷积神经网络(CNN)在具有一定量的训练数据情况下,可通过反向传播(Backpropagation)实现自动提取这些物理特征然而报刊要素的识别要求理解页面的整体结构并且提取其语义特征,需要逻辑或语义标签(例如标题,副标题,正文),最近的研究中,已经成功引入完全卷积神经网络(FCN),该方法成功地用于自然场景图形的语义分割
[2]和文档图像中的文本行检测[3,4],这样的方法可以进一步预测像素的语义类别,止匕外,⑸提出了一种具有2D-LSTM层的卷积网络,它比仅来自卷积神经网络(CNN)的接受域具有更多的上下文基于以上背景,使得适用通用报刊的报刊要素识别模型的实现成为可能,并具有较高的识别率报刊要素识别在多方面领域有良好的应用前景例如在档案管理上,对文本进行语义分类能在很大程度上提高对于档案的搜索和维护效率,使得对于报刊以致档案有更好的归类作用,摆脱了文本平铺式储存的不便性在文件数字化方面,达到对人类所需的文本信息有更好的归类作用要提高识别的准确性,一方面依靠相关数据集的完善,另一方面也依靠算法模型的优化目前,国内外报刊要素识别的研究分为几个方面,有如⑹提出的基于轮廓分类和形态学运算的方法来寻找分隔符,并提取文本区域和标题,也有如⑺提出的基于新颖架构的全卷积神经网络体系结构(FCN),它可以自动的处理输入图像的多尺度处理,还有如⑻中,作者提出了使用词嵌入的基于聚类的文章标识,尽管利用文本词嵌入来查找文章似乎很有希望,但是该系统可能会受到OCR质量的强烈影响
[1]A.Antonacopoulos,C.Clausner,C.Papadopoulos,S.Pletschacher,ICDAR2013()competition onhistorical newspaperlayout analysishnla2013,in:ICDAR,IEEE,2013,pp.1454-
1458.
[2]J.Long,E.Shelhamer,T.Darrell,Fully convolutionalnetworks forsemantic segmentation,in:CVPR,2015,pp.3431-
3440.
[3]M.Diem,F.Kleber,S.Fiel,T.Griining,B.Gatos,cbad:Icdar2017competitionon baselinedetection,in:ICDAR,1,IEEE,2017,pp.1355-
1360.
[4]Renton G,Soullard Y,Chatelain C,et aLFully convolutionalnetwork withdilatedconvolutions forhandwritten textline segmentation[J].International Journalon Document⑶AnalysisRecognition,2018,21
[5]Moysset B,Kermorvant C,Wolf C.Learning todetect andlocalize manyobjects fromfewexamples[J].
2016.
[6]N.Vasilopoulos,E.Kavallieratou,Complex layoutanalysis basedon contourclassificationand morphologicaloperations,Engineering Applicationsof Artificial()Intelligence652017220-
229.
[7]Ys A,Pt B,Cc B,et al.Multi-scale GatedFully ConvolutionalDenseNets forsemanticlabeling ofhistorical newspaperimages[J].Pattern RecognitionLetters,2020,131:435-
441.
[8]Riedl M,Betz D,S Pado.Clustering-Based ArticleIdentification inHistoricalNewspapers[C]//Proceedings ofthe3rd Joint.
2019.本项目尚缺少以下条件在复杂的报刊布局下识别率仍然有待提升,报刊的局部细节众多,例如图形的水平或垂直分隔符,标点符号,小字符,或者直线,表格,大图像,这些细节的组合使得分析变得困难,文字稠密时容易重叠,属于一个类的要素其中有大量分隔符使得分类不准确,如果图像的质量下降很强,识别会失效,没有有效的模型来减少参数的数量和不同输入大小可能使得架构效果不理想
2、项目研究目标及主要内容1)在不同的分析规模之间建立更深的联系并更好地传播特征在标准的体系结构中,由于池化层的存在会降低输入分辨率和阻止特征传播,因此使用的大量密集的连接距离网络输出较远,可能会限制对消失的梯度问题的积极影响,所以需要研究块之间的密集连接2)解决报刊局部特征不明显和图像过大问题由于报刊的相同类别,例如标题的局部特征可能大不相同,这会导致的同类别分类不准确,而且在捕获某些细节并切割时会导致图像非常大,所以需要多尺度的分析3)模型压缩,丢弃无用参数,同时缓解过拟合问题在基于深度学习的报刊要素识别问题的研究中,模型空间占用一直是一个严重的问题,所以要通过对模型压缩相关方法的研究,目标降低模型空间占用,提升识别效率,缓解过拟合问题
3、项目创新特色概述选题与日常生活生产联系紧密,具有广泛的应用前景在大量阅读文献的基础上,研究目标方向选定为当下报刊要素识别及文本信息数字化研究中急需解决的问题,具有一定的创新性
5、研究进度安排图像预处理选取最优模型改进算法
2021.10-
2022.
22022.3-
2022.3系统开发
2022.4-
2022.5形成结论,撰写论文,申请专利
6、项目组成员分工王君丞查阅文献,确定实验方法与技术流程,构建网络层尹光春查阅文献,确定实验方法与技术流程,构建数据集熊毅查阅文献,处理数据,开发识别系统
三、学校提供条件(包括项目开展所需的实验实训情况、配套经费、相关扶持政策等)
1.信息学院专业实验室和计算中心可为项目团队提供实验场地和部分网络实验设备;学校图书馆提供了丰富项目所需专业书籍和电子资料;学院与多家软件企业有合作,已建成多家实验实训基地2015年计算机科学与技术列为校品牌专业
2.学校、教务处和学院一直关注本科生的创新能力培养,特别是实践能力培养,鼓励本科生申报大学生创新创业项目,并尽一切可能提供各种便利
四、预期成果
(1).结题报告1份
(2).软件著作权一份
(3).可用的报刊要素识别系统
(4),论文一篇(SCI或EI)
(5).相关说明文档(运行,配置,开发文档)
五、经费预算总经费(元)财政拨款/企业资助(元)学校拨款(元)6000注总经费、财政拨款、学校拨款按照规定金额填写,校企合作项目企业资助金额不少于5000元具体包括
1、调研、差旅费;
2、用于项目研发的元器件、软硬件测试、小型硬件购置费等;
3、资料购置、打印、复印、印刷等费用;
4、学生撰写与项目有关的论文版面费、申请专利费等金计算根据及理由支出科目额论文版面费论文的审核、发表费用3000图书资料费3000购置国内外相关书籍,为项目提供理论研究基础
六、导师推荐意见签名年月日
七、院系推荐意见院系负责人签名学院盖章年月日
八、学校推荐意见学校负责人签名学校公章年月日。
个人认证
优秀文档
获得点赞 0