首页 > 竞赛 > 竞赛详情

汉字档案手写识别大赛(华录杯复赛) 算法竞赛
竞赛已结束。你可以报名参赛,并提交得到排名,但不会获得实物奖励。
180000

参赛队伍: 119

参赛人数: 154

作品提交数: 360

竞赛背景

档案是历史的见证。档案的完整和系统地保存关系着一个国家历史文化的延续。对于个人而言,档案也关乎着一个人的完整经历。然而,纸质档案不仅耗费空间,还由于自然或人为的原因,经常容易出现损毁,不易保存。因此,在大数据时代,档案数字化已经成为档案工作者工作内容中的重中之重。 然而,许多档案数字化的工作仅仅是通过对纸质文件的扫描来进行的,这样的“数字档案”并不能被计算机所识别。而且,工作人员手动录入所有档案中的文字信息将是一个浩大的工程。因此,如何能够将扫描文件当中的文字信息真正转化为可以被引用、检索,将是档案数字化中最重要的一步。

为了全方位考察选手对于“城市治理”过程中面临实际问题的解决能力, 本次比赛将会围绕政府纸质文档电子化的主题,利用敏感度较低的公司登记表扫描件(已脱敏处理)来替代真是政府文档。进入复赛的算法高手们将通过近1000份应聘信息登记文件的扫描图片构建出汉字手写识别的算法模型,用于准确识别测试数据集中的文字信息。


汉字档案手写识别大赛是“中国华录杯·开放数据创新应用大赛”复赛赛题之一,只有初赛入围团队拥有本赛题的参赛资格。



奖项

复赛阶段将选出6个团队入围决赛,参加线下答辩及颁奖。

最佳算法奖  3个  各3万元 最佳团队奖  3个  各3万元 说明: 1、复赛阶段算法赛题将有6个团队最终入围决赛答辩,决赛6个奖项 2、以上奖金为决赛奖金,均为税前金额,DC将代为扣税后发放给参赛者 3、线上提交阶段结束后,主办方将对所有排行榜队伍进行代码审核,代码需具有普适性和通用性,一旦发现作弊行为,立即取消获奖资格和成绩。

4、如在复赛阶段同时参加了算法赛和创意赛并且在两个赛题中同时成功晋级决赛,在决赛答辩中,每位参赛者和参赛队伍只能选择其中一个赛题进行答辩,不能重复获奖。



时间安排

2018.8.23  15:00                   复赛上线

2018.8.23--10.15  15:00       线上提交结果阶段

2018.10.16--11.16                线下审核代码阶段

2018.11.19--20                    公布决赛入围名单

2018.12 月初                        决赛线下答辩



参赛与组队规则

所有参赛人员及队伍,视为已同意《DC竞赛作弊管理规则》及其他相关规定。队长对其队员的参赛行为负责。

①复赛入围参赛者可任意选择参加算法赛或创意赛,若同时参加两个赛题并且同时成功晋级决赛,在决赛答辩中,每位参赛者和参赛队伍只能选择其中一个赛题进行答辩,不能重复获奖。

②在复赛阶段,可退出队伍、加入队伍,解散队伍、重新组队 ③复赛获得计算资源的参赛团队,由队长进行计算资源申请,该计算资源由所有队员共享使用


团队人数上限 5 人。 在第一阶段的最后3天无法新建队伍,但是可以加入其它队伍。 在最后一个阶段最后3天无法新建队伍,无法加入队伍。 竞赛进入历史阶段后可以新建队伍,但是已参赛队伍不可新增队员、不可解散队伍,注意:答辩队伍成员仅限活跃期间加入的成员。

评分标准

评分算法
other




技术共享 官方QQ群

快分享给朋友吧!

×

抢150元大礼包

意见反馈
关注微信公众号 关注微信公众号
  • © 2013-2018 DataCastle 蜀ICP备17028166号-1

扫一扫分享给周围朋友