王文武:在数据采集中润己泽人

讲述人】王文武,中共党员,米兰,米兰(中国)统计与数据科学学院教授,硕士生导师,学院研究生工作负责人。荣获米兰,米兰(中国)“优秀教师”“曲园教书育人楷模”等称号。

2017年7月,我怀揣着做一名优秀高校教师的梦想,来到米兰,米兰(中国)统计与数据科学学院执教。多年来,在教学和科研过程中,我始终坚持“文科与理科兼修、理论与实践并行”的教学理念,与学生建立亦师亦友的良好师生关系。

勇挑重担

走别人没有走过的路

为了上好每一堂课,我一直不断学习新的教学理论、教学方法和教学手段,以便能够更好地服务学生。随着大数据时代的到来,第一手数据的采集变得越来越重要,因为高质量的数据采集是数据分析、科学研究和统计决策的前提和基础。为了顺应时代潮流,统计与数据科学学院在2017年及时修改研究生培养方案,把《数据采集方法》课程设置为应用统计专业硕士的专业必修课。这门课程以前学院从未开设过,即使放眼全国开设该课程的高校也很少,这对任课老师来说是一个巨大的挑战。

讲授《数据采集方法》课程,便是刚入职的我需要面对的第一个教学难题。于是,我先联系了部分985学校的统计学专业教授,咨询该课程开设的相关情况。得到的结果是大部分高校开设类似课程还在讲授传统的市场调查数据的方法,很少涉及网络大数据获取方法。因此,想直接借鉴别人资料、教材和方法行不通,那就只能靠自己了。我查询了学校图书馆和京东商城所有数据采集方法的书籍,列出一份含有三十多本教材的清单进行选择,通过大数据采集教学目标确定了2016年刚出版的《基于R语言的自动数据收集:网络抓取和文本挖掘实用指南》作为《数据采集方法》教材。

为了能在课堂上游刃有余,在备课过程中,我查阅了计算机网络技术方面和数据采集方法方面的大量资料,确保对课程内容有深入的理解。在讲授过程中,我采用“3节理论+1节应用”的教学方法,既保证了理论上的理解,也保证了实践上的娴熟。最后,我们完成了课本上的6个案例,这对于第一次接触该门课程的任课教师和应用统计专业的研究生而言,无疑都是成功的。

随着该课程材料的积累和经验的丰富,我逐渐梳理出讲授该课程的一套方法。首先,我作为主讲教师讲授网络和数据技术入门,通过课上练习和课后作业等方式,研究生能够顺利掌握网络相关的知识和技术;其次,对研究生进行分组,小组讨论并讲解网络专区和文本挖掘的实用工具箱,掌握数据管理、网络抓取以及文本挖掘等方面的技术和技巧;再次,从国家优秀案例库、省级优秀案例库、博士和硕士毕业论文以及我们团队历年完成的优秀案例中,每个小组选择自己感兴趣的案例进行学习,并对该案例进行重现和讲解,系统掌握数据采集和挖掘技术,并逐步弄懂论文写作的基本格式和要求。最后,每个小组对社会热点问题,按照严格要求合力完成一个案例,进行课程结业答辩,极大地提高了研究生的综合素养。

基于《数据采集方法》课程和完成的优秀案例,我作为教学团队负责人申请立项“2022年山东省优质专业学位教学案例库:数据自动采集、挖掘与统计学习案例库”。到目前为止,我们团队基于该课程已完成30个不同领域的优秀案例,并把优秀案例上传到科学网个人主页http://blog.sciencenet.cn/u/wengewsh,截至目前已被下载、在线学习85000多次,并收到一些专家学者的感谢信。

聚焦实践

让学生在大赛中不断成长

2021年6月,我被任命为校统计学研究所副所长,全面负责研究生工作。作为研究生工作负责人,我发现研究生理论学习有余、而实践参与不足的问题。在各类与统计和数据科学相关的大赛中,参与积极性、获奖层次和比例均较低。在学院领导和各位老师的支持下,学院成立以院长为组长、研究生工作负责人为副组长、7名研究生导师为成员的“大赛工作小组”,每个大赛指定一个负责人。这样从学院层面对大赛给予了足够重视。同时,我们多次召开研究生经验分享会,极大提高了研究生参赛的积极性。

2022年、2023年,学院相继申请到山东省教育厅立项批准和支持举办的“山东省研究生统计方案设计与分析大赛”。为进一步提高大赛层次,学院也承办了“2022年全国大学生市场调查与分析大赛”研究生组山东省比赛。这些比赛不仅让学院积累了组织大赛的丰富经验,也进一步提高了研究生运用统计相关模型、方法与理论解决实际问题的能力,更好地适应社会发展需求。

学生们在每一次大赛中都有新的突破。2022年,我指导的研究生获得“全国大学生市场调查与分析大赛”全国总决赛二等奖、“全国统计建模大赛”全国三等奖。2023年,我所指导的学生获得“全国大学生市场调查与分析大赛”全国总决赛一等奖。这些成绩在学校参赛历史上均实现了历史性突破,也为学生的就业增加了沉甸甸的砝码。2022年毕业的研究生李航同学,由于大赛取得的优异成绩,毕业前收到多个大公司发来的工作邀请,解决户口、年薪丰厚。看到学生满意的笑容,我也开心地笑了。

教研相长

做学生成长引路人

教学之余,不忘科研。经过长时间的积累和沉淀,我在机器学习和人工智能国际顶级期刊《Journal of Machine Learning Research》发表论文2篇,并于2020年主持申请并立项国家自然科学基金面上项目。这是学院40岁以下年轻人首次拿到该项目,对我个人的科研工作是一种激励和肯定。

目前,我的主要精力都用在学生培养上。我指导博士生2人、硕士生13人。我始终认为,对于研究生的培养,打开思维,学会进行学术性的追问与省思,非常重要。我组织学术研讨,鼓励学生自由发言,培养激发他们的创新思维。初带研究生新生时,我发现他们的学术基础较为薄弱,难以及时有效交流研讨。对此,我嘱咐新生静心读文献,打牢基础,绝不一步求成。2021级博士研究生孔德茹在我的指导下,目前已接受SCI论文2篇,还在向更高的学术山峰攀登。

未来的日子里,我愿继续传承师者精神,润己亦泽人,以人格魅力照亮学生心灵,以学术造诣启迪学生智慧,引领学生在数据采集的道路上阔步前行!



编辑:孙红梅 编审:黄江滔

发布:米兰,米兰(中国)新闻中心