新闻动态

新闻动态

会议资讯 | 首届计算社会科学讲习班成功举办

2023-07-03 文:社会学院 图:社会学院

目前社会正处于数字化转型的关键时期,数字社会治理成为国家治理体系和治理能力现代化的重要战略方向。在社会科学领域以自然语言处理为代表的计算社会科学方法也有了长足的发展,亟需将前沿理论探索和蓝图设计落实到高层次社会治理人才的培养实践。

2023年6月26日至2023年6月30日,由中国人民大学社会与人口学院主办的“首届计算社会科学讲习班”在学院大数据分析实验室顺利举行。计算社会科学讲习班以“数字社会治理”未来领军人才专项直博生项目为依托,旨在加强计算社会科学领域的高层次人才培养,推动计算社会科学方法普及,建立计算社会科学的研究旨趣与学术规范,引导学生围绕社会转型和数字社会治理进行前沿学术探索。

本届计算社会科学讲习班邀请了国内外从事计算社会科学研究的优秀青年学者担任讲师,包括中国政法大学社会学系副教授李代、加州大学圣迭戈分校社会学系博士候选人张博伦、中国人民大学社会学系讲师周浥莽、浙江大学社会学系新百人计划研究员李林倬、香港科技大学社会学系助理教授张涵、加州大学圣迭戈分校政治学系博士候选人杨阳、加州大学洛杉矶分校政治学系助理教授英璐薇。讲习班的课程内容涉及到词袋模型、词嵌入模型、图像分析、文本测量、人工智能等以自然语言处理为代表的研究技术,采取理论讲座和代码实操相结合的方式,在讲授方法论的同时引导学员在实际的应用场景中将计算社会科学方法应用于初步的研究设计和数据分析。

6月26日,讲习班正式开班。社会与人口学院副院长宋月萍教授在开班仪式中致辞。宋月萍教授向学员介绍了自然语言处理技术在近年社会科学研究中的重要性,并鼓励学员珍惜机会,努力学习。

中国政法大学社会学系副教授李代、加州大学圣迭戈分校社会学系博士候选人张博伦、中国人民大学社会学系讲师周浥莽介绍了自然语言处理的基础知识,让学员们初步了解计算社会科学领域核心技术的基本内涵和应用。主讲人也帮助学员布置R和python的编程环境。

6月27日,浙江大学社会学系新百人计划研究员李林倬对词嵌入模型进行介绍。在上午的理论课程中,李林倬老师从语意微分(semantic differentials)的基本定义和逻辑原理入手引入词嵌入技术,向学员介绍如何通过大量的文本捕捉词语之间的语义关系,并应用于情感分析、文本分类和信息检索等自然语言处理任务。在下午的实践课程中,李林倬老师以Word2Vec技术为例,具体地介绍了这种词嵌入技术的模型特征和应用方式,帮助同学们理解特定语义结构之下词语之间的替代关系和互补关系。

6月28日,香港科技大学社会学系助理教授张涵老师系统地介绍了社会科学中的图片数据应用技术。在上午的理论课程中,张涵老师解析了图片作为高维数据如何转变为像素矩阵的内在逻辑,并深入浅出地向学员介绍了卷积神经网络的基本内涵。在下午的实践操作课程中,张涵老师介绍了在图片数据分析的实际应用中机器学习的具体过程,并帮助学员实操了通过向量计算图片相似度的基本步骤。

6月29日,加州大学圣迭戈分校政治学系博士候选人杨阳深入浅出地介绍了文本作为测量工具的应用领域。杨阳老师具体介绍了Word counting(关键词计数)、Entity Recognition(抽取文本特定信息)、Stance Analysis(情感与态度分析)、Relation Extraction(文本结构中抽取语意关系)的四种文本测量方式,并介绍了每一种方式在已有的社会科学研究的具体应用。在下午的实践课程中,杨阳老师以中文报刊数据为例,对上午介绍的文本测量方法进行了精彩的代码展示。

6月30日,加州大学洛杉矶分校政治学系助理教授英璐薇就人工智能在社会科学中的应用进行了详细而生动的介绍。在上午的理论课程中,英璐薇老师聚焦于监督学习和非监督学习下的文本学习方法,着重介绍了监督学习中的Naive Bayes(朴素贝叶斯)算法和Support Vector Machine (支持向量网络)算法以及非监督学习中的LDA算法。在下午的实践课程中,英璐薇老师指导学员以推特数据为例,展示了上述机器学习算法的代码实现,并鼓励学员对相关命令进行了自由探索。

经过5天高效高质学习,以“数字社会治理”未来领军人才专项直博生为主的30余名学员顺利结业。学院副院长宋月萍教授在结业仪式中对讲习班的内容做了总结,感谢各位老师的热情讲授和辛勤教导,也肯定各位同学的学习热情和韧劲,更鼓励大家抓住数字社会转型这一机遇,练好计算社会科学这一本领,在数字社会治理领域追随前沿,深耕细作,茁壮成材。讲习班组织者为学员颁发了结业证书。

经过高强度的学习,学员们感到深有收获。参与讲习班的学员、2022级数字社会治理直博生陈壬冰表示:“听说每个程序员的桌上都有一只小黄鸭。这次的计算社会科学讲习班,告诉我一个道理,要通过“表达”来明确自己的意图。人与人之间的沟通,有许多语言之外的信息辅助补充,而人与计算机之间的沟通,是在计算机语言内实现的,需要通过人一步一步地拆解和简化一个大的问题,让计算机清楚自己所要表达的内容,进一步锚定回应。社会研究也是这样的过程,将复杂问题简单化,但又将简单问题提升到理论对话的高度,拓展学科和社会的边界”。2022级博士研究生陈彦冰表示:“对于初次接触计算社会科学的我来说,从讲习班中收获了很多。授课老师们以通俗易懂的方式讲述了计算社会科学领域一些基础的原理、操作的流程以及前沿的应用,通过引入具体的研究案例打开了我的视野。在实践的过程中,老师们也照顾了每一个学生的进度,耐心地解答了大家的问题”。2021级硕士研究生孙嘉琦表示:“短短一周的讲习班,上午理论学习下午上机实操,过程让人疲惫但也充实。虽然自己对于软件操作不熟悉增加了理解的难度,但一周的学习和实践,还是让我非常切实地体会到计算社会科学拓展社会学视野和边界的巨大潜力。最触动我的是,在计算方法的支持下,传统上被认为是小样本定性研究专长的议题也能够进行基于大数据的量化操作和分析。”

中国人民大学社会与人口学院 “数字社会治理” 未来领军人才专项直博生项目,紧紧围绕新技术与国家治理能力现代化的战略需求,依托于中国人民大学社会与人口学院社会学、人口学、人类学、老年学、人口资源环境、社会医学与卫生事业管理等相关专业的师资力量,采取跨学科、强基础、重前沿的人才培养方式,培养重点培养兼具本土视野与世界眼光、深厚理论与前沿方法、创新意识与实践能力的高端复合型研究人,以及数字化社会治理领军型科研人才和管理人才,推动数字社会和数字时代的社会科学研究,为国家和地方的数字社会治理、企业数字化转型实践提供理论、政策及人才支持。