文章分类

“2016大数据社会科学讲习班”在清华大学举行

    2016年8月24日到27日,“2016大数据社会科学讲习班”在清华大学举行。本次活动由清华大学创新发展研究院、清华大学社会科学学院经济学研究所、清华大学社会科学学院政治学系、清华大学数据治理研究中心及清华大学定量分析研究所共同举办。培训旨在把握学术和商务领域应用大数据技术的前沿动态,提高学员驾驭数据和能力,强化自觉运用数据的意识,并进而促进大数据方法在社会科学研究中的普及和广泛应用。这是继2014年、2015年后,清华大学各单位第三次举办同类活动。授课人围绕大数据社会科学方法论、大数据前沿应用、大数据产业前沿动态等议题为近百名学员进行了深入浅出的分析和讲解。

   更值得注意的是,本期培训班受九次方大数据公司的资助,设立“清华-九次方”大数据社会科学创意课题评奖项目,为多达25名优秀学员提供丰厚奖学金。学员在提交基于大数据的研究设计后,可参与相关答辩和评审活动。奖学金分为三个等级,一等奖奖学金为8000元,二等奖奖学金为5000元,三等奖奖学金为2000元。

   近年来,大数据技术在社会科学领域的应用不断增加,高水平的研究成果不断涌现。对此,来自清华大学社会科学学院经济学研究所的刘涛雄教授在其“大数据社会科学方法概论”课程上对这一问题进行了分析。他指出,人们将在前所未有的深度和广度上自动地收集和利用数据,为社会科学的研究服务。基于数据的知识发现未来将成为政治学、经济学、心理学、社会学、管理学等学科最重要的知识获取手段之一。通过社会行为分析和计算系统交叉融合而发展起来的计算社会科学有助于人们更好地研究社会运行规律与发展趋势,并将其用于社会实践过程。例如,人们可以利用基于大数据的情感分析、信任计算、风险计算等手段提高沟通与协作的效率,可以通过构建网络协助平台,更好地利用群体智能来解决复杂问题。但刘涛雄教授也强调,要想在未来更好地在社会科学领域利用大数据技术,还要解决“维数灾难”、非结构化数据的结构化、数据生成机制难以掌握等问题。大数据金融和互联网金融是学员们普遍关心的话题之一。清华大学社会科学学院经济学研究所的汤珂教授介绍了大数据金融在学界和业界的发展情况。汤珂教授指出,大数据和互联网金融可以在以下三个方面提升传统金融业的质量,一是有助于人们更好地提取有效信息建模预测,掌握金融市场动态;二是通过完善支付功能、优化资源配置和开发保险业务方面为实体经济带来贡献;三是为人们带来了新的投资理财方式。汤珂教授还以支付宝和余额宝为例分析了互联网金融为传统金融业带来的巨大变化。R和Python是当前社会科学领域应用最广泛的统计软件之一。清华大学社会科学学院政治学系苏毓淞和孟天广两位老师作为R和Python软件领域的研究者和使用者,对这两款软件的特点、优势和功能进行了详细介绍,并且在课堂上对软件的编程操作进行了讲解和辅导,帮助学员们实际体验软件的强大功能。

   社会网络分析是大数据社会科学的重要分支。清华大学社会科学学院社会学系的郑路副教授为学员们讲解了社会网络分析的核心理论和方法。郑路老师指出,社会网络分析技术可用于深入了解从个人到国家层面的各层次互动行为,包括社会角色、行动关系、情感关系、流动关系、资源转移关系、信息传递关系等。大数据和互联网技术为社会网络分析带来了丰富的研究议题和海量数据,促使新的算法和研究成果不断产生。除了理论介绍外,郑路老师还分享了自己从事社会网络分析过程中得到的一些有趣发现。文本挖掘技术在基于大数据的社会科学研究中已得到普遍应用。清华大学社会科学学院政治学系的孟天广老师就文本挖掘的前沿成果进行了介绍。孟天广老师指出,近年来,随着自然语言研究的深入、统计技术的引入和机器学习理论的发展,大规模文本分析技术突飞猛进,并已成为进行传播学、政治学等领域研究的得力助手,而便捷、廉价的硬件和网络设备,以及各类分析软件则进一步推动了文本挖掘技术的应用。为帮助学员了解文本挖掘的具体过程,孟天广老师以程序演示的方式展示了自己的研究成果。在全面建设小康社会背景下,幸福已成为衡量公共部门治理绩效的关键指标。清华大学著名学者彭凯平就基于大数据的幸福感、幸福心理测量与评估这一议题为学员们进行了精彩演讲。

   在数据量不断增加,算法和模型日趋复杂的同时,人们也更希望通过数据可视化技术直观地洞察数据中蕴藏的规律。数据可视化是指利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。清华大学社会科学学院政治学系的苏毓淞副教授为学员讲解了数据可视化的基本技术和关键原则。苏毓淞老师强调,在海量数据和图像遍布生活各个角落的今天,数据可视化工作者应更加重视合理分配图像表达要素,发掘图像的表达潜力,分析目标群体的个别化情境,从而更帮助人们更好地利用图像获取信息。大数据技术正在帮助人文学科的研究者获取跨学科研究的全新视角和议程。清华大学社会学系的严飞博士以基于县志资料整理和分析项目为例,介绍了各种历史学、文化学和经济学议题通过大数据这一纽带相互融合进而创造出新知识的过程。但同时,严飞老师也强调,人们应该理性地看待基于大数据的研究和应用,将更多精力投入到提取有价值信息、选择关键变量等方面。在业界,一些主打“大数据”资源的企业是开发相关产品和服务的重要实践者,具备丰富的创新性新思维和抓住发展机遇的能力。

   在全部课程结束后,讲习班举办了学习成果展示、问答互动、奖学奖评选结果公布、颁发结业证书等活动。在为期四天的培训过程中,学员们对大数据社会科学的理解得到了深化,对进行大数据社会科学研究的具体过程和技术工具的了解得到了拓展,运用大数据的自觉性和主动性得到了提升。清华大学相关单位将总结经验,以便在未来更好地举办此类培训活动,为推动大数据社会科学在中国的发展不断努力。


获取短网址


分享到: 

文章详情,清华大学创新发展研究院,

文章详情-清华大学创新发展研究院

文章详情,清华大学创新发展研究院