2017年10月17日,美国佛罗里达大学健康与人类行为学院旅游、游憩与体育系Svetlana Stepchenkova教授与该系Andrei Kirilenko教授来访北京大学城市与环境学院旅游研究与规划中心(以下简称“北大城环旅研中心”)并做学术分享。北大城环旅研中心主任吴必虎教授及全体成员热情接待了两位教授的来访。期间,两位教授在北京大学逸夫贰楼3301会议室分享了他们关于“旅游研究与大数据分析”的学术成果。
Andrei Kirilenko教授分享题目为Data Analytics in Tourism Research: Content Analysis of 2014 Winter Olympics and Quality Control Problems(《旅游研究数据分析:2014年冬奥会文本分析及质量控制分析》)。他以2014年索契冬奥会为例,研究了如何通过社交媒体以及大众媒体进行社会舆情分析。他以Twitter为社交媒体案例,以美国、英国、加拿大、俄罗斯重要报刊为大众媒体案例进行研究,统计并分析了冬奥会前、后各类社交媒体及大众媒体社会舆论的主题及情感趋向状况。研究结果表明,无论社交媒体还是大众传媒,在索契冬奥会前后,它们所讨论的主题都是相似的,但对事件的情感倾向却有所不同。表现为社交媒体在比赛前、中、后所呈现出较大的社会情感波动,而大众媒体却相对较平稳。最后,对于数据分析方法方面,Andrei Kirilenko教授给出以下建议:
一、与精度在0.7的基于知识工程的分类方法相比,基于文本数据的机器学习自动分类拥有0.65-0.8的良好分类精度(Donkor,2014)。
二、Kappa检验的测量精度较差,不推荐使用。
三、机器学习算法适用于对社交媒体文本的快速分析,并且拥有较好的性能。
图1:Andrei Kirilenko教授进行学术分享(照片拍摄者:王臻真)
|
Svetlana Stepchenkova教授分享题目为Looking at Long-term Trends in Tourism Scholarship with Big Data Analytics(《基于大数据分析的旅游研究长期趋势展望》)。首先,她以旅游研究领域内三大顶尖期刊ATR(Annals of Tourism Research)、JTR(Journal of Travel Research)及TM(Tourism Research)为数据源,并在Scopus数据库中收集了三类期刊1974年至2017年8月共8890篇文献。其次,她对这8890篇文献进行查重、查错等,最终选择了7427篇文献进行统计分析。然后,她运用LDA模型(Latent Dirichlet Allcation)对文献进行分析。最后得出以下几方面结论:
一、对旅游社会现象、旅游目的地形象及风险、旅游吸引物的研究成为四十多年来三大期刊研究最多的领域。与此同时,旅游目的地社区研究成为相对冷门的研究领域。
二、美国、英国、澳大利亚、加拿大学者成为三大期刊发文的主力军,但他们的论文总量占比近年也有所下降,主要表现为四国论文总量从1978年-1987年期间的64%下降到2008年-2017年期间的43%。与此同时,中国大陆、西班牙、台湾论文数量比重有明显增大的趋势。例如中国大陆学者在1978年-1987年期间的论文数量比重从1%上升到2008年-2017年期间的5%。
三、从论文第一作者的性别分析,发现男性作者数量比重有下降的趋势,表现为从1970年的93%下降到2010年的57%。
图2:Svetlana Stepchenkova教授进行学术分享(照片拍摄者:王臻真)
吴必虎教授及现场其他参与者聆听了两位教授的学术分享并进行热烈的讨论。学术的火花再一次碰撞。
图3:吴必虎教授与两位教授进行讨论(照片拍摄者:王臻真)
图4:现场其他参与者与两位教授进行讨论(照片拍摄者:王臻真)
图5:吴必虎教授与两位教授合影(照片拍摄者:王臻真)
图6:北京大学旅研中心成员与两位教授合影(照片拍摄者:王臻真)
撰稿人:冯祉烨