时报

您现在的位置: 重庆时报_时报历史 > 时报品牌 > 学术研究近三百年中国城市的国际知名度排名

学术研究近三百年中国城市的国际知名度排名

发布时间:2017-4-30 18:18:10   点击数:

作者:陈云松南京大学社会学系,吴青熹江苏省委党校社会学教研部,张翼中国社会科学院社会学研究所。

摘要:本文利用谷歌图书的百万书籍大数据,以中国地级以上(含)城市近年来英语书籍中出现的词频来展示和分析城市国际知名度的变迁及其特征。研究发现,北京、香港、上海、广州、南京、澳门、天津、台北、重庆和拉萨依次为近年国际知名度的前十强。在此基础上,本文进一步对基于书籍大数据的国际知名度和媒体提及率进行基于时间序列回归的格兰杰因果检验。研究表明,近代中国大陆城市在国际媒体中的提及率显著影响其国际知名度,而港澳台城市的国际知名度和媒体提及率之间则不存在这种关联。这意味着近代以来大陆城市的国际传播主要通过媒体报道进入西方社会。本文最后总结了中国城市国际知名度获得过程的模式和特征。

感谢《大数据时代》作者、牛津大学维克托·迈尔-舍恩伯格,南京大学周晓虹、张鸿雁、成伯清、闵学勤、王浩斌、吴愈晓,武汉大学罗教讲等教授对本文内容和方法所提出的意见和建议。斯坦福大学严飞,南京大学社会学院研究生黄超、刘伟峰、郭亚静、郝小帅和陈迪波参与了部分数据(地级市)的采集工作。读者如需特定城市国际知名度近年详细数据和排名结果,可联系作者。

一、研究缘起

城市是人类文明在地理空间上的汇聚点,具有文化的贮存、传播、交流、创造和发展等基本功能(Mumford,)。在城市的诸多内涵要素中,城市文化是城市的灵魂。作为文化在地理空间上的重要载体,一座城市在全球范围内的知名度是城市综合影响力的重要组成部分。一个国家的城市群体的影响力,是衡量国家的非权力性影响力,也即软实力的重要指标(Nye,)。因此,对城市文化影响力尤其是国际知名度的研究,具有重要的经济、社会和政治内涵。不过,囿于数据和测量的局限,学界迄今尚未对这一领域有过系统的分析和探索。例如,即便是对当代城市知名度进行分析,海外抽样问卷的方法也需要较大的成本且面临样本选择的问题,而如果要观察几个世纪以来城市知名度的变迁轨迹,传统的抽样数据和分析方法就更无法实现。

“大数据”尤其是数字化书籍大数据的适时出现,为开展相关的社会科学研究提供了空前的机遇(陈云松等,)。目前,谷歌图书(GoogleBooks)语料库能提供公元年以来7种语言多万种数字化书籍的全文词频检索(Michel,etal.,;Lin,etal.,)。通过观测和分析关键词在语料库中使用频率的变化,我们可以发现相关的关键词在人类文化发展史中或鲜为人知或饶有趣味的趋势和现象。国际语言学界、历史学界对此已经开始进行跨学科探索(Bentley,etal.,;Acerbi,etal.,;Twenge,etal.,)。国内学者也已利用这一数据,对跨度百年的社会文化现象进行历史轨迹描述和量化分析(陈云松,;ChenandYan,)。

本文首先以谷歌图书年以来的百万英语书籍作为语料库,以中国大陆全部直辖市、副省级以上城市、省会城市、各地级市以及港澳台主要城市英文名称作为关键词,以这些关键词在语料库中每年出现的频率高低为指标,在纵向跨度年、横向跨度达千亿词汇的文化大数据中,精确描绘上述各城市词频位次的变迁及特征。鉴于英语是近百年来全球使用范围最广和最重要的通用语言之一,而积累数世纪的海量书籍则构成数百年里国际社会知识、观念和经验的最重要载体,因此我们认为,基于谷歌图书百万英语书籍语料库的城市词频,可以用来作为测量城市国际知名度的标尺。

在构建国际知名度测度的基础上,我们进一步对中国城市国际知名度的积累渠道进行分析。近代以降,囿于交通、信息传输技术和成本以及清政府在政治、经济、文化和外交上的闭关锁国政策,绝大多数中国城市与西方社会直接的人流、物流互动非常有限。因此,我们提出中国城市群体国际知名度形成的“差异化”假说。具体而言,近代以来中国大陆城市的国际知名度多受到西方当时主要媒体(报纸)提及率的影响,而对于香港、澳门和台北等曾经有过较长殖民地历史的中国城市而言,该关联并不显著:殖民统治使得这些城市直接成为中西文化对撞的窗口,从而具有与大陆城市(没有殖民地历史或殖民地历史较短)不同的知名度获得途径。为检验这一假说,本研究从《纽约时报》全文数据库中提取中国城市提及率指标,并将其与国际知名度指标进行了基于时间序列回归的格兰杰因果关系分析,以观察两者的统计关联在大陆城市和港澳台三城市之间有无差异。本文既是对城市国际知名度进行大数据测量的首次尝试,也是中国社会科学领域较早利用大数据进行的计量模型回归分析。

二、概念及测量

(一)城市的国际知名度

现有文献中城市的国际知名度仅局限于当代,多被量化为国际展览次数、知名搜索网站可搜索信息条数、利用外资和外资企业数量等指标(如马继刚等,;李红波等,)。而且,相关研究均局限在某个城市或某个区域,缺乏对全国城市群体的鸟瞰。总体上,现存文献对城市国际知名度的研究既缺乏时间维度上的历史回顾,也没有全国性的系统分析和测量。本文将借助数百年以来人类最重要和最广泛使用的书面语言文化载体(书籍)这一大数据,来填补这一研究的薄弱环节。

我们认为,在一个具有足够规模、跨度和代表性的英语书籍语料库中,一座城市在某一时间跨度内出现的次数可以代表该城市在该时段内的国际知名度。该测量方法的严密性和合理性在于:第一,书面语言本身是承载人类观念、意识和价值观的最重要、最全面的载体,而英语是近代以来全球使用范围最广、最重要的国际通用语言。因此,英语书面语言载体是用来研究知名度的最佳数据库;第二,书籍中的语言和词汇既能反映作者/撰稿人的个人观点,又能反映和捕捉社会大众的整体思潮。积累数个世纪的海量英语书籍,实际上容纳和承载了国际社会绝大多数的知识、观念和经验。只要我们使用的书籍语料库具有足够的规模、跨度和代表性,我们就可以认为一个词汇在其中的出现频率能够近似地反映这个词汇本身及其蕴含的社会文化影响力和知名度,甚至折射出某种社会趋势、风尚或思潮(Twenge,etal.,)。

不过,考虑到每年书籍中的词汇量不尽相同,因此,我们用词频除以当年的词汇总量,以获得数据的时间可比性。该比例的计算公式为

Rit=CitCt

其中,Rit为城市名在公元t年的词频比例,也即知名度。Cit表示城市i在公元t年的出现次数,Ct为公元t年中出版书籍的全部词汇量。

(二)城市的媒体提及率

与基于海量书籍的知名度指标相比,媒体提及率所捕捉的主要是城市突发事件,也即新闻。因此,媒体提及率受新闻规律的影响显然更大,其变化起伏更为剧烈,内容覆盖较之书籍也更为狭窄。不过,当中国城市和国际社会处于相对隔膜的状态时,国际知名度形成、积累的直接途径往往被堵塞,此时国际媒体的提及与否就会对国际知名度的变化产生非常大的影响,甚至成为主导。这也正是本文关心媒体提及率的缘起:我们试图分析近代以来中国城市的国际媒体提及率与国际知名度之间是否存在紧密联系。

由于互联网等新媒体在20世纪80年代之后才出现,而本文关心的是近代以来中国城市的国际知名度,因此,本文中的“媒体”是指近代报刊等传统媒体。在一个具有代表性的近代西方报刊全文数据库中,我们测量中国城市的媒体提及率的方法是:在分析时间段内的每一年,我们用该年度提及中国城市的文章数量除以该年度报刊的刊文总量。这个比值,也就是城市的媒体提及率,其计算公式为:

Qit=C′itC′t

其中,Qit为城市i在公元t年报刊中的提及率,C′it表示在公元t年的报刊中提及城市i的文章数量,C′t为整个t年中全部文章数。

三、数据和策略

我们使用谷歌图书语料库作为中国城市国际知名度的测量来源数据库。谷歌图书语料库源于谷歌公司自年底启动的对哈佛、牛津等40多所顶级大学图书馆藏书及出版社赠书的数字化工程。年,让-巴蒂斯特·米歇尔(Jean-BaptisteMichel)等人从已被数字化的多万种书籍中选择了其中多万种(种)识别质量较高的非期刊书籍,作为其文化定量分析的语料库。这多万种书籍时间跨度从公元年到年,含7种语言,占古登堡印刷术发明以来人类印刷出版图书总数的4%,词汇量达亿(Michel,etal.,)。到年,超过0多万种书籍已被扫描和识别,可供分析的最新版语料库书籍高达多万种(种),词汇量更高达亿(Lin,etal.,)。表1展示了谷歌图书语料库年版的主要构成。考虑到公元年至年语料库中的书籍较为稀少,甚至有年度空缺,我们把对谷歌图书语料库的分析历史的上限设定为公元年。考虑到年之后的书籍仍然在数字化过程中,为减少样本偏误,我们把分析历史下限设定为公元年。

四、近三百年中国城市的国际知名度

我们首先对个城市近年、年、年、年、50年和20年的国际知名度指标进行分段分析(均截至年),计算出平均知名度来进行排名。考虑到文章篇幅,表2给出了国际知名度排名前20强的城市榜单。2从表中可见,近年、年、年、年、50年(年之后)和20年(改革开放后)等六个不同历史跨度的国际知名度前20强均集中在25座城市。这表明,城市国际知名度本身是较为稳定和集中的指标,尽管年来经历了清、中华民国和新中国三个政权,但知名城市的构成并无太大变化。

表2:近代以来各历史阶段中国城市国际知名度前20强

注:带*者为非省会地级市。

在六个不同历史跨度中:

全部进入前20强的城市有17座,分别是北京(1.17)、香港(2.0)、上海(3.3)、广州(3.5)、南京(5.3)、澳门(6.5)、天津(7.0)、台北(7.2)、重庆(9.5)、拉萨(10.2)、沈阳(11.5)、西安(12.8)、厦门(14)、武汉(14.7)、大连(14.8)、杭州(16.8)和哈尔滨(17.2);

五次进入20强的为福州(18.5)、苏州(19.6);

三次进入20强的为宁波(14.7)、深圳(16);

两次进入前20强的为成都(18);

一次进入的为延安(14)、青岛(19)和昆明(19)。

除了苏州和延安是仅有的两个地级市,排名也比较靠后外,其他的23座城市则由省会、副省级(计划单列)城市、直辖市和香港、澳门、台北构成。

按照不同历史跨度的平均排名:

北京、香港、上海、广州、南京、澳门、天津、台北、重庆和拉萨稳居近代以来中国城市国际知名度的前10名。

五~六(略)

七、中国城市国际知名度的形成模式和特征

利用谷歌图书大数据,本文对年来中国主要城市的国际知名度进行了测量、可视化、排序和时间序列回归分析。由于本文的指标基于百万书籍大数据,因此,它能够较为客观、准确地展示这一时间段内西方公众特别是英语世界对中国城市的总体了解程度。根据前文的时间序列分析,可以发现,大陆城市的国际知名度更多地受到西方媒体提及率的影响,这初步验证了本文提出的“差异化”途径。接下来,本文将进一步完整地提出近代中国城市国际知名度形成的“二元模式”和五大特征。

(一)国际知名度获得的“二元模式”

国际知名度获得的二元模式,主要是指在文化交流过程中存在的直接与间接的知名度获得过程。直接和间接交流的差异,在中国大陆城市和有较长殖民地历史的中国城市之间表现得非常明显。特别是,由于政治体制、市场结构和文化的差异,近代以来中国大陆城市在政治、经济、文化和人力资源的对外交流方面存在较高壁垒,而港澳台三城市曾长期作为殖民地,与西方社会的经济社会来往、人文政治互动等具有天然的畅通渠道。这种差异通过路径依赖和教育模式的复制而随时间不断强化(特别是在香港、澳门回归之前)。

总体上,这种差别的存在使得中国大陆城市和有较长殖民地历史的港澳台三城市在国际知名度获得方面形成了泾渭分明的两大类型。对于港澳台而言,它们“直接”成为中西文化对撞交流的窗口,较为接受西方文化,而西方社会也把它们视为自己的文化亲族,理所当然地会给予更多







































北京治疗最好白癜风十佳医院
上海治白癜风最好的医院


转载请注明:http://www.zhongqingshibao.com/sbpp/8272.html

网站简介 | 发布优势 | 服务条款 | 隐私保护 | 广告合作 | 合作伙伴 | 版权申明 | 网站地图

当前时间: