舆情快递



首页 · 舆情在线 · 舆情快递

  编者按:

人类学是一门以人作为直接研究对象,并以其行为基础和综合理解为目的的学科,其目的是以全面的方式理解人这个个体。然而现在俄勒冈州立大学的人类学助理教授章邵增老师,却给现在的学者开辟了一个新的人类学运用方向——那就是革新当代的“大数据”。文章指出,首先,在基本的理论和方法论中,我们可以尝试用传统的考古学—民族志结合的方法来对大数据进行处理,在数据分析与解释的过程中来重新地思考数据的真实性和质量问题。其次,从章老师与非人类学专业研究人员的合作案例中展开具体地分析,以此来分析人类学在大数据革新中所起的作用。最后,在大数据分析的考古学—民族志方法的基础上提出“大人类学”的设想,鼓励学生敢于去想象一个“更大”的人类学,敢于把大数据当做人类学田野里面人类行为的遗迹之一。

  电子信息技术在我们的日常生活中的重要性日益凸显,今年新冠疫情的爆发更是加速了这一趋势,电子信息技术正在以飞快的速度改变着人类的行为方式和社会文化。无论是否是人类学研究者,大量的事实证明,我们都有必要借助一点人类学的经典方法来观察存在于社会这个“大田野”中的不断浮现的新的人类行为和社会文化。

正文: 

7月25日,美国俄勒冈州立大学(Oregon State University)人类学系助理教授章邵增老师利用腾讯会议给大家带来了“用人类学研究方法来革新大数据分析”为主题的线上学术讲座。该讲座属于“未来人类学家”安康夏令营课程,同时对社会开放,也吸引了其他听众和海内外知名学者参与。北京大学赖立里老师和任珏博士进行了评议和讨论。

  本次讲座主要包含三个部分。第一部分以大数据的数据真实性和数据清理这个关键难题为出发点,简要介绍了多学科诸如数据科学(data science)、传媒研究、人类学等在这个难题上的探索,并提出了结合考古学和民族志方法来处理这个难题的新思路。第二部分详细介绍了这个结合人类学方法的大数据分析新思路如何成功地应用于三个跨学科的大数据研究项目,包括网络游戏数据、家用产品传感器数据和社交媒体数据。第三部分总结了这个新思路对大数据分析的方法论的革新意义,并提出了在信息技术普及时代如何再次想象和拓展人类学这个问题以供大家思考。

  在讲座的第一部分,章老师认为,尽管大数据目正飞速增长、甚至仿佛无处不在,但仍非一切事物都已进入电子化计算。大数据分析的迅速发展得益于其史无前例的数量(Volume)、速度(Velocity)和多样性(Variety),但目前仍受困于数据真实性(Veracity)的问题而未能充分有效地实现其和价值(Value)。大数据研究者都将数据清理作为数据使用和分析之前的一个独立步骤,但这种做法实际上可能误导了数据真实性问题的理解和处理。在章老师看来,“数据清理”是在数据分析之前就预设了“真”与“假”的二元对立,但如果将数据中人的因素考虑进来,这种对立便可能会即刻消解。而需要纳入考虑的“人”的部分,往往是大数据本身未能涵盖的。那么如何将人纳入到大数据分析实践中?有些被轻易清理出去的数据,比如所谓的虚假数据和噪声数据等,可以是很好的切入点。毕竟很多这些看起来很麻烦的数据也大都是今天人类使用信息技术产品的行为所留下的原始证据 ,为数据完整性和价值等多重原因都不应该急着剔除。

  章老师强调,电子设备用户直接生成的和安装在现实世界中的各种传感器生成的大数据,其实都是人类活动和行为的痕迹。更确切地说,这样的大数据只是世界上部分人留下的部分行为遗迹而已,因而往往是不完整的、不具代表性的数据。大数据的这些特质一如传统的考古学数据。因此,我们应该对大数据有新的认知,将其定义为一种新的考古学数据,并将考古学的方法应用于大数据的分析。

  考古学的经典方法对处理这样的数据有多重的优势。其擅长于分析和利用有幸遗存的不完整、不具代表性的数据,并重视数据的解释性价值,包括数据的历史来源,也包括有瑕疵甚至有偏见的数据。考古学的推理重在追溯和重建数据产生和遗存的情境,只有在具体的情境中才能实现科学的分析和有意义的推理。当然,情境化解释的方法论路径并不限于考古学,人类学的其他分支学科也是如此,如主要在社会文化人类学的民族志研究。秉持着严谨的科学精神,人类学者往往采取多个数据来源相互确证的研究方法,如民族志研究往往结合参与式观察、深度访谈、问卷访谈和文献收集等多种数据收集方法,并在此基础上进行跨文化比较来提炼可靠的结论、发展出概念和理论。而当前的大数据分析往往孤立地使用大数据,大数据虽然量大、且方便获得和使用,却往往是脱离了其生成和遗存的情境,因而很难判断数据的真假,也很难判断数据分析结果的代表性和推论意义。幸运的是,大数据作为人类留下的行为痕迹和考古学数据,来自于很近的“古”甚至是正在展开的现在,而民族志方法正好擅长于研究活着的人和正在展开的现在,尤其擅长于“深描”来重建人类行为的情境,因此可以为大数据这种考古学数据做出很好的补充、确证和更可靠的解读。因此,或许我们应该重新关注可用数据的多样性,并尝试以考古学-民族志结合的方法来处理大数据,重新思考数据的真实性或质量问题:不将其作为数据分析前的一个独立步骤,而是在数据分析和解释的过程中解决。

  在阐释完基本的理论和方法论之后,章老师在第二部分以他与非人类学专业研究人员的三个合作研究案例展开了具体的分析。他首先以精灵宝可梦(Pokémon Go)游戏中的位置恶搞为例,说明在具体情境中进行大数据分析的意义。在这个游戏中,全世界大量玩家都进行了“位置恶搞”,即利用网络机器人、APP软件、无人机和宠物狗等工具来伪造游戏玩家的实际地理位置去捕获游戏精灵和获取精灵资源,其结果就是产生了海量的伪造了位置信息的游戏数据。游戏公司直接斥之为作弊,并终止作弊玩家的游戏账号。但是章老师及其合作者认为这些数据有其背后的价值所在。于是他们在地理信息系统(GIS)和大数据分析中融合了人类学民族志的方法,去亲自参与这个游戏并访谈那些“恶搞者”,从而更有效地解读数据背后的行为动机和社会意义。很多游戏玩家恰是通过“位置恶搞”来挑战精灵资源分布的不平等和商业资本的虚伪,进而实现自己智力、技能、道德和情感上的满足。因此,这些表面上的假数据,都来自于人类真实的行为遗迹其实,因此也是真实的数据。而且它们是有用的数据:对于游戏公司来说,这些数据能够帮助他们重构商业战略;对研究人员来讲来讲,这些数据可以用来研究人的游戏行为,还可以去开拓新的人文地理学的研究方向。

  第二个案例是关于2016年下半年反对美国达科他州石油管道网络的一场社交媒体抗议运动而形成的海量数据,包括用户发帖元数据中的“虚假”位置数据和帖文的真实内容。融合人类学的方法,包括对抗议运动背景的追溯和对网络抗议者的访谈,揭示了这个99%数据都是“假数据”的数据集对研究人机互动(包括用户与社交媒体内容推荐算法的互动)、新形式社会运动、以及“后真相时代”等重要议题的价值。第三个案例是关于在国际发展领域清洁炉灶项目中用于监测炉灶使用状况的实时传感器产生的大数据。尤其这些数据中的异常峰值或“噪声”数据,进行自动化数据清理的人工智能算法直接剔除了这些数据,但是用民族志方法得到的情境化数据,则揭示了数据峰值其实很好地反映了某些用户对燃料支架的策略性使用,从而有力支持了监测系统和炉灶设计的改进。

  最后,章老师总结了大数据分析的考古学-民族志方法,并在此基础上提出“大人类学”(big anthropology)的设想。首先,当今新的数据格局需要在认识论上重新定义大数据、在方法论上革新数据分析,以便更可靠地评判大数据的真假、更有效地利用大数据的价值。然后,这种融合了人类学方法的大数据分析不再是将一些数据简单作为虚假或无用的数据而剔除,而是以情境化的方式解决数据真实性或质量问题,重视那些所谓有问题的数据的价值,这样才会有助于重新审视整个大数据集的代表性和价值。在此基础上,章老师鼓励夏令营的“未来人类学家”同学们敢于去想象一个更大的人类学, 敢于把大数据当作人类学田野里面人类行为遗迹之一种而已,融合人类学多分支学科的多种方法、技巧和数据源去做分析和理解,这样既有助于有效挖掘大数据的潜力,又可以拓展人类学的学科视野。

  在讨论环节,同学们以实际案例和章老师进行互动,例如美国通过大数据计算分析尝试在警务系统中缓解种族冲突时,由于先于分析而产生的歧视,实际上是加强了种族歧视,而非解决此类不平等。赖立里老师和任珏博士也从自己的教学研究和从业经历给予了相应的补充解答。学员们受益匪浅,本次线上学术讲座在热烈的氛围中完满结束。

章邵增老师寄语

  我非常荣幸收到夏令营组织方和同学们的邀请,也非常激动能在这个特殊的时期远程但是亲切地与夏令营的同学们一起去想象未来的人类学,以及未来的人类学家。

  电子信息技术在我们的生活中日益重要,而新冠疫情又加速了这一趋势,迅速改变着我们的行为方式和社会文化。如果说人类学者田野调查的传统是要到一个新的、不同的社会里去经历“文化震撼”,去观察和理解一个未知的社会,那么2020年我们都倍受震撼地进入了一个迥异于昨的后新冠社会,一个新的人类学田野。人类学者与否,我们都有必要借用一点人类学的经典方法比如参与式观察,去观察和理解这个新田野里不断浮现的前所未见的人类行为和社会文化,比如远程讲座的普及。这样的文化震撼之后,我们得想想,接下去要做什么样的人类学研究、怎样做人类学研究?我一般都觉得我自己还挺年轻的,但是我不得不承认几年前我读大学本科的时候可没有“未来人类学家夏令营”这样的好活动,既可以增加师生之间课堂之外的交流,又可以与人类学小圈子之外甚至学术界之外的大社会进行人类学的交流。我觉得这样很有创新的活动,就是未来人类学家迈出的第一步,探索未来人类学的好开端。