2016年11月10日 星期四 国内统一刊号:CN51—0098     中国•企业家日报

计量反腐学学科概览

来源:企业家日报 作者:

  ■ 李后强

  

  马克思曾经强调,“一门科学只有在成功地运用数学时,才算达到了真正完善的地步。”

  腐败是社会的恶性“肿瘤”,是人类共同的敌人。反腐败,既是工作,也是科学,应该努力使用现代数学工具和手段,以达到更加精准和有效的要求。腐败是人性贪婪与制度缺失的结果,世界各国都有,表现形式多种多样,但其本质是公权私用。通俗地说,“腐败就是滥用国家权利谋取个人私利的行为”,就是用公共权力为自己捞好处、谋利益的行为,如权钱交易、权色交易、权权交易等。科技反腐是国际发展趋势,越来越受到各国政府和组织的重视,并取得显著成效。科技反腐的重点不是网络举报,而是数据收集、存储、分析,相关性研究,通过计量和计算找到各类数据(现象)之间的必然关系。计量,简单地说,就是计算、量化、定量、计数等,既有传统方法也有现代方法。计量反腐学是一门用数学方法特别是用大数据手段研究腐败发生特点、趋势、规律及如何预防、惩治、根除腐败的学科,有其自身的概念、方法和原理,目的是铲除腐败存量并抑制腐败增量,最高目标是让腐败无处藏身,永远绝迹。

  当今社会增长最快的不是物质财富,而是各类数据。人类每秒钟创造的网线长度已经超过了声速。数据膨胀的速度和原子弹爆炸的速度是一样的,而这是一个持续的爆炸,远远不是一瞬间。据说,到2050年数据量将达到非常恐怖的100万Zetabit,一个Zetabit是1万亿G,由此进入的时代叫Zeta时代。所有生意都是数据生意。什么是数据?除了通常的阿拉伯数字1、2、3、4、5……外,还有文字、图像、声音等,因为文字、图像、声音可以分解成数据。比如,我们元旦节召开一个庆祝晚会,那么现场记录的讲话、谈话、笑声、歌声、录像、节目单、字幕、横幅、座位、水杯、茶叶、人数、职业、性别、民族、温度、入场次序、空气质量等等,都是数据。又如在酒楼聚餐,订餐人、包间号、室内装饰、座位、菜单、价格、酒水、服务员、就餐时间、就餐人员、入席次序、结束时间、付款人、召集人、男女性别等等,都是数据。根据这些数据不但能够恢复现场,而且能够提取我们需要的重要信息。通常讲,数据就是数值,也就是我们通过观察、实验或计算得出的结果。数据可以用于科学研究、工程设计、案件查证等。大数据(Big data)就是极其庞大的数据量和相当规模的数据类型,就是无法用传统方法储存和处理的数据量。更准确地说,大数据是指无法在可承受的时间范围内,用常规软件工具进行捕捉、管理和处理的数据集合,是需要用新处理模式才能获取强大决策力的海量的、高增长和多样化的信息资产。也有人认为,大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等特征。亦即,尽管数据量很大很大,已经超出传统处理能力,但许多数据是没有价值的,在海量数据中只有极少数据有实质性意义,因此价值密度很低,工作量极大。大数据通常有“5V特点”:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)和Veracity(真实性)。表面看,大数据是一串数据,是一个科学名词,实际上,大数据是一种方法与思维的革命,甚至是一种哲学、一种范式、一种文化、一种信仰的转换。当我们遇到难题,只要想到大数据方法,就可能是“山重水复疑无路,柳暗花明又一村”。2015年9月,国务院印发了《促进大数据发展行动纲要》,系统部署了大数据发展工作,明确要求推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。未来的时代,将不是IT时代,而是DT的时代。

  在大数据处理中,关键是云计算(cloud computing)。对云计算的定义有多种,据说至少可以找到100种解释。自然界的“云”,是指停留在大气层上的水滴或冰晶或者由它们混合组成的可见集合体,是地球上庞大的水循环的有形结果。云的类型很多,可以有各种形状,有不同颜色,有不同厚度。信息概念的“云”,就是对于网络、互联网的一种比喻。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象表征。有人认为,云计算这个名词可能是借用了原子结构中的“电子云”(Electron Cloud)的概念,目的是强调说明计算联系的弥漫性、无所不在的分布性和广泛的社会性等特征。中学知识告诉我们,在原子核周围运动的电子,是弥漫整个空间的,并且以云状形态存在,因此描述电子的运动不能用牛顿经典力学而是用概率分布的密度函数(用薛定谔波动方程来描述),以此来说明在特定的时间内,粒子位于某个位置的概率有多大,而不能说明精准的位置,这跟经典力学的提法完全不同。

  在信息领域,“云”是一些可以自我维护和管理的虚拟计算资源,通常是一些大型服务器集群,包括计算服务器、存储服务器和宽带资源等。需要记住的是,“云”是一个庞大的资源池(资源包括网络、服务器、存储、应用软件、服务等),你可以按需购买;云可以像自来水、电、煤气那样进行计费。“云”具有相当的规模,谷歌(Google)云计算已经拥有100多万台服务器,亚马逊、IBM、微软和雅虎(Yahoo)等公司的“云”均拥有几十万台服务器。“云”能赋予用户前所未有的计算能力。“云”的规模可以动态伸缩,能满足用户规模增长的庞大需要。大家用“云”这个概念,是因为它在某些方面具有现实中云的特征:云一般都较大;云的规模可以动态伸缩,它的边界是模糊的;云在空中飘忽不定,无法也无需确定它的具体位置,但它确实存在于某处,只要我们需要它就可以找到,并立即出现在我们的眼前。常见的云服务有公共云(Public Cloud)与私有云(Private Cloud)两种。云计算的特点是超大规模、高可靠性、高可扩展性、虚拟化、通用性、多样性、便利性、按需服务。我们可以将所需的软硬件、资料都放到网络上,在任何时间、任何地点使用不同的IT设备互相连接,就能实现数据存取、有效运算等操作。我们可以通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。云计算的核心理念是资源池,池的规模可以动态扩展,分配给用户的处理能力可以动态回收重用。这种模式能够大大提高资源的利用率,提升平台的服务质量。云计算将计算资源集中起来,利用网络使多台计算机共享信息以完成相同或相似的任务,使得计算变得方便快捷,并通过专门软件实现自动管理,能够让用户按需获取计算力、存储空间和信息服务。云计算是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,许多跨国信息公司正在使用云计算的概念兜售自己的产品和服务。其实,云计算在这个概念被提出来之前就已经存在这种处理方式了,所以从操作上讲并不新鲜,它就是基于互联网的相关服务的增加、使用和交付的模式。云计算可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟氢弹爆炸、预测气候变化和市场发展趋势,用于研究腐败现象当然可行。

  在计量反腐学中,如果把云计算与物联网结合,就能发挥更大监督和预防作用。物联网是新一代信息技术的重要组成部分, 是“感知中国”的重要内容。物联网是指通过传感设备,把需要监控、连接、互动的物体或过程的信息,与互联网结合形成的一个巨大网络,其目的是实现物与物、物与人,所有的物品与网络的连接,从而方便我们进行识别、管理和控制。物联网的英文名称是:“Internet of things(IoT)”。顾名思义,物联网就是物物相连的互联网,其基础仍然是互联网,云计算是实现物联网的核心,其用户端可以延伸和扩展到任何物品与物品之间,并进行信息交换和通信,也就是物物相息。1999年提出的物联网概念是:通过射频识别(RFID)(RFID+互联网)、红外感应器、全球定位系统、激光扫描器、气体感应器等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。根据国际电信联盟(ITU)的定义,物联网主要解决物品与物品(Thing to Thing,T2T),人与物品 (Human to Thing,H2T),人与人(Human to Human,H2H)之间的互连。其中,传感器技术是关键,需要把模拟信号转换成数字信号,这样才便于计算机处理。RFID标签也是一种传感器技术,它融合了无线射频技术和嵌入式技术,RFID在自动识别、物品物流管理领域有着广阔的应用前景。嵌入式系统技术综合了计算机软硬件、传感器技术、集成电路技术、电子应用技术。经过几十年的演变,以嵌入式系统为特征的智能终端产品随处可见,并正在改变着人们的生活,小到人们身边的MP3,大到航天航空的卫星系统。如果把物联网用人体做一个简单比喻,传感器相当于人的眼睛、鼻子、皮肤等感官,网络就是神经系统用来传递信息,嵌入式系统则是人的大脑,在接收到信息后要进行分类处理。智能标签很重要,例如在生活中我们使用的各种智能卡、二维码、条码标签,其基本作用就是用来获取对象个体的识别信息。此外,我们通过智能标签还可以获得对象物品所包含的扩展信息,例如智能卡上的金额余额,二维码中所包含的网址和名称等。只要在物品(服装、手表、书画、金银等)上贴上智能标签,就能随时识别和监控物品的流向和位置。专家预测,物联网普及以后,用于动物、植物和机器、物品的传感器与电子标签及配套的接口装置的数量,将大大超过手机的数量。人类可以以更加精细和动态的方式管理生产和生活,达到“智慧”状态,提高资源利用率和生产力水平,改善人与自然间的关系。但是,我国射频标签的芯片和读写器的核心模块仍然依赖进口,射频标签自主技术标准也严重缺位,必须加大创新力度。

  我们的社会已经进入“数据文化”时代。让“大数据说话”成为潮流。几乎每一部智能手机都可以定位使用者一天的行迹,通过对海量数据信息的分析,就能探寻个人行为特征,进而有针对性地管理。在大数据、云计算和物联网视野里,一切透明,没有隐私和暗箱,因此对腐败现象的研究,有特殊价值。腐败的特点是“见光死”,只要透明,就没有腐败,只要有监督,就没有腐败。利用大数据可以发现腐败痕迹,寻找腐败特征和规律,进而探寻预防对策。可以说,大数据就是阳光,就是自动跟踪器,能预防和消除腐败。各个部门特别是组织、公安、法院、银行、房管、工商、电信等部门的数据要交换、共享、整合、分析,发挥电子政务的作用。目前,国外大数据反腐多数建立在电子政务基础之上,因为每个权力运行都会在上面留下痕迹。当然,这里必须界定哪些数据是由纪检监察机构掌握的,因为这涉及干部个人隐私。目前,中国最需要进行数据立法,出台《数权法》,与《物权法》一样,保护个人数据。个人数据是指与一个身份已经确定或者可以确定的自然人(数据主体)相关的任何信息。身份可以确定的人,是指其身份可以直接或间接,特别是通过身份证件号码或一个或多个与身体、生理、精神、经济、文化、社会身份有关的特殊因素来确定的人。对于个人数据要进行保护,没经本人同意或相关部门批准,不准泄露和使用。

  在中国,我们希望构建“不敢腐、不能腐、不想腐”的体制机制。“不敢”是外压问题,“不能”是制度问题,“不想”是道德问题,三者层次不同,采用的方法也不同,但共同点都是抑制腐败发生,关键是引入高科技手段,剖析腐败发生的根源及其扩散规律。数学与物理学已经为此做好了思想和工具的准备。比如,传统数学中的非线性扩散方程、统计分析、动力系统等可以用于研究腐败发生的趋势和规律。为什么腐败分子都是“两面人”?可以用数学的“莫比乌斯环”或“克莱因瓶”来描述。窝案、串案如何形成?可以用数学物理中的DLA(扩散限制凝聚)模型来描述,从而找到形成过程。腐败的蔓延可以用扩散方程或传染方程来描述。从小腐败到大腐败直至“出事”的临界点和分叉点,可以用“中心流形定理”来描述。腐败从有序到无序的发生过程,可以用动力系统的KAM定理来判断。要达到“不敢腐”的目的,必须要快速准确识别腐败分子,形成高压态势,使各级公权掌握者有畏惧心理;要达到“不能腐”的目的,必须是扎牢制度笼子,堵住各种可能腐败的漏洞,做到无机可乘;要达到“不想腐”的目的,必须让各级公权掌握者深刻认识到腐败付出的代价,现代科技的巨大威力,伸手必被捉。大数据主要用于研究数据现象之间的相关性,具有很强的预判功能,对于构建“不敢腐、不能腐、不想腐”的体制机制具有特别重要的意义,可以解决传统方法不能解决的难题。为便于理解,我们举几个简单例子。

  问题一,比如调查大学生谈恋爱,只要分析食堂饭卡相关性就清楚了。在一段时间内,如果两张饭卡总是一前一后同时出现在同一食堂,并且持卡人性别是一男一女,那么基本可以肯定二者已经建立恋爱关系,事实证明的确如此。专家只要分析大学生的“一卡通”数据,就能知道学生的日常行为和社会关系。

  问题二,比如预判干部生活作风,只要分析餐馆、酒楼、宾馆、商场、电影院、交通工具等储存的公开数据,就可以知道某干部经常出入的场所(如宾馆、餐馆、道路等),与哪些人关系密切,再跟踪分析这些人的职业和品行,由此能判断他(她)会发生哪些问题,如权钱交易或权色交易,从而提前打招呼和提醒,或按照中央纪委的“四种形态”进行处理。在大数据领域有一句名言,“混乱是还未被发现的数列”。科学家总能在混乱中发现规律,找到相关性。国外使用大数据方法预测过总统大选和电影奥斯卡奖得主,准确率达90%以上,基本没有秘密和悬念可言,结果总能提前揭晓,其他只是等着走程序。

  问题三,比如调查现金行贿问题,过去这是一个难点,只要双方不认账就很难认定,现在通过大数据就很容易掌控。因为每一张纸币都有一个编号,就像身份证号码或汽车牌照号一样是唯一的,没有重复号码,没有两张纸币的编号是相同的。对于人民币而言,就是“人民币冠字号”,如2005年版某张100元人民币的冠字号是K059724385,另一张100元的则是G4N5270318;又如某2005年版的10元人民币的冠字号是P0D5004008,另一张是P8A0304269;还有2005年版某张50元人民币的冠字号是R195040718,某张20元人民币的冠字号是ED45784213,等等。每一张人民币编号都不一样,2005年版的人民币英文字母加数字共10个字,在银行大数据库中都有记录。某公司、某单位、某人掌握的现金纸币编号都在银行储存着,一旦出现在另外的公司、单位或个人手中,只要超过一定数量,并且当事人不是亲人、家人关系,装有特殊脸谱识别或指纹识别功能的验钞机器就可以报警,有关机关就有理由要求当事人说明原因。这样,现金行贿就很难了,因为受贿的现金无法使用。如果转账,就更容易查出来,每笔资金进出银行都有痕迹。如果送贵重物品或有价证券或购物卡,因为每个销售公司都有记录,只要使用人员不对,机器马上报警。在保护个人隐私的情况下,对于国家公职人员可以建立专门的数据库,包括指纹、脸谱、家庭财产、现金冠字号码、血缘亲戚关系、社会人脉关系等,这样很容易实现个体监督。对于贵重物品如黄金、名画、名表、服装等,可以植入芯片,让物品自己“说话”,实现物与物对话,随时可以跟踪,就像汽车的GPS系统,走到哪里跟踪到哪里,并与干部大数据库联网,任何腐败痕迹都能发现。特别是把各个部门的监控数据进行整合,例如把交通、宾馆、饭店、银行、商场、影院等方面的公开数据汇聚分析,很快能发现有问题的人。从现代技术角度讲,把大数据与物联网结合,任何腐败行为都能随时掌握,没有盲区和空白,腐败无处藏身。当然,这样会使一些领导干部产生抵触情绪,因为涉及个人隐私、个人数据保护。

  问题四,比如对于“一把手”的监督,这是预防腐败的最大难题,但可以用大数据来解决。权力过度集中、监督主体缺失、监督制度不完善等是造成对“一把手”监督难的主要原因,其核心在于“一把手”自由裁量权过大、信息不对称、利益不一致等关键因素。随着传统计量方法、数理模型方法的发展特别是大数据技术在反腐败领域的运用,破解“一把手”监督难题已经成为可能。只要把“一把手”的权力清单量化,把权力边界划定清楚,把他(她)每天除开私人空间外的行为数据都记录下来(包括决策过程、调研情况、社会交往等),然后进行相关性分析,并把结果报告纪律管理部门,就可以知道他(她)行为正确与否,上级领导可以及时提醒,抓早抓小,防止小错演变为大错。这种监督是把监督权力交给机器,交给数据,交给社会,因此科学性、操作性较强。用这种方法也可以防止“权权交易”。实际上,只要把决策者的行为数据进行分析,并且与相关纪律(6类负面清单)法律进行对比,就能判定权力掌控者之间是否有交易行为。贵阳试点的“数据铁笼”,就是把能纳入网络的行政权力全部纳入数据库,让权力运行全程电子化,处处留痕迹,实现人在干,“云”在算。

  问题五,比如用蒙面或整容或造声进行腐败,也没有用。因为人的声纹不会改变,就像指纹一样,储存在大数据库中,只要进行比对就清楚了。人的头像尺寸、轮廓定位、动作习惯、饮食方式、生化指标、基因序列等,都可以记录在大数据库中,一旦需要就抽出来比对,因此外表的改变也无法改变最终结果和命运。大数据就是这样厉害!恪尽职守!

  从概念上说,“大的数据”与“大数据”不同,前者是死资源,不能说话,后者是活脑袋,可以像福尔摩斯一样分析找出线索。大数据可以用于各种社会或自然关系的分析,能够使未来更加清晰、更加靠谱,减少随机性或不确定性,使人们在已知的道路上前进。关键是要树立“大数据思维”,就是遇事就想大数据,相信总能从海量数据中找到答案。本质上,这是一种整体的系统思维,相信世界上任何事物都是相互联系的,就像人体各个器官都是有机联系,总能由表及里,挖出内容。只要树立了大数据思维,反腐就像中医治病,能够“头痛看脚”,根据餐厅的数据可以查出加油站的数据,从银行的数据可以查出宾馆的数据,从子女的数据查出父母的数据,从亲友的数据找到领导干部的数据。过去没有互联网、物联网、大数据储存设备和云计算,无法让反腐败工作插上科技的翅膀,因此反腐难以成为完美的科学。现在都有了,于是诞生了计量反腐学,能够进行精准反腐。这是科技的力量,智慧的映照,大数据的威力。

  当代社会的显著特点是学科交叉融合,文理渗透,新的学科和理论不断涌现。计量反腐学就是横向交叉学科,用上了高级数学、大数据、物联网和云计算,是一门实用科学,也是一门战略科学,世界上没有先例,是中国人自己创造的学科。在计量反腐学视野中,大数据就是照妖镜、显微镜,物联网就是报警器、手术刀,能使腐败无处藏身并手到病除。计量反腐学的诞生符合“创新、协调、绿色、开放、共享”的发展理念,顺应了时代潮流,回应了社会期盼。我们正走在大数据和物联网的路上。因此,我们坚信,未来必定是一个清廉光明的新世界。

  (作者系四川省社会科学院党委书记、教授)