?
泰州市海陵区审计局 王鹏
?
【摘要】国务院《关于加强审计工作的意见》中对大数据技术在审计工作中的运用提出了相关要求,大数据思维正对传统审计工作如审计思路、审计取证产生了很大的影响。对大数据技术审计取证结合数据挖掘技术方法进行了阐述,并对大数据技术取证风险及应对进行了分析研究。
【关键词】大数据审计 数据挖掘 审计证据 取证风险
?
一、引言
近年来,“大数据”成为了我们生活中的一个热词,大数据技术其实已经在我们生活之中各行各业无处不在,例如,基于你在购物网站的浏览习惯,网站会自动推荐你可能感兴趣的商品;在飞机上安装传感器收集发动机工作数据,对可能出现的故障进行提前预警。通过对海量数据的学习、分析,形成一种对潜在可能的预测,大数据技术正在悄无声息的改变着我们的生活。但大数据技术在审计工作中的应用才刚刚起步,国务院《关于加强审计工作的意见》(国发〔2014〕48号)中,对加快推进审计信息化工作作出了相关要求,“探索在审计实践中运用大数据技术的途径,加大数据综合利用力度,提高运用信息化技术查核问题、评价判断、宏观分析的能力。”这是国家审计署第一次将大数据技术在审计工作中的运用列入审计信息化工作重点。审计部门作为经济运行综合性监督部门,审计证据、审计报告经常需要以数据来说话,所以审计部门要保持对社会经济数据的灵敏触感,充分适应大数据环境,并深度挖掘、充分运用所拥有的数据,以大数据思维来开展审计工作,是服务国家治理的内在要求和必然选择。在这样大环境下,如何利用大数据技术开展审计工作,如何利用大数据技术取得审计证据,利用大数据技术取证有哪些风险,应该如何降低或者规避风险,都是值得我们认真思考问题。
二、大数据技术审计取证的特点和技术方法
审计证据是指审计机关和审计人员获取的,用以证明审计事实真相,形成审计结论的证明材料。运用大数据技术取证与传统审计取证有何不同?在传统审计工作中,对于大量需要审计的数据,一般采用数据抽样分析。抽样审计模式,由于抽取样本的有限性,存在着一定的审计风险。大数据技术审计取证“样本=总体”的全数据模式是要分析与被审计对象相关的所有数据,建立全局审计的审计思维模式。例如,对医院业务进行审计时,不再局限于个别业务种类、个别部门的抽样,可以从整体分析医院业务异常的波动点,从而得到审计疑点,取得相关审计证据。在全数据模式下开展审计数据分析取证,收集总体的所有数据,就能看到更细微、深入的信息,就可对数据进行多维度的深层次分析,从而发现隐藏在细节数据中的更具价值的信息,规避了抽样风险和从局部推算整体的局限性,从而使得审计数据分析工作结果更加精准。
大数据的特点是数据体量巨大、数据类型繁多、价值密度低。如何从浩瀚的海量数据中发现对审计工作有价值的信息,是基于审计人员提前对被审计对象的整个经济活动有充分的认识和深入的了解,并对大数据进行数据挖掘(Data mining)的过程。数据挖掘,简单的说,则是一个从未经处理过的数据中提取信息的过程,重点是找到数据的相关性和模式分析。这样的一个过程就是审计证据取得的过程。
数据挖掘的方法有很多,它们分别从不同的角度对数据进行挖掘。其中绝大部分都可以用于审计工作中。
1.关联分析。关联分析主要用于发现隐藏在大型数据集中的有意义的联系,所发现的联系可以用关联规则和频繁项集的形式表示。进行关联分析时,主要包括了两个阶段:第一,从大型数据集中导出频繁项集;第二,利用频繁项集生成关联规则。利用关联分析, 审计人员可通过对被审计数据库中的数据利用关联规则进行挖掘分析, 找出被审计数据库中不同数据项之间的联系, 从而发现存在异常联系的数据项, 在此基础上通过进一步分析, 发现审计疑点。
2.聚类分析。聚类分析将数据划分成有意义或有用的组,然后发现其特性。在审计过程中,通常是利用聚类分析技术对信息系统中被审计单位的同类型的财务数据或者业务数据进行分组,使其成为有相似特性的聚集。一般说来,相关经济活动数据的变动具有一定的规律性。所以如果某些数据处于稀疏区域,说明其变动表现异常,需要重点关注。同时通过观察该区域记录的特征,可以发现审计需要查证的问题特征。
3.分类分析。分类的主要功能是根据数据的属性将数据分派到不同的组中。在实际应用中,需要运用一定的统计方法从数据库中选出已经分好类的样本数据库作为训练集,在该训练集上运用数据挖掘分类的技术建立分类模型,然后根据数据属性对没有分类的数据进行分类。
4. 离群点挖掘。离群点,又称孤立点,是指数据集中偏离大部分数据的数据,使人怀疑这些数据的偏离并非由随机因素产生,而是产生于不同的机制,即不满足一般模式或行为的数据。在审计工作中,审计人员需要通过职业判断,发现异常审计数据或异常发生频率等,从而发现有可能隐藏的违规行为。
三、大数据技术审计取证风险和防范
大数据技术审计取证相比传统抽样审计取证有着更加精确、更加全面的优点,但是在大数据环境下,所取得的审计证据仍然必须具有充分性和适当性,大数据的特征和审计人员的认知决定了大数据技术审计取证有不可规避的潜在风险,这些风险有内在原因也有外在原因,对此审计人员有必要引起相当的重视,并在日后的审计工作过程中做出预判和应对。
1.数据盲点的存在
大数据时代,审计人员取得的信息数据中存在盲点与噪音,简单的说,盲点就是“我不知道”和“不知道哪个重要”。针对大数据技术审计,可能存在两个问题,一是取得数据的人不知道别人怎么用,二是用数据的人不知道数据从哪里来。
1.1 物理盲点。数据集中不存在、没有收集的数据。一种因为主观因素没有收集,另一种由于技术或者环境因素不能收集。这两种情况的存在,可能导致审计人员取得的审计证据并不能真实的反映被审计对象的真实情况,影响了审计证据的充分性与适当性,例如采集数据的审计人员采集了被审计对象的全部数据,但是被审计对象提供的数据没有及时更新,也就收集不到被审计对象真实有效的数据。再比如数据采集人员没有了解审计项目的审计目标,导致采集的数据不全面。
所以,审计数据采集必须是基础中的基础。大数据技术审计过程中,首先要解决的就是采集基础数据,基础数据各部门各单位的侧重都不一样,统计、记录口径也有很大差异,根据审计目标有选择性的采集基础数据,基础数据必须是基础中的基础。在进行数据采集前, 审计人员应结合本次审计工作方案中明确的审计目的、范围、内容及重点,结合审前调查了解到的被审计单位数据的来源和形式,以此来确定本次数据采集的范围、内容及重点。
1.2 逻辑盲点。审计人员没有关注或已经忽略的重要数据。逻辑盲点往往与审计人员的经验和能力有关,这一风险直接影响了审计质量。例如,审计人员只注重某一交易的成交量,却没有关注相关交易的退单量,导致了审计证据的适当性受到了影响。一方面是由于审计环境发生了重大变化,另一方面,数据挖掘模型与审计思路多是基于审计人员的经验,易于发现个案,但对审计对象整体的情况缺乏全面把握,毕竟审计人员的经验和知识是局限性的,随着被审计对象业务流程和信息技术的创新,审计人员的经验和业务技能进入“尾随”状态,审计模型相对于数据滞后,审计经验无法运用。
所以,在每个审计项目实施前,需要科学合理配置审计组人员,要考虑审计人员的经验程度、计算机应用能力高低甚至年龄的大小等,尽量组成结构合理的审计小组,这对大数据环境下审计风险的规避有重要意义。审计人员还要将数据挖掘分析得到的知识集成到审计业务信息系统的组织结构中去,使审计人员能在随后的审计工作中组织和运用这些审计经验,借鉴以前的数据挖掘思路,以提高其数据分析能力和业务水平。
1.3 人为制造盲点,也就是假数据。制造假数据的方法和因素有很多,被审计对象的舞弊行为,可能会通过看起来符合常规的行为来掩饰,或者直接不放入采集的数据之中,例如,一些账外资产、小金库,可能被被审计对象藏蔽起来。审计人员在运用大数据技术进行审计的时候,还需要具备负数据思考的能力。反向观察也是一种负数据思考,在通过大数据技术取得的审计证据,不能仅仅局限于数据挖掘模型、数据、表格,还需要通过审计实地盘查,结合实物证据,考虑被审计对象可能发生的舞弊行为。做大数据分析,需要做趋势判断、疑点判断,趋势分析、疑点分析还需要结合环境,行业背景,作出审计人员的反向观察。
2.大数据技术审计证据的脆弱性
大数据技术审计使一些常规的审计概念和内涵等出现了变化,比如审计证据中的电子证据,电子证据不可避免的具体一定的脆弱性,其脆弱性表现在两个方面,一方面大数据技术审计证据是计算机系统重新显示或复制出来的,只能是原件的副本,不可能是传统意义上的原件,其审计证明力比较脆弱,另一方面,电子数据易于修改的特性,使得大数据技术审计证据的真实性和安全性也比较脆弱。
为规避或者降低审计证据脆弱性,采集数据应提取全部数据及后台备份数据,确保采集数据的源头准确、可靠。在获得原始数据之后,与被审计对象相关人员提前确认数据情况,及时记录数据内容、容量等反映大数据特征的信息,形成审计取证材料并取得被审计对象认可并盖章,将采集内容和过程证据化。另外,电子证据的本质是电子数据,是被审计对象各类原始数据的内在属性和特征。审计证据在取得后,还需核实其真实性、合理性与适当性。一方面,审计人员应固化审计电子证据,在审计取证单上罗列分析结果并阐述产生的后果及影响,并尽可能将审计分析形成的结果表用附件的形式记录,要求被审计单位予以确认;另一方面,审计人员应在审计工作底稿中描述审计证据取得的过程,并记载分析逻辑、模型设计和数据处理过程,以此印证大数据分析模型、原始数据与审计结果之间的实质性联系,增强审计证据的相关性,防范大数据技术审计证据脆弱性的风险。
随着大数据时代的到来,大数据技术在审计工作中的逐步应用,审计人员对审计中获取的大数据的汇总、归纳,并从中找出关联规律、共性问题和发展趋向,能够帮助审计人员从立体、全局的角度发现以前难以发现的问题。大数据审计思维将贯穿于审计项目的准备、实施全过程中,审计取证作为审计实施的一个基础环节,相关技术方法的运用和风险提前预判,将会是大数据时代对所有审计机关提出的一个重要课题。
?
参考文献:
[1]维克托·迈尔-舍恩伯格,肯尼思·库克耶。大数据时代[M]。盛杨燕,周涛,译。大数据时代。浙江人民出版社。2013
[2]车品觉。决战大数据[M]。浙江人民出版社。2014
[3]赵勇。架构大数据—大数据技术及算法解析[M]。电子工业出版社。2015
[4]陈大峰,汪加才,韩冰青。基于离群数据挖掘的计算机审计[J]。南京审计学院学报。2019年4月
[6]张利华。风险导向审计下电子证据的获取思路[J]。审计月刊。2006(13)
?