制作思维导图?构建大数据法律监督模型可以这么做
当前,全国检察机关正在按照最高人民检察院的统一部署开展大数据法律监督工作,并取得扎实成效,越来越显示出强大的生命力。最高检检察长应勇指出“数字检察是法律监督手段的革命”“法律监督应用模型是数字检察的一个重要突破口”,法律监督模型是开展大数据法律监督工作最重要的载体和手段,具有较强的业务属性和技术属性。模型的构建既要坚持“业务主导”,依靠一线检察官的业务实践;又要坚持“技术支撑”,依托专业技术人员的设计研发。思维导图是构建大数据法律监督模型的重要方法和表现方式,也是后期学习交流和部署应用的重要途径。从调研情况看,目前各地编制的大数据法律监督模型指引,思维导图设计风格迥异,标识缺乏统一的模式和规范,不利于学习交流和后期建模。笔者通过对思维可视化工具、大数据法律监督模型设计需求等进行分析,提出大数据法律监督模型思维导图制作的建议,为后期全国大数据法律监督平台设计及大数据法律监督模型规范化建设积累经验。
思维可视化工具概述
人类思维的可视化呈现,对提高效率有极为重要的作用,目前主要包括思维导图、流程图、概念图、图模型等思维可视化的图示技术,其中最主要的是思维导图和流程图。
思维导图,又名心智导图、脑图等,是一种利用图像式表达发散性思维的有效图形思维工具,可以使用一个关键词或想法引起形象化的构造和分类的想法。思维导图图文并重,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接。每一个关节点代表与中心主题的一个连结,而每一个连结又可以成为另一个中心主题,呈现出放射性立体结构,就如同大脑中的神经元一样互相连接。
流程图,也称为“输入—输出”图,是通过图形来对某个特定业务或场景的整体流程走向进行规范化的梳理和绘制,直观地描述工作流或工作过程的具体步骤图。标准的流程图,有特定的符号(形状)和常用的结构(顺序结构、选择结构、循环结构),为了提高流程图的逻辑性,遵循从左到右、从上到下的顺序排列。流程图可以把复杂过程简单而直观地展示出来,便于比较、对照、改进,有助于提高工作和沟通效率。
大数据法律监督模型的思维导图重在数据关系,流程图重在分析过程。在简单模型构建时,可在思维导图中适当引入流程图元素,直接阐明数据分析过程;在复杂模型构建时,可以采用“总分”结构,即通过思维导图对法律监督业务场景进行整体概括,通过流程图对具体数据分析过程进行细化设计。
大数据法律监督模型中思维导图的作用
2012年,检察业务应用系统上线运行,以流程为核心规范业务,核心是“业务数据化”,而大数据法律监督工作是以数据为核心赋能业务,核心是“数据业务化”。开展大数据法律监督工作,是数据赋能业务的一个重要方向,思维导图是重要工具。通过思维导图,我们可以直接展示大数据法律监督模型的全局,避免一开始就陷入细节,只见树木不见森林。
1. 思维导图是梳理思路的重要工具
最高检指出:“各级检察机关要把数字检察工作作为前瞻性、基础性工作来抓,积极构建‘业务主导、数据整合、技术支撑、重在应用’的数字检察工作机制。”业务主导是关键,而检察官就是大数据法律监督模型的“架构师”,需要在办案中树立大数据法律监督思维,以人民为中心,共同分析问题,提炼要素特征,归纳筛选条件和关键词,构建监督模型,溯源社会治理。但应当认识到,法律监督与大数据的结合不是一蹴而就的,模型需要在实践中不断淬炼、持续完善,思维导图就是检察官梳理思路的重要工具。通过思维导图,可以让数据来源更加清晰、规则更加明确、监督路径更加清晰、治理效果更加全面。
2. 思维导图是数据治理的重要工具
每一个思维导图,都是检察官对现实世界基于问题域的业务逻辑抽象,而技术人员需要从若干的思维导图中总结提炼共同的数据源、共同的监督算法和共同的展现方式。数据方面,需要以数据为核心,分析思维导图所涉及内部数据和外部数据,在总结全国大数据法律监督模型的基础上,做好内部数据治理和外部数据集纳工作。算法方面,需要对所有思维导图所涉及的算法进行汇总统计,为大数据法律监督建模平台梳理算法需求。线索方面,需要同步考虑大数据法律监督线索的分流、交办和督办以及与检察业务应用系统对接等问题。监督模型大体可分为简单模型和复杂模型,其中90%的模型是单表、两表关联应用,主要涉及筛选、对比、碰撞等简单操作,通用建模平台一般能够承载,但如果监督模型涉及诸如亿级轨迹数据的热力图分析,或者是需要软件研发支持的复杂模型,则需要合理分配功能布局。
3. 思维导图是数据平台建设的重要工具
随着检察信息化工作的开展,基于流程建模的信息系统逐渐增多,积累数据也越来越多,但这些原始数据往往是基于各信息系统的数据孤岛。为了充分合理地利用数据,检察机关应完善全国检察大数据中心,基于对业务数据的理解和数据分析的需要,通过高度抽象的数据模型,整合各源系统的数据,最终形成统一、规范、易用的数据仓库,使数据最终以可视化的方式呈现,使用户能够快速有效地获取数据中有价值的信息,从而作出准确有效的决策。比如检察官可以在大数据法律监督平台通过一定审批程序按照大数据中心发布的数据资源目录调用对应数据,并结合自有数据进行监督模型设计,从而形成“数据治理—模型设计—数据治理—模型设计”的良性循环。
大数据法律监督模型思维导图的制作方法
大数据法律监督模型设计的实质是数据建模,思维导图是数据思维的集中体现,让思维可视化,将抽象的概念、问题、任务等信息以图形的方式呈现出来,使思维能够更加清晰、直观地理解和表达。以思维导图为主要体现的数据建模是促进业务与技术的有效沟通的重要工具,有助于业务部门、数字检察部门和信息技术部门形成对主要业务定义和术语的统一理解,具有跨部门、中性的特点,可以表达和覆盖所有业务。
思维导图在促进团队协作方面发挥着重要的作用,其制作应当遵循一个规范模式,以提高检察官和研发单位数据工程师的沟通交流效率,快速理解模型内核和设计思路。理想情况下,研发单位数据工程师可以通过检察官设计的思维导图,可直接在大数据建模平台通过“拖拉拽”方式实时建模,思维导图就是模型搭建的设计蓝图。具体而言,有以下几点需要注意:
1. 思维导图要素清晰
大数据法律监督模型的数据建模工作需要提炼,包括问题域、监督点位、监督规则、数据来源、数据内容、监督线索等要素,其核心是数据与规则。完整的思维导图,应当能够集中展示该模型的数据来源、数据分析关键词(监督规则)、数据分析步骤以及法律监督线索。
2. 思维导图布局清晰
思维导图应符合人的视角习惯,从左到右,从上到下,布局困难的也可以通过标顺序,通过一些符号,让数据分析步骤的文字更加清晰地展示出来。从数据分析角度,总体分为三大部分:数据资源、数据分析过程和数据输出。数据资源包括检察业务数据,政法机关共享协同数据、行政机关共享协同数据和第三方提供的公共数据、互联网公开数据等;数据分析过程包括数据准备、数据处理、数据分析等;数据输出即为检察机关关注的大数据法律监督线索。一般而言,大数据法律监督模型思维导图应当以数据为核心对各类要素进行分层分类展示,纵向分层体现从原始数据到监督线索的分析过程,横向分类体现监督点位和监督规则。具体而言,包括如下要素:
数据资源
最上层应当展示模型数据来源,且尽可能将所有数据来源归集展示在最上层。分析过程后期使用的数据来源,也可以一并展示在最上层,通过线条连接至分析过程使用位置。应当注意的是,数据来源应当是可用的数据集,或者来自大数据中心数据资源目录,或者来自结构化的数据文档,以便在大数据建模平台搭建模型时选取。数据来源是非结构化数据的(如裁判文书),需注明通过大数据能力平台进行预处理。
数据分析过程
中间层应当展示通过算法与规则对多源数据的处理过程。应当注意的是,数据分析过程的每一个基于监督规则的分支都对应一个监督点位,要注意纵向对齐(比如数据引入条件层层筛选的,主要过程结果集应当纵向对齐)。监督规则及算法应该明确标识,简单的如单表条件筛选或多表交集、差集、并集(对比碰撞);复杂的如分类、回归、随机森林、朴素贝叶斯、聚类等算法。
数据输出
最下层应当展示模型分析的结果,即不同监督点位的经分析处理的数据结果集。应当注意的是,结果集不仅仅是技术层面的处理结果,还应当使用法言法语明确监督点位,如“涉嫌拒不执行判决、裁定罪案件监督”“涉嫌重婚罪、诈骗罪等刑事、行政案件监督”。
3. 思维导图元素清晰
大数据法律监督模型的思维导图和流程图有类似之处,应当遵循基本的绘制原则。思维导图的基本元素是图形(矩形)和连接线。结合实践经验,建议注意以下几点:矩形图形大小原则保持一致;矩形图形一般按照监督点位纵向对齐排列;并行关系的矩形图形建议横向保持同一高度;连接线原则上进下出,一般不再左右连接;连接线横平竖直,不使用斜线;连接线要避免交叉,可以重合;矩形图形框内原则上是数据集属性,图内文字描述要简洁;数据处理规则应当分开表述,不宜放入矩形图形框;多数据集运算需标注算法和规则,标注一般在水平连接线上方。当然,思维导图可以根据具体情况,适当加入流程图的菱形判断框。
4. 思维导图与要旨应相互呼应
从更高要求讲,思维导图的文字描述应精炼,具体内容可以在模型设计文档中的要旨、数据分析方法等部分进行详细阐述。
思维导图是大数据监督模型的“纲”,以思维导图为抓手,数字检察部门可以有序开展大数据法律监督的基础工作。比如,通过汇总分析思维导图的数据资源层情况,开展大数据治理工作;通过汇总分析思维导图的数据分析过程,开展大数据法律监督平台的算法和规则库建设,并提出大数据中心的能力需求;通过汇总分析思维导图的监督点位,形成大数据法律监督工作目录指引,便于各业务条线开展相应的法律监督工作等等。
(作者为最高人民检察院数字检察工作领导小组办公室处长、二级高级检察官申云天,四川省成都市人民检察院案件管理办公室副主任、四级高级检察官徐彬)
编辑:李娜 高航
来源:《检察日报》“数字检察”公众号