建设“双核”数据中心,驱动成渝地区检察协作

为服务成渝地区双城经济圈建设,重庆主城都市区、成都都市圈检察机关为发挥“双核”引领作用,开展成渝地区“4+2”检察协作。检察协作的落地离不开“双核”数据中心的支持。针对目前“双核”数据中心建设管理、数据管理、业务驱动等问题,提出围绕服务保障成渝地区双城经济圈建设主题,两地检察机关应在机制、人才、平台、资源、应用等方面统一认识、统一标准,对数据中心进行合理规划、升级、融合、共享。


首届成渝地区双城经济圈法治论坛

关键词:数据中心 成渝地区 检察协作

推动成渝地区双城经济圈建设,是构建以国内大循环为主体、国内国际双循环相互促进的新发展格局的一项重大举措。习近平总书记指出,“法治是最好的营商环境”,为保障成渝地区双城经济圈建设,重庆市人民检察院、四川省人民检察院迅速行动,印发了《关于加强检察协作服务保障成渝地区双城经济圈建设的意见》(以下简称“《协作意见》”),为积极发挥重庆主城都市区、成都都市圈检察机关“双核”引领作用,成都都市圈涉及的成都、德阳、眉山、资阳市人民检察院与重庆主城都市区主要涉及的重庆市人民检察院第一分院、第五分院会签并印发了实施意见和任务分工表。意见明确以具体业务条线协作为落实主体,由牵头部门完成协作对接、机制建设等协作任务,笔者所在部门也承担着充分利用互联网、大数据技术,搭建信息共享平台的具体任务。

一、成渝地区“4+2”检察协作任务与“双核”数据中心建设

(一)“跨区域”之惑

《协作意见》明确了“维护交通物流秩序和信息及重要基础设施等安全、保护生态环境、维护金融安全、保护知识产权、保护民营企业”等五大方面的协作领域和“线索移送、管辖争议解决机制,办案协作工作机制,政策、行动协同机制,涉检信访申诉矛盾纠纷化解协作机制,信息、资源共享机制,业务交流协作机制”等六大方面协作机制。
五大协作领域和六大协作机制的具体落实,离不开信息化,而信息化也不能脱离具体业务而孤立存在。早在2006年公布的《2006-2020国家信息化发展战略》就明确指出,“信息化是充分利用信息技术,开发利用信息资源,促进信息交流和知识共享,提高经济增长质量,推动经济社会发展转型的历史进程。”在成渝地区检察协作中,我们如何“利用技术、开发资源、促进交流”?在举个简单的例子,笔者对协作内容进行了统计,“跨区域”出现了34次,几乎覆盖了五大协作领域和六大协作机制。试问:各业务条线如何甄别五大协作领域的跨区域案件?

(二)“信息化”之解

信息技术理论将数据处理分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)[ 何玉洁,张俊超,《数据仓库与OLAP实践教程》,清华大学出版社,2008年3月]。

  • OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,这类系统以支持业务处理为主要目的,被称为联机事务处理。对检察机关而言,最重要的OLTP应用无疑是2013年上线的检察业务应用系统。
  • OLAP是数据仓库系统的主要应用,由于现代管理理论更加强调决策的及时性和准确性,这使得以支持决策管理分析为主要目的的应用迅速崛起,这类应用支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,被称为联机分析处理。目前检察机关尚未在全国统一此类软件,各地在自行探索。

对于“跨区域”之惑,固然可以通过生产系统进行结构化采集的犯罪地、住所地等案卡项进行检索、统计,但这些固定的采集项之外,无法提供更多支持。案件的“跨区域”性质,其实静静的躺在非结构化的电子卷宗里、躺在半结构化的审查报告里,只是系统无法感知而已。
笔者认为成渝地区检察协作,需要对现有的结构化数据和非结构化数据进行数据挖掘,得到隐藏在数据中的有价值的信息。笔者建议:为更好服务成渝地区双城经济圈建设,提供更好的法治保障,川渝两地检察机关以检察信息资源计划为主导,共建川渝“双核”数据中心。具体来说,通过OCR(Optical Character Recognition,光学字符识别)、 NLP(Natural Language Processing,自然语言处理)、ETL(Extract-Transform-Load,数据提取、转换和加载) 等技术从川渝两地检察机关检察业务应用系统、电子卷宗系统获得相关的结构化数据和非结构化数据,综合运用数据挖掘等技术,形成川渝检察业务数据仓库。在此基础上,积极探索建立检察业务决策支持系统(Decision Support System, DSS),实现川渝两地刑事案件、民事案件、行政案件和公益诉讼案件的宏观分析,为两地检察机关机关打击和预防犯罪提供决策支持。

二、成渝地区“4+2”检察协作数据共享问题分析

信息社会,数据是至关重要的治理资源。“用数据说话、用数据决策、用数据管理、用数据创新”已经成为公共管理和国家治理的重要原则。在实际工作中,成渝地区双城经济圈和重庆主城都市区、成都都市圈涉及地域并不一致,仅以两个极核讨论,极核其实是“散装”的核心。以检察系统为例,成都都市圈涉及的成都、德阳、眉山、资阳市人民检察院,重庆主城都市区主要涉及重庆市人民检察院第一分院、第五分院,这就带来了以下问题。

(一)建设管理问题

按照一般思路,“双核”可各自建设一个“核”的数据中心,但具体选址落地就比较困难。成都极核相对容易,一般认为可在成都市人民检察院建设,重庆极核的选择则相对困难,涉及两个分院,且重庆是直辖市,管理体制也难以另建数据中心(灾备中心除外)。按照财政经费管理体制,极核数据中心的建设经费、维护经费等如何分摊,都是具体而现实的问题。所以按照行政区划范围,各建极核数据中心并不现实,更重要是不利于“双核”带动整个成渝地区经济圈。
在刑事案件办理过程中,“对管辖权有争议的,由共同的上一级人民检察院指定管辖”。选择共同的上一级:重庆市人民检察院、四川省人民检察院建设“双核”数据中心,应是当然之选。

(二)数据管理问题

“双核”数据中心建设规划,自然应当着眼全局,覆盖四川全省和重庆全市,这也是建设成渝地区双城经济圈的当然之义。但在具体应用过程中仍然会遇到具体的问题。数据中心硬件可以集成,但成渝地区“4+2”检察协作涉及6个检察院,检察院之间互不统属,数据管理权限的运行方式各不相同,数据开放程度也各有差异。最重要的问题是:检察业务应用系统2.0的部署点是在省级院,但省级院不可能将全省的数据管理权限交由两个极核的任何一家检察院。所以这又涉及数据返还的问题:将省级检察院数据中心集中存储管理的数据根据需要返还市级检察院。特别是推动高频数据、重点领域数据向极核检察院返还落地,全力支持成渝双城经济圈相关检察院创新应用。

(三)业务驱动问题

在成渝地区“4+2”检察协作推进过程中,或多或少存在这么一个问题:技术部门不知道业务部门“要做什么”,业务部门不知道技术部门“能做什么”,造成业务部门推进工作时困难重重难以破解,技术部门空有资源难以施展。笔者认为一定要发挥案管部门的职能作用,在“双核”数据中心建设过程中,由案件管理部门统筹检察业务和数据需求,技术信息部门主管数据中心基础建设。

三、“双核”数据中心建设建议

“双核”数据中心建设,并不是在重庆市人民检察院、四川省人民检察院现有数据中心之外,新建一套新的数据中心,而是在“把握新发展阶段、贯彻新发展理念、融入新发展格局”背景下,围绕服务保障成渝地区双城经济圈主题,在机制、人才、平台、资源、应用方面统一认识、统一标准,对各自现有数据中心进行合理规划、升级、融合、共享。

(一)机制建设

目前围绕《协作意见》,各地各业务条线已经出台了较多的制度,但目前并未就数据中心建设、数据管理机制形成规范性文件。检察业务应用系统2.0的生态中,流程办案部分全国统一,但智能辅助、数据应用等均由各省(各部署点)自行建设。数据治理与应用是我们实现数字战略的基础,包括组织、制度、流程、工具等一整套管理体系。目前全国各地正值检察工作网和检察业务应用系统2.0建设的初期,为更好的服务成渝地区双城经济圈建设,需尽早在数据中心建设方面就数据治理体系建设规划、技术发展路线达成共识、统一标准、相向而行,避免系统异构为数据互通增加不必要的难度。

(二)人才建设

高检院《检察业务数据管理办法》明确提出各级院均应当有专职兼职的检察业务数据管理与分析人才。无论是技术信息部门还是业务数据管理部门,目前都亟须在数据采集、数据清洗、数据治理、数据分析、数据可视化等方面具备相当能力的人才。建设“双核”数据中心,除了政策支持、资金支持,还有人才支持。在新形势下,川渝两地应当尽快建立金字塔式的懂业务、懂管理、懂分析、懂技术、懂设计的检察业务数据管理与分析团队,在检察协作机制下同步做好互派锻炼计划,为“双核”数据中心平台、资源、应用建设奠定良好的人力资源基础。

(三)平台建设

目前川渝两地有三个生产中心(检察业务应用系统部署点):重庆市人民检察院、四川省人民检察院以及成都市人民检察院。2014年高检院成立了检察业务应用系统技术支持中心成都分中心(全国唯一的分中心),并同意成都市检察机关独立部署检察业务应用系统(一般是省级部署)。
根据“两地三中心”(生产中心、同城容灾中心,异地容灾中心)建设要求,本地的生产中心和容灾中心相距100公里以上,进行应用级 /业务级容灾保护,且在 300公里以外的异地建立容灾中心,进行数据级 /应用级容灾保护。在“双核”数据中心建设时,可考虑这一特点,规划重庆市人民检察院、四川省人民检察院的数据中心可互为对方的异地容灾中心。当然,异地检察院仅提供容灾中心的场地、电力等基础设施,异地容灾中心的机房建设、设备管理、数据管理均自行负责。
数据链路方面,检察工作网为星型拓扑结构。川渝两地各节点数据交互均要通过高检院进行中转。考虑到提升川渝两地数据传输速率和稳定性,建议另行增加川渝数据链路专线。

(四)资源建设

生产系统数据需要严格遵循案件管辖和业务管理层级设置,川渝两地共建一个数据中心在当前体制下存在较多政策限制。正如上文描述,以异地灾备中心建设的方式,将自身数据“送”到对方家门口,再通过相同的数据接口进行调用,实现“使用”数据而非“拥有”数据。
川渝两地的数据中心在相对一致的数据治理体系技术做好自身主题数据库建设,建立数据共享池,制定数据资源目录并确定数据开放目录。

(五)应用建设

1.一网通查。

依托“双核”数据中心的能力支持,可拓展诸多覆盖川渝两地的数据应用场景。这类应用,数据覆盖面越广越方便。比如犯罪记录查询,同级党政机关因工作需要提请检察机关查询犯罪记录,而目前检察机关尚未整合全国的犯罪记录,反馈结果只限于本地。依托“双核”数据中心的能力支持,只需将待查询的身份证号码或号码集合提交系统,通过各自数据中心核对,即可提供覆盖川渝两地的犯罪记录。又如变更工商登记核查,市场监督管理局向检察机关提供申请工商登记事项变更的企业列表,依托“双核”数据中心的能力支持即可在川渝两地锁定涉案企业,防止因工商变更有碍案件办理或查控追逃、资产查封、资金冻结等相关工作。

2.一网通办。

随着依法治国进程的加速,司法理念的不断开放,不同法律职业者之间在各司其职的基础上相互协调和制衡,促进良好司法秩序的构建已成为业界共识。今年6月《检察日报》报道了重庆律师在重庆南岸区检察院成功自助获取其在成都武侯区院代理的诈骗案电子卷宗光盘。成渝地区双城经济圈建设,也促进律师在跨区域代理案件。依托“双核”数据中心的能力支持,可更加智能的识别律师身份,方便律师异地业务办理,实现一网通办,“让数据多跑路”,提供更优质的检察产品。

3.案件画像。

回归“跨区域”之惑,为了智能识别跨区域案件,“双核”数据中心需要进行案件标签体系建设。正如电商愿意给用户画像一样,检察机关也需要具备给案件画像的能力。以“跨区域”为例,除了依托结构化数据外,需要系统对案件非结构化的电子卷宗和半结构化的电子文档进行智能识别和标注,根据“跨区域”定义和匹配规则(比如川渝两地地名地址库),给案件打上“跨区域”的性质标签和具体的位置标签,以便各业务条线确定的诸如跨区域涉民营企业案件、跨区域知识产权保护案件、跨区域电信诈骗犯罪、跨区域毒品犯罪、跨区域金融犯罪、跨区域走私犯罪、跨区域破坏生态环境犯罪等等检察协作工作落地落实。

4.GIS应用。

基于GIS的犯罪分析应用目前已经较为成熟,比如根据某时间区间案件的案发地、结果地等结构化字段,将案件直观分布在GIS地图上,形成的案件分布分析地图。对于个案而言,可以根据全案所有位置标签与GIS系统进行对接、映射,从而将个案的所有位置与地理信息直观的显示在GIS地图上,辅助检察官可视化的分析案情。

以上只是基于今年的检察协作任务例举的应用场景,随着两地检察协作的持续深入,“双核”数据中心能提供的应用必更加丰富。

四、结束语

在全国检察机关全面建设检察工作网之际,为更好服务成渝地区双城经济圈建设,建议两地检察机关在建设完善本地数据中心的同时,结合异地容灾中心建设,加强在机制、人才、平台、资源、应用等方面的研究与合作,统一认识、统一标准,共同建设“双核”数据中心,共同研究数据治理体系,为成渝地区检察协作、成渝地区双城经济圈建设提供不竭的科技驱动。

(作者为四川省成都市人民检察院案件管理办公室副主任、四级高级检察官徐彬)