这就是浙江法院智能语音识别系统,记者通过现场观摩、远程旁听,见证了这一庭审记录的革命性变化。目前,这一智能语音识别系统已在全省105家法院推广应用。
在过去的传统庭审中,需要书记员全程记录。为了方便记录,诉讼参与人发言时往往要刻意放慢语速,庭审后还要花上大量时间核对笔录。2014年8月,浙江法院积极探索以庭审录音录像代替传统书面笔录。浙江高院审判管理处处长姚海涛介绍,庭审记录改革后,法官的庭审注意力明显更集中了,庭审节奏也更加紧凑,而且调解撤诉率、当庭宣判率等审判质效数据全面提升;对当事人及其他诉讼参与人而言,庭后校对笔录的时间也省略了,有利于规范庭审言行,防止随意否定、修改庭审发言。
不过,录音录像代替书面庭审笔录虽然好处多多,但还是有些弊端,比如法官不便直接采集笔录内容制作裁判文书,当事人要上诉或申请再审的,书记员需要重新誊录笔录,比较费事等。为此,2016年3月,浙江高院启动智能语音识别项目的研发工作,5月,智能语音识别系统在杭州西湖法院、上城法院、下城法院等部分法院试运行,8月底正式在全省法院推广。
据介绍,浙江法院智能语音识别系统具备语音自主学习能力,可以自动学习历史案件数据,结合不同法官和诉讼参与人的语音资料进行有针对性的学习,哪怕带有一定口音的普通话,机器经过反复学习和模型训练,识别率也可持续提高。为提升当事人姓名、案件特定关键词的识别率,法官还可以提前导入案件起诉状等内容,让机器提前“学习”。
在试点初期,机器对“闭庭”“上诉人”“异议人”等法律用语的识别率不是很高,浙江高院安排语音识别服务器对司法审判有关的知识库进行了大量“学习”,大大提升了对于庭审过程中法言法语的有效识别,现在的整体识别准确率可以达到95%以上。
姚海涛介绍,智能语音识别系统专门针对法院工作场景开发,主要为庭审、调解、合议、听证、审判委员会讨论等办案环节提供语音转写服务。昨天,记者专门体验了一把,发现操作也很简单,只要点击安装在电脑桌面上的软件即可“一键开启”,可提供开庭、休庭、复庭、闭庭等操作。系统可根据案件性质、诉讼参与人多少等不同情况,预先设置身份,语音文字转换时自动注明发言人角色,自动区分庭审发言对象及发言内容。语音识别过程中,法官或书记员还可对识别出的文字进行实时修改或标注,系统会自动匹配标注部分的录音,方便查看、编辑。
截至目前,浙江全省法院数据中心已汇聚216万个案件的庭审录音录像。“由于庭审中产生的大量语音属于非结构化数据,以前无法直接对这些进行数据分析、挖掘和利用。”姚海涛说,现在借助语音识别技术,可以将语音数据不断转化为文字数据,进行高频词分析、内容检索、争议焦点归纳、法官庭审习惯分析、当事人画像、案件预判、知识挖掘等大数据利用。