浙江法院智能语音识别系统全面上线 - 安防知识网

近日，浙江省高级法院2号法庭开庭审理被告人赵某涉嫌故意杀人上诉案，“被告人赵某携带家中另一把尖刀再次赶至东新公园内，觅得正在打牌的被害人黄某后即持刀猛刺致其倒地不起……”法庭里，法官和其他诉讼参与人说的每一句话，都通过一块电子屏幕同步记录下来，并自动转化为文字，迟延不超过500毫秒，还不时进行自动纠错。

　　这就是浙江法院智能语音识别系统，记者通过现场观摩、远程旁听，见证了这一庭审记录的革命性变化。目前，这一智能语音识别系统已在全省105家法院推广应用。

　　在过去的传统庭审中，需要书记员全程记录。为了方便记录，诉讼参与人发言时往往要刻意放慢语速，庭审后还要花上大量时间核对笔录。2014年8月，浙江法院积极探索以庭审录音录像代替传统书面笔录。浙江高院审判管理处处长姚海涛介绍，庭审记录改革后，法官的庭审注意力明显更集中了，庭审节奏也更加紧凑，而且调解撤诉率、当庭宣判率等审判质效数据全面提升；对当事人及其他诉讼参与人而言，庭后校对笔录的时间也省略了，有利于规范庭审言行，防止随意否定、修改庭审发言。

　　不过，录音录像代替书面庭审笔录虽然好处多多，但还是有些弊端，比如法官不便直接采集笔录内容制作裁判文书，当事人要上诉或申请再审的，书记员需要重新誊录笔录，比较费事等。为此，2016年3月，浙江高院启动智能语音识别项目的研发工作，5月，智能语音识别系统在杭州西湖法院、上城法院、下城法院等部分法院试运行，8月底正式在全省法院推广。

　　据介绍，浙江法院智能语音识别系统具备语音自主学习能力，可以自动学习历史案件数据，结合不同法官和诉讼参与人的语音资料进行有针对性的学习，哪怕带有一定口音的普通话，机器经过反复学习和模型训练，识别率也可持续提高。为提升当事人姓名、案件特定关键词的识别率，法官还可以提前导入案件起诉状等内容，让机器提前“学习”。

　　在试点初期，机器对“闭庭”“上诉人”“异议人”等法律用语的识别率不是很高，浙江高院安排语音识别服务器对司法审判有关的知识库进行了大量“学习”，大大提升了对于庭审过程中法言法语的有效识别，现在的整体识别准确率可以达到95%以上。

　　姚海涛介绍，智能语音识别系统专门针对法院工作场景开发，主要为庭审、调解、合议、听证、审判委员会讨论等办案环节提供语音转写服务。昨天，记者专门体验了一把，发现操作也很简单，只要点击安装在电脑桌面上的软件即可“一键开启”，可提供开庭、休庭、复庭、闭庭等操作。系统可根据案件性质、诉讼参与人多少等不同情况，预先设置身份，语音文字转换时自动注明发言人角色，自动区分庭审发言对象及发言内容。语音识别过程中，法官或书记员还可对识别出的文字进行实时修改或标注，系统会自动匹配标注部分的录音，方便查看、编辑。

　　截至目前，浙江全省法院数据中心已汇聚216万个案件的庭审录音录像。“由于庭审中产生的大量语音属于非结构化数据，以前无法直接对这些进行数据分析、挖掘和利用。”姚海涛说，现在借助语音识别技术，可以将语音数据不断转化为文字数据，进行高频词分析、内容检索、争议焦点归纳、法官庭审习惯分析、当事人画像、案件预判、知识挖掘等大数据利用。