12日, 北京大學法制與發(fā)展研究院大數據法律研究中心發(fā)布了題為《2014年
當我們在談論最高人民法院時我們在談什么》的研究報告。
根據該研究報告,按熱度降序排列的十大關鍵詞依次為“網絡侵權”、“上下班途中”、“唐慧”、“老賴”、“四五改革”、“巡回法庭”、“環(huán)境”、“減刑、假釋”、“消費者”以及“3Q大戰(zhàn)”,同時也列舉了“偽基站”、“投案自首”、“涉醫(yī)犯罪”和“老鼠倉”等其他熱議關鍵詞。
排名第一的是網絡侵權一詞。2014年10月9日,最高人民法院通報《關于審理利用信息網絡侵害人身權益民事糾紛案件適用法律若干問題的規(guī)定》的有關情況,同時公布八起利用信息網絡侵害人身權益的典型案例。該規(guī)定明確了非法刪帖、網絡水軍的責任承擔、轉載網絡信息行為的過錯及程度認定、個人信息保護范圍、網絡服務提供者是否“知道”侵權等內容,對于規(guī)范網絡行為、建立良好的網絡秩序,具有重要的意義。
由于網絡媒體是當前人們獲取信息、認識周邊事物的重要渠道,故該份研究報告從這一角度出發(fā),從人們所實際接收到的信息出發(fā)對最高人民法院去年一年的工作進行回顧。
排名第二的是上下班途中。2014年4月21日,最高人民法院通過了《關于審理工傷保險行政案件若干問題的規(guī)定》,規(guī)定對社會保險行政部門認定諸如在合理時間內往返于工作地與住所地等情形為“上下班途中”的,人民法院應予支持。
排名第三的是唐慧一詞。2014年6月12日,最高人民法院依法裁定不核準周軍輝、秦星死刑,發(fā)回重審;9月5日,湖南省高級人民法院公開宣判,周軍輝、秦星被判處無期徒刑。唐慧案前前后后持續(xù)八年,吸引了社會各方的關注,間接促成了勞動教養(yǎng)制度的終結,對我國的司法環(huán)境產生了深刻的影響。
為該研究報告提供數據支持的國雙科技收集匯總了在2014年在各個主流網絡媒體上所發(fā)表的圍繞最高人民法院的三萬余篇新聞報道,通過其自主研發(fā)的自然語言處理、機器學習和大規(guī)模并行數據倉庫等技術對報道中提及的主題進行了識別、抽取、聚合和排序,最終挑選出與最高人民法院工作內容最相關的以上十個關鍵詞。
專家指出,大數據這個詞匯出現在公眾視線里已經有一段時間了。隨著計算、存儲和網絡通信的能力提升和成本降低,越來越多的機器數據、行為數據、特征數據以及一些非結構化數據開始被用來進行分析,以發(fā)掘其中潛在的價值。在一些行業(yè)如互聯網行業(yè),由于天然的離數據更近、對數據友好,因而在大數據方面有更廣泛和有效的應用。而在法律行業(yè),由于大部分數據都是以書面文字的形態(tài)記錄和存儲,在未經加工的情況下難以直接被計算機很好地理解,因而相關方面的研究其實只是剛剛起步。
專家認為,有一點可以肯定的是,計算機和大數據可能會迅速更新我們對周圍所處司法環(huán)境的認識:從小而言,我們可能會知道人們都會因為什么原因打官司,請什么樣的律師更有可能打贏官司,打官司的時候應該注意哪些證據、采用哪種思路;從大而言,我們可能會知道哪些糾紛在適用法律時經常會出差錯或標準不一致,哪些案件目前缺乏相應的法律法規(guī)進行調整……大數據的精髓,在于發(fā)現數據中客觀存在但又易被忽視的內在規(guī)律,并引導我們進一步理解這些規(guī)律產生的原因。盡管目前還沒有這種超級計算機出現,但目前的技術水平已經足夠支撐我們在法律領域利用大數據技術做一些初步的探索和研究。