[go: up one dir, main page]

CN106815201B - 一种自动判定裁判文书判决结果的方法及装置 - Google Patents

一种自动判定裁判文书判决结果的方法及装置 Download PDF

Info

Publication number
CN106815201B
CN106815201B CN201510866865.0A CN201510866865A CN106815201B CN 106815201 B CN106815201 B CN 106815201B CN 201510866865 A CN201510866865 A CN 201510866865A CN 106815201 B CN106815201 B CN 106815201B
Authority
CN
China
Prior art keywords
judgment
identifier
losing
amount
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510866865.0A
Other languages
English (en)
Other versions
CN106815201A (zh
Inventor
胡斌
崔维福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201510866865.0A priority Critical patent/CN106815201B/zh
Priority to PCT/CN2016/105273 priority patent/WO2017092556A1/zh
Priority to US15/780,627 priority patent/US20180365314A1/en
Publication of CN106815201A publication Critical patent/CN106815201A/zh
Application granted granted Critical
Publication of CN106815201B publication Critical patent/CN106815201B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Primary Health Care (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种自动判定裁判文书判决结果的方法及装置,涉及自然语言处理领域,为解决人工提取判决结果效率低的问题而发明。本发明的方法包括:在裁判文书中遍历预设的标识一和标识二,所述标识一为判决如下、裁定如下或其变体,所述标识二为受理费或其变体;截取标识一与标识二中间的判决段落,所述判决段落包括判决结果;在所述判决段落中,在所述标识一之后的预设字符范围内查找败诉关键词,所述败诉关键词包括驳回、不准或其变体;若查找到所述败诉关键词,则确定所述判决结果为败诉。本发明主要应用于对中文裁判文书的判决结果进行自动判定的过程中。

Description

一种自动判定裁判文书判决结果的方法及装置
技术领域
本发明涉及自然语言处理领域,尤其是一种自动判定裁判文书判决结果的方法及装置。
背景技术
裁判文书是人民法院行使国家审判权,在案件审理终结后,依据对当事人讼争事实的认定和法律、法规及有关司法解释的规定,对案件的诉讼程序问题和当事人的实体权利义务问题作出的具有法律约束力的司法文件。
对于司法部门和律师,裁判文书是除了法律法规以外的参考文献。通常将以往同类案件裁判文书的裁判结果作为参考,以便判断当前案件的判决结果,或者判定当前案件的胜诉可能性。
现有技术中,查询案件的裁判文书的判决结果,是靠人工完成的。裁判文书的数量非常庞大,若由人工查询则工作量大,耗费时间长,而且容易造成漏检。
发明内容
本发明提出了一种自动判定裁判文书判决结果的方法及装置,能够解决人工提取判决结果效率低的问题。
为了解决上述技术问题,一方面,本发明提供了一种自动判定裁判文书判决结果的方法,该方法包括:
在裁判文书中遍历预设的标识一和标识二,所述标识一为判决如下、裁定如下或其变体,所述标识二为受理费或其变体;
截取标识一与标识二中间的判决段落,所述判决段落包括判决结果;
在所述判决段落中,在所述标识一之后的预设字符范围内查找败诉关键词,所述败诉关键词包括驳回、不准或其变体;
若查找到所述败诉关键词,则确定所述判决结果为败诉。
另一方面,本发明还提供了一种自动判定裁判文书判决结果的装置,该装置包括:
遍历单元,用于在裁判文书中遍历预设的标识一和标识二,所述标识一为判决如下、裁定如下或其变体,所述标识二为受理费或其变体;
截取单元,用于截取遍历单元遍历的标识一与标识二中间的判决段落,所述判决段落包括判决结果;
查找单元,用于在所述截取单元截取的判决段落中,在所述标识一之后的预设字符范围内查找败诉关键词,所述败诉关键词包括驳回、不准或其变体;
确定单元,用于若所述查找单元查找到所述败诉关键词,则确定所述判决结果为败诉。
本发明提供的自动判定裁判文书判决结果的方法与装置,能够在裁判文书中遍历预设的标识,截取判决部分段落,再通过查找败诉关键词,确定判决结果为是否为败诉。与现有技术相比,本发明能够自动地判定判决结果,降低人的工作量,节省大量人力,并且提高提取判决结果的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种自动判定裁判文书判决结果的方法流程图;
图2示出了本发明实施例提供的另一种自动判定裁判文书判决结果的方法流程图;
图3示出了本发明实施例提供的再一种自动判定裁判文书判决结果的方法流程图;
图4示出了本发明实施例提供的一种自动判定裁判文书判决结果的装置组成框图;
图5示出了本发明实施例提供的另一种自动判定裁判文书判决结果的装置组成框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种自动判定裁判文书判决结果的方法,如图1所示,该方法包括:
101、在裁判文书中遍历预设的标识一和标识二。
裁判文书是以电子文本的形式保存的,以便于机器的识别。裁判文书,可以是从网站上获取的以电子文本的形式记录的,可以是以图片的形式记录的,也可以是纸质的裁判文书。将非电子文本形式的裁判文书,通过扫描、文字识别等技术手段转换成电子文本的形式。在本实施例中对裁判文书的初始记录形式不做限定。
裁判文书,记载人民法院审理过程和结果,是人民法院确定和分配当事人实体权利义务的唯一凭证。一个案件的判决结果,包括案件本身的判决结果和案件受理费。裁判文书的判决结果,通过“判决如下”、“裁定如下”、或其变体作为判决结果的引出标识。在“判决如下”或“裁定如下”之后,包括判决结果部分和受理费用负担情况。以“受理费”或其变体引出,案件当事人需要向人民法院交纳的费用负担情况。所以将关键词“判决如下”、“裁定如下”或其变体作为标识一,将关键词“受理费”或其变体作为标识二。
变体,是指含义相同的另一种表达形式。标识一为判决如下、裁定如下,其变体与“判决如下、裁判如下”的含义相同,标识二为受理费,其变体与“受理费”的含义相同。
102、截取标识一与标识二中间的判决段落,判决段落包括判决结果。
步骤101给出了标识一与标识二详细的描述,在裁判文书中对判决结果描述结束后,才给出受理费情况。标识一与标识二中间的部分包括判决结果,截取包括判决结果的判决部分段落,以便通过该段落分析判决结果。
103、在判决段落中,在标识一之后的预设字符范围内查找败诉关键词。
在步骤102截取的判决部分段落中,查找败诉关键词。败诉关键词包括驳回、不准或其变体,这样的完全否定词。通过完全否定的方式,限定某一情况或某一事件,表示对某一情况或某一事件的完全否定。所以将“驳回”、“不准”、及其变体,作为败诉关键词。
所述预设字符,是指一个段落,即以换行符为标识,在两个换行符中间的部分为一个自然段落。在标识一之后,第一个换行符与第二个换行符之间的段落,为查找败诉关键词的查找范围。
104、若查找到败诉关键词,则确定判决结果为败诉。
根据步骤103的查找结果,若找到败诉关键词,则确定判决结果为败诉。在本实施例中对败诉关键词的个数不做限定。
示例性的,一段裁判文书,如下:
本院在审理原告梁跃芳与被告某市新雅楼酒家董事会承包合同纠纷,愿意通过内部协调解决,要求撤诉,依据《中华人民共和国民事诉讼法》第52条和第131条之规定裁定如下:
驳回原告梁芳起诉。
案件受理费2200元及其他诉讼费2200元,共计4400元由原告承担。
在裁判文书中,找到标识一“裁定如下”,标识二“受理费”,截取标识一与标识二中间的判决部分段落“准许原告梁芳撤回起诉”,在判决部分段落中查找败诉关键词“驳回”及“不准”,在判决部分段落中有败诉关键词,所以确定本案为败诉。
本发明实施例提供的自动判定裁判文书判决结果的方法,能够在电子文本形式的裁判文书中遍历预设的标识,截取判决部分段落,再通过查找败诉关键词来确定判决结果为是否为败诉。与现有技术相比,本发明实施例能够自动地判定判决结果,降低人的工作量,节省大量人力,并且提高提取判决结果的效率。
进一步的,作为图1所示方法的细化和扩展,本发明另一实施例还提供的一种自动判定裁判文书判决结果的方法,如图2所示,该方法包括:
201、在裁判文书中遍历预设的标识一和标识二。
在电子文本形式的裁判文书中,遍历标识一与标识二,以确定标识一与标识二的位置。标识一为判决如下、裁定如下或其变体,标识二为受理费或其变体。在裁判文书中,逐段,逐行,逐句的查找标识一与标识二,确保遍历裁判文书中的所有位置。
202、截取标识一与标识二中间的判决段落,判决段落包括判决结果。
与步骤201中的标识一与标识二相同,标识一为判决如下、裁定如下或其变体,标识二为受理费或其变体。标识一与标识二在裁判文书中是成对出现的,若裁判文书中存在多对标识一及标识二,则截取裁判文书中最后出现的一对标识一及标识二中间的段落,作为裁判部分段落。
标识一与标识二中间的判决段落,包含判决结果。从标识一开始,到标识二结束,中间段落为判决段落。标识一与标识二是成对出现的。
裁判文书,根据审判的次数不同,分为一审裁判文书、二审裁判文书等等。在二审裁判文书中,要给出一审裁判文书的判决结果,再描述二审过程,最后给出二审的判决结果。三审裁判文书中,要给出一审裁判文书和二审裁判文书的判决结果,再描述三审过程,最后给出三审的判决结果。在裁判文书中,最后出现的判决结果为本次审判的判决结果。一个判决结果对应一对标识一与标识二,裁判文书中最后出现的一对标识一及标识二中间的段落为判定判决结果需要选取的段落,作为待判断段落。
203、在判决段落中,在标识一之后的预设字符范围内查找败诉关键词。
本步骤与如图1所示的步骤103所示的方法相同,这里不再赘述。
204a、若查找到败诉关键词,则确定判决结果为败诉。
本步骤与如图1所示的步骤104所示的方法相同,这里不再赘述。
204b、若未查找到败诉关键词,则在判决段落中查找标识三,标识三为离婚。
若未查找到败诉关键词,还需继续判断,该裁判文书的判决结果是否为败诉。若在标识一之后预设字符范围内未查找到败诉关键词,则在步骤202截取的判决段落中查找离婚标识。对于民事案件中的“离婚案件”,在判决结果的表述上,可能与其他民事案件不同。所以在未查找到败诉关键词后,需要查找离婚标识,若裁判文书是对离婚案件的裁定,则需要继续查找,以判断判决结果。
205b、若查找到标识三,则在包含标识三的自然句或自然段中查找标识四,标识四为不予支持或其变体。
若查找到标识三,则裁判文书是对离婚案件的裁定。在包含标识三的自然句或自然段中查找标识四,自然句的分隔符包括但不限于句号、分号感叹号等,自然段的分隔符是换行符。
206b、若查找到标识四,则确定判决结果为败诉。
若步骤205b中查找到标识四,则确定判决结果为败诉。
实质上“离婚”、“不予支持”与败诉关键词“不准”及“驳回”,表达的含义是一样的。为了避免出现这样的特殊表述时,对判决结果的错误判定,在判定裁判文书判决结果的过程中,加入对于“离婚”案件的判定方法,从而提高提取判决结果是否为败诉的准确性。
进一步的,作为图1所示方法的细化和扩展,本发明另一实施例还提供的一种自动判定裁判文书判决结果的方法,如图3所示,该方法包括:
301、在裁判文书中遍历预设的标识一和标识二。
在电子文本形式的裁判文书中,遍历标识一与标识二,以确定标识一与标识二的位置。标识一为判决如下、裁定如下或其变体,标识二为受理费或其变体。在裁判文书中,逐段,逐行,逐句的查找标识一与标识二,确保遍历裁判文书中的所有位置。
302、截取标识一与标识二中间的判决段落,判决段落包括判决结果。
与步骤201中的标识一与标识二相同,标识一为判决如下、裁定如下或其变体,标识二为受理费或其变体。标识一与标识二在裁判文书中是成对出现的,若裁判文书中存在多对标识一及标识二,则截取裁判文书中最后出现的一对标识一及标识二中间的段落,作为裁判部分段落。
303、在判决段落中,在标识一之后的预设字符范围内查找败诉关键词。
本步骤与如图1所示的步骤103所示的方法相同,这里不再赘述。
304a、若查找到败诉关键词,则确定判决结果为败诉。
本步骤与如图1所示的步骤104所示的方法相同,这里不再赘述。
304b、若未查找到败诉关键词,且未查找到标识三,则确定判决结果为胜诉;或者若未查找到败诉关键词,且在包含标识三的自然句或自然段中未查找到标识四,则确定判决结果为胜诉。
标识三为离婚,未查找到离婚标识,说明裁判文书判定的不是离婚案件。对非离婚案件的裁判文书,若未查找到败诉关键词,那么判决结果为胜诉。
包含标识三的自然句或者自然段,说明裁判文书中含有“离婚”,所以裁判文书判定的案件为离婚案件。在离婚案件裁判文书的判决段落中未查找到标识四“不予支持或其变体”,若未查找到败诉关键词,则确定判决结果为胜诉。
若判决结果为胜诉,则在判决段落中除预设字符范围以外的其他部分查找败诉关键词;若在所述预设字符范围以外的其他部分查找到所述败诉关键词,则确定所述判决结果为部分胜诉。
在判决结果为胜诉的裁判文书中,判定是否为部分胜诉。部分胜诉是指对原告提出的要求没有全部支持。对没有支持的部分,使用败诉关键词否定。
305、根据预设的金额关键词,从裁判文书中提取涉案金额,计算支持比例。
若判决结果为胜诉,根据具体的判决内容,提取涉案金额。在金额提取时,根据金额关键词,将对应的数据做转换。金额关键词,包括中文大小写“壹”、“一”,数量单位“万”、“亿”,金额抵扣关系“赔偿”、“垫付”。将金额关键词对应的关于金额的描述,转化成带有正负的阿拉伯数字,以便后续对金额数据进行处理。
从提取的涉案金额中,选取法院支持的金额,计算法院支持的金额总和。从提取的涉案金额中,选取法院未支持的金额,计算法院未支持的金额总和。法院支持金额与未支持金额的和,为总涉案金额。最终计算支持比例,支持比例为法院支持金额除以总涉案金额。
进一步的,作为对上述图1至图3所示方法的实现,本发明另一实施例还提供了一种自动判定裁判文书判决结果的装置。本装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本装置实施例能够对应实现前述方法实施例中的全部内容。如图4所示,该装置包括:遍历单元41、截取单元42、查找单元43以及确定单元44。其中,
遍历单元41,用于在裁判文书中遍历预设的标识一和标识二,标识一为判决如下、裁定如下或其变体,标识二为受理费或其变体;
截取单元42,用于截取遍历单元41遍历的标识一与标识二中间的判决段落,判决段落包括判决结果;
查找单元43,用于在截取单元42截取的判决段落中,在标识一之后的预设字符范围内查找败诉关键词,败诉关键词包括驳回、不准或其变体;
确定单元44,用于若查找单元43查找到败诉关键词,则确定判决结果为败诉。
进一步地,查找单元43,用于若未查找到败诉关键词,则在判决段落中查找标识三,标识三为离婚;
查找单元43,还用于若查找到标识三,则在包含标识三的自然句或自然段中查找标识四,标识四为不予支持或其变体;
确定单元44,用于若查找单元43查找到标识四,则确定判决结果为败诉。
进一步的,确定单元44,还用于若查找单元未查找到败诉关键词,且未查找到标识三,则确定判决结果为胜诉;或者
确定单元44,还用于若查找单元未查找到败诉关键词,且在包含标识三的自然句或自然段中未查找到标识四,则确定判决结果为胜诉。
进一步地,查找单元43,还用于若判决结果为胜诉,则在判决段落中除预设字符范围以外的其他部分查找败诉关键词;
确定单元44,还用于若在查找单元预设字符范围以外的其他部分查找到败诉关键词,则确定判决结果为部分胜诉。
进一步地,遍历单元遍历得到的标识一与标识二在裁判文书中是成对出现的;
截取单元42,如图5所示,包括:
查找模块421,用于查找裁判文书中最后出现的一对标识一及标识二;
截取模块422,用于截取查找模块421查找到的最后出现的一对标识一与标识二中间的判决段落。
进一步地,如图5所示,该装置还包括:
金额计算单元45,用于在确定单元判决结果为胜诉之后,根据预设的金额关键词,从裁判文书中提取涉案金额,计算支持比例。
本发明实施例提供的自动判定裁判文书判决结果的装置,能够在电子文本形式的裁判文书中遍历预设的标识,截取判决部分段落,再通过查找败诉关键词,确定判决结果为是否为败诉。与现有技术相比,本发明实施例能够自动地判定判决结果,降低人的工作量,节省大量人力,并且提高提取判决结果的效率。
所述自动判定裁判文书判决结果的装置包括处理器和存储器,上述遍历单元41、截取单元42、查找单元43和确定单元44等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决人工提取判决结果效率低的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:在裁判文书中遍历预设的标识一和标识二,所述标识一为判决如下、裁定如下或其变体,所述标识二为受理费或其变体;截取标识一与标识二中间的判决段落,所述判决段落包括判决结果;在所述判决段落中,在所述标识一之后的预设字符范围内查找败诉关键词,所述败诉关键词包括驳回、不准或其变体;若查找到所述败诉关键词,则确定所述判决结果为败诉;若未查找到所述败诉关键词,则在所述判决段落中查找标识三,所述标识三为离婚,若查找到所述标识三,则在包含所述标识三的自然句或自然段中查找标识四,所述标识四为不予支持或其变体,若查找到所述标识四,则确定所述判决结果为败诉。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种自动判定裁判文书判决结果的方法,其特征在于,所述方法包括:
在裁判文书中遍历预设的标识一和标识二,所述标识一为判决如下、裁定如下或其变体,所述标识二为受理费或其变体,所述标识一与所述标识二在所述裁判文书中是成对出现的;
截取标识一与标识二中间的判决段落,所述判决段落包括判决结果,进一步包括:查找所述裁判文书中最后出现的一对标识一及标识二;截取所述最后出现的一对标识一与标识二中间的判决段落;
在所述判决段落中,在所述标识一之后的预设字符范围内查找败诉关键词,所述败诉关键词包括驳回、不准或其变体,具体包括:以换行符为标识,在两个换行符中间部分为一个自然段落,在标识一之后,第一个换行符与第二个换行符之间的段落,为查找败诉关键词的查找范围;
若查找到所述败诉关键词,则确定所述判决结果为败诉;
在确定所述判决结果为胜诉之后,所述方法还包括:根据预设的金额关键词,从所述裁判文书中提取涉案金额,计算支持比例,具体包括:在金额提取时,将金额关键词对应的关于金额的描述,转化成带有正负的阿拉伯数字;从提取的涉案金额中,选取法院支持的金额,计算法院支持的金额总和;从提取的涉案金额中,选取法院未支持的金额,计算法院未支持的金额总和;法院支持金额与未支持金额的和,为总涉案金额;最终计算支持比例,支持比例为法院支持金额除以总涉案金额。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若未查找到所述败诉关键词,则在所述判决段落中查找标识三,所述标识三为离婚;
若查找到所述标识三,则在包含所述标识三的自然句或自然段中查找标识四,所述标识四为不予支持或其变体;
若查找到所述标识四,则确定所述判决结果为败诉。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若未查找到所述败诉关键词,且未查找到所述标识三,则确定所述判决结果为胜诉;或者
若未查找到所述败诉关键词,且在包含所述标识三的自然句或自然段中未查找到所述标识四,则确定所述判决结果为胜诉。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述判决结果为胜诉,则在所述判决段落中除所述预设字符范围以外的其他部分查找所述败诉关键词;
若在所述预设字符范围以外的其他部分查找到所述败诉关键词,则确定所述判决结果为部分胜诉。
5.一种自动判定裁判文书判决结果的装置,其特征在于,所述装置包括:
遍历单元,用于在裁判文书中遍历预设的标识一和标识二,所述标识一为判决如下、裁定如下或其变体,所述标识二为受理费或其变体,所述标识一与所述标识二在所述裁判文书中是成对出现的;
截取单元,用于截取遍历单元遍历的标识一与标识二中间的判决段落,所述判决段落包括判决结果,进一步包括:查找所述裁判文书中最后出现的一对标识一及标识二;截取所述最后出现的一对标识一与标识二中间的判决段落;
查找单元,用于在所述截取单元截取的判决段落中,在所述标识一之后的预设字符范围内查找败诉关键词,所述败诉关键词包括驳回、不准或其变体,具体包括:以换行符为标识,在两个换行符中间部分为一个自然段落,在标识一之后,第一个换行符与第二个换行符之间的段落,为查找败诉关键词的查找范围;
确定单元,用于若所述查找单元查找到所述败诉关键词,则确定所述判决结果为败诉;
金额计算单元,用于在确定单元判决结果为胜诉之后,根据预设的金额关键词,从裁判文书中提取涉案金额,计算支持比例,具体包括:在金额提取时,将金额关键词对应的关于金额的描述,转化成带有正负的阿拉伯数字;从提取的涉案金额中,选取法院支持的金额,计算法院支持的金额总和;从提取的涉案金额中,选取法院未支持的金额,计算法院未支持的金额总和;法院支持金额与未支持金额的和,为总涉案金额;最终计算支持比例,支持比例为法院支持金额除以总涉案金额。
6.根据权利要求5所述的装置,其特征在于,
所述查找单元,用于若未查找到所述败诉关键词,则在所述判决段落中查找标识三,所述标识三为离婚;
所述查找单元,还用于若查找到所述标识三,则在包含所述标识三的自然句或自然段中查找标识四,所述标识四为不予支持或其变体;
所述确定单元,用于若查找到所述标识四,则确定所述判决结果为败诉。
7.根据权利要求6所述的装置,其特征在于,
所述确定单元,还用于若所述查找单元未查找到所述败诉关键词,且未查找到所述标识三,则确定所述判决结果为胜诉;或者
所述确定单元,还用于若所述查找单元未查找到所述败诉关键词,且在包含所述标识三的自然句或自然段中未查找到所述标识四,则确定所述判决结果为胜诉。
8.根据权利要求7所述的装置,其特征在于,
所述查找单元,还用于若所述判决结果为胜诉,则在所述判决段落中除所述预设字符范围以外的其他部分查找所述败诉关键词;
所述确定单元,还用于若所述查找单元在所述预设字符范围以外的其他部分查找到所述败诉关键词,则确定所述判决结果为部分胜诉。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求4中任意一项所述的自动判定裁判文书判决结果的 方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求4中任意一项所述的自动判定裁判文书判决结果的 方法。
CN201510866865.0A 2015-12-01 2015-12-01 一种自动判定裁判文书判决结果的方法及装置 Expired - Fee Related CN106815201B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510866865.0A CN106815201B (zh) 2015-12-01 2015-12-01 一种自动判定裁判文书判决结果的方法及装置
PCT/CN2016/105273 WO2017092556A1 (zh) 2015-12-01 2016-11-10 一种自动判定裁判文书判决结果的方法及装置
US15/780,627 US20180365314A1 (en) 2015-12-01 2016-11-10 Method and Device for Automatically Determining Decision in Judgment Document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510866865.0A CN106815201B (zh) 2015-12-01 2015-12-01 一种自动判定裁判文书判决结果的方法及装置

Publications (2)

Publication Number Publication Date
CN106815201A CN106815201A (zh) 2017-06-09
CN106815201B true CN106815201B (zh) 2021-06-08

Family

ID=58796293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510866865.0A Expired - Fee Related CN106815201B (zh) 2015-12-01 2015-12-01 一种自动判定裁判文书判决结果的方法及装置

Country Status (3)

Country Link
US (1) US20180365314A1 (zh)
CN (1) CN106815201B (zh)
WO (1) WO2017092556A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543150B (zh) * 2017-09-21 2022-11-22 北京国双科技有限公司 一种庭审笔录的处理方法和装置
CN109858008A (zh) * 2017-11-30 2019-06-07 南京大学 基于深度学习的文书判决结果倾向性的方法及装置
CN110245907A (zh) * 2018-03-09 2019-09-17 北京国双科技有限公司 庭审笔录内容的生成方法及装置
CN109446511B (zh) * 2018-09-10 2022-07-08 平安科技(深圳)有限公司 裁判文书处理方法、装置、计算机设备和存储介质
CN109308355B (zh) * 2018-09-17 2020-03-13 清华大学 法律判决结果预测方法及装置
CN109766425A (zh) * 2018-12-29 2019-05-17 重庆木舌科技有限公司 在线实时校园法律咨询系统
CN110287292B (zh) * 2019-07-04 2021-10-01 科大讯飞股份有限公司 一种裁判量刑偏离度预测方法及装置
CN111177332B (zh) * 2019-11-27 2023-11-24 中证信用增进股份有限公司 自动提取裁判文书涉案标的和裁判结果的方法及装置
CN111798344B (zh) * 2020-07-01 2023-09-22 北京金堤科技有限公司 主体名称确定方法和装置、电子设备和存储介质
CN111931479B (zh) * 2020-08-10 2024-07-16 鼎富智能科技有限公司 基于合同纠纷判决书的信息抽取方法及装置
CN114120348A (zh) * 2021-11-08 2022-03-01 深圳市鼎法科技有限公司 基于裁判文书的数据处理方法及装置、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1506875A (zh) * 2002-12-12 2004-06-23 华为技术有限公司 语言本地化中特征字符串的提取与替换方法
CN101567069A (zh) * 2009-05-27 2009-10-28 瑞迪法证风险管理科技(北京)有限公司 一种法律风险测评数据处理方法和查询系统
CN103500216A (zh) * 2013-09-30 2014-01-08 北京林业大学 一种文件信息的提取方法
CN103942211A (zh) * 2013-01-21 2014-07-23 腾讯科技(深圳)有限公司 一种正文页的识别方法及装置
CN104572849A (zh) * 2014-12-17 2015-04-29 西安美林数据技术股份有限公司 基于文本语义挖掘的标准化自动建档方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7529756B1 (en) * 1998-07-21 2009-05-05 West Services, Inc. System and method for processing formatted text documents in a database
US20030158848A1 (en) * 2002-02-15 2003-08-21 Finney Randolph L. Divorce document generating and calculating system
US20150066895A1 (en) * 2004-06-18 2015-03-05 Glenbrook Networks System and method for automatic fact extraction from images of domain-specific documents with further web verification
JP5206296B2 (ja) * 2008-10-03 2013-06-12 富士通株式会社 類似文章抽出プログラム、方法、装置
US20160048936A1 (en) * 2013-03-15 2016-02-18 Search For Yeti, LLC Computer-Implemented Methods of and Systems for Analyzing Patent Claims
CN103324745B (zh) * 2013-07-04 2017-04-05 微梦创科网络科技(中国)有限公司 基于贝叶斯模型的文本垃圾识别方法和系统
CN103631948B (zh) * 2013-12-11 2017-01-11 北京京东尚科信息技术有限公司 命名实体的识别方法
US20180053114A1 (en) * 2014-10-23 2018-02-22 Brighterion, Inc. Artificial intelligence for context classifier
US10565533B2 (en) * 2014-05-09 2020-02-18 Camelot Uk Bidco Limited Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches
US20180144421A1 (en) * 2016-11-21 2018-05-24 Velites Consulting Group, LLC System and Methods for Complaint Evaluation
US20190354855A1 (en) * 2018-05-15 2019-11-21 CoreDotToday Inc. Method for calculating similarity of cases based on citation relationship

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1506875A (zh) * 2002-12-12 2004-06-23 华为技术有限公司 语言本地化中特征字符串的提取与替换方法
CN101567069A (zh) * 2009-05-27 2009-10-28 瑞迪法证风险管理科技(北京)有限公司 一种法律风险测评数据处理方法和查询系统
CN103942211A (zh) * 2013-01-21 2014-07-23 腾讯科技(深圳)有限公司 一种正文页的识别方法及装置
CN103500216A (zh) * 2013-09-30 2014-01-08 北京林业大学 一种文件信息的提取方法
CN104572849A (zh) * 2014-12-17 2015-04-29 西安美林数据技术股份有限公司 基于文本语义挖掘的标准化自动建档方法

Also Published As

Publication number Publication date
US20180365314A1 (en) 2018-12-20
CN106815201A (zh) 2017-06-09
WO2017092556A1 (zh) 2017-06-08

Similar Documents

Publication Publication Date Title
CN106815201B (zh) 一种自动判定裁判文书判决结果的方法及装置
CN109388801B (zh) 相似词集合的确定方法、装置和电子设备
CN106815203B (zh) 一种裁判文书中的金额解析方法及装置
Pan et al. Assessing the impact of software on science: A bootstrapped learning of software entities in full-text papers
WO2020114373A1 (zh) 一种实现司法文书中要素识别的方法及装置
CN109101489B (zh) 一种文本自动摘要方法、装置及一种电子设备
CN104156490A (zh) 基于文字识别检测可疑钓鱼网页的方法及装置
CN106202041A (zh) 一种解决知识图谱中的实体对齐问题的方法和装置
CN110083832B (zh) 文章转载关系的识别方法、装置、设备及可读存储介质
CN102279890A (zh) 基于微博的情感词提取收集方法
WO2020135247A1 (zh) 法律文书解析方法及装置
CN103514213A (zh) 词语提取方法及装置
TW201923629A (zh) 資料處理方法及裝置
CN111985244A (zh) 一种针对文档内容的洗稿检测方法及装置
CN104123273B (zh) 一种面向对象程序的注释质量评价和注释建议方法
CN106649749A (zh) 一种基于汉语音位特征的文本查重方法
WO2023060634A1 (zh) 基于跨篇章事件提取的案件串联方法、装置及相关组件
CN110348003A (zh) 文本有效信息的抽取方法及装置
CN115344805A (zh) 素材审核方法、计算设备及存储介质
WO2020063524A1 (zh) 一种法律文书的确定方法及系统
CN110866407A (zh) 确定互译文本及文本间相似度分析方法、装置及设备
CN104572904A (zh) 一种标签关联程度的确定方法及装置
CN110879832A (zh) 目标文本检测方法、模型训练方法、装置及设备
CN110019659B (zh) 裁判文书的检索方法及装置
CN107590163B (zh) 文本特征选择的方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210608