CN108287818A - 裁判文书中金额的提取方法、装置和电子设备 - Google Patents
裁判文书中金额的提取方法、装置和电子设备 Download PDFInfo
- Publication number
- CN108287818A CN108287818A CN201810005074.2A CN201810005074A CN108287818A CN 108287818 A CN108287818 A CN 108287818A CN 201810005074 A CN201810005074 A CN 201810005074A CN 108287818 A CN108287818 A CN 108287818A
- Authority
- CN
- China
- Prior art keywords
- information
- group
- amount
- amount information
- normalized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种裁判文书中金额的提取方法、装置和电子设备,其中,裁判文书中金额的提取方法包括:对裁判文书中的文本进行归一化处理;对归一化处理后的文本进行段落意群解析,并获取相关段落意群;提取出相关段落意群中的金额信息及其对应的上下文信息;计算金额信息的可信度得分;根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息。本发明实施例的裁判文书中金额的提取方法、装置和电子设备,能够提高工作效率,降低人工成本,为案件分析提供可靠的数据基础。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种裁判文书中金额的提取方法、装置和电子设备。
背景技术
裁判文书是记载人民法院审理过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的惟一凭证。一份结构完整、要素齐全、逻辑严谨的裁判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。目前,主要通过人工的方式来提取出裁判文书中案件的相关金额,从而为人民法院的判决等提供数据基础。然而,随着信息化时代的来临,数据量越来越大。上述方法已无法满足快节奏的操作需求,效率低,人工成本高。
发明内容
本发明提供一种信息推荐方法、装置和电子设备,以解决上述技术问题中的至少一个。
本发明实施例提供一种裁判文书中金额的提取方法,包括:
对裁判文书中的文本进行归一化处理;
对归一化处理后的文本进行段落意群解析,并获取相关段落意群;
提取出所述相关段落意群中的金额信息及其对应的上下文信息;
计算所述金额信息的可信度得分;
根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。
可选的,对裁判文书中的文本进行归一化处理,包括:
识别所述文本中的数字信息;
对所述数字信息进行归一化。
可选的,对所述数字信息进行归一化,包括:
修正被标点符号分隔的数字信息;和/或
将所述数字信息的表达格式归一化为预设表达格式。
可选的,对归一化处理后的文本进行段落意群解析,并获取相关段落意群,包括:
将归一化处理后的所述文本切分为多个段落意群;
基于预设规则识别出所述相关段落意群和不相关段落意群;
提取所述相关段落意群,并过滤所述不相关段落意群。
可选的,提取出所述相关段落意群中的金额信息及其对应的上下文信息,包括:
识别并提取所述金额信息,并将所述金额信息转换为数值形式;
基于预设条件获取所述金额信息对应的上下文信息。
可选的,提取出所述相关段落意群中的金额信息及其对应的上下文信息,包括:
识别并提取所述金额信息,并将所述金额信息转换为数值形式;
基于预设条件获取所述金额信息对应的上下文信息。
本发明另一实施例提供一种裁判文书中金额的提取装置,包括:
归一化模块,用于对裁判文书中的文本进行归一化处理;
意群解析模块,用于对归一化处理后的文本进行段落意群解析,并获取相关段落意群;
提取模块,用于提取出所述相关段落意群中的金额信息及其对应的上下文信息;
计算模块,用于计算所述金额信息的可信度得分;
输出模块,用于根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。
可选的,所述归一化模块,用于:
识别所述文本中的数字信息;
对所述数字信息进行归一化。
可选的,所述归一化模块,具体用于:
修正被标点符号分隔的数字信息;和/或
将所述数字信息的表达格式归一化为预设表达格式。
可选的,所述意群解析模块,用于:
将归一化处理后的所述文本切分为多个段落意群;
基于预设规则识别出所述相关段落意群和不相关段落意群;
提取所述相关段落意群,并过滤所述不相关段落意群。
可选的,所述提取模块,用于:
识别并提取所述金额信息,并将所述金额信息转换为数值形式;
基于预设条件获取所述金额信息对应的上下文信息。
可选的,所述计算模块,用于:
对所述金额信息及其对应的上下文信息进行解析,获得所述金额信息的特征信息;
根据所述特征信息,基于预设算法计算得到所述金额信息的可信度得分。
本发明还一实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明第一方面实施例所述的裁判文书中金额的提取方法。
本发明又一实施例提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器用于执行本发明第一方面实施例所述的裁判文书中金额的提取方法。
本发明实施例提供的技术方案可以包括以下有益效果:
通过对裁判文书中的文本进行归一化处理,以及对归一化处理后的文本进行段落意群解析,并获取相关段落意群,并提取出所述相关段落意群中的金额信息及其对应的上下文信息,然后计算所述金额信息的可信度得分,以及根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息,能够提高工作效率,降低人工成本,为案件分析提供可靠的数据基础。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的裁判文书中金额的提取方法的流程图;
图2是根据本发明一个实施例的裁判文书中金额的提取装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的裁判文书中金额的提取方法、装置和电子设备。
图1是根据本发明一个实施例的裁判文书中金额的提取方法的流程图。
如图1所示,该裁判文书中金额的提取方法包括:
S101,对裁判文书中的文本进行归一化处理。
目前,主要通过人工的方式来提取出裁判文书中案件的相关金额,从而为人民法院的判决等提供数据基础。但是,人工提取的方法需要从业人员对判决文书进行阅读,凭借经验分析,以获取所需的金额,对人工的要求高,费时费力,数据量巨大的情况下,效率低。为此,本发明提出一种裁判文书中金额的提取方法,提高提取金额的效率。
在本发明的一个实施例中,对于一篇裁判文书,首先可识别文本中的数字信息,然后对数字信息进行归一化。
具体地,可修正被标点符号分隔的数字信息;和/或将数字信息的表达格式归一化为预设表达格式。例如,文中有的数字为“100,000”,其实际上代表的意思是10万,因此需要对其进行归一化,去掉中间的标点符号,修改为“100000”。再例如:将一些不常见的数字表达转换为常用的数字表达(预设表达格式),繁体的“壹”转换为简体的“一”;全角的阿拉伯数字转换为半角等。
S102,对归一化处理后的文本进行段落意群解析,并获取相关段落意群。
具体地,可将归一化处理后的文本切分为多个段落意群,再基于预设规则识别出相关段落意群和不相关段落意群。然后,可提取相关段落意群,并过滤不相关段落意群。
下面以刑事案件为例进行说明:
一个典型的刑事案件可以切分为如下段落意群:
a)被告人信息
b)判决过程性信息
c)检察院指控
i.核心事实叙述【用于提取犯罪时间、地点、财物等信息】
ii.案发后的情况【用于提取退赃、退赔、谅解等信息】
iii.公诉机关认为段落,包含公诉机关对事实的认定以及对判刑的建议
d)经审理查明
i.核心事实描述
ii.案发后情况
iii.被告人及辩护人的意见及辩护诉求【是否认罪、部分事实的争议】
e)证明材料
f)本院认为
i.剥离大段的法律原文引用【用于去除干扰】
ii.剥离否定性词汇和句子
iii.剥离被告以及辩护人的申诉
iv.剥离检察院的意见
v.剥离对证据的认定
g)判决
h)审判人员及书记员、审判时间等
i)附件
其中,被告人信息;判决过程性信息;检察院指控中的案发后的情况;经审理查明中的案发后情况;判决;审判人员及书记员、审判时间等;以及f)本院认为中,列出的五种情况之外的,以本院认为为开头的段落的内容,上述信息均为不相关段落意群。也就是说,上述信息所包含的金额信息均不在考虑范围内。
例如:有判决书在文书中直接引用刑法第一百四十条的原文:“生产者、销售者在产品中掺杂、掺假,以假充真,以次充好或者以不合格产品冒充合格产品,销售金额五万元以上不满二十万元的,处二年以下有期徒刑或者拘役,并处或者单处销售金额百分之五十以上二倍以下罚金”,这些引用的内容只能作为量刑依据,而不能作为具体的犯罪金额加以提取。因此,不在考虑范围内。
S103,提取出相关段落意群中的金额信息及其对应的上下文信息。
具体地,可识别并提取相关段落意群中的金额信息,并将金额信息转换为数值形式,然后基于预设条件获取金额信息对应的上下文信息。举例来说,提取的信息可包括:金额信息所在意群段落名称;金额信息所在段落;金额信息所在段落在意群段落中的位置(第几段);金额信息所在句子(以句号、问号分隔);金额信息所在句子在段落中的位置(段落中的第几句);金额信息所在子句(在句子中,再以顿号、分号等标点符号分隔);金额信息所在子句在句子中的位置(句子中的第几个子句)。
S104,计算金额信息的可信度得分。
具体地,可对金额信息及其对应的上下文信息进行解析,再获得金额信息的特征信息,然后根据特征信息,基于预设算法计算得到金额信息的可信度得分。
举例来说,在提取得到金额信息及其对应的上下文信息的数据之后,可计算得到金额信息的可信度。其中,运算规则可包括但不局限于:
a)金额信息所在意群的重要程度;
b)金额信息所在句子包含的关键词(例如,综上、详述如下等);
c)金额信息所在段落、句子、子句的位置;
d)金额信息所在段落及意群段落中包含金额的个数;
e)不同意群之间的金额相互验证程度。
由于案件的特点不同,因此运算规则中的例如重要程度,在不同案件中所占的权重可能会稍许不同。
S105,根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息。
在计算得到可信度得分后,可根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息。例如:需求是最终的判罚金额,那么经过预设规则的计算,得到最终的判罚金额为5万元,并且它对应的置信度为90分,可信度较高。输出金额的同时还输出可信度,可帮助用户判断计算得到金额是否可信,进一步提高效率。
上述方法具有对适应多种不同类型的案件判决书文体、分析数值准确、既给出分析的数值,又给出可信度,对案件的进一步分析提供有效的基础。此外,整体判决文书先进行细粒度的意群解析,然后在相关意群的范围内进行金额提取,有效避免了一些不相关意群中出现的数字、金额对提取工作的干扰。
本发明实施例的裁判文书中金额的提取方法,通过对裁判文书中的文本进行归一化处理,以及对归一化处理后的文本进行段落意群解析,并获取相关段落意群,并提取出相关段落意群中的金额信息及其对应的上下文信息,然后计算金额信息的可信度得分,以及根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息,能够提高工作效率,降低人工成本,为案件分析提供可靠的数据基础。
为了实现上述实施例,本发明还提出了一种裁判文书中金额的提取装置,图2是根据本发明一个实施例的裁判文书中金额的提取装置的结构框图,如图2所示,该装置包括归一化模块210、意群解析模块220、提取模块230、计算模块240以及输出模块250。
其中,归一化模块210,用于对裁判文书中的文本进行归一化处理。
意群解析模块220,用于对归一化处理后的文本进行段落意群解析,并获取相关段落意群。
提取模块230,用于提取出相关段落意群中的金额信息及其对应的上下文信息。
计算模块240,用于计算金额信息的可信度得分。
输出模块250,用于根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息。
需要说明的是,前述对裁判文书中金额的提取方法的解释说明,也适用于本发明实施例的裁判文书中金额的提取装置,本发明实施例中未公布的细节,在此不再赘述。
本发明实施例的裁判文书中金额的提取装置,通过对裁判文书中的文本进行归一化处理,以及对归一化处理后的文本进行段落意群解析,并获取相关段落意群,并提取出相关段落意群中的金额信息及其对应的上下文信息,然后计算金额信息的可信度得分,以及根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息,能够提高工作效率,降低人工成本,为案件分析提供可靠的数据基础。
为了实现上述实施例,本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明第一方面实施例的裁判文书中金额的提取方法。
为了实现上述实施例,本发明还提出了一种电子设备。
电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器用于执行本发明第一方面实施例的裁判文书中金额的提取方法。
例如,计算机程序可被处理器执行以完成以下步骤的裁判文书中金额的提取方法:
S101’,对裁判文书中的文本进行归一化处理。
S102’,对归一化处理后的文本进行段落意群解析,并获取相关段落意群。
S103’,对归一化处理后的文本进行段落意群解析,并获取相关段落意群。
S104’,计算金额信息的可信度得分。
S105’,根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息。
本发明实施例的电子设备,通过对裁判文书中的文本进行归一化处理,以及对归一化处理后的文本进行段落意群解析,并获取相关段落意群,并提取出相关段落意群中的金额信息及其对应的上下文信息,然后计算金额信息的可信度得分,以及根据可信度得分对金额信息进行排序,并输出可信度得分最高的金额信息,能够提高工作效率,降低人工成本,为案件分析提供可靠的数据基础。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (14)
1.一种裁判文书中金额的提取方法,其特征在于,包括:
对裁判文书中的文本进行归一化处理;
对归一化处理后的文本进行段落意群解析,并获取相关段落意群;
提取出所述相关段落意群中的金额信息及其对应的上下文信息;
计算所述金额信息的可信度得分;
根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。
2.如权利要求1所述的方法,其特征在于,对裁判文书中的文本进行归一化处理,包括:
识别所述文本中的数字信息;
对所述数字信息进行归一化。
3.如权利要求2所述的方法,其特征在于,对所述数字信息进行归一化,包括:
修正被标点符号分隔的数字信息;和/或
将所述数字信息的表达格式归一化为预设表达格式。
4.如权利要求1所述的方法,其特征在于,对归一化处理后的文本进行段落意群解析,并获取相关段落意群,包括:
将归一化处理后的所述文本切分为多个段落意群;
基于预设规则识别出所述相关段落意群和不相关段落意群;
提取所述相关段落意群,并过滤所述不相关段落意群。
5.如权利要求1所述的方法,其特征在于,提取出所述相关段落意群中的金额信息及其对应的上下文信息,包括:
识别并提取所述金额信息,并将所述金额信息转换为数值形式;
基于预设条件获取所述金额信息对应的上下文信息。
6.如权利要求1所述的方法,其特征在于,计算所述金额信息的可信度得分,包括:
对所述金额信息及其对应的上下文信息进行解析,获得所述金额信息的特征信息;
根据所述特征信息,基于预设算法计算得到所述金额信息的可信度得分。
7.一种裁判文书中金额的提取装置,其特征在于,包括:
归一化模块,用于对裁判文书中的文本进行归一化处理;
意群解析模块,用于对归一化处理后的文本进行段落意群解析,并获取相关段落意群;
提取模块,用于提取出所述相关段落意群中的金额信息及其对应的上下文信息;
计算模块,用于计算所述金额信息的可信度得分;
输出模块,用于根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。
8.如权利要求7所述的装置,其特征在于,所述归一化模块,用于:
识别所述文本中的数字信息;
对所述数字信息进行归一化。
9.如权利要求8所述的装置,其特征在于,所述归一化模块,具体用于:
修正被标点符号分隔的数字信息;和/或
将所述数字信息的表达格式归一化为预设表达格式。
10.如权利要求7所述的装置,其特征在于,所述意群解析模块,用于:
将归一化处理后的所述文本切分为多个段落意群;
基于预设规则识别出所述相关段落意群和不相关段落意群;
提取所述相关段落意群,并过滤所述不相关段落意群。
11.如权利要求7所述的装置,其特征在于,所述提取模块,用于:
识别并提取所述金额信息,并将所述金额信息转换为数值形式;
基于预设条件获取所述金额信息对应的上下文信息。
12.如权利要求7所述的装置,其特征在于,所述计算模块,用于:
对所述金额信息及其对应的上下文信息进行解析,获得所述金额信息的特征信息;
根据所述特征信息,基于预设算法计算得到所述金额信息的可信度得分。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~6任一项所述的裁判文书中金额的提取方法。
14.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~6任一项所述的裁判文书中金额的提取方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810005074.2A CN108287818A (zh) | 2018-01-03 | 2018-01-03 | 裁判文书中金额的提取方法、装置和电子设备 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810005074.2A CN108287818A (zh) | 2018-01-03 | 2018-01-03 | 裁判文书中金额的提取方法、装置和电子设备 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN108287818A true CN108287818A (zh) | 2018-07-17 |
Family
ID=62834905
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201810005074.2A Pending CN108287818A (zh) | 2018-01-03 | 2018-01-03 | 裁判文书中金额的提取方法、装置和电子设备 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN108287818A (zh) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109446511A (zh) * | 2018-09-10 | 2019-03-08 | 平安科技(深圳)有限公司 | 裁判文书处理方法、装置、计算机设备和存储介质 |
| CN109800426A (zh) * | 2018-12-26 | 2019-05-24 | 上海创至计算机科技股份有限公司 | 一种裁判文书纠错装置以及方法 |
| CN110502741A (zh) * | 2019-07-11 | 2019-11-26 | 平安科技(深圳)有限公司 | 中文文本的识别方法及装置 |
| CN110781299A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 资产信息识别方法、装置、计算机设备及存储介质 |
| CN111126064A (zh) * | 2019-11-14 | 2020-05-08 | 四川隧唐科技股份有限公司 | 金额识别方法、装置、计算机设备和可读存储介质 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101354712A (zh) * | 2008-09-05 | 2009-01-28 | 北京大学 | 中文术语自动提取系统及方法 |
| CN105005556A (zh) * | 2015-07-29 | 2015-10-28 | 成都理工大学 | 一种基于地质大数据的标引关键词提取方法和系统 |
| CN106033462A (zh) * | 2015-03-19 | 2016-10-19 | 科大讯飞股份有限公司 | 一种新词发现方法及系统 |
| CN106502969A (zh) * | 2016-10-21 | 2017-03-15 | 天津海量信息技术股份有限公司 | 司法案件涉案金额的归一化方法 |
| CN106815203A (zh) * | 2015-12-01 | 2017-06-09 | 北京国双科技有限公司 | 一种裁判文书中的金额解析方法及装置 |
-
2018
- 2018-01-03 CN CN201810005074.2A patent/CN108287818A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101354712A (zh) * | 2008-09-05 | 2009-01-28 | 北京大学 | 中文术语自动提取系统及方法 |
| CN106033462A (zh) * | 2015-03-19 | 2016-10-19 | 科大讯飞股份有限公司 | 一种新词发现方法及系统 |
| CN105005556A (zh) * | 2015-07-29 | 2015-10-28 | 成都理工大学 | 一种基于地质大数据的标引关键词提取方法和系统 |
| CN106815203A (zh) * | 2015-12-01 | 2017-06-09 | 北京国双科技有限公司 | 一种裁判文书中的金额解析方法及装置 |
| CN106502969A (zh) * | 2016-10-21 | 2017-03-15 | 天津海量信息技术股份有限公司 | 司法案件涉案金额的归一化方法 |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109446511A (zh) * | 2018-09-10 | 2019-03-08 | 平安科技(深圳)有限公司 | 裁判文书处理方法、装置、计算机设备和存储介质 |
| WO2020052184A1 (zh) * | 2018-09-10 | 2020-03-19 | 平安科技(深圳)有限公司 | 裁判文书处理方法、装置、计算机设备和存储介质 |
| CN109446511B (zh) * | 2018-09-10 | 2022-07-08 | 平安科技(深圳)有限公司 | 裁判文书处理方法、装置、计算机设备和存储介质 |
| CN109800426A (zh) * | 2018-12-26 | 2019-05-24 | 上海创至计算机科技股份有限公司 | 一种裁判文书纠错装置以及方法 |
| CN109800426B (zh) * | 2018-12-26 | 2023-10-03 | 上海创至计算机科技股份有限公司 | 一种裁判文书纠错装置以及方法 |
| CN110502741A (zh) * | 2019-07-11 | 2019-11-26 | 平安科技(深圳)有限公司 | 中文文本的识别方法及装置 |
| CN110502741B (zh) * | 2019-07-11 | 2023-11-17 | 平安科技(深圳)有限公司 | 中文文本的识别方法及装置 |
| CN110781299A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 资产信息识别方法、装置、计算机设备及存储介质 |
| CN110781299B (zh) * | 2019-09-18 | 2024-03-19 | 平安科技(深圳)有限公司 | 资产信息识别方法、装置、计算机设备及存储介质 |
| CN111126064A (zh) * | 2019-11-14 | 2020-05-08 | 四川隧唐科技股份有限公司 | 金额识别方法、装置、计算机设备和可读存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108287818A (zh) | 裁判文书中金额的提取方法、装置和电子设备 | |
| KR101536520B1 (ko) | 토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버 | |
| Trappey et al. | Intelligent trademark similarity analysis of image, spelling, and phonetic features using machine learning methodologies | |
| CN107798621B (zh) | 疾病诊断信息审核方法及装置 | |
| Velte | Does board composition influence CSR reporting? A meta-analysis | |
| Liu et al. | Using argument-based features to predict and analyse review helpfulness | |
| CN102144229B (zh) | 用于从具有文本段的文档中提取术语的系统 | |
| US20100254613A1 (en) | System and method for duplicate text recognition | |
| Poletto et al. | Annotating hate speech: Three schemes at comparison | |
| CN109255126A (zh) | 文章推荐方法及装置 | |
| CN108304490A (zh) | 基于文本的相似度确定方法、装置及计算机设备 | |
| CN103617158A (zh) | 一种对话文本情感摘要的生成方法 | |
| CN107451148A (zh) | 一种视频分类方法、装置及电子设备 | |
| CN102262765A (zh) | 一种发布商品信息的方法及装置 | |
| KR101326313B1 (ko) | 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법 | |
| Samarasinghe et al. | Machine learning approach for the detection of hate speech in sinhala unicode text | |
| Biesialska et al. | Leveraging contextual embeddings and self-attention neural networks with bi-attention for sentiment analysis | |
| CN109743589A (zh) | 文章生成方法及装置 | |
| Khanehzar et al. | Framing unpacked: A semi-supervised interpretable multi-view model of media frames | |
| Miyazaki et al. | Cross-domain analysis on Japanese legal pretrained language models | |
| Hirst et al. | Party status as a confound in the automatic classification of political speech by ideology | |
| CN114781348B (zh) | 一种基于词袋模型的文本相似度计算方法及系统 | |
| CN110457009B (zh) | 基于数据分析的软件安全需求推荐模型的实现方法 | |
| CN108628875A (zh) | 一种文本标签的提取方法、装置及服务器 | |
| Zhang et al. | ICAF: iterative contrastive alignment framework for multimodal abstractive summarization |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| TA01 | Transfer of patent application right | ||
| TA01 | Transfer of patent application right |
Effective date of registration: 20190903 Address after: 100192 Dongsheng Science Park, Zhongguancun, 66 Xixiaokou Road, Haidian District, Beijing Applicant after: Green Bay Network Technology Co., Ltd. Address before: 100089 Beijing Haidian District Xixiaokou Road 66 Zhongguancun Dongsheng Science Park B-6 Building B 5 floors Applicant before: Grass count language (Beijing) Technology Co., Ltd. |
|
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180717 |