[go: up one dir, main page]

CN114168717A - 对话装置、方法以及信息记录介质 - Google Patents

对话装置、方法以及信息记录介质 Download PDF

Info

Publication number
CN114168717A
CN114168717A CN202110219523.5A CN202110219523A CN114168717A CN 114168717 A CN114168717 A CN 114168717A CN 202110219523 A CN202110219523 A CN 202110219523A CN 114168717 A CN114168717 A CN 114168717A
Authority
CN
China
Prior art keywords
search
database
databases
searches
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110219523.5A
Other languages
English (en)
Other versions
CN114168717B (zh
Inventor
小林优佳
岩田宪治
吉田尚水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN114168717A publication Critical patent/CN114168717A/zh
Application granted granted Critical
Publication of CN114168717B publication Critical patent/CN114168717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的实施方式涉及对话装置、方法以及信息记录介质。提供能够进行灵活的对话的对话装置、方法以及信息记录介质。实施方式的对话装置包括:指定部,指定多个数据库中的1个数据库;检索部,使用关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;以及生成部,根据在被指定的所述数据库中与所述关键字一致的数据件数和在所述其他数据库中与所述关键字一致的数据件数来生成应答。

Description

对话装置、方法以及信息记录介质
本申请在日本专利申请2020-152168(申请日:9/10/2020)的基础上,从该申请享有优先的利益。本申请通过参照该申请,包含该申请的全部内容。
技术领域
本发明的实施方式涉及对话装置、方法以及信息记录介质。
背景技术
一般而言,对话装置从用户输入的自然语句等文本信息中提取检索所需的检索关键字,使用提取出的检索关键字来检索数据库,根据检索出的结果向用户输出应答。成为检索对象的数据库是1个以上的数据库,例如包括综合了多个数据库功能的1个数据库、相互独立的多个数据库。具体而言,对话装置检索用户等指定的1个以上的数据库。
第一,在对话装置检索被指定的1个数据库的情况下,无法输出考虑了未被指定的其他数据库中的检索结果的应答。例如,在基于某个检索关键字在特定的数据库中的检索件数为0件的情况下,对话装置无法进行进一步的检索,而无法继续提示在检索件数的筛选时应使用的其他检索关键字、其他数据库。第二,在对话装置检索被指定的多个数据库的情况下,无法决定优先利用从多个数据库得到的多个检索结果中的哪个检索结果来输出应答。因此,期望一种对话装置,其在优先利用被指定的1个数据库中的检索结果的同时,输出将该检索结果与未指定的其他数据库中的检索结果合并后的应答。
发明内容
本发明要解决的技术问题在于,提供一种能够进行灵活的对话的对话装置、方法以及信息记录介质。
实施方式的对话装置包含指定部、取得部、提取部、检索部、生成部以及输出部。指定部指定多个数据库中的1个数据库。取得部取得用户输入的文本信息。提取部从所述文本信息提取检索所需的检索关键字。检索部使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库。生成部根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数,生成应答。输出部将所生成的所述应答输出至所述用户。
根据上述结构的对话装置,能够进行灵活的对话。
附图说明
图1是表示第一实施方式的对话装置的结构例的框图。
图2是表示第一实施方式的对话装置的动作例的流程图。
图3是表示与筛选关键字的决定有关的详细内容的流程图。
图4是表示存储在多个数据库中的数据表的一例的图。
图5是表示多个数据库各自的数据件数的一例的图。
图6是表示第二实施方式的对话装置的结构例的框图。
图7是表示第二实施方式的对话装置的动作例的流程图。
附图标记说明
1…对话装置、2…数据库、11…处理电路、12…存储器、13…显示装置、14…输入接口、15…通信接口、111…指定部、112…取得部、113…提取部、114…检索部、115…判定部、116…生成部、117…输出部、118…计算部、119…决定部、120…识别部、100…对话系统、200…数据表、300…汇总数据表。
具体实施方式
以下,参照附图对实施方式的对话装置进行说明。
(第一实施方式)
参照图1对第一实施方式的对话装置1的结构例进行说明。
对话装置1是从用户所输入的自然语句等文本信息中提取检索所需的检索关键字,使用提取出的检索关键字检索多个数据库2,根据检索出的结果向用户输出应答的装置。具体而言,对话装置1是任务定向型的对话装置,通过安装于服务器等,既可以作为对话专用的硬件来安装,或者也可以作为应用程序等的软件来安装。在本实施方式中,对话装置1包括处理电路11、存储器12、显示装置13、输入接口14以及通信接口15。各构成部通过总线可相互通信地连接。另外,各结构部也可以不通过各个硬件来安装。例如,各构成部中的至少2个也可以通过1个硬件来安装。
另外,对话装置1被连接为能够经由网络与多个数据库2通信。另外,包括对话装置1、数据库2以及网络的系统整体也称为对话系统100。
处理电路11控制对话装置1的动作。处理电路11具有CPU(Central ProcessingUnit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、FPU(FloatingPoint Unit)等处理器作为硬件。处理电路11通过经由处理器执行在存储器12中展开的程序,来执行与各程序对应的各部(指定部111、取得部112、提取部113、检索部114、判定部115、生成部116、输出部117、计算部118、决定部119)。此外,各部也可以不通过由单独的处理器构成的处理电路来安装。例如,各部也可以通过组合多个处理器而得到的处理电路来安装。
指定部111指定多个数据库中的1个数据库。
取得部112取得用户输入的文本信息。
提取部113从文本信息提取检索所需的检索关键字。
检索部114使用检索关键字,检索被指定的数据库和多个数据库中除了被指定的数据库以外的其他数据库。
判定部115判定各种命题的真伪。
生成部116根据在被指定的数据库中与检索关键字一致的数据件数即第一检索件数、和在其他数据库中与检索关键字一致的数据件数即第二检索件数,来生成应答。
输出部117将所生成的应答输出至用户。
计算部118针对多个数据库所包含的各个数据表,计算多个数据项目各自的平均信息量。另外,计算部118使用对多个数据库分别设定的加权,针对多个数据项目各自的平均信息量来计算加权平均。
决定部119将多个数据项目中的、平均信息量的加权平均最大的数据项目决定为筛选关键字。
存储器12存储有处理电路11使用的数据、程序等信息。存储器12具有RAM(RandomAccess Memory:随机存取存储器)等半导体存储器元件作为硬件。此外,存储器12也可以是在与磁盘(软(注册商标)盘、硬盘)、光磁盘(MO)、光盘(CD、DVD、Blu-ray(注册商标))、闪存器(USB闪存器、存储卡、SSD)、磁带等外部存储装置之间读写信息的驱动装置。此外,存储器12的存储区域既可以存在于对话装置1内部,也可以存在于外部存储装置。
显示装置13显示由处理电路11生成的数据、存储在存储器12中的数据等信息。作为显示装置13,例如能够使用阴极射线管(CRT:Cathode Ray Tube)显示器、液晶显示器(LCD:Liquid Crystal Display)、等离子体显示器、有机EL显示器(OELD:OrganicElectro-Luminescence Display)以及平板终端等显示器。
输入接口14接受来自利用对话装置1的用户的输入,将接受到的输入变换为电信号并输出至处理电路11。作为输入接口14,能够使用鼠标、键盘、轨迹球、开关、按钮、操纵杆、触控板、触摸面板显示器、麦克风等物理的操作部件。另外,输入接口14也可以是从与对话装置1分体的外部的输入装置接受输入,将接受到的输入变换为电信号并输出至处理电路11的装置。
通信接口15在与数据库2之间经由网络收发数据。通信接口15与外部装置之间能够使用任意的通信标准。
数据库2存储各种数据。数据库2例如可以作为存储在服务器中的数据文件而被安装。在本实施方式中设为,数据库2包含多个关系数据库(RDB),多个数据库2分别包含定义了与检索关键字相关联的多个数据项目的数据表。数据库2例如包括数据库A、数据库B以及数据库C。另外,数据库2设为是通过遵循SQL(Statured Query Language)等数据库语言的查询(query)来检索的数据库。
参照图2对第一实施方式的对话装置的动作例进行说明。
在步骤S101中,指定部111指定多个数据库2中的1个数据库。例如,对话装置1接受用户经由键盘等输入接口14输入的指示,指定与该指示对应的数据库。此外,对话装置1也可以指定默认的数据库,还可以根据用户的资料(profile)等自动地指定数据库。即,作为数据库的指定方法,能够应用任意的方法。另外,对在对话结束之前被指定了一次的数据库进行保存并设为并不再次询问。
在步骤S102中,取得部112取得用户输入的文本信息。例如,对话装置1取得用户经由键盘(键输入)、触控板(touchpad)以及触摸面板显示器(基于手写识别的输入)、头戴式耳机以及AI扬声器等的麦克风(基于声音识别的输入)等输入接口14输入的文本信息。所取得的文本信息被存储在存储器12中。
在步骤S103中,提取部113从文本信息提取检索所需的检索关键字。在检索关键字的提取中,作为第一提取方法,可以预先准备包含成为提取对象的多个关键字在内的列表,如果所取得的文本信息中包含有该列表上的任意一个关键字,则提取相应的关键字。第一提取方法例如准备“电阻器”、“电容器”、“晶体管”这样的多个关键字,如果所取得的文本信息是“寻找电阻器”,则由于该多个关键字中的“电阻器”被包含在文本信息中,因此提取“电阻器”。
作为第二提取方法,可以预先准备包含成为提取对象的关键字在内的多个文章的列表,如果所取得文本信息中包含有该列表上的任意一个文章,则提取该文章中包含的关键字。第二提取方法例如准备“寻找○○”、“检索△△”、“有□□吗”这样的多个文章,如果所取得的文本信息是“寻找电阻器”,则提取与○○的部分对应的“电阻器”。
作为第三提取方法,也可以预先大量地准备包含成为提取对象的关键字在内的文章和该文章中成为提取对象的关键字(标签)的组,使用该组作为学习数据来制作机器学习模型,通过该机器学习模型进行提取。第三提取方法例如准备“寻找电阻器”这样的文章与对该文章的标签即“电阻器”的组、“检索电容器”这样的文章与针对该文章的标签即“电容器”的组、“有晶体管吗”这样的文章与针对该文章的标签即“晶体管”的组那样的多个组作为学习数据,通过使学习用模型学习文章与标签的关系从而制作机器学习模型。如果使用该机器学习模型所取得的文本信息是“寻找电阻器”,则基于学习到的文章与标签的关系提取“电阻器”。即,作为检索关键字的提取方法,能够应用任意的方法。所提取的检索关键字被存储在存储器12中。
在步骤S104中,检索部114使用检索关键字,检索被指定的数据库和多个数据库2中除了被指定的数据库以外的其他数据库。例如,对话装置1基于提取出的检索关键字,制作基于SQL的查询,检索多个数据库2。查询例如是包含“select*from database A wherename like%电阻器%”那样的检索关键字在内的指令语句。多个搜索结果与检索到的每个数据库建立关联地存储在存储器12中。在本实施方式中设为,检索结果是在数据库2中与检索关键字一致的数据件数。
在步骤S105中,判定部115判定在被指定的数据库中与检索关键字一致的数据件数(第一检索件数)是否为0件。在判定为是0件的情况下(步骤S105的是),进入到步骤S106。在判定为不是0件、即1件以上的情况下(步骤S105的否),进入到步骤S109。
在步骤S106中,判定部115判定在未被指定的其他数据库中与检索关键字一致的数据件数(第二检索件数)是否为0件。在判定为是0件的情况下(步骤S106的是),进入到步骤S107。在判定为不是0件、即1件以上的情况下(步骤S106的否),进入到步骤S108。
在步骤S107中,生成部116生成询问与检索关键字不同的关键字的应答。到本步骤为止,判明了若是该检索关键字则无法在被指定的数据库以及其他数据库中进行进一步的检索,因此对话装置1生成“reject()”指令。本指令表示未受理该检索关键字这一情况,是询问不同关键字的应答的一例。所生成的应答被存储在存储器12中。
在步骤S108中,生成部116生成询问与被指定的数据库不同的数据库的应答。到本步骤为止,判明了如果检索与被指定的数据库不同的其他数据库,则能够发现数据,因此对话装置1生成“request(db)”指令。本指令是询问新指定的其他数据库的应答的一例。所生成的应答被存储在存储器12中。或者,对话装置1也可以生成回答在其他数据库中的检索件数的应答。
在步骤S109中,判定部115判定在被指定的数据库中与检索关键字一致的数据件数(第一检索件数)是否为阈值以下。该阈值既可以设定为用户经由输入接口14输入的任意的值,也可以设定为预先存储在存储器12中的任意的值。在判定为是阈值以下的情况下(步骤S109的是),进入到步骤S110。在判定为不是阈值以下、即大于阈值的情况下(步骤S109的否),进入到步骤S111。
在步骤S110中,生成部116生成对在被指定的数据库中的检索件数进行回答的应答。到本步骤为止,判明了在被指定的数据库中的检索件数为阈值以下,因此对话装置1生成“offer(contents)”指令。本指令是回答在指定的数据库中的检索件数的应答的一例。所生成的应答被存储在存储器12中。
在步骤S111中,生成部116生成询问在被指定的数据库中的检索件数的筛选中所需的筛选关键字的应答。到本步骤为止,判明了在被指定的数据库中的检索件数大于阈值,因此对话装置1生成“request(slot)”指令。本指令是询问用于筛选检索件数的数据项目(也称为时隙)的应答的一例。所生成的应答被存储在存储器12中。另外,筛选关键字相当于成为询问对象的数据项目,与该筛选关键字的决定有关的详细流程在图3中后述。
在步骤S112中,输出单元117向用户输出所生成的应答。对话装置1例如将所生成的指令输出至显示装置13。另外,所生成的应答是机械能够理解的形式的信息(指令),因此对话装置1也可以变换为人能够理解的形式的信息(文本信息)并输出。在应答的变换中,作为第一变换方法,也可以在存储器12中预先准备“$name$的检索结果是$count$件”这样的多个定型语句,通过在$name$中嵌入检索关键字、在$count$中嵌入检索件数来进行变换。作为第二变换方法,也可以预先大量准备检索关键字、检索件数、以及生成的文章的组,使用该组作为学习数据生成机器学习模型,通过该机器学习模型而输出。即,作为变换方法,可以应用任意的方法。之后,对话装置1将变换为文本信息的应答输出至显示装置13。另外,用户观察显示装置13所输出的应答,因此也可以说对用户输出应答。
例如,对话装置1从存储器12取得在步骤S107中生成的“reject()”指令,变换为“无法检索。请用其他关键字进行检索”这样的应答语句并输出至显示装置13。另外,对话装置1从存储器12取得在步骤S108中生成的“request(db)”指令,变换为在“东京事业所的数据库中无法检索。请指定其他事业所的数据库”这样的应答语句并输出至显示装置13。另外,对话装置1从存储器12取得在步骤S110中生成的“offer(contents)”指令,变换为“检索结果为10件”这样的应答语句并输出至显示装置13,另外,对话装置1从存储器12取得在步骤S111中生成的“request(slot)”指令,变换为“请告知〇〇(数据项目)”这样的应答语句并输出至显示装置13。另外,在slot中放入对话装置1询问的数据项目,例如如果slot是电压(voltage),则成为request(voltage)指令。在该情况下,对话装置1从存储器12取得request(voltage)指令,变换为“电压是几个”这样的应答语句并输出至显示装置13。
另外,本动作例所示的各步骤能够适当变更顺序。例如,步骤S101可以处于步骤S104之前的任意阶段。另外,步骤S105以及步骤S106也可以相互调换顺序。
参照图3对与筛选关键字的决定有关的详细内容进行说明。
在步骤S201中,计算部118针对多个数据库2所包含的各个数据表中,计算多个数据项目各自的数据件数。具体而言,对话装置1针对被指定的数据库以及未被指定的其他数据库中的多个数据项目的每一个中,计算各数据项目的每个值的数据件数。
例如,假设在多个数据库2中存储有图4所示的数据表200。数据表200存储与电气部件有关的数据,作为数据项目包含“部件ID”、“部件名”以及“型号”。部件ID是分配给各个记录的序列号,被分配从0001起各增加1的值。部件名是电气部件的名称,包含“电阻器”、“电容器”以及“晶体管”作为数据值。型号是各电气部件固有的识别编号,包含“ABC”、“DEF”以及“GHI”作为数据值。另外,即使是相同的部件名,也存在型号不同的情况。进而,即使是同一型号,也存在部件名不同的情况。另外,也存在同一记录重复的情况。这样,在数据表200中存储有多个将部件名和型号建立对应而得到的记录(数据)。
对话装置1针对“部件名”分别计算具有“电阻器”的数据件数、具有“电容器”的数据件数、具有“晶体管”的数据件数。同样地,对话装置1针对“型号”分别计算具有“ABC”的数据件数、具有“DEF”的数据件数、具有“GHI”的数据件数。同样地,对话装置1针对多个数据库2所包含的各个数据表进行计算。作为计算结果,多个数据库2各自的数据件数如图5所示的汇总数据表300那样表示。
在步骤S202中,计算部118针对多个数据库2所包含的各个数据表,计算多个数据项目各自的平均信息量。各数据项目的平均信息量反映各数据项目中的各数据值的件数的偏差,平均信息量越高,表示各数据值的件数的偏差越小,是均等的。根据这样的性质,由于平均信息量更高的数据项目包含更多的信息,因此对检索件数的筛选是有用的。
例如,考虑关于汇总数据表300来计算多个数据项目各自的平均信息量的情况。平均信息量通过以下的式子算出。
[数式1]
Figure BDA0002954095330000091
H(Sj)表示数据项目(时隙)Sj中的平均信息量。各数据项目Sj具有多个值Vi。P(Vi)是将与值Vi有关的数据件数除以数据项目Sj所包含的全部的数据件数而得到的数值。
针对汇总数据表300中,基于数式(1),如以下那样求出多个数据库2中的每个数据库2的各数据项目的平均信息量。
HA(P部件名)=0.477、HA(P型号)=0.439
HB(P部件名)=0.185、HB(P型号)=0.461
HC(P部件名)=0.346、HC(P型号)=0.415
另外,HA(P部件名)表示与数据库A的数据项目“部件名”有关的平均信息量。
在步骤S203中,计算部118使用对多个数据库2分别设定的加权,针对多个数据项目各自的平均信息量来计算加权平均。具体而言,对话装置1将对被指定的数据库设定的加权设定为比对其他数据库设定的加权大的值。
例如,考虑针对汇总数据表300的各数据项目的平均信息量来计算加权平均的情况。平均信息量的加权平均通过以下的式子算出。
[数式2]
Figure BDA0002954095330000101
Hall表示平均信息量的加权平均。Wi是针对多个数据库2的每一个而设定的加权。Wi具有多个值,各值的总和为1。
针对汇总数据表300,基于数式(2),如以下那样求出各数据项目的平均信息量的加权平均。另外,设为:多个数据库2中、被指定的数据库设为数据库A、未被指定的其他数据库是数据库B以及数据库C。
Hall(P部件名)=3/5*HA(P部件名)+1/5*HB(P部件名)+1/5*HC(P部件名)=0.392
Hall(P型号)=3/5*HA(P型号)+1/5*HB(P型号)+1/5*HC(P型号)=0.439、
另外,设定为:数据库A的加权WA=3/5、数据库B的加权WB=1/5、数据库C的加权WC=1/5。
在步骤S204中,决定部119将多个数据项目中的平均信息量的加权平均最大的数据项目决定为筛选关键字。各数据项目的平均信息量为,各数据值的数据件数越均等则越大,因此若是平均信息量更大的数据项目,包含用户搜索的数据的概率越高。在上述的例子中,由于Hall(P型号)比Hall(P部件名)大,因此对话装置1将数据项目“型号”决定为筛选关键字。另外,筛选关键字作为对话装置1询问的数据项目(时隙)而在步骤S112中被使用。
根据以上所示的第一实施方式,生成重视用户所指定的数据库中的检索结果、并且考虑了其他数据库中的检索结果的应答。由此,即使被指定的数据库的检索件数为0件,也能够考虑其他数据库中的检索结果来进行灵活的对话。另外,在被指定的数据库的检索件数为1件以上且比阈值大的情况下,能够优先利用被指定的数据库的检索结果、并且进一步考虑其他数据库的检索结果地、决定作为筛选关键字进行询问的数据项目。
(第二实施方式)
参照图6对第二实施方式的对话装置的结构例进行说明。在第二实施方式中,对话装置1决定从用户发出的声音信息中提取出的多个检索关键字中的、最接近用户的发出内容的检索关键字(正确关键字)。另外,第二实施方式的对话装置1的结构,除了第一实施方式的结构以外,还在处理电路11中具有识别部120。
识别部120对声音信息进行声音识别并变换为文本信息。
参照图7对第二实施方式的对话装置的动作例进行说明。
在步骤S301中,指定部111指定多个数据库中的1个数据库。步骤S301与步骤S101相同。
在步骤S302中,识别部120对用户通过声音输入的声音信息进行声音识别,并变换为文本信息。具体而言,对话装置1对用户经由麦克风等输入接口14输入的声音信息进行声音识别。声音信息是反映了用户的发言的声音信号,是与一定期间中的声音的振幅、频率的时间变化有关的波形信息。对于向文本信息的变换,只要应用一般的声音识别处理中使用的现有技术即可,例如,可以是基于声学模型、语言模型的声音识别。在本实施方式中,对话装置1根据识别的可靠度,变换为包含多个变换候选在内的文本信息。
在步骤S303中,取得部112取得变换后的文本信息。所取得的文本信息被存储在存储器12中。
在步骤S304中,提取部113从变换后的文本信息提取多个搜索关键字。具体而言,对话装置1从包含多个变换候选在内的文本信息中分别提取与各变换候选对应的检索关键字。提取出的多个检索关键字被存储在存储器12中。
在步骤S305中,检索部114使用多个检索关键字,检索被指定的数据库和未被指定的其他数据库。步骤S305与步骤S104相同。
在步骤S306中,判定部115判定在被指定的数据库中与多个检索关键字一致的数据件数是否为0件。在判定为是0件的情况下(步骤S306的是),进入到步骤S307。在判定为不是0件、即1件以上的情况下(步骤S306的否),进入到步骤S310。
在步骤S307中,判定部115判定在未被指定的其他数据库中与多个检索关键字一致的数据件数是否为0件。在判定为是0件的情况下(步骤S307的是),进入到步骤S308。在判定为不是0件、即1件以上的情况下(步骤S307的否),进入到步骤S309。
在步骤S308中,生成部116生成询问与多个检索关键字不同的关键字的应答。到本步骤为止,判明了若是该多个检索关键字,则无法在被指定的数据库以及其他数据库中进行进一步的检索,因此对话装置1生成“reject()”指令。本指令表示不受理该多个检索关键字,是询问不同关键字的应答的一例。所生成的应答被存储在存储器12中。
在步骤S309中,生成部116生成如下应答,该应当为,将多个检索关键字中的、其他数据库中的检索件数的总和最大的检索关键字作为正确关键字,而回答其他数据库中的正确关键字的检索件数的应答。到本步骤为止,判明了在被指定的数据库中的检索件数为0件,其他数据库中的检索件数为1件以上,因此对话装置1生成“offer(contents)”指令。本指令是回答其他数据库中的正解关键字的检索件数的应答的一例。所生成的应答被存储在存储器12中。
在步骤S310中,生成部116生成如下应答,该应当为,将多个检索关键字中的、在被指定的数据库中的检索件数为1件以上的检索关键字作为正确关键字,而回答该正确关键字的检索件数的应答。到本步骤为止,判明了在被指定的数据库中的检索件数为1件以上,因此对话装置1生成“offer(contents)”指令。本指令是回答在被指定的数据库中的正解关键字的检索件数的应答的一例。所生成的应答被存储在存储器12中。
另外,在S310中,在存在多个符合正确关键字的检索关键字的情况下,也可以将该多个检索关键字中的声音识别的可靠度最大的检索关键字作为正确关键字。或者,也可以将该多个检索关键字中的、被指定的数据库中的检索件数最大的检索关键字作为正确关键字。当然,对于多个检索关键字中的1个检索关键字,在被指定的数据库中得到了1件以上的检索件数的情况下,将该检索关键字作为正确关键字即可。
在步骤S311中,输出单元117向用户输出所生成的应答。步骤S311与步骤S112相同。
以上,对第二实施方式的对话装置1的动作的概略进行了说明。在此,作为具体例,考虑如下情况:用户指定数据库A,对话装置1使用多个检索关键字,检索被指定的数据库A和作为未被指定的其他数据库的数据库B、以及数据库C。
例如,假设声音识别的结果是,按照声音识别的可靠度从高到低的顺序,作为用户的发言语句而得到“寻找ABC”、“寻找ABE”、“寻找ABP”这3个候选。对话装置1从各候选中提取“ABC”、“ABE”、“ABP”作为多个检索关键字。接着,使用该多个检索关键字检索各数据库的结果如下。
select*from database A where code like%ABC%->0
select*from database B where code like%ABC%->0
select*from database C where code like%ABC%->0
select*from database A where code like%ABE%->0
select*from database B where code like%ABE%->10
select*from database C where code like%ABE%->0
select*from database A where code like%ABP%->0
select*from database B where code like%ABP%->10
select*from database C where code like%ABP%->20
例如检索结果“select*from database A where code like%ABC%->0”表示“数据库A中作为型号(code)而包括“ABC”的数据件数为0件”。
根据上述检索结果,如以下那样求出被指定的数据库A中的各检索关键字的检索件数的总和、其他数据库B以及数据库C中的各检索关键字的检索件数的总和。
countA(ABC)=0,countB+C(ABC)=0
countA(ABE)=0,countB+C(ABE)=10
countA(ABP)=0,countB+C(ABP)=30
例如,“countA(ABC)=0”表示数据库A中的“ABC”的检索结果为0件。“countB+C(ABC)=0”表示数据库B以及数据库C中的“ABC”的检索结果为0件。
根据上述检索结果可知,在被指定的数据库A中,多个检索关键字“ABC”、“ABE”、“ABP”的检索件数为0件,在其他数据库B以及数据库C中,该多个检索关键字的检索件数为1件以上。因此,进行与步骤S309相当的处理。在此,由于多个检索关键字中的、其他的数据库B以及数据库C中的检索件数的总和最大的检索关键字是“ABP”,因此对话装置1将“ABP”决定为正确关键字。最后,生成回答“ABP”在其他数据库B以及数据库C中的检索件数的如以下那样的应答,并输出至显示装置13。“通过ABP进行了检索,但未找到。在数据库B中找到了10件,在数据库C中找到了20件。
根据以上说明的第二实施方式,即使在多个检索关键字中无法根据用户所指定的数据库的检索结果来决定正确关键字的情况下,也能够通过利用其他数据库的检索结果来决定正确关键字。即,与第一实施方式同样,能够进行灵活的对话。
对本发明的几个实施方式进行了说明,但这些实施方式是作为例子而提示的,并不意图限定发明的范围。这些实施方式能够以其他各种方式实施,在不脱离发明的主旨的范围内,能够进行各省略、置换、变更。这些实施方式及其变形包含在发明的范围或主旨中,同样包含在权利要求书所记载的发明及其等同的范围内。
另外,能够将上述的实施方式汇总为以下的技术方案。
(技术方案1)
一种对话装置,具备:
指定部,指定多个数据库中的1个数据库;
取得部,取得用户输入的文本信息;
提取部,从所述文本信息中提取检索所需的检索关键字;
检索部,使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;
生成部,根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数,生成应答;以及
输出部,将所生成的所述应答输出至所述用户。
(技术方案2)
根据上述技术方案1,
在所述第一检索件数为0件、并且所述第二检索件数为0件的情况下,所述生成部生成询问与所述检索关键字不同的关键字的应答。
(技术方案3)
根据上述技术方案1或技术方案2,
在所述第一检索件数为0件、并且所述第二检索件数为1件以上的情况下,所述生成部生成询问与被指定的所述数据库不同的数据库的应答。
(技术方案4)
根据上述技术方案1或技术方案2,
在所述第一检索件数为0件、并且所述第二检索件数为1件以上的情况下,所述生成部生成回答所述第二检索件数的应答。
(技术方案5)
根据上述技术方案1至技术方案4中任一项,
在所述第一检索件数为1件以上、并且为阈值以下的情况下,所述生成部生成回答所述第一检索件数的应答。
(技术方案6)
根据上述技术方案1至技术方案5中任一项,
在所述第一检索件数为1件以上、并且大于阈值的情况下,所述生成部生成询问所述第一检索件数的筛选所需的筛选关键字的应答。
(技术方案7)
根据上述技术方案6,
所述多个数据库分别包含定义了与所述检索关键字关联的多个数据项目的数据表,
所述对话装置还具备:
计算部,针对所述多个数据库所包含的各个数据表,计算所述多个数据项目各自的平均信息量,并且使用对所述多个数据库分别设定的加权,对于所述多个数据项目各自的平均信息量来计算加权平均;以及
决定部,将所述多个数据项目中的所述平均信息量的加权平均最大的数据项目决定为所述筛选关键字。
(技术方案8)
根据上述技术方案1至技术方案7中任一项,
还具备识别部,该识别部对声音信息进行声音识别并变换为文本信息,
所述取得部取得变换后的所述文本信息,
所述提取部从变换后的所述文本信息中提取多个检索关键字,
所述检索部使用所述多个检索关键字,检索被指定的所述数据库和所述其他数据库,
所述生成部在被指定的所述数据库中的所述多个检索关键字的检索件数为0件、并且所述其他数据库中的所述多个检索关键字的检索件数为1件以上的情况下,将所述多个检索关键字中的、在所述其他数据库中的检索件数的总和最大的检索关键字作为正确关键字,生成应答,该应答回答所述其他数据库中的所述正确关键字的检索件数。
(技术方案9)
一种对话方法,
指定多个数据库中的1个数据库;
取得用户输入的文本信息;
从所述文本信息中提取检索所需的检索关键字;
使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;
根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数来生成应答;
将所生成的所述应答输出至所述用户。
(技术方案10)
一种信息记录介质,存储用于使计算机实现如下功能的对话程序:
指定功能,指定多个数据库中的1个数据库;
取得功能,取得用户输入的文本信息;
提取功能,从所述文本信息中提取检索所需的检索关键字;
检索功能,使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;
生成功能,根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数,生成应答;以及
输出功能,将所生成的所述应答输出至所述用户。

Claims (10)

1.一种对话装置,具备:
指定部,指定多个数据库中的1个数据库;
取得部,取得用户输入的文本信息;
提取部,从所述文本信息中提取检索所需的检索关键字;
检索部,使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;
生成部,根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数,生成应答;以及
输出部,将所生成的所述应答输出至所述用户。
2.根据权利要求1所述的对话装置,
在所述第一检索件数为0件、并且所述第二检索件数为0件的情况下,所述生成部生成询问与所述检索关键字不同的关键字的应答。
3.根据权利要求1或权利要求2所述的对话装置,
在所述第一检索件数为0件、并且所述第二检索件数为1件以上的情况下,所述生成部生成询问与被指定的所述数据库不同的数据库的应答。
4.根据权利要求1或权利要求2所述的对话装置,
在所述第一检索件数为0件、并且所述第二检索件数为1件以上的情况下,所述生成部生成回答所述第二检索件数的应答。
5.根据权利要求1至权利要求4中任一项所述的对话装置,
在所述第一检索件数为1件以上、并且为阈值以下的情况下,所述生成部生成回答所述第一检索件数的应答。
6.根据权利要求1至权利要求5中任一项所述的对话装置,
在所述第一检索件数为1件以上、并且大于阈值的情况下,所述生成部生成询问所述第一检索件数的筛选所需的筛选关键字的应答。
7.根据权利要求6所述的对话装置,
所述多个数据库分别包含定义了与所述检索关键字关联的多个数据项目的数据表,
所述对话装置还具备:
计算部,针对所述多个数据库所包含的各个数据表,计算所述多个数据项目各自的平均信息量,并且使用对所述多个数据库分别设定的加权,对于所述多个数据项目各自的平均信息量来计算加权平均;以及
决定部,将所述多个数据项目中的所述平均信息量的加权平均最大的数据项目决定为所述筛选关键字。
8.根据权利要求1至权利要求7中任一项所述的对话装置,
还具备识别部,该识别部对声音信息进行声音识别并变换为文本信息,
所述取得部取得变换后的所述文本信息,
所述提取部从变换后的所述文本信息中提取多个检索关键字,
所述检索部使用所述多个检索关键字,检索被指定的所述数据库和所述其他数据库,
所述生成部在被指定的所述数据库中的所述多个检索关键字的检索件数为0件、并且所述其他数据库中的所述多个检索关键字的检索件数为1件以上的情况下,将所述多个检索关键字中的、在所述其他数据库中的检索件数的总和最大的检索关键字作为正确关键字,生成应答,该应答回答所述其他数据库中的所述正确关键字的检索件数。
9.一种对话方法,
指定多个数据库中的1个数据库;
取得用户输入的文本信息;
从所述文本信息中提取检索所需的检索关键字;
使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;
根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数来生成应答;
将所生成的所述应答输出至所述用户。
10.一种信息记录介质,存储用于使计算机实现如下功能的对话程序:
指定功能,指定多个数据库中的1个数据库;
取得功能,取得用户输入的文本信息;
提取功能,从所述文本信息中提取检索所需的检索关键字;
检索功能,使用所述检索关键字,检索被指定的所述数据库和所述多个数据库中的除了被指定的所述数据库以外的其他数据库;
生成功能,根据在被指定的所述数据库中与所述检索关键字一致的数据件数即第一检索件数、和在所述其他数据库中与所述检索关键字一致的数据件数即第二检索件数,生成应答;以及
输出功能,将所生成的所述应答输出至所述用户。
CN202110219523.5A 2020-09-10 2021-02-26 对话装置、方法以及信息记录介质 Active CN114168717B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-152168 2020-09-10
JP2020152168A JP7434117B2 (ja) 2020-09-10 2020-09-10 対話装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
CN114168717A true CN114168717A (zh) 2022-03-11
CN114168717B CN114168717B (zh) 2025-07-08

Family

ID=80470712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110219523.5A Active CN114168717B (zh) 2020-09-10 2021-02-26 对话装置、方法以及信息记录介质

Country Status (3)

Country Link
US (1) US11636271B2 (zh)
JP (1) JP7434117B2 (zh)
CN (1) CN114168717B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12393617B1 (en) * 2022-09-30 2025-08-19 Amazon Technologies, Inc. Document recommendation based on conversational log for real time assistance
CN118629564B (zh) * 2024-05-22 2025-02-28 中国人民解放军总医院 基于数据处理的自动出院监测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180101616A1 (en) * 2016-10-09 2018-04-12 Alibaba Group Holding Limited Search System, Page Display Method and Client Terminal
CN109918405A (zh) * 2019-01-25 2019-06-21 平安科技(深圳)有限公司 一种基于多租户多数据源的检索方法和装置
CN110580160A (zh) * 2018-06-11 2019-12-17 株式会社东芝 组件管理装置、组件管理方法及记录介质
CN111259168A (zh) * 2019-01-31 2020-06-09 中粮营养健康研究院有限公司 文献处理方法、装置、存储介质及设备
CN111460114A (zh) * 2020-03-10 2020-07-28 平安科技(深圳)有限公司 检索方法、装置、设备及计算机可读存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54163104A (en) 1978-06-13 1979-12-25 Toppan Printing Co Ltd Inking device
US6976019B2 (en) * 2001-04-20 2005-12-13 Arash M Davallou Phonetic self-improving search engine
US7716235B2 (en) * 2001-04-20 2010-05-11 Yahoo! Inc. Phonetic self-improving search engine
US20070136251A1 (en) * 2003-08-21 2007-06-14 Idilia Inc. System and Method for Processing a Query
JP5295605B2 (ja) * 2008-03-27 2013-09-18 株式会社東芝 検索キーワード改良装置、サーバ装置、および方法
AR074963A1 (es) 2008-12-31 2011-02-23 Thomson Reuters Glo Resources Sistema y metodo para recuperar informacion relevante.
JP5813912B2 (ja) * 2009-01-28 2015-11-17 任天堂株式会社 プログラム、情報処理装置、および情報処理システム
US8452765B2 (en) * 2010-04-23 2013-05-28 Eye Level Holdings, Llc System and method of controlling interactive communication services by responding to user query with relevant information from content specific database
US10395276B1 (en) * 2012-09-07 2019-08-27 Groupon, Inc. Pull-type searching system
US9658983B1 (en) 2012-12-14 2017-05-23 Amazon Technologies, Inc. Lifecycle support for storage objects having multiple durability levels specifying different numbers of versions
US9922054B2 (en) * 2014-11-19 2018-03-20 Informex, Inc. Data retrieval apparatus, program and recording medium
JP6159908B6 (ja) 2016-03-31 2018-06-27 スマートインサイト株式会社 異種データソース混在環境におけるフィールド間の関係性の自動的発見のための方法、プログラム、および、システム
JP6939099B2 (ja) 2017-06-05 2021-09-22 株式会社ぐるなび 情報処理装置、情報処理方法及びプログラム
SG10201706106QA (en) * 2017-07-26 2019-02-27 Huawei Int Pte Ltd Searchable Encryption with Hybrid Index
JP7172187B2 (ja) 2018-06-29 2022-11-16 富士通株式会社 情報表示方法、情報表示プログラムおよび情報表示装置
US20210165786A1 (en) * 2019-10-02 2021-06-03 Infosum Limited Accessing datasets
CN111046141B (zh) 2019-12-03 2023-07-18 新华智云科技有限公司 一种基于历史时间特征的文本库关键词精炼方法
US20210216540A1 (en) * 2020-01-10 2021-07-15 Adobe Inc. Accessible and efficient search process using clustering
US11586690B2 (en) * 2020-02-05 2023-02-21 Apple Inc. Client-side personalization of search results
US11386263B2 (en) * 2020-06-12 2022-07-12 Servicenow, Inc. Automatic generation of form application

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180101616A1 (en) * 2016-10-09 2018-04-12 Alibaba Group Holding Limited Search System, Page Display Method and Client Terminal
CN110580160A (zh) * 2018-06-11 2019-12-17 株式会社东芝 组件管理装置、组件管理方法及记录介质
CN109918405A (zh) * 2019-01-25 2019-06-21 平安科技(深圳)有限公司 一种基于多租户多数据源的检索方法和装置
CN111259168A (zh) * 2019-01-31 2020-06-09 中粮营养健康研究院有限公司 文献处理方法、装置、存储介质及设备
CN111460114A (zh) * 2020-03-10 2020-07-28 平安科技(深圳)有限公司 检索方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN114168717B (zh) 2025-07-08
JP2022046231A (ja) 2022-03-23
JP7434117B2 (ja) 2024-02-20
US20220075959A1 (en) 2022-03-10
US11636271B2 (en) 2023-04-25

Similar Documents

Publication Publication Date Title
US20240069860A1 (en) Search and knowledge base question answering for a voice user interface
US10963499B2 (en) Generating command-specific language model discourses for digital assistant interpretation
US10431214B2 (en) System and method of determining a domain and/or an action related to a natural language input
US11016968B1 (en) Mutation architecture for contextual data aggregator
US10176804B2 (en) Analyzing textual data
KR102334064B1 (ko) 음성 입력에 기초한 테이블형 데이터에 관한 연산의 수행 기법
US8620658B2 (en) Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
EP3736807B1 (en) Apparatus for media entity pronunciation using deep learning
JP5241840B2 (ja) データベース内の文書をインデックス付け及び検索するための、コンピュータで実施される方法、及び情報検索システム
US20030149564A1 (en) User interface for data access and entry
US20190205391A1 (en) Automated Document Cluster Merging for Topic-Based Digital Assistant Interpretation
US20190205325A1 (en) Automated Discourse Phrase Discovery for Generating an Improved Language Model of a Digital Assistant
CN101309327A (zh) 语音聊天系统、信息处理装置、话语识别和关键字检测
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
CN104850543A (zh) 语音对话支持装置和语音对话支持方法
JP5221768B2 (ja) 翻訳装置、及びプログラム
JP2015125499A (ja) 音声通訳装置、音声通訳方法及び音声通訳プログラム
CN114168717B (zh) 对话装置、方法以及信息记录介质
JP7474296B2 (ja) 情報処理システム、情報処理方法、およびプログラム
WO2014033855A1 (ja) 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法
JP7809298B2 (ja) 情報処理システム、情報処理方法及びプログラム
JP2019159696A (ja) 検索装置および方法
US7359858B2 (en) User interface for data access and entry
JP4986301B2 (ja) 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant