[go: up one dir, main page]

CN111984129A - 一种输入方法、装置、设备和机器可读介质 - Google Patents

一种输入方法、装置、设备和机器可读介质 Download PDF

Info

Publication number
CN111984129A
CN111984129A CN201910426237.9A CN201910426237A CN111984129A CN 111984129 A CN111984129 A CN 111984129A CN 201910426237 A CN201910426237 A CN 201910426237A CN 111984129 A CN111984129 A CN 111984129A
Authority
CN
China
Prior art keywords
input
information
voice
user
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910426237.9A
Other languages
English (en)
Inventor
郭云云
耿梦娇
刘蓓
陈帅
崔娜娜
李臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Banma Zhixing Network Hongkong Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910426237.9A priority Critical patent/CN111984129A/zh
Publication of CN111984129A publication Critical patent/CN111984129A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种输入方法、装置、设备和机器可读介质,所述的方法包括:响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;接收用户的输入信息;若所述输入信息为语音信息,则保持所述输入法的语音输入状态;或者,若所述输入信息为文本输入信息,则进入所述输入法的文本输入状态;所述文本输入信息通过所述文本输入界面输入。本申请实施例可以适用于不方便手动操作的场景,可以提高用户的输入效率,可以提高语音输入方式的使用率,以及可以提高在语音输入状态和文本输入状态之间切换的效率。

Description

一种输入方法、装置、设备和机器可读介质
技术领域
本申请涉及输入法技术领域,特别是涉及一种输入方法、一种输入装置、一种设备和一种机器可读介质。
背景技术
输入法是指为了将字符输入计算机或其他设备(如手机、平板电脑等)而采用的编码方法。对于中文、英文、日文、韩文等语言的用户而言,一般都需要通过输入法与计算机或其他设备进行交互。
目前的输入过程通常为:响应于用户对于输入控件的点击操作,显示输入法的键盘界面,该键盘界面中可以包括多个按键,以供用户采用键盘输入方式输入所需的字符。
在实际应用中,键盘输入方式通常需要花费较长时间的手动操作,因此不适用于不方便手动操作的场景,如车载场景、家居远距场景等。以车载场景为例,一方面,使用键盘方式通常需要长时间的操作,车机或后视镜等车载设备的位置并不适合用户进行长时间的操作,不符合人体工学,容易造成身体劳累;另一方面,在开车的过程中使用键盘方式,则容易影响到驾驶的安全性。
发明内容
本申请实施例所要解决的技术问题是提供一种输入方法,可以适用于不方便手动操作的场景,可以提高用户的输入效率,可以提高语音输入方式的使用率,以及可以提高在语音输入状态和文本输入状态之间切换的效率。
相应的,本申请实施例还提供了一种输入装置、一种设备、以及一种机器可读介质,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种输入方法,包括:
响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
接收用户的输入信息;
若所述输入信息为语音信息,则保持所述输入法的语音输入状态;或者,若所述输入信息为文本输入信息,则进入所述输入法的文本输入状态;所述文本输入信息通过所述文本输入界面输入。
另一方面,本申请实施例还公开了一种输入装置,包括:
调用响应模块,用于响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
输入接收模块,用于接收用户的输入信息;以及
输入响应模块,用于在所述输入信息为语音信息的情况下,保持所述输入法的语音输入状态;或者,在所述输入信息为文本输入信息的情况下,进入所述输入法的文本输入状态;所述文本输入信息通过所述文本输入界面输入。
再一方面,本申请实施例还公开了一种设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述设备执行前述一个或多个所述的方法。
又一方面,本申请实施例公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行前述一个或多个所述的方法。
与现有技术相比,本申请实施例包括以下优点:
本申请实施例在输入法被调用后,即进入输入法的语音输入状态,以使用户快速通过语音输入方式进行字符的输入;由于语音输入方式可以适用于不方便手动操作的场景,如车载场景、家居远距场景等,因此本申请实施例可以适用于不方便手动操作的场景。
并且,本申请实施例在输入法被调用后,即进入输入法的语音输入状态,可以使用户快速通过语音输入方式进行输入,因此可以提高用户的输入效率,且可以提高语音输入方式的使用率。
另外,本申请实施例优先进入语音输入状态,并可以向用户提供语音输入方式和文本输入方式,供用户选择和使用。通过本申请实施例,用户可以在语音输入状态和文本输入状态之间快速切换,可以快速使用语音输入方式和文本输入方式,因此可以发挥语音输入方式和文本输入方式的优点,进而可以提高在语音输入状态和文本输入状态之间切换的效率,以及可以提高用户的输入效率。
附图说明
图1是本申请的一种输入方法的应用环境的示意;
图2是本申请的一种输入方法实施例二的步骤流程图;
图3是本申请的一种输入方法实施例三的步骤流程图;
图4是本申请的一种输入方法实施例四的步骤流程图;
图5是本申请的一种输入方法实施例五的步骤流程图;
图6是本申请的一种输入方法实施例六的步骤流程图;
图7是本申请的一种输入装置实施例的结构框图;以及
图8是本申请一实施例提供的设备的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
本申请的构思易于进行各种修改和替代形式,其具体实施例已经通过附图的方式示出,并将在这里详细描述。然而,应该理解,上述内容并不是用来将本申请的构思限制为所公开的具体形式,相反地,本申请的说明书和附加权利要求书意欲覆盖所有的修改、等同和替代的形式。
本说明书中的“一个实施例”,“实施例”,“一个具体实施例”等,表示所描述的实施例可以包括特定特征、结构或特性,但是每个实施例可以包括或可以不必然包括该特定特征、结构或特性。此外,这样的短语不一定指的是同一实施例。另外,在联系一个实施例描述特定特征、结构或特性的情况下,无论是否明确描述,可以认为本领域技术人员所知的范围内,这样的特征、结构或特性也与其他实施例有关。另外,应该理解的是,“在A,B和C的至少一个”这种形式所包括的列表中的条目中,可以包括如下可能的项目:(A);(B);(C);(A和B);(A和C);(B和C);或(A,B和C)。同样,“A,B或C中的至少一个”这种形式列出的项目可能意味着(A);(B);(C);(A和B);(A和C);(B和C);或(A,B和C)。
在一些情况下,所公开的实施例可以被实施为硬件、固件、软件或其任意组合。所公开的实施例也可以实现为携带或存储在一个或多个暂时的或者非暂时的机器可读(例如计算机可读)存储介质中的指令,该指令可以被一个或多个处理器执行。机器可读存储介质可以实施为用于以能够被机器读取的形式存储或者传输信息的存储装置、机构或其他物理结构(例如易失性或非易失性存储器、介质盘、或其他媒体其它物理结构装置)。
在附图中,一些结构或方法特征可以以特定的安排和/或排序显示。然而,优选地,这样的具体安排和/或排序并不是必要的。相反,在一些实施方案中,这样的特征可以以不同的方式和/或顺序排列,而不是如附图中所示。此外,特定的附图中的结构或方法特征中所包含的内容,不意味着暗示这种特征是在所有实施例是必须的,并且在一些实施方案中,可能不包括这些特征,或者可能将这些特征与其它特征相结合。
针对键盘输入方式不适用于不方便手动操作的场景的技术问题,本申请实施例提供了一种输入方案,该方案可以包括:响应于用户对输入法的调用操作,进入所述输入法的语音输入状态。
本申请实施例中,输入法是一种寄宿程序,寄宿在宿主程序提供的环境中。宿主程序可用于在计算机环境下,提供寄宿程序赖以生存的软件环境也即宿主环境(hostenvironment),同时,宿主程序还可以动态加载寄宿程序提供的DLL(动态链接库,DynamicLink Library),以动态加载外部功能。
本申请实施例的调用操作可用于调用输入法,以使输入法在宿主环境中向用户提供服务。语音输入状态可以指支持语音输入方式的输入状态,语音输入状态可以采集用户输入的语音信息,确定并展示该语音信息对应的字符候选项,供用户选择。
可选地,可以采用语音识别技术,确定该语音信息对应的字符候选项。如果将该语音信息记作S,对S进行一系列处理后得到与之相对应的语音特征序列O,记作O={O1,O2,…,Oi,…,OT},其中Oi是第i(i为自然数)个语音特征,T为语音特征总个数。语音信息S对应的句子可看作是由许多词组成的一个词串,记作W={w1,w2,…,wn}。语音识别的过程就是根据已知的语音特征序列O,求出最可能的词串W’,n为自然数。
具体来说,语音识别是一个模型匹配的过程,在这个过程中,可以首先根据人的语音特点建立语音模型,通过对输入的语音信息的分析,抽取所需的特征,来建立语音识别所需的模板;对用户的语音信息进行识别的过程即是将语音信息的特征与所述模板比较的过程,最后确定与的特征与匹配的最佳模板,从而获得语音识别结果。具体的语音识别算法,可采用基于统计的隐含马尔可夫模型的训练和识别算法,也可采用基于神经网络的训练和识别算法、基于动态时间归整匹配的识别算法等等其他算法,本申请实施例对于具体的语音识别过程不加以限制。
本申请实施例在输入法被调用后,即进入输入法的语音输入状态,以使用户快速通过语音输入方式进行字符的输入;由于语音输入方式可以适用于不方便手动操作的场景,如车载场景、家居远距场景等,因此本申请实施例可以适用于不方便手动操作的场景。
并且,本申请实施例在输入法被调用后,即进入输入法的语音输入状态,可以使用户快速通过语音输入方式进行输入,因此可以提高用户的输入效率,且可以提高语音输入方式的使用率。
本申请实施例提供的数据处理方案可应用于图1所示的应用环境中,如图1所示,客户端100与服务端200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务端200进行数据交互。
可选地,客户端可以运行在设备上,例如,该客户端可以为设备上运行的APP(应用程序,Application),如输入法APP等,本申请实施例对于客户端所对应的具体APP不加以限制。
可选地,上述设备可以内置或者外接屏幕,上述屏幕用于显示信息。例如,显示的信息可以包括:输入控件、或者字符候选项等。
上述设备可以内置或者外置语音采集装置,该语音采集装置用于采集用户输入的语音信息。语音采集装置可以包括:麦克风等。
上述设备可以内置或者外置电声换能装置,该电声换能装置用于将电信号转变为声信号。该电声换能装置可以包括:扬声器等。
上述设备具体可以包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio LayerIV)播放器、膝上型便携计算机、车载设备、PC(个人计算机,Personal Computer)、机顶盒、智能电视机、可穿戴设备、车载设备、智能家居设备等。智能家居设备可以包括:智能音响、智能门锁、智能门禁等,车载设备可以包括:车机、后视镜等,可以理解,本申请实施例对于具体的设备不加以限制。
方法实施例一
本申请的一种输入方法实施例一,具体可以包括如下步骤:
响应于用户对输入法的调用操作,进入所述输入法的语音输入状态。
本申请实施例的方法所包括的至少一个步骤可由客户端执行,当然,本申请实施例对于方法的步骤的具体执行主体不加以限制。
本申请实施例的调用操作可用于调用输入法,以使输入法在宿主环境中向用户提供服务。
本申请实施例中,可选的是,该调用操作具体可以包括:用户针对输入(input)控件的触发操作。输入控件可由宿主程序提供,用于接收用户输入的信息。输入控件的例子可以包括:输入框等,输入框可以包括:搜索框等。
用户针对输入控件的触发操作,可以表征用户向输入控件中输入信息的需求,因此可以起到调用输入法的作用。可选地,该触发操作可以为,针对输入控件的点击操作等。
本申请实施例中,控件是指对数据和方法的封装。控件可以有自己的属性和方法,其中属性是控件数据的简单访问者,方法则是控件的一些简单而可见的功能、控件创建过程包括设计、开发、调试工作,然后是控件的使用。
可以理解,用户针对输入控件的触发操作,只是作为调用操作的可选实施例,实际上,本领域技术人员可以根据实际应用需求,确定上述调用操作,例如,上述调用操作还可以为:语音指令、或者物理按键的操作、或者虚拟按键的操作等,本申请实施例对于具体的调用操作。
本申请实施例在接收到用户对输入法的调用操作后,即进入所述输入法的语音输入状态,可以使用户快速通过语音输入方式进行字符的输入。
文本输入可以指通过键盘、触摸屏等方式进行输入。需要说明的是,文本输入方式在例如手机、平板电脑的智能设备中得到了广泛应用,这使得用户偏向于通过文本输入方式进行输入。
目前,一些输入法在键盘界面中设置语音入口,以使用户通过触发该语音入口触发语音输入状态。然而,文本输入方式为主要的输入方式,使得语音输入方式为次要的输入方式,进而使用户忽略键盘界面中的语音入口,这使得语音输入方式的使用率较低。并且,用户通过触发该语音入口触发语音输入状态,将增加触发语音输入状态的操作成本,且影响用户的输入效率。
而本申请实施例在输入法被调用后,即进入输入法的语音输入状态,以使用户快速通过语音输入方式进行字符的输入,可以适用于不方便手动操作的场景,如车载场景、家居远距场景等;且可以提高用户的输入效率,以及可以提高语音输入方式的使用率。
本申请实施例中,可选的是,所述进入所述输入法的语音输入状态,具体可以包括:
显示输入法处于语音输入状态的提示信息;或者
显示语音输入界面。
其中,提示信息可用于提示输入法处于语音输入状态,可以提示用户进行语音输入。语音输入界面可用于表征语音输入对应的界面,其可以包括:语音采集图标、或者语音采集文本等,可以理解,本申请实施例对于具体的语音输入界面不加以限制。
在本申请的一种可选实施例中,上述方法还可以包括:
响应于用户对输入法的调用操作,显示文本输入入口、或者文本输入界面;
所述语音入口用于触发语音输入状态;所述文本输入入口用于触发所述文本输入界面的显示。
可选地,上述语音入口可以通过控件实现。可选地,上述语音入口可以对应有语音图标,该语音图标可用于标识语音输入。可选地,可以响应于用户对于上述语音入口的触发操作,进入语音输入状态。
可选地,上述文本输入入口可以通过控件实现。可选地,上述文本输入入口可以对应有手写图标,该手写图标可用于标识文本输入。
本申请实施例中,语音入口和文本输入入口(或文本输入界面),可以使用户在语音输入状态和文本输入状态之间进行切换。
本申请实施例的文本输入状态可以指支持文本输入方式的输入状态。文本输入状态可以包括:键盘输入状态、手写输入状态等。本申请实施例主要以键盘输入状态为例对输入方法进行说明,其他文本输入状态对应的输入方法相互参照即可。键盘输入状态对应的文本输入界面可以包括:键盘界面,键盘界面中可以包括:多个按键,按键可以包括:字母按键、数字按键、符号按键、功能按键等。符号按键可以包括:标点符号按键等。功能按键可以包括:删除按键、搜索按键等。
例如,在响应于用户对输入法的调用操作,进入所述输入法的语音输入状态之后,若接收到用户对于文本输入入口(或文本输入界面)的触发操作,则可以进入文本输入状态。
又如,在处于文本输入状态的情况下,若接收到用户对于语音入口的触发操作,则可以进入语音输入状态。
本申请实施例中,可选的是,在输入控件的周围区域展示语音入口、和/或、文本输入入口。例如,语音入口位于输入控件的左侧,或者,文本输入入口位于输入控件的右侧,等等。
在本申请的一种应用示例中,假设输入控件为搜索框,搜索框的左侧显示有搜索图标,则可以响应于用户对该搜索框的触发操作,进入所述输入法的语音输入状态,并在该搜索图标上叠加显示语音入口。可选地,还可以在该搜索框的右侧显示手写输入入口。
方法实施例二
参照图2,示出了本申请的一种输入方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201、响应于用户对输入法的调用操作,进入所述输入法的语音输入状态;
步骤202、响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息;所述第一提示信息用于对输入内容进行提示。
本申请实施例在接收到用户对输入法的调用操作后,还可以输出输入环境信息对应的第一提示信息,该第一提示信息用于对输入内容进行提示,可以起到引导用户输入的作用。
本申请实施例中,可选的是,上述202输出输入环境信息对应的第一提示信息,具体可以包括:
播放输入环境信息对应的第一提示信息;和/或
在输入控件中展示输入环境信息对应的第一提示信息。
本申请实施例可以在输入控件中展示输入环境信息对应的第一提示信息,以使用户查看第一提示信息。或者,本申请实施例可以通过语音方式,播放第一提示信息,可以在一定程度上克服用户在车载场景等场景下不方便查看屏幕的问题。
可选地,该第一提示信息可以包括:输入内容的信息。输入内容的信息可以包括:输入内容的类别等。输入内容的类别可以包括:地址、道路、音乐、或者电台等。
本申请实施例向用户提供输入环境信息对应的第一提示信息,该第一提示信息可以约束和引导用户的输入,提高用户的输入内容与输入环境信息之间的匹配度,进而可以提高输入内容的准确度。
可选地,上述输入环境信息具体指用户所处的环境信息。在实际应用中,所述输入环境信息具体可以包括:时间环境、地理环境、物理环境或应用环境信息等环境信息中的一种或多种。物理环境可以包括:天气环境、湿度环境等。
可选地,上述输入环境信息具体可以包括如下信息中的至少一种:
应用程序环境信息;和/或
界面环境信息。
应用程序环境信息可以指用户所处的应用程序信息,应用程序环境信息可以包括:应用程序的类别、应用程序的名称等。例如,在应用程序的类别为音乐的情况下,第一提示信息可以包括:“请输入歌曲的名称”。又如,,在应用程序的类别为电台的情况下,第一提示信息可以包括:“请输入电台的名称”、或者“请输入电台主持人的名称”等。
界面环境信息可以与用户所处的界面内容相关。例如,界面内容包括:导航得到的多条道路,则界面环境信息可以与“道路”相关,对应的提示信息可以包括:“请选择一条道路”。又如,界面内容包括:我的位置附近的地图数据,则界面环境信息可以与“地址”相关,对应的提示信息可以包括:“请输入地址”。
在本申请的一种可选实施例中,上述方法还可以包括:依据输入环境信息与提示信息之间的映射关系,确定输入环境信息对应的第一提示信息。本申请实施例可以保存输入环境信息与提示信息之间的映射关系,以根据该映射关系确定用户的输入环境信息对应的提示信息,进而可以根据不同的输入环境信息提供不同的第一提示信息。
输入环境信息与提示信息之间的映射关系的确定依据可以包括:用户在输入环境信息下的历史输入内容。可选地,可以对用户在输入环境信息下的历史输入内容进行分析,以得到符合输入环境信息的输入规律的目标历史输入内容,并依据目标历史输入内容得到输入环境信息对应的提示信息。对用户在输入环境信息下的历史输入内容进行分析的过程可以包括:确定用户在输入环境信息下的历史输入内容的出现频率,依据该出现频率确定目标历史输入内容。例如,可以将出现频率最高的M个历史输入内容,作为目标历史输入内容,其中,M可以为自然数。又如,可以将出现频率高于阈值的历史输入内容,作为目标历史输入内容。
当然,依据用户在输入环境信息下的历史输入内容确定映射关系,只是作为可选实施例,实际上,上述映射关系可由本领域技术人员或者用户确定。例如,可以向用户提供采集接口,以通过该采集接口采集输入环境信息及对应的提示信息等。
综上,本申请实施例的输入方法,在接收到用户对输入法的调用操作后,进入所述输入法的语音输入状态,并输出输入环境信息对应的第一提示信息,该第一提示信息可以快速引导用户的输入,以使用户快速通过语音输入所需的信息,因此可以提高用户的输入效率。
方法实施例三
参照图3,示出了本申请的一种输入方法实施例三的步骤流程图,具体可以包括如下步骤:
步骤301、响应于用户对输入法的调用操作,进入所述输入法的语音输入状态;
步骤302、接收用户输入的语音信息;
步骤303、输出针对所述语音信息的响应信息。
本申请实施例中,进入所述输入法的语音输入状态,具体可以包括:启动语音输入状态对应的软件和硬件。例如,语音输入状态对应的硬件可以包括:语音采集装置等。又如,语音输入状态对应的软件可以包括:语音处理模块等,该语音处理模块可用于执行步骤302-步骤303,以实现语音处理功能。
步骤302中,可以通过语音采集装置采集用户输入的语音信息。
步骤303中,可以采用语音识别技术,确定该语音信息对应的语音识别结果,并依据该语音识别结果,确定针对该语音信息的响应信息。
本申请实施例可以提供输出针对所述语音信息的响应信息的如下输出方式:
输出方式1、若所述语音信息符合输入条件,则输出所述语音信息对应的数据;或者
输出方式2、若所述语音信息不符合输入条件,则输出输入环境信息和所述语音信息对应的第二提示信息;所述第二提示信息用于对输入内容进行提示。
输入条件可用于表征输入要求或者输入规则。语音信息符合输入条件,可以说明语音信息是符合输入要求的,因此可以输出语音信息对应的字符候选项。
根据一种实施例,所述语音信息对应的数据具体可以包括:字符候选项,所述字符候选项可以为依据输入环境信息对应的词库得到。
本申请实施例可以展示语音信息对应的至少一个字符候选项,供用户选择。可选地,可以在输入控件的周围区域展示语音信息对应的至少一个字符候选项。可选地,可以响应于用户对于字符候选项的选择操作,将该选择操作对应的目标字符候选项输出至输入控件中。
在本申请的一种可选实施例中,上述输入条件可以包括:输入内容的信息。语音信息符合输入条件可以包括:语音信息对应的语音识别结果的信息与输入内容的信息相匹配等。输入内容的信息可以包括:输入内容的类别等,输入内容的类别可以包括:地址、道路、音乐、电台、电台主持人等。可以理解,本领域技术人员可以根据实际应用需求,确定输入条件,本申请实施例对于具体的输入条件不加以限制。
例如,语音信息A对应的语音识别结果为“地址A”,输入条件与“地址”相关,则语音信息A对应的字符候选项可以包括:“地址A”对应的POI(兴趣点,Point of interest)的名称,供用户选择。在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。
本申请实施例中,可选的是,所述字符候选项可以为依据输入环境信息对应的词库得到。
本申请实施例可以针对输入环境信息,建立并保存对应的词库。则可以从输入环境信息对应的词库中获取语音信息对应的字符候选项。
可选地,输入环境信息可以对应有环境关键词,不同的环境关键词可以对应有不同的词库。环境关键词可以包括:地址、道路、音乐、电台、电台主持人等。
根据另一种实施例,所述语音信息对应的数据具体可以包括:搜索结果,所述搜索结果可以为依据输入环境信息对应的数据库得到。
本申请实施例可以针对输入环境信息,建立并保存对应的数据库。则可以从输入环境信息对应的数据库中获取语音信息对应的搜索结果。例如,“地址”对应的数据库可以包括:POI数据库等。
本申请实施例可以在用户未触发搜索的情况下,向用户提供语音信息对应的搜索结果。通常用户需要通过触发输入控件对应的搜索控件,触发输入控件中输入内容的搜索。而本申请实施例可以在用户未触发搜索的情况下,提前向用户提供语音信息对应的搜索结果,因此可以节省用户的搜索成本。
在本申请的一种应用示例中,假设语音信息B对应的语音识别结果为“文本B”,则若语音信息B对应的输入环境信息包括“地址”,则语音信息B对应的字符候选项可以包括:“文本B”对应的POI;或者,则若语音信息B对应的输入环境信息包括“音乐”,则语音信息B对应的字符候选项可以包括:“文本B”对应的歌曲或者歌手。语音信息B对应的字符候选项可以为依据输入环境信息对应的词库得到。
输出方式2中,若所述语音信息不符合输入条件,则可以说明语音信息不符合输入要求,因此可以输出输入环境信息和所述语音信息对应的第二提示信息;所述第二提示信息用于对输入内容进行提示,以使用户再次输入符合输入条件的语音信息。
可选地,在接收用户输入的语音信息之前,上述方法还可以包括:响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息,该第一提示信息用于对输入内容进行提示。此种情况下,若语音信息不符合输入条件,则可以再次输出输入环境信息和语音信息对应的第二提示信息。本申请实施例可以向用户提供多次的提示信息,以提高用户的输入内容的准确度。
在本申请的一种应用示例中,第一提示信息可以为“请输入地址”,假设用户的语音信息对应的语音识别结果不属于“地址”类别,则可以输出第二提示信息“请输入地址”、或者“您输入的信息有误,请输入地址”、或者“您输入的信息不符合要求,请输入地址”等。第二提示信息可以指出已输入的语音信息存在的问题,并引导用户输入正确的内容,由此可以提高用户的输入内容的准确度。
需要说明的是,输出方式1和输出方式2只是作为输出针对所述语音信息的响应信息的输出方式的可选实施例,实际上,本领域技术人员可以根据实际应用需求,采用其他输出方式,例如,在一种其他输出方式中,可以直接输出所述语音信息对应的数据,也即无论语音信息是否符合输入条件,均可以输出所述语音信息对应的数据;此种情况下,字符候选项可以为依据语音识别结果得到。例如,可以直接将语音识别结果作为字符候选项,又如,可以利用语言模型,对语音识别结果进行纠正,将纠正后的语音识别结果作为字符候选项。
本申请实施例中,针对所述语音信息的响应信息可由服务器或者客户端确定,本申请实施例对于响应信息的具体确定方式不加以确定。
综上,本申请实施例的输入方法,在响应于调用操作、进入输入法的语音输入状态后,可以通过语音采集装置采集用户输入的语音信息,并确定针对该语音信息的响应信息。本申请实施例可以使用户通过调用操作,快速进行语音输入,因此可以提高用户的输入效率。
方法实施例四
参照图4,示出了本申请的一种输入方法实施例四的步骤流程图,具体可以包括如下步骤:
步骤401、响应于用户对输入法的调用操作,进入所述输入法的语音输入状态;
步骤402、响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息;所述第一提示信息用于对输入内容进行提示;
步骤403、接收用户输入的语音信息;
步骤404、判断该语音信息是否符合输入条件,若是则执行步骤405,否则执行步骤406;
步骤405、输出所述语音信息对应的数据;或者
步骤406、输出输入环境信息和所述语音信息对应的第二提示信息;所述第二提示信息用于对输入内容进行提示,并返回步骤403。
本申请实施例在用户输入的语音信息符合输入条件的情况下,可以输出所述语音信息对应的数据;在用户输入的语音信息不符合输入条件的情况下,可以向用户输出第二提示信息,以引导和帮助用用户输入符合输入条件的语音信息。
由于在语音信息不符合输入条件的情况下,本申请实施例可以继续向用户提供第二提示信息,因此本申请实施例可以提高语音输入的智能性。
方法实施例五
参照图5,示出了本申请的一种输入方法实施例五的步骤流程图,具体可以包括如下步骤:
步骤501、响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
步骤502、接收用户的输入信息;
步骤503、若所述输入信息为语音信息,则保持所述输入法的语音输入状态;或者
步骤504、若所述输入信息为文本输入信息,则进入所述输入法的文本输入状态;所述文本输入信息可以通过所述文本输入界面输入。
本申请实施例在接收到用户对输入法的调用操作后,可以进入所述输入法的语音输入状态,并显示语音入口、以及文本输入界面。所述语音入口用于触发语音输入状态,所述文本输入界面用于触发文本输入状态。显示的语音入口、以及文本输入界面可供用户在语音输入状态和文本输入状态之间快速切换。
本申请实施例在进入输入法的语音输入状态、显示语音入口、以及文本输入界面的情况下,支持的输入方式可以包括:语音输入方式和文本输入方式。其中,语音输入方式的实现过程可以包括:输入语音信息;文本输入方式的实现过程可以包括:通过触发文本输入界面中的界面元素,输入文本输入信息。因此,本申请实施例优先进入语音输入状态,并可以向用户提供语音输入方式和文本输入方式,供用户选择和使用。通过本申请实施例,用户可以在语音输入状态和文本输入状态之间快速切换,可以快速使用语音输入方式和文本输入方式,因此可以发挥语音输入方式和文本输入方式的优点,进而可以提高用户的输入效率。
本申请实施例在执行步骤501至步骤502后,可以根据步骤502中输入信息的类型,确定执行步骤503或者步骤504。
若所述输入信息的类型为语音信息,则可以执行步骤503,也即可以保持所述输入法的语音输入状态。可选地,在步骤503之后,上述方法还可以包括:输出针对所述语音信息的响应信息。
所述输出针对所述语音信息的响应信息,具体可以包括:
若所述语音信息符合输入条件,则输出所述语音信息对应的数据;或者
若所述语音信息不符合输入条件,则输出输入环境信息和所述语音信息对应的第二提示信息;所述第二提示信息用于对输入内容进行提示。
可选地,所述语音信息对应的数据具体可以包括:字符候选项,所述字符候选项为依据输入环境信息对应的词库得到。
可选地,所述语音信息对应的数据具体可以包括:搜索结果,所述搜索结果可以为依据输入环境信息对应的数据库得到。
若所述输入信息的类型为手动操作信息,则可以执行步骤504,也即可以进入所述输入法的文本输入状态。可选地,在步骤504之后,上述方法还可以包括:对手动操作信息进行处理,并输出该手动操作信息对应的字符候选项。
文本输入界面可以包括:键盘界面或者手写界面等。
以键盘界面为例,文本输入信息与文本输入界面相应,具体可以包括:文本输入信息与文本输入界面中的按键相应,可选地,文本输入信息为按键字符串等。以键盘界面为全键盘(QWERTY键盘)为例,按键字符串可以包括:“zifuchuan”等。
以手写界面为例,文本输入信息可以为用户输入的轨迹数据。此种情况下,可以对用户输入的轨迹数据进行处理,以得到该轨迹数据对应的字符候选项。
在本申请的一种可选实施例中,上述方法还可以包括:在进入文本输入状态后,若符合切换条件,则进入语音输入状态。
本申请实施例提供的切换条件可以包括:
切换条件1、在预设时长内未接收到所述文本输入信息;或者
切换条件2、接收到针对所述语音入口的触发操作;或者
切换条件3、接收到用户的语音唤醒指令。
切换条件1可以实现从文本输入状态到语音输入状态的自动切换,因此可以提高输入状态的切换效率。
预设时长可由本领域技术人员或者用户确定,或者,预设时长可以为依据用户的输入间隔信息确定。输入间隔信息可以表征用户的相邻两次输入过程之间的停顿时间。一次输入过程从初始的手动操作信息开始,终止于用户将字符候选项上屏,用户将字符候选项上屏可以指,用户选择展示的字符候选项,以将选择的字符候选项输出至屏幕,尤其地,将选择的字符候选项输出至屏幕的输入控件中。
可选地,预设时长可以大于或者等于输入间隔信息。在预设时长大于或者等于输入间隔信息的情况下,可以认为用户不具备文本输入的需求,因此可以自动进入语音输入状态。
切换条件2和切换条件3可以实现从文本输入状态到语音输入状态的手动切换。切换条件3的语音唤醒指令可以为语音形式的唤醒指令,如语音形式的“语音输入”、“切换到语音”等,可以适用于用户不便于手动操作的场景。
可选地,所述方法还可以包括:响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息;所述第一提示信息用于对输入内容进行提示。
可选地,所述输入环境信息具体可以包括如下信息中的至少一种:
应用程序环境信息;和/或
界面环境信息。
可选地,所述方法还可以包括:依据输入环境信息与提示信息之间的映射关系,确定输入环境信息对应的第一提示信息。
可选地,所述输出输入环境信息对应的第一提示信息,具体可以包括:
播放输入环境信息对应的第一提示信息;和/或
在输入控件中展示输入环境信息对应的第一提示信息。
可选地,所述调用操作具体可以包括:用户针对输入控件的触发操作。
综上,本申请实施例的输入方法,在接收到调用操作后,优先进入语音输入状态,并可以向用户提供语音输入方式和文本输入方式,供用户选择和使用。通过本申请实施例,用户可以在语音输入状态和文本输入状态之间快速切换,可以快速使用语音输入方式和文本输入方式,因此可以发挥语音输入方式和文本输入方式的优点,进而可以提高在语音输入状态和文本输入状态之间切换的效率,以及可以提高用户的输入效率。
方法实施例六
参照图6,示出了本申请的一种输入方法实施例六的步骤流程图,具体可以包括如下步骤:
步骤601、响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
步骤602、响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息;所述第一提示信息用于对输入内容进行提示;
步骤603、判断是否接收到用户的输入信息,若否,则执行步骤604,若是,则执行步骤605;
步骤604、输出输入环境信息对应的第一提示信息;
在执行步骤604后,可以返回执行步骤603。
步骤605、判断用户的输入信息是否为语音信息,若是,则执行步骤606,否则执行步骤607;
步骤606、保持所述输入法的语音输入状态,并返回执行步骤605;
步骤607、进入所述输入法的文本输入状态;
所述文本输入信息可以通过所述文本输入界面输入。
步骤608、在未接收到用户的搜索触发操作的情况下,判断文本输入操作的停顿时长是否超过预设时长,若是,则执行步骤609,否则执行步骤610;
步骤609、进入所述输入法的语音输入状态;
步骤610、保持所述输入法的文本输入状态。
步骤607中,输入信息不为语音信息,可以包括:输入信息为文本输入信息。文本输入信息可以与展示的文本输入界面相应,例如,文本输入信息可以为键盘界面中的按键点击信息。此种情况下,本申请实施例还可以在进入所述输入法的语音输入状态的情况下,展示文本输入界面,以使用户快速输入文本输入信息。
步骤608中,搜索触发操作可用于触发输入控件中输入内容的搜索。在未接收到用户的搜索触发操作的情况下,说明用户存在输入需求,因此可以进行输入状态的切换。
在执行步骤609后,可以执行步骤603。在执行步骤610后,可以执行步骤608。
综上,本申请实施例的输入方法,在接收到用户对输入法的调用操作之后、以及接收到用户的输入信息之前,优先进入语音输入状态,并可以输出输入环境信息对应的第一提示信息,以引导和帮助用户输入准确的输入内容。
并且,本申请实施例可以向用户提供语音输入方式和文本输入方式,供用户选择和使用。通过本申请实施例,用户可以在语音输入状态和文本输入状态之间快速切换,可以快速使用语音输入方式和文本输入方式,因此可以发挥语音输入方式和文本输入方式的优点,进而可以提高用户的输入效率。
另外,本申请实施例可以在文本输入操作的停顿时长超过预设时长的情况下,实现从文本输入状态到语音输入状态的自动切换,因此可以提高输入状态的切换效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
本申请实施例还提供了一种输入装置。
参照图7,示出了本申请的一种输入装置实施例的结构框图,具体可以包括如下模块:
调用响应模块701,用于响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
输入接收模块702,用于接收用户的输入信息;以及
输入响应模块703,用于在所述输入信息为语音信息的情况下,保持所述输入法的语音输入状态;或者,在所述输入信息为文本输入信息的情况下,进入所述输入法的文本输入状态;所述文本输入信息通过所述文本输入界面输入。
可选地,所述装置还可以包括:
第一提示信息输出模块,用于响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息;所述第一提示信息用于对输入内容进行提示。
可选地,所述输入环境信息可以包括如下信息中的至少一种:
应用程序环境信息;和/或
界面环境信息。
可选地,所述装置还可以包括:
第一提示信息确定模块,用于依据输入环境信息与提示信息之间的映射关系,确定输入环境信息对应的第一提示信息。
可选地,所述第一提示信息输出模块,可以包括:
第一提示信息播放模块,用于播放输入环境信息对应的第一提示信息;和/或
第一提示信息展示模块,用于在输入控件中展示输入环境信息对应的第一提示信息。
可选地,所述调用操作可以包括:
用户针对输入控件的触发操作。
可选地,所述装置还可以包括:
响应输出模块,用于在所述输入信息为语音信息的情况下,输出针对所述语音信息的响应信息。
可选地,所述响应输出模块可以包括:
数据输出模块,用于若所述语音信息符合输入条件,则输出所述语音信息对应的数据;或者
第二提示信息输出模块,用于若所述语音信息不符合输入条件,则输出输入环境信息和所述语音信息对应的第二提示信息;所述第二提示信息用于对输入内容进行提示。
可选地,所述语音信息对应的数据可以包括:字符候选项,所述字符候选项可以为依据输入环境信息对应的词库得到。
可选地,所述语音信息对应的数据可以包括:搜索结果,所述搜索结果可以为依据输入环境信息对应的数据库得到。
可选地,所述装置还可以包括:
切换模块,用于在进入文本输入状态后,若符合切换条件,则进入语音输入状态。
可选地,所述切换条件可以包括:
在预设时长内未接收到所述文本输入信息;或者
接收到针对所述语音入口的触发操作;或者
接收到用户的语音唤醒指令。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请实施例的实施例可被实现为使用任意适当的硬件和/或软件进行想要的配置的系统或装置。图8示意性地示出了可被用于实现本申请中所述的各个实施例的示例性设备1300。
对于一个实施例,图8示出了示例性设备1300,该设备1300可以包括:一个或多个处理器1302、与处理器1302中的至少一个耦合的系统控制模块(芯片组)1304、与系统控制模块1304耦合的系统存储器1306、与系统控制模块1304耦合的非易失性存储器(NVM)/存储装置1308、与系统控制模块1304耦合的一个或多个输入/输出设备1310,以及与系统控制模块1306耦合的网络接口1312。该系统存储器1306可以包括:指令1362,该指令1362可被一个或多个处理器1302执行。
处理器1302可包括一个或多个单核或多核处理器,处理器1302可包括通用处理器或专用处理器(例如图形处理器、应用程序处理器、基带处理器等)的任意组合。在一些实施例中,设备1300能够作为本申请实施例中所述的服务端、目标设备、无线设备等。
在一些实施例中,设备1300可包括具有指令的一个或多个机器可读介质(例如,系统存储器1306或NVM/存储装置1308)以及与该一个或多个机器可读介质相合并被配置为执行指令、以实现前述装置包括的模块、从而执行本申请实施例中所述的动作的一个或多个处理器1302。
一个实施例的系统控制模块1304可包括任何适合的接口控制器,用于提供任何适合的接口给处理器1302中的至少一个和/或与系统控制模块1304通信的任意适合的装置或部件。
一个实施例的系统控制模块1304可包括一个或多个存储器控制器,用于提供接口给系统存储器1306。存储器控制器可以是硬件模块、软件模块和/或固件模块。
一个实施例的系统存储器1306可被用于加载和存储数据和/或指令1362。对于一个实施例,系统存储器1306可包括任何适合的易失性存储器,例如,适合的DRAM(动态随机存取存储器)。在一些实施例中,系统存储器1306可包括:双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
一个实施例的系统控制模块1304可包括一个或多个输入/输出控制器,以向NVM/存储装置1308及(一个或多个)输入/输出设备1310提供接口。
一个实施例的NVM/存储装置1308可被用于存储数据和/或指令1382。NVM/存储装置1308可包括任何适合的非易失性存储器(例如闪存等)和/或可包括任何适合的(一个或多个)非易失性存储设备,例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器等。
NVM/存储装置1308可包括在物理上是设备1300被安装在其上的装置的一部分的存储资源,或者其可被该装置访问而不必作为该装置的一部分。例如,NVM/存储装置1308可经由网络接口1312通过网络和/或通过输入/输出设备1310进行访问。
一个实施例的(一个或多个)输入/输出设备1310可为设备1300提供接口以与任意其他适当的设备通信,输入/输出设备1310可以包括通信组件、音频组件、传感器组件等。
一个实施例的网络接口1312可为设备1300提供接口以通过一个或多个网络和/或与任何其他适合的装置通信,设备1300可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合进行无线通信。
对于一个实施例,处理器1302中的至少一个可与系统控制模块1304的一个或多个控制器(例如,存储器控制器)的逻辑封装在一起。对于一个实施例,处理器1302中的至少一个可与系统控制模块1304的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,处理器1302中的至少一个可与系统控制模块1304的一个或多个控制器的逻辑集成在同一新品上。对于一个实施例,处理器1302中的至少一个可与系统控制模块1304的一个或多个控制器的逻辑集成在同一芯片上以形成片上系统(SoC)。
在各个实施例中,设备1300可以包括但不限于:台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等计算设备。在各个实施例中,设备1300可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,设备1300可以包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,如果显示器包括触摸面板,显示屏可以被实现为触屏显示器,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在装置时,可以使得该装置执行本申请实施例中各方法的指令(instructions)。
在一个示例中提供了一种设备,包括:一个或多个处理器;和,其上存储的一个或多个机器可读介质中的指令,由所述一个或多个处理器执行时,导致所述装置执行如本申请实施例中的方法,该方法可以包括:图2或图3或图4或图5或图6所示的方法。
在一个示例中还提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如本申请实施例中的方法,该方法可以包括:图2或图3或图4或图5或图6所示的方法。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程输入装置的处理器以产生一个机器,使得通过计算机或其他可编程输入装置的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程输入装置以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程输入装置上,使得在计算机或其他可编程装置上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程装置上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者装置中还存在另外的相同要素。
以上对本申请所提供的一种输入方法、一种输入装置、一种设备、以及一种机器可读介质介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种输入方法,其特征在于,包括:
响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
接收用户的输入信息;
若所述输入信息为语音信息,则保持所述输入法的语音输入状态;或者,若所述输入信息为文本输入信息,则进入所述输入法的文本输入状态;所述文本输入信息通过所述文本输入界面输入。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于用户对输入法的调用操作,输出输入环境信息对应的第一提示信息;所述第一提示信息用于对输入内容进行提示。
3.根据权利要求2所述的方法,其特征在于,所述输入环境信息包括如下信息中的至少一种:
应用程序环境信息;和/或
界面环境信息。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
依据输入环境信息与提示信息之间的映射关系,确定输入环境信息对应的第一提示信息。
5.根据权利要求2所述的方法,其特征在于,所述输出输入环境信息对应的第一提示信息,包括:
播放输入环境信息对应的第一提示信息;和/或
在输入控件中展示输入环境信息对应的第一提示信息。
6.根据权利要求1至5中任一所述的方法,其特征在于,所述调用操作包括:
用户针对输入控件的触发操作。
7.根据权利要求1至5中任一所述的方法,其特征在于,所述方法还包括:
若所述输入信息为语音信息,则输出针对所述语音信息的响应信息。
8.根据权利要求7所述的方法,其特征在于,所述输出针对所述语音信息的响应信息,包括:
若所述语音信息符合输入条件,则输出所述语音信息对应的数据;或者
若所述语音信息不符合输入条件,则输出输入环境信息和所述语音信息对应的第二提示信息;所述第二提示信息用于对输入内容进行提示。
9.根据权利要求8所述的方法,其特征在于,所述语音信息对应的数据包括:字符候选项,所述字符候选项为依据输入环境信息对应的词库得到。
10.根据权利要求8所述的方法,其特征在于,所述语音信息对应的数据包括:搜索结果,所述搜索结果为依据输入环境信息对应的数据库得到。
11.根据权利要求1至5中任一所述的方法,其特征在于,所述方法还包括:
在进入文本输入状态后,若符合切换条件,则进入语音输入状态。
12.根据权利要求11所述的方法,其特征在于,所述切换条件包括:
在预设时长内未接收到所述文本输入信息;或者
接收到针对所述语音入口的触发操作;或者
接收到用户的语音唤醒指令。
13.根据权利要求1至5中任一所述的方法,其特征在于,所述进入所述输入法的语音输入状态,包括:
显示输入法处于语音输入状态的提示信息;或者
显示语音输入界面。
14.一种输入装置,其特征在于,包括:
调用响应模块,用于响应于用户对输入法的调用操作,进入所述输入法的语音输入状态,并显示文本输入界面或文本输入界面的入口;
输入接收模块,用于接收用户的输入信息;以及
输入响应模块,用于在所述输入信息为语音信息的情况下,保持所述输入法的语音输入状态;或者,在所述输入信息为文本输入信息的情况下,进入所述输入法的文本输入状态;所述文本输入信息通过所述文本输入界面输入。
15.一种设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如权利要求1-13中一个或多个所述的方法。
16.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-13中一个或多个所述的方法。
CN201910426237.9A 2019-05-21 2019-05-21 一种输入方法、装置、设备和机器可读介质 Pending CN111984129A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910426237.9A CN111984129A (zh) 2019-05-21 2019-05-21 一种输入方法、装置、设备和机器可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910426237.9A CN111984129A (zh) 2019-05-21 2019-05-21 一种输入方法、装置、设备和机器可读介质

Publications (1)

Publication Number Publication Date
CN111984129A true CN111984129A (zh) 2020-11-24

Family

ID=73436218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910426237.9A Pending CN111984129A (zh) 2019-05-21 2019-05-21 一种输入方法、装置、设备和机器可读介质

Country Status (1)

Country Link
CN (1) CN111984129A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114051157A (zh) * 2021-09-30 2022-02-15 北京搜狗科技发展有限公司 一种输入方法和装置
CN114415846A (zh) * 2021-12-30 2022-04-29 北京百度网讯科技有限公司 控制输入方法、装置、电子设备、存储介质及程序产品
CN114740985A (zh) * 2020-12-23 2022-07-12 北京搜狗科技发展有限公司 一种功能调用方法、装置和用于调用功能的装置
WO2025200611A1 (zh) * 2024-03-27 2025-10-02 荣耀终端股份有限公司 一种文字输入方法和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1555481A (zh) * 2002-03-15 2004-12-15 三菱电机株式会社 车辆用导航装置
CN104346127A (zh) * 2013-08-02 2015-02-11 腾讯科技(深圳)有限公司 语音输入的实现方法、装置及终端
CN107831994A (zh) * 2017-11-28 2018-03-23 珠海市魅族科技有限公司 输入法启用方法及装置、计算机装置和可读存储介质
CN108062214A (zh) * 2017-10-20 2018-05-22 沈阳美行科技有限公司 一种搜索界面的展示方法及装置
CN108737634A (zh) * 2018-02-26 2018-11-02 珠海市魅族科技有限公司 语音输入方法及装置、计算机装置和计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1555481A (zh) * 2002-03-15 2004-12-15 三菱电机株式会社 车辆用导航装置
CN104346127A (zh) * 2013-08-02 2015-02-11 腾讯科技(深圳)有限公司 语音输入的实现方法、装置及终端
CN108062214A (zh) * 2017-10-20 2018-05-22 沈阳美行科技有限公司 一种搜索界面的展示方法及装置
CN107831994A (zh) * 2017-11-28 2018-03-23 珠海市魅族科技有限公司 输入法启用方法及装置、计算机装置和可读存储介质
CN108737634A (zh) * 2018-02-26 2018-11-02 珠海市魅族科技有限公司 语音输入方法及装置、计算机装置和计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114740985A (zh) * 2020-12-23 2022-07-12 北京搜狗科技发展有限公司 一种功能调用方法、装置和用于调用功能的装置
CN114051157A (zh) * 2021-09-30 2022-02-15 北京搜狗科技发展有限公司 一种输入方法和装置
CN114415846A (zh) * 2021-12-30 2022-04-29 北京百度网讯科技有限公司 控制输入方法、装置、电子设备、存储介质及程序产品
WO2025200611A1 (zh) * 2024-03-27 2025-10-02 荣耀终端股份有限公司 一种文字输入方法和设备

Similar Documents

Publication Publication Date Title
US11664027B2 (en) Method of providing voice command and electronic device supporting the same
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
US11024300B2 (en) Electronic device and control method therefor
US11749273B2 (en) Speech control method, terminal device, and storage medium
US8782549B2 (en) Incremental feature-based gesture-keyboard decoding
US20160139877A1 (en) Voice-controlled display device and method of voice control of display device
CN111984129A (zh) 一种输入方法、装置、设备和机器可读介质
KR20210032875A (ko) 음성 정보 처리 방법, 장치, 프로그램 및 저장 매체
US12008988B2 (en) Electronic apparatus and controlling method thereof
CN109215660A (zh) 语音识别后文本纠错方法及移动终端
TW201716987A (zh) 欄位條目的音訊輸入技術
US10950221B2 (en) Keyword confirmation method and apparatus
EP3640937B1 (en) Electronic apparatus and controlling method thereof
CN108073291B (zh) 一种输入方法和装置、一种用于输入的装置
US11373634B2 (en) Electronic device for recognizing abbreviated content name and control method thereof
WO2024179519A1 (zh) 语义识别方法及其装置
CN110781270A (zh) 一种解码网络中非关键词模型的构建方法和装置
US20140350929A1 (en) Method and apparatus for managing audio data in electronic device
KR20110025510A (ko) 전자 기기 및 이를 이용한 음성인식 방법
US10423706B2 (en) Method and device for selecting information
CN115543099B (zh) 输入方法、装置和用于输入的装置
CN113625885B (zh) 一种输入方法、装置和用于输入的装置
CN111124141B (zh) 一种用于确定候选项的神经网络模型训练方法和装置
KR102728035B1 (ko) 전자 장치 및 그 제어 방법
CN115454259A (zh) 一种输入方法、装置和用于输入的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201218

Address after: Room 603, 6 / F, Roche Plaza, 788 Cheung Sha Wan Road, Kowloon, China

Applicant after: Zebra smart travel network (Hong Kong) Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20201124

RJ01 Rejection of invention patent application after publication