[go: up one dir, main page]

CN116932706A - 汉语翻译的方法和电子设备 - Google Patents

汉语翻译的方法和电子设备 Download PDF

Info

Publication number
CN116932706A
CN116932706A CN202210396448.4A CN202210396448A CN116932706A CN 116932706 A CN116932706 A CN 116932706A CN 202210396448 A CN202210396448 A CN 202210396448A CN 116932706 A CN116932706 A CN 116932706A
Authority
CN
China
Prior art keywords
user
mouth
action
hand
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210396448.4A
Other languages
English (en)
Inventor
谢雨晨
常亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202210396448.4A priority Critical patent/CN116932706A/zh
Priority to PCT/CN2023/086870 priority patent/WO2023197949A1/zh
Publication of CN116932706A publication Critical patent/CN116932706A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/009Teaching or communicating with deaf persons

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种汉语翻译的方法和电子设备,该方法包括:响应于用户的输入,电子设备获取文字信息,该文字信息包括关键词;该电子设备显示该文字信息对应的手部动作;该电子设备显示关键词对应的口部动作。本申请提供的翻译方法和电子设备在将文本信息翻译成手语时附加符合手语使用者习惯的口部动作,有利于提高汉语翻译成手语时语言表达的准确性,有利于减少手语使用者对翻译结果的误解,有利于增强与手语使用者之间的交流和沟通,有利于提升电子设备用户的应用体验。

Description

汉语翻译的方法和电子设备
技术领域
本申请涉及计算机领域,具体的,涉及一种汉语翻译的方法和电子设备。
背景技术
手语数字人(digital human)可以通过手部动作和/或口部动作来帮助手语使用者理解语言信息。
当手语数字人在做手部动作的同时配合相应的口部动作来表达某句话或某个含义时,口部动作有时并不能起到辅助手部动作帮助理解的目的,反而有可能造成不必要的误解。例如,在做自然手语的手部动作时,配合听力无障碍人士说话的口部动作,由于手部动作与口部动作在同一时刻表达的可能并不是同一个词语,这样便会造成误解。
发明内容
本申请提供一种汉语翻译方法,在将文本信息翻译成手语时只为关键词附加口部动作,有利于提高汉语翻译成手语时语言表达的准确性。
第一方面,提供了一种汉语翻译方法,包括:响应于用户的输入,电子设备获取文字信息,该文字信息包括关键词;该电子设备显示该文字信息对应的手部动作;该电子设备显示关键词对应的口部动作。
在一种可能的实现方式中,该关键词由电子设备根据用户输入的文字信息通过以下方式中的一种或多种识别得到:文字信息的内容、用户的翻译历史信息或其他用户对该文字信息中关键词的确定的方法。
需要说明的是,这里关键词可以是文字信息包含的一个或多个字或者也可以是文字信息包含的一个或多个词汇。
还需要说明的是,手语使用者在做手语动作时的词汇表达的顺序可能是与自然口语的语序是不同的,这里电子设备显示文字信息对应的手部动作的顺序可以是根据手语使用者的习惯确定的。
在打手语时为只为关键词附加上相应的口部动作,本技术方案将文字信息翻译成更服务手语使用者的表达习惯的手语,有利于提升文字信息翻译结果的准确度,有利于降低手语使用者对翻译得到的手语造成误解的机率,有利于增强与手语使用者之间的相互沟通。
结合第一方面,在第一方面的某些实现方式中,该关键词根据手语使用者的语言习惯确定。
在打手语时为根据手语使用者的语言习惯确定的关键词附加上相应的口部动作,本技术方案将文字信息翻译成更服务手语使用者的表达习惯的手语,有利于提升文字信息翻译结果的准确度,有利于降低手语使用者对翻译得到的手语造成误解的机率,有利于增强与手语使用者之间的相互沟通。
结合第一方面,在第一方面的某些实现方式中,该电子设备不显示普通词汇对应的口部动作,该文字信息包括该普通词汇,该普通词汇与该关键词不同。
本技术方案中,对于不是关键词的普通词汇不显示口部动作,有利于减少翻译过程中的数据传输,有利于提高翻译过程中数据传输与处理的效率,有利于提高电子设备用户的应用使用体验。
结合第一方面,在第一方面的某些实现方式中,该电子设备在显示关键词对应的手部动作的同时显示该口部动作。
本技术方案,在做关键词对应的手部动作的同时展示关键词对应的口部动作,该技术方案的实施有利于保证手部动作和口部动作的对应关系,有利于进一步提高文字信息翻译结果的准确度,有利于提高手语使用者对翻译得到的手语的理解程度。
结合第一方面,在第一方面的某些实现方式中,该关键词为专有名词。
该专有名词可以包括以下词汇中的一种或多种:人名、地名、机构团体、作品名和其他专有名词。
为专有名词附加口部动作,有利于提高手语使用者对于较难理解的专有名词的理解程度,有利于增强与手语使用者之间的相互沟通。
结合第一方面,在第一方面的某些实现方式中,在显示关键词对应的口部动作前,该电子设备显示第一词汇,该文字信息包括该第一词汇,该第一词汇为推荐附加口部动作的词汇;响应于用户的确认操作,该电子设备确定该第一词汇为关键词。
本技术方案通过向电子设备用户推荐关键词,并在用户确认后为推荐的关键词附加口部动作。本技术方案的实施有利于提升手语学习者对手语使用的理解程度,有利于提升电子设备用户的应用使用体验,有利于提升手语学习者学习手语的效率。
结合第一方面,在第一方面的某些实现方式中,在显示关键词对应的口部动作前,响应于用户的第一输入,电子设备获取第二词汇,该第二词汇为用户请求附加口部动作的词汇;在文字信息包含该第二词汇的情况下,该电子设备确定第二词汇为关键词;在文字信息不包含该第二词汇的情况下,该电子设备显示更新请求信息,该更新请求信息用于提示文字信息不包含该第二词汇;响应于用户的第二输入,电子设备获取更新后的第二词汇。
本技术方案对于用户输入的请求附加口部动作的词汇进行识别,并将文字信息中是否包含用户请求附加口部动作的词汇的识别结果通知用户。本技术方案的实施有利于提升汉语翻译成手语的效率,有利于提高对文字信息翻译的准确度,有利于提升用户的应用使用体验。
结合第一方面,在第一方面的某些实现方式中,第一词汇根据用户的翻译历史确定,该翻译历史包含用户输入的第二词汇,该第二词汇为用户请求附加口部动作的词汇。
翻译历史中包含的第二词汇在一定程度上可以提现电子设备用户的语言习惯和应用使用习惯。本技术方案根据用户请求附加口部动作的历史来为用户推荐附加口部动作的词汇。本技术方案的实施有利于根据用户的习惯来确定汉语的翻译结果,有利于提升翻译的效果,有利于提升电子设备用户的应用使用体验。
结合第一方面,在第一方面的某些实现方式中,该口部动作根据关键词的汉语拼音的发音口型确定。
结合第一方面,在第一方面的某些实现方式中,该发音口型对应的混合形状数值保存在口部动作数据库中。
通过建立口部动作数据库,在需要显示口部动作时由电子设备发送请求消息至服务器后,服务器从数据库中调用所需的口部动作数据。相比于通过深度学习等方案获取的口部动作数据,有利于简化口部动作数据获取的流程,有利于提高翻译的效率,提升电子设备的应用使用体验。
结合第一方面,在第一方面的某些实现方式中,该手部动作包括第一手部动作和第二手部动作,该第一手部动作在该第二手部动作之前,该电子设备从服务器接收第一手部动作数据,该第一手部动作数据用于显示第一手部动作;在显示第一手部动作的同时电子设备从服务器接收第二手部动作数据,该第二手部动作数据用于显示第二手部动作。
需要说明的是,这里第一手部动作或第二手部动作可以是一个具体的动作,也可以是一个具体动作的一帧或多帧包含的动作画面。
本技术方案中电子设备先接收需要先显示的手部动作数据,并在显示需要先显示的手部动作的同时接收后显示的手部动作数据,采用分片传输手部动作数据、边显示边传输的方案,有利于缩短数据传输产生的等待时间,有利于提升用户的应用使用体验。
结合第一方面,在第一方面的某些实现方式中,该口部动作包括第一口部动作和第二口部动作,该第一口部动作在第二口部动作之前,该电子设备从服务器接受第一口部动作数据,该第一口部动作数据用于显示该第一口部动作;在显示第一口部动作的同时电子设备从服务器接收第二口部动作数据,该第二口部动作数据用于显示该第二口部动作。
需要说明的是,这里第一口部动作或第二口部动作可以是一个具体的动作,也可以是一个具体动作的一帧或多帧包含的动作画面。
本技术方案中电子设备先接收需要先显示的口部动作数据,并在显示需要先显示的口部动作的同时接收后显示的口部动作数据,采用分片传输口部动作数据、边显示边传输的方案,有利于缩短数据传输产生的等待时间,有利于提升用户的应用使用体验。
结合第一方面,在第一方面的某些实现方式中,在显示文字信息对应的手部动作前,电子设备从服务器接收响应消息,该响应消息用于指示文字信息不包含敏感信息。
在将文字信息翻译成手部动作和/或口部动作前,首先对文字信息进行文本风控检查,本技术方案的实施有利于过滤不良文本信息,有利于提高电子设备用户的应用使用体验。
第二方面,提供了一种汉语翻译方法,包括:服务器接收翻译请求消息,该翻译请求消息包括文字信息,该文字信息包括关键词,该关键词根据手语使用者的语言习惯确定,该翻译请求消息用于请求获取该文字信息对应的手部动作数据,该翻译请求消息还用于请求获取该关键词对应的口部动作数据;该服务器根据文字信息确定是否发送手部动作数据和/或口部动作数据。
这里,手部动作数据用于显示文字信息对应的手部动作,口部动作数据用于显示关键词对应的口部动作。
在一种可能的实现方式中,该关键词由电子设备根据用户输入的文字信息通过以下方式中的一种或多种识别得到:文字信息的内容、用户的翻译历史信息或其他用户对该文字信息中关键词的确定的方法。
需要说明的是,这里关键词可以是文字信息包含的一个或多个字或者也可以是文字信息包含的一个或多个词汇。
本技术方案中只对根据用户习惯确定的关键词附加口部动作,本技术方案的实施有利于减少文字信息翻译成手语时,电子设备与服务器之间传递数据的数据量,有利于提升电子设备对文字信息翻译的效率。
结合第二方面,在第二方面的某些实现方式中,该关键词为专有名词。
结合第二方面,在第二方面的某些实现方式中,该服务器确定该文字信息中是否包含敏感信息;在文字信息中包含敏感信息的情况下,该服务器发送第一响应消息,该第一响应消息用于指示该文字信息包含敏感信息;在文字信息不包含敏感信息的情况下,该服务器发送第二响应消息,该第二响应消息包括手部动作数据和/或口部动作数据。
在将文字信息翻译成手部动作和/或口部动作前,首先对文字信息进行文本风控检查,本技术方案的实施有利于过滤不良文本信息,有利于提高电子设备用户的应用使用体验。
结合第二方面,在第二方面的某些实现方式中,该手部动作数据包括第一手部动作数据和第二手部动作数据,该第一手部动作数据用于显示第一手部动作,该第二手部动作数据用于显示第二手部动作,该第一手部动作在该第二手部动作之前,该服务器在发送第一手部动作数据之后发送该第二手部动作数据。
需要说明的是,这里第一手部动作或第二手部动作可以是一个具体的动作,也可以是一个具体动作的一帧或多帧包含的动作画面。
本技术方案中服务器先发送需要先显示的手部动作数据,并在显示需要先显示的手部动作的同时发送后显示的手部动作数据,采用分片传输手部动作数据、边显示边传输的方案,有利于缩短数据传输产生的等待时间,有利于提升用户的应用使用体验。
结合第二方面,在第二方面的某些实现方式中,该口部动作数据包括第一口部动作数据和第二口部动作数据,该第一口部动作数据用于显示第一口部动作,该第二口部动作数据用于显示第二口部动作,该第一口部动作在该第二口部动作之前,该服务器在发送第一口部动作数据之后发送该第二口部动作数据。
需要说明的是,这里第一口部动作或第二口部动作可以是一个具体的动作,也可以是一个具体动作的一帧或多帧包含的动作画面。
本技术方案中服务器先发送需要先显示的口部动作数据,并在显示需要先显示的口部动作的同时发送后显示的口部动作数据,采用分片传输口部动作数据、边显示边传输的方案,有利于缩短数据传输产生的等待时间,有利于提升用户的应用使用体验。
结合第二方面,在第二方面的某些实现方式中,该服务器从口部动作数据库中获取该口部动作数据,该口部动作数据库包含汉语拼音发音口型对应的混合形状数值。
通过为口部动作数据建立数据库,在需要显示口部动作时由电子设备发送请求消息至服务器后,服务器从数据库中调用所需的口部动作数据。相比于通过深度学习等方案获取的口部动作数据,有利于简化口部动作数据获取的流程,有利于提高翻译的效率,提升电子设备的应用使用体验。
第三方面,提供一种电子设备,包括处理器和存储器,该存储器存储有一个或者多个计算机程序,该一个或多个计算机程序包括指令,当该指令被处理器执行时,该处理器用于:响应于用户的输入,获取文字信息,该文字信息包括关键词,该关键词根据手语使用者的语言习惯确定;该处理器还用于显示该文字信息对应的手部动作,该处理器还用于显示关键词对应的口部动作。
结合第三方面,在第三方面的某些实现方式中,该关键词根据手语使用者的语言习惯确定。
结合第三方面,在第三方面的某些实现方式中,该处理器还用于不显示普通词汇对应的口部动作,该文字信息包括该普通词汇,该普通词汇与该关键词不同。
结合第三方面,在第三方面的某些实现方式中,该处理器具体用于在显示关键词对应的手部动作的同时显示该口部动作。
结合第三方面,在第三方面的某些实现方式中,该处理器还用于,显示第一词汇,该文字信息包括该第一词汇,该第一词汇为推荐附加口部动作的词汇;响应于用户的确认操作,该处理器还用于确定该第一词汇为关键词。
结合第三方面,在第三方面的某些实现方式中,响应于用户的第一输入,该处理器用于获取第二词汇,该第二词汇为用户请求附加口部动作的词汇;在文字信息包含第二词汇的情况下,该处理器还用于确定第二词汇为关键词;在文字信息不包含第二词汇的情况下,该处理器还用于显示更新请求信息,该更新请求消息用于提示文字信息不包含第二词汇;响应于用户的第二输入,该处理器还用于获取更新后的第二词汇。
结合第三方面,在第三方面的某些实现方式中,该手部动作包括第一手部动作和第二手部动作,该第一手部动作在该第二手部动作之前,该处理器还用于从服务器接收第一手部动作数据,该第一手部动作数据用于显示第一手部动作;在显示第一手部动作的同时该处理器还用于从服务器接收第二手部动作数据,该第二手部动作数据用于显示第二手部动作。
结合第三方面,在第三方面的某些实现方式中,该口部动作包括第一口部动作和第二口部动作,该第一口部动作在第二口部动作之前,该处理器还用于从服务器接收第一口部动作数据,该第一口部动作数据用于显示第一口部动作;在显示第一口部动作的同时该处理器还用于从服务器接收第二口部动作数据,该第二口部动作数据用于显示第二口部动作。
结合第三方面,在第三方面的某些实现方式中,该处理器还用于从服务器接收响应消息,该响应消息用于指示文字信息不包含敏感信息。
第四方面,提供一种服务器,包括处理器和存储器,该存储器存储有一个或者多个计算机程序,该一个或多个计算机程序包括指令,当该指令被处理器执行时,该处理器用于:接收翻译请求消息,该翻译消息包括文字信息,该翻译请求消息用于请求获取该文字信息对应的手部动作数据,该文字信息包括关键词,该关键词根据手语使用者的语言习惯确定,该翻译请求消息还用于请求获取该关键词对应的口部动作数据;该处理器还用于根据文字信息确定是否发送手部动作数据和/或口部动作数据。
结合第四方面,在第四方面的某些实现方式中,该处理器还用于确定该文字信息中是否包含敏感信息;在文字信息中包含敏感信息的情况下,该处理器还用于发送第一响应消息,该第一响应消息用于指示该文字信息包含敏感信息;在文字信息不包含敏感信息的情况下,该处理器还用于发送第二响应消息,该第二响应消息包括手部动作数据和/或口部动作数据。
结合第四方面,在第四方面的某些实现方式中,该手部动作数据包括第一手部动作数据和第二手部动作数据,该第一手部动作数据用于显示第一手部动作,该第二手部动作数据用于显示第二手部动作,该第一手部动作在该第二手部动作之前,该处理器还用于在发送第一手部动作数据之后发送该第二手部动作数据。
结合第四方面,在第四方面的某些实现方式中,该口部动作数据包括第一口部动作数据和第二口部动作数据,该第一口部动作数据用于显示第一口部动作,该第二口部动作数据用于显示第二口部动作,该第一口部动作在该第二口部动作之前,该处理器还用于在发送第一口部动作数据之后发送该第二口部动作数据。
结合第四方面,在第四方面的某些实现方式中,该处理器还用于从口部动作数据库中获取该口部动作数据,该口部动作数据库包含汉语拼音发音口型对应的混合形状数值。
第五方面,提供一种汉语翻译装置,包括获取单元和处理单元,该获取单元用于响应于用户的输入,获取文字信息,该文字信息包括关键词,该关键词根据手语使用者的语言习惯确定;该处理单元用于显示该文字信息对应的手部动作;该处理单元还用显示关键词对应的口部动作。
结合第五方面,在第五方面的某些实现方式中,该关键词根据手语使用者的语言习惯确定。
结合第五方面,在第五方面的某些实现方式中,该处理单元还用于不显示普通词汇对应的口部动作,该文字信息包括该普通词汇,该普通词汇与该关键词不同。
结合第五方面,在第五方面的某些实现方式中,该处理单元还用于在显示关键词对应的手部动作的同时显示该口部动作。
结合第五方面,在第五方面的某些实现方式中,该处理单元还用于显示第一词汇,该文字信息包括该第一词汇,该第一词汇为推荐附加口部动作的词汇,响应于用户的确认操作,该处理单元还用于确定该第一词汇为关键词。
结合第五方面,在第五方面的某些实现方式中,该获取单元还用于响应于用户的第一输入,获取第二词汇,该第二词汇为用户请求附加口部动作的词汇;在文字信息包含第二词汇的情况下,该处理单元还用于确定第二词汇为关键词;在文字信息不包含第二词汇的情况下,该处理单元还用于显示更新请求消息,该更新请求消息用于提示文字信息不包含该第二词汇;该获取单元还用于响应于用户的第二输入,获取更新后的第二词汇。
结合第五方面,在第五方面的某些实现方式中,该汉语翻译装置还包括通信单元,该手部动作包括第一手部动作和第二手部动作,该第一手部动作在该第二手部动作之前,在显示文字信息对应的手部动作前,该通信单元用于从服务器接收第一手部动作数据,该第一手部动作数据用于显示第一手部动作;该通信单元还用于在显示第一手部动作的同时从服务器接收第二手部动作数据,该第二手部动作数据用于显示第二手部动作。
结合第五方面,在第五方面的某些实现方式中,该口部动作包括第一口部动作和第二口部动作,该第一口部动作在第二口部动作之前,该通信单元还用于从服务器接收第一口部动作数据,该第一口部动作数据用于显示第一口部动作;在显示第一口部动作的同时该通信单元还用于从服务器接收第二口部动作数据,该第二口部动作数据用于显示第二口部动作。
结合第五方面,在第五方面的某些实现方式中,在显示文字信息对应的手部动作前,该通信单元还用于从服务器接收响应消息,该响应消息用于指示文字信息不包含敏感信息。
第六方面,提供一种汉语翻译装置,包括通信单元和处理单元,该通信单元用于,接收翻译请求消息,该翻译请求消息包括文字信息,该翻译请求消息用于请求获取该文字信息对应的手部动作数据,该文字信息包括关键词,该关键词根据手语使用者的语言习惯确定,该翻译请求消息还用于请求获取该关键词对应的口部动作数据;该处理单元用于根据文字信息确定是否发送手部动作数据和/或口部动作数据。
结合第六方面,在第六方面的某些实现方式中,该处理单元还用于确定该文字信息中是否包含敏感信息;在文字信息中包含敏感信息的情况下,该通信单元还用于发送第一响应消息,该第一响应消息用于指示该文字信息包含敏感信息;在文字信息不包含敏感信息的情况下,该通信单元还用于发送第二响应消息,该第二响应消息包括手部动作数据和/ 或口部动作数据。
结合第六方面,在第六方面的某些实现方式中,该手部动作数据包括第一手部动作数据和第二手部动作数据,该第一手部动作数据用于显示第一手部动作,该第二手部动作数据用于显示第二手部动作,该第一手部动作在该第二手部动作之前,该通信单元还用于在发送第一手部动作数据之后发送该第二手部动作数据。
结合第六方面,在第六方面的某些实现方式中,该口部动作数据包括第一口部动作数据和第二口部动作数据,该第一口部动作数据用于显示第一口部动作,该第二口部动作数据用于显示第二口部动作,该第一口部动作在该第二口部动作之前,该通信单元还用于在发送第一口部动作数据之后发送该第二口部动作数据。
结合第六方面,在第六方面的某些实现方式中,该处理单元还用于从口部动作数据库中获取该口部动作数据,该口部动作数据库包含汉语拼音发音口型对应的混合形状数值。
第七方面,提供一种计算机程序产品,该计算机程序产品包括计算机程序代码,当计算机程序代码在计算机上运行时,使得第一方面或其任意可能的实现方式中的方法被执行。
第八方面,提供一种计算机程序产品,该计算机程序产品包括计算机程序代码,当计算机程序代码在计算机上运行时,使得第二方面或其任意可能的实现方式中的方法被执行。
第九方面,提供一种计算机可读存储介质,该计算机可读介质中存储有计算机指令,当计算机指令在计算机上运行时,使得第一方面或其任意可能的实现方式中的方法被执行。
第十方面,提供一种计算机可读存储介质,该计算机可读介质中存储有计算机指令,当计算机指令在计算机上运行时,使得第二方面或其任意可能的实现方式中的方法被执行。
第十一方面,提供一种芯片,包括处理器,用于读取存储器中存储的指令,当该处理器执行该指令时,使得该芯片实现第一方面或其任意可能的实现方式中的方法被执行。
第十二方面,提供一种芯片,包括处理器,用于读取存储器中存储的指令,当该处理器执行该指令时,使得该芯片实现第二方面或其任意可能的实现方式中的方法被执行。
附图说明
图1是适用于本申请实施例中一种电子设备硬件架构示意图。
图2是适用于本申请实施例中一种电子设备软件架构示意图。
图3是本申请实施例提供的一种汉语翻译方法示意图。
图4是本申请实施例提供的另一种汉语翻译方法示意图。
图5是本申请实施例提供的又一种汉语翻译方法示意图。
图6是本申请实施例提供的又一种汉语翻译方法示意图。
图7是本申请实施例提供的又一种汉语翻译方法示意图。
图8是本申请实施例提供的又一种汉语翻译方法示意图。
图9是本申请实施例提供的又一种汉语翻译方法示意图。
图10是本申请实施例提供的又一种汉语翻译方法示意图。
图11是本申请实施例提供的又一种汉语翻译方法示意图。
图12是本申请实施例提供的又一种汉语翻译方法示意图。
图13是本申请实施例提供的一种汉语翻译装置示意图。
图14是本申请实施例提供的另一种汉语翻译装置示意图。
图15是本申请实施例提供的一种电子设备示意图。
图16是本申请实施例提供的一种服务器示意图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本申请的限制。如在本申请的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括例如“一个或多个”这种表达形式,除非其上下文中明确地有相反指示。还应当理解,在本申请以下各实施例中,“至少一个”、“一个或多个”是指一个、两个或两个以上。术语“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系;例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。
在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。
示例性的,图1示出了电子设备100的结构示意图。电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏 194,以及用户身份识别(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户身份识别(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus, USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过 UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备 100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB 接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation, FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system, BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed, Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP 还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193 中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体 (complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP 加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM 卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个 SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM 卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用嵌入式SIM(embedded-SIM,eSIM)卡,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
应理解,本申请实施例中的电话卡包括但不限于SIM卡、eSIM卡、全球用户识别卡(universal subscriber identity module,USIM)、通用集成电话卡(universalintegrated circuit card,UICC)等等。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图2是本申请实施例的电子设备100的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。应用程序层可以包括一系列应用程序包。
如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(media libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
应理解,本申请实施例中的技术方案可以用于Android、IOS、鸿蒙等系统中。
以上结合图1和图2介绍了适用于本申请提供的翻译方法的电子设备的硬件和软件的架构,以下结合图3至图16说明本申请实施例提供的汉语翻译方法。在正式介绍本申请实施例前,首先介绍以下实施例中可能用到的一些术语。
1、中国手语(Chinese sign language,CSL):中国通用手语,主要在中国使用。
2、语音识别(automatic speech recognition,ASR):又可以称为语音转文本(speech to text, STT),其目标是以电脑自动将人类的语音内容转换为相应的文字。
3、光学字符识别(optical character recognition,OCR):指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
4、软件开发套件(software development kit,SDK):指一些用于为特定的软件包、软件框架、硬件平台及操作系统等创建应用软件的开发工具的集合。
5、混合变形(blendshape):对三维模型网格顶点进行操作,以实现定义形状的技术,可用来控制虚拟人物的面部表情。
6、数字人:指通过计算机技术,将人体结构数字化,在电脑屏幕上出现看得见的,能够调控的虚拟人体形态,进一步将人体功能性信息附加到这个人体形态框架上,经过虚拟现实技术的交叉融合,这个“数字人”将能模仿真人做出各种各样的反应,若设置有声音和力反馈的装置,还可以提供视、听、触等直观而自然的实时感。
7、手语(sign language、signed language、signing)是一种不使用听觉-语音,而使用视觉 -手势模式——以肢体动作、脸部表情来表达传达意义、意思使用的语言。
8、词性:指词的特点,用于划分词类。现代汉语的词可以分为实词和虚词两大类,其中实词是指能够单独充当句法成分或大多充当橘子的主要成分。有词汇意义和语法意义。包括名词、动词、形容词、副词、数词、量词、代词和拟声词。虚词不能够单独充当句法成分或大多充当句子的辅助性成分。只有语法意义。包括介词、连词、助词和叹词。
表1给出了一种词性的分类方法,其中专有名词可以包括:人名、地名、机构团体、作品名和其他专有名词等。
表1词性标签及其含义
图3为本申请实施例提供的一种汉语翻译方法示意图,以下以电子设备使用App1将文字信息翻译成相应的手语的过程为例介绍本申请实施例提供的汉语翻译方法。
需要说明的是,以下实施例中App1的使用者(即:电子设备用户或用户)既可以是听障人士,也可以是听力无障碍人士。
电子设备用户可以通过App1的输入功能控件304输入需要进行翻译的数据,该输入功能控件304可以用于向App1输入以下数据类型中的一种或多种:文本(例如303所示内容)、图像、文档、音频、视频等。
当电子设备用户输入文本时,App1可以直接获取电子设备用户输入的文本包含的文字信息。该文本可以是电子设备用户手动输入的,也可以是App1提供的一个或多个文本(App1内置的常用句),电子设备用户从该一个或多个文本中选择的。
当终端终端用户输入图像时,App1在接收图像数据后通过OCR识别图像中包含的文字信息。当电子设备用户输入文档(如示例.txt等)数据后,App1在接收文档数据后解析文档获得文档中包含的文字信息。
当电子设备用户输入音频或视频数据时,App1在接收音频或视频数据后通过ASR和 /或OCR识别音频或视频数据中包含的文字信息。示例性的,当App1接收的视频数据包含字幕时,App1可以通过OCR识别视频中的文字信息,当App1接收的视频数据包含音频数据时,App1可以通过ASR识别视频数据中包含的文字信息,当App1接收的视频数据即包含字幕又包含音频数据时,App1可以同时利用ASR和OCR识别视频中包含的文字信息,并进行相互校对,提高文字识别的正确率。
当App1获取如303中所示的文字信息“约翰今天下午去了电影院。”,App1可以根据该文字信息获取与该文字信息对应的手部动作数据,进而利用该手部动作数据驱动虚拟人物模型,使得虚拟人物模型可以展示文字信息对应的手部动作。
在一些实施例中,在App1将获取的文字翻译成手语前,App1还会识别用户输入的待翻译的数据中包含的不同词汇的词性,对于专有名词,App1还会获取该专有名词对应的口部动作数据。当虚拟人物展示专有名词的手部动作时,在口部动作数据的驱动下,虚拟人物还会展示该专有名词对应的口部动作。
在一些实施例中,当电子设备用户打开图3所示的界面时,响应于用户的操作,App1 显示提示信息302,该提示信息用于提示电子设备用户使用App1的方法或步骤。
示例性地,该提示信息可以用于提示电子设备用户通过输入功能控件304向App1输入待翻译的数据。
示例性地,该提示信息还可以用于提示电子设备用户输入需要附加口部动作的字、词。
可选地,App1还可以显示处理状态信息。示例性地,如在301处显示App1当前执行的操作或用户正在执行的操作。
图4为本本申请实施例提供的另一种汉语翻译方法示意图。
本申请实施例中,以App1通过OCR识别图像中的文字信息为例说明App1对于以图像、文档等需要识别文字信息的待翻译数据的处理过程。
电子设备用户通过输入功能控件向App1输入包含“约翰今天下午去了电影院。”的文字信息的图片。App1在接收用户的输入图片后,通过OCR对图片中的文字信息进行识别。
在一些实施例中,App1识别文字信息正确(“约翰今天下午去了电影院。”),App1显示文本识别结果确认提示窗(如图4中(a)所示),用户点击“确认”,App1获取用户的确认指示,执行下一步操作,即图4中(c)所示的操作。
在另一些实施例中,App1识别文字信息错误(“约翰今天上午去了电影院。”),App1显示文本识别结果确认提示窗,用户在确认App1识别文本错误后,点击“修改”, App1获取用户的修改指示,显示如图4中(b)所示的修改文本识别结果提示窗,用户在输入正确的文字信息(“约翰今天下午去了电影院。”)后点击“确认”,响应于用户的输入,App1获取到修改后的文字信息,执行下一步操作,即图4中(c)所示的操作。
如图4中(c)所示,App1在获取用户确认后的文字信息后可以将文字信息翻译成对应的手部动作。
在一些实施例中,App1在将确认的文字信息翻译成手部动作前,显示操作提示信息“请输入需要附加口部动作的关键词:”,电子设备用户根据该操作提示信息通过输入功能控件向App1输入“约翰”,响应于用户的输入,App1在获取“约翰”关键词后,在根据文字信息获取文字信息对应的手部动作数据的同时,还会获取关键词“约翰”对应的口部动作数据,从而App1可以利用获取的手部动作数据和关键词的口部动作数据驱动虚拟人物展示相应的手部动作和口部动作。
在另一些实施例中,App1在将确认的文字信息翻译成口语前,分析该文字信息中包含专有名词“约翰”,App1将该专有名词作为需要附加口部动作的关键词,并在获取文字信息对应的手部动作数据的同时,获取该专有名词对应的口部动作数据,从而App1可以利用获取的手部动作数据和关键词的口部动作数据驱动虚拟人物展示相应的手部动作和口部动作。
需要说明的是,关键词可以是包含一个或多个汉字的词汇。
图5所示为本申请实施例提供的另一种汉语翻译方法示意图。本申请实施例中,电子设备用户输入需要附加口部动作的关键词,App1对用户输入的关键词进行检查以降低文字信息翻译成手部动作过程中可能出现错误的机率。
如图5中(a)所示,电子设备用户输入待翻译的文字信息为“用完水请关闭水龙头。”响应于用户的输入,App1显示提示信息“请输入需要附加口部动作的关键词:”。
在一些实施例中,电子设备用户根据上述提示信息输入关键词:“关闭、水龙头”,响应于用户的输入,App1检查并确定文字信息中包含用户输入的关键词,则执行相应的翻译操作。
在另一些实施例中,电子设备用户根据上述提示信息输入关键词:“关闭、火龙头”,响应于用户的输入,App1检查并确定文字信息中包含关键词“关闭”,但不包含关键词“火龙头”,则App1显示如图5中(b)所示的确认关键词提示信息:“未找到“火龙头”,请确认是否为“水龙头”?”根据该提示信息,电子设备用户确认已经输入的关键词有误且App1识别的关键词正确,并点击“确认”。响应于用户的确认操作,App1将需要附加口部动作的关键词更新为:“关闭”和“水龙头”。
或者,当用户确认已经输入的关键词有误且App1识别的关键词也不正确,用户可以点击“修改”从而输入正确的需要附加口部动作的关键词。
在又一些实施例中,电子设备用户根据上述提示信息输入关键词:“水龙头”,响应于用户的输入,App1检查并确定文字信息中包含用户输入的关键词,但并无法获取到该关键词对应的口部动作数据,则App1发出提示信息,该提示信息可以为“无法找到您输入的“水龙头”对应的口部动作数据,已经为您后台请求人工服务,请稍后。”。
可选的,App1可以为用户建立与人工客服的视频连接,在建立连接后,人工客服可以为用户展示上述无法获取到的关键词的口部动作。或者,人工客服在后台补充好上述无法获取到的关键词的口部动作数据后供App1调用,App1获取到该口部动作数据后展示给电子设备用户。
在又一些实施例中,电子设备用户根据上述提示信息输入了待翻译的文字信息的全部内容。响应于用户的输入,App1检查到需要附加口部动作数据的关键词较多,App1可以发出提示信息,提示用户:当前需要附加口部动作数据的关键词较多,可以重新输入需要附加口部动作的关键词。
在又一些实施例中,电子设备用户未根据上述提示信息输入任何关键词,App1检测在预设时长内未获取到用户输入的关键词,则App1可以根据识别的用户输入的文字信息的内容,发出提示信息,该提示信息包含推荐附加口部动作的关键词。
在一个实施例中,该推荐附加口部动作的关键词可以根据如表1所示的汉语词汇的词性确定,例如专有名词、时间词等。
在另一个实施例中,该推荐附加口部动作的关键词也可以是根据用户习惯确定,示例性的,用户在App1中翻译查询历史中多次将“约翰”作为关键词附加口部动作,则当App1 获取到用户输入的待翻译数据中同样包含“约翰”,可以将“约翰”作为推荐附加口部动作的关键词。
同样示例性的,用户在为待翻译的文字信息选择附加口部动作的关键词时,多次将一句话中的主语和宾语确定为附加口部动作的关键词,则当App1在预设时长中未获取到用户输入的需要附加口部动作的关键词时,可以将用户输入的待翻译的文字信息中的主语和宾语确定为推荐附加口部动作的关键词。
在又一个实施例中,该推荐附加口部动作的关键词可以根据其他用户的确定方法来确定。示例性的,对于相同的一段视频,80%的用户将“电影院”、“游乐场”确定为需要附加口部动作的关键词,则当用户输入相同的视频,且App1在预设时长中未获取到用户输入的需要附加口部动作的关键词时,App1可以将“电影院”、“游乐场”作为推荐附加口部动作的关键词。
可选的,当用户输入的需附加口部动作数据的关键词只包含“电影院”,App1还可以发出提示信息,提示用户是否为“游乐场”也添加口部动作数据?当电子设备用户确定为“游乐场”添加口部动作数据,响应于用户的操作,App1将“电影院”、“游乐场”作为需要附加口部动作的关键词。
如图5中(c)所示,当App1获取了用户确认的关键词后,App1还会显示提示信息,该提示信息用于提示更新后的关键词。
以上结合图3至图5介绍了本申请提供的汉语翻译方法的文字信息的输入过程,以下结合图6至图11说明本申请实施例提供的汉语翻译方法对应的翻译结果的展示和使用等的过程。
当App1根据用户的输入获取到文字信息对应的手部动作数据和口部动作数据后,App1显示如图6所示的翻译结果界面。
该翻译结果界面可以包括处理提示信息630,该处理提示信息用于提示文字信息的翻译已经完成。可选地,该提示信息还用于提示电子设备用户翻译结果的使用方式。
该翻译结果界面还可以包括整体展示区域611,该整体展示区域用于展示虚拟人物在打手语时的整体情况。可选的,当用户确认需要为一个或多个关键词附加口部动作数据时,该整体展示区域用于展示待翻译的文字信息的手部动作和附加口部动作数据的关键词的口部动作。
该翻译结果界面还可以包括手部动作展示区域613,该手部动作展示区域用于展示用户输入的待翻译的文字信息的手部动作的细节。可选的,该手部动作展示区域可以包括辅助线和/或辅助文字,该辅助线和/或辅助文字用于帮助用户理解手指的动作轨迹等手语细节。
该翻译结果界面还可以包括口部动作展示区域612,该口部动作展示区域用于展示用户请求附加口部动作数据词汇的口部动作或者推荐附加口部动作数据词汇的口部动作。可选的,该口部动作展示区域可以包括辅助线和/或辅助文字,该辅助线和/或辅助文字用于帮助用户理解嘴部动作轨迹等口部动作细节。
该翻译结果界面还可以包括文字状态展示区域614,该文字状态展示区域用于展示当前展示的手部动作和/或口部动作对应的文字。可选的,该文字状态展示区域还包括拼音注解区域,该拼音注解区域用于展示当前展示的手部动作和/或口部动作对应的文字的拼音注解。
在一些实施例中,文字状态展示区域按照手部动作的顺序显示相应的词汇。
这里需要说明的是,手部动作的顺序与听力无障碍人士从左至右的阅读顺序可能并不是相同的。
示例性的,“我没有带手机。”的手语表达顺序为:手机、我、带、没有,因此,如果将“手机”作为需要附加口部动作的关键词,则这句话通过文字状态展示区域可以按照如下形式显示:从左到右依次显示“手机”、“我”、“带”、“没有”。对于“手机”,可以进行高亮或者加粗等突出显示。
在另一些实施例中,文字状态展示区域按照自然口语的顺序显示文字信息,并按照手部动作的顺序突出显示手部动作对应的词汇。
示例性的,在文字状态展示区域的文字的默认色彩为黑色,当前展示的手部动作对应的文字为红色,当前展示口部动作对应的文字为绿色加粗。
同样示例性的,手语“我没有带手机。”的手语表达顺序为:手机、我、带、没有,因此,如果将“手机”作为需要附加口部动作的关键词,则这句话通过文字状态展示区域会按照如下形式显示:“手机”绿色加粗显示,“我”红色显示,“带”红色显示,“没有”红色显示。
在一些实施例中,上述整体展示区域611、口部动作展示区域612、手部动作展示区域613、文字状态展示区域614以及提示信息630组成翻译结果界面。
在另一些实施例中,上述整体展示区域611、口部动作展示区域612、手部动作展示区域613和文字状态展示区域614组成翻译结果界面的翻译结果展示区域610,该翻译结果展示区域610为翻译结果界面的一部分。
可选的,该翻译结果展示区域610还可以包括提示信息630和输入区域620,该输入区域用于展示用户已经输入的待翻译的文字信息、App1发出的输入提示信息、用户已经输入的需要附加口部动作的关键词等。可选的,该电子设备用户还可以在该输入区域中重新输入需要附加口部动作数据的关键词。当用户在输入区域重新输入需要附加口部动作数据的关键词,响应于用户的输入,App1获取用户重新输入的关键词对应的口部动作数据,并在翻译结果展示区域中更新整体展示区域、口部动作展示区域、手部动作展示区域和文字状态展示区域。
示例性的,在用户已经确定文字信息:“我没有带手机。”中的“手机”为需要附加口部动作的词汇后,用户在图6所示的输入区域中重新输入“我”,响应于用户的输入,App1 确定“我”为需要附加口部动作的关键词。
以上结合图6介绍了翻译结果展示界面的基本组成,以下结合图7详细介绍翻译结构展示界面各组件可以具备的功能。
电子设备用户通过单击、双击或长按翻译结果展示区域的空白处触发App1显示翻译结果展示区域的功能选项。
电子设备用户通过单击、双击或长按整体展示区域或口部动作展示区域或手部动作展示区域或文字状态展示区域触发App1显示翻译这些区域具备的功能选项卡。
上述功能选项卡可以包括以下功能中的一项或多项:“全屏查看”、“倍速播放”、“插入到音/视频”、“隐藏”、“保存”或“分享”等。
当电子设备用户选择“全屏查看”功能选项时,响应于用户的操作,App1全屏展示整体展示区域或口部动作展示区域或手部动作展示区域或文字状态展示区域。
当电子设备用户选择“倍速播放”功能选项时,响应于用户的操作,App1显示播放速率调整功能窗,用户可以在该播放速率调整功能窗中选择或输入需要设置的播放速率。在获取用户选择或输入的播放速率后,App1按照对应的速率(慢速或快速)播放整体展示区域或口部动作展示区域或手部动作展示区域或文字状态展示区域中包含的内容。
当电子设备用户选择“插入到音/视频”功能选项时,响应于用户的操作,App1将整体展示区域或口部动作展示区域或手部动作展示区域或文字状态展示区域中的一个或多个插入到对应的音频或视频当中。可选的,当在音频文件中插入上述任一区域后,App1 可以将修改后的音频文件以视频文件的格式保存。
当电子设备用户选择“隐藏”功能选项时,响应于用户的操作,App1隐藏整体展示区域或口部动作展示区域或手部动作展示区域或文字状态展示区域。当用户再次点击已经隐藏的区域时,该区域对应的功能选项中可以包含“显示”功能选项,当用户选择该“显示”功能选项,响应于用户的操作,App1显示已经隐藏的区域。
这里需要说明的是,对于待翻译的文字信息中不包含口部动作,或者用户选择不为任何关键词附加口部动作,则口部动作展示区域可以默认隐藏。
当电子设备用户选择“保存”功能选项时,响应于用户的操作,App1保存用户选择的区域对应的数据。可选的,响应于用户的操作,App1还可以显示保存提示窗,该保存提示窗用于提示用户是否同时保存其他相关区域对应的数据,该保存提示窗还用于获取用户的指示信息。示例性的,当用户选择同时保存其他相关区域对应的数据,响应于用户的操作,App1将用户选择区域对应的数据以及相关区域对应的数据都保存到电子设备本地。
示例性的,当用户在整体展示区域选择“保存”功能选项时,App1显示提示信息:“是否同时保存口部动作展示区域、手部动作展示区域和文字状态展示区域的数据?”当用户选择保存口部动作展示区域时,响应于用户的选择,App1同时保存整体展示区域和口部动作展示区域对应的数据。
当电子设备选择“分享”功能选项时,响应于用户的操作,App1显示分享功能控件,该分享功能控件包括一个或多个分享途径。终端用户可以选择一种或多种分享途径,响应于用户的选择,App1通过用户选择的一种或多种分享途径分享用户选择的区域对应的数据。
可选的,当电子设备选择“分享”功能选项时,响应于用户的操作,App1还可以显示分享提示窗,该分享提示窗用于提示用户是否同时分享其他相关区域对应的数据,该分享提示窗还用于获取用户的指示信息。示例性的,当用户选择同时分享其他相关区域对应的数据,响应于用户的操作,App1将用户选择区域对应的数据以及相关区域对应的数据都作为待分享数据。
示例性的,当用户在整体展示区域选择“分享”功能选项时,App1显示提示信息:“是否同时分享口部动作展示区域、手部动作展示区域和文字状态展示区域的数据?”当用户选择分享口部动作展示区域时,响应于用户的选择,App1同时分享整体展示区域和口部动作展示区域对应的数据。
对于保存到电子设备本地的不同展示区域对应的数据,电子设备用户可以再次打开查看、分享和编辑等。
图8所示为资源库的界面,该资源库用于按照一定的规则分类、排列并展示保存到电子设备本地的不同展示区域对应的数据,上述规则包括分类规则和排列规则。
其中,分类规则可以包括以下规则中的任一种:区域(整体展示区域、口部动作展示区域或手部动作展示区域等)、时间(保存到电子设备本地的时间,例如:今天、昨天、一周前等)或来源(例如:来源于当前电子设备、来源于相同账户的电子设备或来源于家庭电子设备等)等。
排序规则可以包括以下规则中的任一种:时间(例如时间由远至近或由近至远)、数据中包含的文字信息先后(例如:文字信息首字母字母表顺序)或附加口部动作关键词的先后顺序(关键词第一个词的笔画先后顺序)。
电子设备用户可以选择资源库的“分类方式”功能选项801为保存在本地的数据设置不同的分类方式。电子设备用户也可以选择资源库的“排列方式”功能选项802为保存在本地的数据设置不同的排列方式。
在一些实施例中,资源库还包括搜索框805,电子设备用户可以在该搜索框中输入字、词、时间、区域、来源等内容来快速查找相应的数据。
在另一些实施例中,资源库还包括“回收站”功能选项803,电子设备用户可以选择该“回收站”功能选项,以查看已经存入“回收站”的数据。该“回收站”用于存储暂时存储用户删除的数据,在预设时长后未被用户恢复的数据或者用户在“回收站”中确认删除的数据,App1会将其从电子设备的存储介质上擦除。
在又一些实施例中,资源库还包括“分享”功能选项804,电子设备用户可以选择该“分享”功能选项,以分享资源库中的一个或多个数据。
当电子设备用户在资源库中选择任一数据打开,响应于用户的操作,电子设备可以显示如图9所示的播放界面。
与图6中所示的翻译结果展示区域610类似,根据打开数据类型的不同,该播放界面可以包括整体展示区域、口部动作展示区域、手部动作展示区域和文字状态展示区域中的一种或多种,这些区域中也可以打开如图6中所示的区域对应的选项功能,详细的选项功能的触发方式以及具体的功能可以参考图6中相关的描述,为避免重复,此处不再赘述。
在一些实施例中,该播放界面可以包括播放功能控件901,该播放功能控件可以控制数据播放的开始与停止,该播放功能控件还可以查看当前数据播放的进度。
可选的,该播放功能控件还可以包含附加口部动作数据关键词的提示控件902,电子设备用户可以通过选择(例如点击)该提示控件以直接查看关键词的口部动作。
在一些实施例中,该播放界面可以包括“分享”功能选项903,电子设备用户可以选择“分享”功能选项,对播放界面的正在播放的数据中的一种或多种进行分享。
以下结合图10详细介绍翻译数据的分享过程,需要说明的是,该分享过程可以通过如图6中的分享功能触发,也可以通过如图8中资源库的界面中的分享功能触发,或者也可以通过图9中播放界面的分享功能触发,或者还可以通过其他方式触发,本申请对此不做限制。
如图10所示为分享界面,该分享界面包括分享选择提示信息1001、分享数据预览区域1002和分享途径选择窗1003。
分享选择提示信息1001用于提示当前已经选择的待分享的数据的信息,该分享选择提示信息可以包括待分享数据的数量,该分享选择提示信息还可以包括待分享数据中包含的种类。
示例性的,当电子设备用户选择3个手部动作展示区域对应的数据、4个口部动作展示区域对应的数据和4个口部动作展示区域对应的数据,该分享选择提示信息可以显示:已选择11项,包含:手部动作展示区域对应的数据(手动)、口部动作展示区域对应的数据(口动)、文字状态展示区域对应的数据(文字)。
分享数据预览区域1002用于展示待分享的数据。示例性的,当电子设备用户选择分享整体展示区域的数据时,分享数据预览区域可以显示分享整体展示区域的某一帧画面用于预览该整体展示区域的数据。
可选的,该分享数据预览区域还可以包括功能复选框1004,电子设备用户可以通过点击该功能复选框来选择待分享数据或取消选择待分享数据。
分享途径选择窗1003用于展示可用的一种或多种分享途径,该分享途径窗还用于获取电子设备用户选择的一种或多种分享途径。示例性的,如图10中所示,上述一种或多种分享途径可以包括:蓝牙分享、上传到云盘或通过邮件发送等。
上述结合图3至图10详细以App1为例介绍了本申请实施例提供的翻译方法,上述描述的App1的一种或多种功能可以通过App1的设置功能选项开启或关闭。以下结合图11说明App1的设置功能。
该设置功能选项中可以包含“关键词自动识别、转换”功能选项,电子设备用户可以通过该功能选项开启或关闭输入过程中App1对输入的文本、视频、音频数据中的关键词,该关键词指需要附加口部动作数据的关键词。
该设置功能选项中还可以包含“关键词自动纠正”功能选项,电子设备用户可以通过该功能选项开启或关闭输入过程中App1对输入过程中用户输入的关键词存在错误的情况进行提示和/或自动纠正。
该设置功能选项中还可以包含“翻译加速功能”功能选项,电子设备用户可以通过该功能选项来开启提高文字信息翻译的效率的功能,详细如何提高文字信息翻译的效率的方式在下文实施例中介绍。
该设置功能选项中还可以包含“结果展示内容”功能选项,电子设备用户可以通过该功能选项来选择在翻译结果展示界面需要展示的内容。示例性的,电子设备用户在该功能选项中选择“手部动作”和“口部动作”,则在图6所示的界面中,整体展示区域和文字状态展示区域默认不显示,手部动作展示区域和口部动作展示区域默认显示。
该设置功能选项中还可以包含“资源库默认分类方式”功能选项,电子设备用户可以通过该功能选项来选择用户保存到电子设备本地的不同数据在资源库中的默认分类方式。
该设置功能选项中还可以包含“资源库默认排序方式”功能选项,电子设备用户可以通过该功能选项来选择用户保存到电子设备本地的不同数据在资源库中的默认排序方式。
以上以电子设备用户的角度说明了本申请实施例提供的汉语翻译方法,以下结合图 12说明本申请实施例提供的汉语翻译方法,电子设备内部的实现流程。
S1201,电子设备获取待翻译的文字信息。
该待翻译的文字信息可以是电子设备用户直接向电子设备输入的,也可以是电子设备根据用户输入的文本、图片、音频或视频等数据识别得到的。具体获取待翻译的文字信息的方法可以参考图3至图5中的相关描述。
在一些实施例中,电子设备还获取了需要附加口部动作数据的关键词。
S1202,电子设备向服务器发送翻译请求,相应的,服务器接收该翻译请求。
该翻译请求用于请求获取待翻译的文字信息对应的手部动作数据。当S1201中电子设备还获取了需要附加口部动作数据的关键词,该翻译请求还用于请求获取该关键词对应的口部动作数据。
在一些实施例中,该翻译请求用于请求获取需要附加口部动作数据的关键词对应的口部动作数据。
S1203,服务器发送手部动作数据和/或口部动作数据,相应的,电子设备接收该手部动作数据和/或口部动作数据。
服务器根据S1202中接收的翻译请求消息的内容确定向电子设备发送手部动作数据和/或口部动作数据。
可选的,在向电子设备发送上述手部动作数据和/或口部动作数据前,服务器首先对电子设备请求翻译的文字信息进行文本风控检查,该文本风控检查用于检查待翻译的文字信息是否包含敏感信息,以起到过滤不良文本信息的作用。
在一些实施例中,服务器确定待翻译的文字信息通过文本风控检查后直接向电子设备发送上述手部动作数据和/或口部动作数据。
在另一些实施例中,服务器确定待翻译的文字信息通过文本风控检查后,向电子设备发送指示信息,该指示信息用于指示待翻译的文字信息通过文本风控检查。电子设备在接收该指示信息后,向服务器发送通过文本风控检查的文字对应的文字转手语请求,在接收该文字转手语请求后,服务器向电子设备发送上述手部动作数据和/或口部动作数据。
在又一些实施例中,服务器确定待翻译的文字信息未通过文本风控检查,则服务器向电子设备发送指示信息,该指示信息用于指示待翻译的文字信息未通过文本风控检查。
服务器可以从手部动作数据库中确定与待翻译的文字信息对应的手部动作数据,并将该手部动作数据发送至电子设备。
类似的,服务器也可以从口部动作数据库中确定与关键词对应的口部动作数据,并将该口部动作数据发送至电子设备。
在一些实施例中,服务器包括词性标注模块和口部动作数据库,该词性标注模块用于对从电子设备接受的文字信息中的各个词汇标注词性标签,词性标签的具体含义如表1所示。口部动作数据库用于保存汉语拼音的口型对应的混合形状数值,该混合形状数值可以用于显示关键词对应的口部动作。
具体的,首先由录像设备录制模特人脸单个拼音口型视频,比如拼音口型“wu”,录制后每一帧的混合形状数值保存到口部动作数据库中。
表2所示为口部动作数据库建立过程中需要录制口型视频的汉语拼音,不同的汉字的口部动作是根据其对应的汉语拼音确定的。通过录制不同的汉语拼音对应的口型视频,再将口型视频转换为可以驱动虚拟人物口部动作的数据。在获取需要附加口部动作数据的关键词时,服务器可以调用口型生成算法获取关键词对应的汉语拼音发音的口型视频转换得到的数据,并将该数据发送给电子设备,从而电子设备可以利用获取的该数据驱动虚拟人物做出相应的口部动作。
表2汉语拼音
在一些实施例中,服务器将上述口部动作数据和手部动作数据一起发送至电子设备。
在另一些实施例中,服务器根据手部动作的先后顺序,分片依次发送不同时间帧的手部动作数据。
在又一些实施例中,服务器根据口部动作的先后顺序,分片依次发送不同时间帧的口部动作数据。
在又一些实施例中,手部动作数据语口部动作数据具备相同的时间戳,服务器根据手部动作或口部动作的先后顺序,分片发送不同时间帧的手部动作数据和口部动作数据。
S1204,驱动虚拟人物。
电子设备根据在S1203中接收的手部动作数据和/或口部动作数据,驱动虚拟人物模型展示待翻译文字对应的手部动作和/或关键词的口部动作。
在获取文字信息对应的翻译结果后,电子设备用户可以保存、分享、编辑和设置翻译结果,详细的执行过程可以参考图6至图11中的相关描述,为了简洁,此处不再赘述。
基于相同的发明构思,如图13所示,本申请实施例还提供一种汉语翻译装置1300,该汉语翻译装置1300包括获取单元1310和处理单元1320,该获取单元用于获取如图3 至图11所示实施例中电子设备用户输入的信息,该处理单元用于执行如图3至图11所示的实施例中电子设备执行的处理操作,如根据用户输入的文字信息获取相应的手部动作数据等。
可选的,该汉语翻译装置还可以包括通信单元1330,该通信单元用于执行如图3至图11所示的实施例中电子设备执行的与服务器的通信和数据传输操作等。
如图14所示,本申请实施例还提供另一种汉语翻译装置1400,该汉语翻译装置1400 包括处理单元1410和通信单元1420,该处理单元用于执行对电子设备发送的待翻译的文字信息的文本风控操作检查等,该通信单元用于执行如图3至图11所示的实施例中服务器与电子设备执行的通信和数据传输操作等。
可选的,该汉语翻译装置还可以包括存储单元1430,该存储单元用于存储一个或多个计算机程序、手部动作数据和口部动作数据等。
如图15所示,本申请实施例还提供一种电子设备1500,该电子设备包括处理器1510 和存储器1520,该处理器用于执行如图3至图11所示的实施例中电子设备执行的处理操作,如根据用户输入的文字信息获取相应的手部动作数据等,该存储器上存储有一个或多个计算机程序,该一个或多个计算机程序包括指令,当该指令被一个或多个处理器执行时,使得如前文中任一种汉语翻译方法被执行。
如图16所示,本申请实施例还提供一种服务器1600,该服务器包括处理器1610和存储器1620,该处理器用于执行对电子设备发送的待翻译的文字信息的文本风控操作等,该存储器存储有一个或多个计算机程序、手部动作数据和口部动作数据等,该一个或多个计算机程序包括指令,当该指令被一个或多个处理器执行时,使得如前文中任一种汉语翻译方法被执行。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序代码,当计算机程序代码在计算机上运行时,使得计算机实现如图3至图12所示的实施例中的方法。
本申请实施例还提供一种计算机可读存储介质,该计算机可读介质存储有计算机指令,当计算机指令在计算机上运行时,使得计算机实现如图3至图12所示的实施例中的方法。
本申请实施例还提供一种芯片,包括处理器,用于读取存储器中存储的指令,当该处理器执行该指令时,使得该芯片实现如图3至图12所示的实施例中的方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (18)

1.一种汉语翻译的方法,其特征在于,包括:
响应于用户的输入,电子设备获取文字信息,所述文字信息包括关键词;
所述电子设备显示所述文字信息对应的手部动作;
所述电子设备显示关键词对应的口部动作。
2.根据权利要求1所述的方法,其特征在于,所述关键词根据手语使用者的语言习惯确定。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:所述电子设备不显示普通词汇对应的口部动作,所述文字信息包括所述普通词汇,所述普通词汇与所述关键词不同。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述电子设备显示关键词对应的口部动作,包括:
所述电子设备在显示所述关键词对应的手部动作的同时显示所述口部动作。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述关键词为专有名词。
6.根据权利要求1至5中任一项所述的方法,其特征在于,在显示所述关键词对应的口部动作前,所述方法还包括:
所述电子设备显示第一词汇,所述文字信息包括所述第一词汇,所述第一词汇为推荐附加口部动作的词汇;
响应于用户的确认操作,所述电子设备确定所述第一词汇为所述关键词。
7.根据权利要求1至6中任一项所述的方法,其特征在于,在显示所述关键词对应的口部手部动作前,所述方法还包括:
响应于用户的第一输入,所述电子设备获取第二词汇,所述第二词汇为用户请求附加口部动作的词汇;
在所述文字信息包含所述第二词汇的情况下,所述电子设备确定所述第二词汇为所述关键词;
在所述文字信息不包含所述第二词汇的情况下,所述电子设备显示更新请求信息,所述更新请求信息用于提示所述文字信息不包含所述第二词汇;
响应于用户的第二输入,所述电子设备获取更新后的第二词汇。
8.根据权利要求6所述的方法,其特征在于,所述第一词汇根据用户的翻译历史确定,所述翻译历史包含用户输入的第二词汇,所述第二词汇为用户请求附加口部动作的词汇。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述口部动作根据所述关键词的汉语拼音的发音口型确定。
10.根据权利要求9所述的方法,其特征在于,所述发音口型对应的混合形状数值保存在口部动作数据库中。
11.根据权利要求1至10中任一项所述的方法,其特征在于,所述手部动作包括第一手部动作和第二手部动作,所述第一手部动作在所述第二手部动作之前,所述电子设备显示所述文字信息对应的手部动作,包括:
所述电子设备从服务器接收第一手部动作数据,所述第一手部动作数据用于显示所述第一手部动作;
在显示所述第一手部动作的同时所述电子设备从所述服务器接收第二手部动作数据,所述第二手部动作数据用于显示所述第二手部动作。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述口部动作包括第一口部动作和第二口部动作,所述第一口部动作在所述第二口部动作之前,所述电子设备显示关键词对应的口部动作,包括:
所述电子设备从服务器接收第一口部动作数据,所述第一口部动作数据用于显示所述第一口部动作;
在显示所述第一口部动作的同时所述电子设备从所述服务器接收第二口部动作数据,所述第二口部动作数据用于显示所述第二口部动作。
13.根据权利要求1至12中任一项所述的方法,其特征在于,在显示所述文字信息对应的手部动作前,所述方法还包括:
所述电子设备从服务器接收响应消息,所述响应消息用于指示所述文字信息不包含敏感信息。
14.一种电子设备,其特征在于,包括处理器和存储器,所述存储器用户存储程序指令,所述处理器用于调用所述程序指令来执行权利要求1至13中任一项所述的方法。
15.一种汉语翻译装置,其特征在于,包括用于实现权利要求1至13中任一项所述的方法的模块。
16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,权利要求1至13中任一项所述的方法被执行。
17.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被计算机执行时,以使得实现权利要求1至13中任一项所述的方法。
18.一种芯片产品,其特征在于,包括:处理器,用于读取存储器中存储的指令,当所述处理器执行所述指令时,使得所述芯片实现权利要求1至13中任一项所述的方法。
CN202210396448.4A 2022-04-15 2022-04-15 汉语翻译的方法和电子设备 Pending CN116932706A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210396448.4A CN116932706A (zh) 2022-04-15 2022-04-15 汉语翻译的方法和电子设备
PCT/CN2023/086870 WO2023197949A1 (zh) 2022-04-15 2023-04-07 汉语翻译的方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210396448.4A CN116932706A (zh) 2022-04-15 2022-04-15 汉语翻译的方法和电子设备

Publications (1)

Publication Number Publication Date
CN116932706A true CN116932706A (zh) 2023-10-24

Family

ID=88329034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210396448.4A Pending CN116932706A (zh) 2022-04-15 2022-04-15 汉语翻译的方法和电子设备

Country Status (2)

Country Link
CN (1) CN116932706A (zh)
WO (1) WO2023197949A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021196645A1 (zh) * 2020-03-31 2021-10-07 北京市商汤科技开发有限公司 交互对象的驱动方法、装置、设备以及存储介质
CN113496168A (zh) * 2020-04-02 2021-10-12 百度在线网络技术(北京)有限公司 手语数据采集方法、设备、存储介质
CN113835522A (zh) * 2021-09-10 2021-12-24 阿里巴巴达摩院(杭州)科技有限公司 手语视频生成、翻译、客服方法、设备和可读介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11308450B2 (en) * 2018-04-27 2022-04-19 Microsoft Technology Licensing, Llc Generating personalized smart responses
CN112287690B (zh) * 2020-10-29 2024-11-26 中国科学技术大学 基于条件句子生成和跨模态重排的手语翻译方法
CN113657101B (zh) * 2021-07-20 2024-11-26 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN113971837B (zh) * 2021-10-27 2024-08-20 厦门大学 一种基于知识的多模态特征融合的动态图神经手语翻译方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021196645A1 (zh) * 2020-03-31 2021-10-07 北京市商汤科技开发有限公司 交互对象的驱动方法、装置、设备以及存储介质
CN113496168A (zh) * 2020-04-02 2021-10-12 百度在线网络技术(北京)有限公司 手语数据采集方法、设备、存储介质
CN113835522A (zh) * 2021-09-10 2021-12-24 阿里巴巴达摩院(杭州)科技有限公司 手语视频生成、翻译、客服方法、设备和可读介质

Also Published As

Publication number Publication date
WO2023197949A1 (zh) 2023-10-19

Similar Documents

Publication Publication Date Title
CN110111787B (zh) 一种语义解析方法及服务器
EP3905246A1 (en) Song recording method, sound correction method and electronic device
CN114694646B (zh) 一种语音交互处理方法及相关装置
US11893359B2 (en) Speech translation method and terminal when translated speech of two users are obtained at the same time
CN114691839B (zh) 一种意图槽位识别方法
CN111881315A (zh) 图像信息输入方法、电子设备及计算机可读存储介质
CN113806473A (zh) 意图识别方法和电子设备
WO2020119455A1 (zh) 视频播放过程实现单词或语句复读的方法及电子设备
CN112416984B (zh) 一种数据处理方法及其装置
WO2024082914A1 (zh) 视频问答方法及电子设备
CN116193275B (zh) 视频处理方法及相关设备
CN114528842B (zh) 一种词向量构建方法、装置、设备及计算机可读存储介质
CN114093368A (zh) 跨设备声纹注册方法、电子设备及存储介质
CN114664306B (zh) 一种编辑文本的方法、电子设备和系统
CN116052648A (zh) 一种语音识别模型的训练方法、使用方法及训练系统
CN116861066A (zh) 应用推荐方法和电子设备
CN113380240A (zh) 语音交互方法和电子设备
CN115966198B (zh) 音频的处理方法及装置
WO2023236908A1 (zh) 图像描述方法、电子设备及计算机可读存储介质
CN116932706A (zh) 汉语翻译的方法和电子设备
CN119179412A (zh) 交互方法及电子设备
CN116301510A (zh) 一种控件定位方法及电子设备
CN113470638B (zh) 槽位填充的方法、芯片、电子设备和可读存储介质
CN115841099B (zh) 基于数据处理的页面填充词的智能推荐方法
EP4401001A1 (en) Language translation method and electronic device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20231024

RJ01 Rejection of invention patent application after publication