[go: up one dir, main page]

CN116304126A - 跨越自然语言的媒体搜索方法、装置、设备和介质 - Google Patents

跨越自然语言的媒体搜索方法、装置、设备和介质 Download PDF

Info

Publication number
CN116304126A
CN116304126A CN202310266118.8A CN202310266118A CN116304126A CN 116304126 A CN116304126 A CN 116304126A CN 202310266118 A CN202310266118 A CN 202310266118A CN 116304126 A CN116304126 A CN 116304126A
Authority
CN
China
Prior art keywords
data
language
user
application
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310266118.8A
Other languages
English (en)
Inventor
宋佳
刘思宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202310266118.8A priority Critical patent/CN116304126A/zh
Publication of CN116304126A publication Critical patent/CN116304126A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

提供了跨越自然语言的媒体搜索方法、装置、设备和介质。在一种方法中,基于用户在应用中输入的关键字,在应用的媒体存储库中搜索与关键词相匹配的媒体数据,媒体数据中的第一语言数据是由第一自然语言所表示的。基于用户与应用相关联的历史交互中所涉及的自然语言,确定用户理解的第二自然语言。响应于确定第一自然语言不同于第二自然语言,将第一语言数据翻译为由第二自然语言表示的第二语言数据。在应用中呈现媒体数据以及第二语言数据。利用本公开的示例性实现方式,以此方式,可以提高用户的搜索效率并且提高用户获取信息的效率。

Description

跨越自然语言的媒体搜索方法、装置、设备和介质
技术领域
本公开的示例性实现方式总体涉及数据搜索,特别地涉及跨越自然语言的媒体搜索方法、装置、设备和计算机可读存储介质。
背景技术
数据搜索技术已经被广泛应用于多种类型的应用。例如,在媒体应用中可以基于用户输入的关键字来搜索相匹配的媒体数据。随着国际化的发展,某些应用的用户范围已经跨越了不同国家和地区,并且这些用户通常使用不同的自然语言(例如,中文、英语、法语,等等)。这要求应用可以提供多种自然语言的处理能力。此时,如何以更为有效并且用户友好的方式来向用户提供数据搜索服务,成为跨语言应用程序开发的难点和热点。
发明内容
在本公开的第一方面,提供了一种跨越自然语言的媒体搜索方法。在该方法中,基于用户在应用中输入的关键字,在应用的媒体存储库中搜索与关键词相匹配的媒体数据,媒体数据中的第一语言数据是由第一自然语言所表示的。基于用户与应用相关联的历史交互中所涉及的自然语言,确定用户理解的第二自然语言。响应于确定第一自然语言不同于第二自然语言,将第一语言数据翻译为由第二自然语言表示的第二语言数据。在应用中呈现媒体数据以及第二语言数据。
在本公开的第二方面,提供了一种跨越自然语言的媒体搜索装置。该装置包括:搜索模块,被配置用于基于用户在应用中输入的关键字,在应用的媒体存储库中搜索与关键词相匹配的媒体数据,媒体数据中的第一语言数据是由第一自然语言所表示的;确定模块,被配置用于基于用户与应用相关联的历史交互中所涉及的自然语言,确定用户理解的第二自然语言;翻译模块,被配置用于响应于确定第一自然语言不同于第二自然语言,将第一语言数据翻译为由第二自然语言表示的第二语言数据;以及呈现模块,被配置用于在应用中呈现媒体数据以及第二语言数据。
在本公开的第三方面,提供了一种电子设备。该电子设备包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使电子设备执行根据本公开第一方面的方法。
在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时使处理器实现根据本公开第一方面的方法。
应当理解,本内容部分中所描述的内容并非旨在限定本公开的实现方式的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
附图说明
在下文中,结合附图并参考以下详细说明,本公开各实现方式的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了根据本公开的一个示例性实现方式的应用环境的框图;
图2示出了根据本公开的一些实现方式的跨越自然语言的媒体搜索的框图;
图3示出了根据本公开的一些实现方式的媒体数据中的语言数据的框图;
图4示出了根据本公开的一些实现方式的基于历史交互来确定第二自然语言的框图;
图5A示出了根据本公开的一些实现方式的用于在应用中执行语言设置的界面的框图;
图5B示出了根据本公开的一些实现方式的用于在操作系统中执行语言设置的界面的框图;
图6示出了根据本公开的一些实现方式的用于选择翻译目标语言的界面的框图;
图7示出了根据本公开的一些实现方式的搜索结果页面的框图;
图8示出了根据本公开的一些实现方式的播放页面的框图;
图9示出了根据本公开的一些实现方式的跨越自然语言的媒体搜索方法的流程图;
图10示出了根据本公开的一些实现方式的跨越自然语言的媒体搜索装置的框图;以及
图11示出了能够实施本公开的多个实现方式的设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实现方式。虽然附图中示出了本公开的某些实现方式,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实现方式,相反,提供这些实现方式是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实现方式仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实现方式的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实现方式”或“该实现方式”应当理解为“至少一个实现方式”。术语“一些实现方式”应当理解为“至少一些实现方式”。下文还可能包括其他明确的和隐含的定义。如本文中所使用的,术语“模型”可以表示各个数据之间的关联关系。例如,可以基于目前已知的和/或将在未来开发的多种技术方案来获取上述关联关系。
可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当根据相关法律法规通过适当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限制性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式,例如可以是弹出窗口的方式,弹出窗口中可以以文字的方式呈现提示信息。此外,弹出窗口中还可以承载供用户选择“同意”或“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其他满足相关法律法规的方式也可应用于本公开的实现方式中。
在此使用的术语“响应于”表示相应的事件发生或者条件得以满足的状态。将会理解,响应于该事件或者条件而被执行的后续动作的执行时机,与该事件发生或者条件成立的时间,二者之间未必是强关联的。例如,在某些情况下,后续动作可在事件发生或者条件成立时立即被执行;而在另一些情况下,后续动作可在事件发生或者条件成立后经过一段时间才被执行。
示例环境
数据搜索技术已经被广泛应用于多种类型的应用。例如,在媒体应用中可以基于用户输入的关键字来搜索相匹配的媒体数据。参见图1描述根据本公开的一个示例性实现方式的应用环境,该图1示出了根据本公开的一个示例性实现方式的应用环境的框图100。在多语言的应用环境下,应用110可以支持多种自然语言。换言之,用户可以使用不同自然语言来在应用110中发布媒体数据、执行搜索、评论、转发、或者与其他用户沟通,等等。应用110可以提供由不同自然语言表示的用户界面,并且用户发布的媒体数据也可以涉及不同的自然语言,等等。
如图1所示,在应用110中可以利用某个自然语言来输入关键字(例如,“咖啡制作”),以便在应用110的媒体存储库中搜索匹配于该关键字的媒体数据。此时,找到的媒体数据可以由与关键字所使用的自然语言相同或者不同的语言来表示。在图1的示例中,用户可以利用中文来输入关键字“咖啡制作”,并且执行搜索。在返回的搜索结果中可以包括由中文表示的媒体数据,还可以包括利用其他自然语言表示的媒体数据。例如,媒体数据120可以由英语来表示,并且媒体数据130可以由法语来表示,等等。
在国际化环境下,搜索结果可能会涉及利用用户不能理解的自然语言制作的视频数据,这导致较差的用户体验。此外,对于某些小语种用户而言,在媒体存储库中可能仅包括极少数量(甚至不包括)的以该小语种制作的视频,这造成搜索结果难以满足用户要求。此时,如何以更为有效并且用户友好的方式来向用户提供数据搜索服务,成为跨语言应用程序开发的难点和热点。
跨语言媒体搜索的概要
在本公开的上下文中,将以视频作为媒体数据的示例描述跨语言搜索的细节。将会理解,在此的视频仅仅是媒体数据的示例,备选地和/或附加地,媒体数据可以包括其他格式的数据。例如,在音频应用中,媒体数据可以涉及音频数据;在图像应用中,媒体数据可以包括图像数据;并且在新闻应用中,媒体数据可以包括组合多种数据格式的多媒体数据,例如,可以在新闻文本中插入视频、音频、图片等多种数据格式。
为了至少部分地解决现有技术中的不足,根据本公开的一个示例性实现方式,提出了一种跨越自然语言的媒体搜索方法。参见图2描述根据本公开的一个示例性实现方式的概要,该图2示出了根据本公开的一些实现方式的跨越自然语言的媒体搜索的框图200。如图2所示,用户230可以向应用110中输入关键字,并且可以在应用110的媒体存储库中搜索与该关键词相匹配的媒体数据。在此,媒体数据可以包括一个或多个语言数据,并且该语言数据可以是由第一自然语言210所表示的。例如,图2所示的媒体数据120的标题是利用英语来表示的,并且媒体数据130的标题是利用法语来表示的。
进一步,为了以用户230能够理解的方式来呈现搜索结果,可以基于用户230与应用110相关联的历史交互240中所涉及的自然语言,确定用户230能够理解的第二自然语言。将会理解,在此的历史交互240可以涉及多种类型。例如,历史交互240可以涉及用户230在应用110中设置翻译目标语言,此时可以直接将该翻译目标语言作为第二自然语言220。又例如,历史交互240可以涉及用户230在应用110中发布信息,假设用户110一直使用中文来发布信息,则可以将中文作为第二自然语言220,等等。
进一步,可以确定找到的媒体数据所使用的第一自然语言210与用户230熟悉的第二自然语言220是否相同。如果两者不同,则可以将媒体数据中的由第一自然语言210表示的语言数据翻译为由第二自然语言220表示的语言数据。继而,可以在应用110中呈现媒体数据以及翻译后的语言数据。为了便于描述,可以将由第一自然语言210表示的语言数据称为第一语言数据,并且可以将由第二自然语言220表示的语言数据称为第二语言数据。
利用本公开的示例性实现方式,无论用户230以何种自然语言输入关键字,并且无论在媒体存储库中检索到以何种自然语言表示的媒体数据,都可以按照用户230可以理解的自然语言来向该用户230呈现搜索结果。以此方式,一方面可以提高用户理解搜索结果的能力,另一方面可以扩大搜索范围进而向用户230提供匹配于搜索关键字的更为丰富的搜索结果。尤其是对于小语种用户而言,除了可以在利用该小语种表示的媒体存储库中执行搜索,还可以在通用语言(例如,英语、法语,等等)的相关媒体存储库中执行搜索。以此方式,可以大大提高用户获取媒体数据的效率,进而改善用户体验。
跨语言媒体搜索的详细过程
已经描述了跨语言媒体搜索的概要,在下文中将参见图3至图8描述根据本公开的一个示例性实现方式的更多细节。根据本公开的一个示例性实现方式,媒体数据120中的以第一自然语言210表示的语言数据可以包括多种类型。图3示出了根据本公开的一些实现方式的媒体数据中的语言数据的框图300。如图3所示,在此的媒体数据120可以是视频数据,并且该视频数据中的语言数据可以包括以下至少任一项:声音数据、图像数据、标题数据、字幕数据、评论数据、弹幕数据。
如图3所示,声音数据310可以涉及视频中的利用第一自然语言210表示的话语,例如,人物独白、人物对话、旁白、以及背景音乐中的歌词,等等。字幕数据360可以对应于视频中的声音数据310,也即该声音数据310的文本表示。图像数据320可以涉及视频中的画面中的文字,例如,图3所示的咖啡杯上的文字“coffee”,以及画面中的其他文字,例如,标语、海报,等等。标题数据330可以涉及视频标题中的文字,例如,正标题和/或副标题中的文字。评论数据340可以涉及在该条视频下的评论信息,例如,一个或多个针对该视频的评论,等等。弹幕数据350可以涉及一个或多个用户针对该视频发布的弹幕。
根据本公开的一个示例性实现方式,可以基于目前已知的和/或将在未来开发的多种技术来从媒体数据120中提取多种类型的语言数据。例如,可以基于语音识别技术来获取声音数据310的文本表示,可以基于光学字符识别(OCR)技术来提取图像数据320的文本表示,等等。
将会理解,尽管图3示出了以单一语言(例如,英语)来表示多种类型的语言数据的情况,备选地和/或附加地,多种类型的语言数据可以涉及不同的语言。例如,声音数据310可以以英语表示,并且评论数据340可以包括以中文和英语发布的评论,等等。利用本公开的示例性实现方式,可以识别媒体数据120中的多种类型的语言数据,进而向用户提供多个方面的翻译数据。以此方式,可以使得用户230更加易于理解搜索结果中的多方面信息,进而获得更加匹配于输入关键字的搜索结果。
根据本公开的一个示例性实现方式,可以向发布媒体数据的作者提供有关翻译功能的提示信息,如果该作者允许自己发布的媒体数据中的语言数据被翻译为发布语言以外的其他语言,则可以获取媒体数据进而执行相应的翻译操作。如果该作者不允许应用110翻译自己发布的媒体数据,则可以禁用翻译功能。根据本公开的一个示例性实现方式,可以在应用110的设置页面中提供是否支持翻译功能的提示信息,也可以在作者发布某个媒体数据期间提供提示信息。以此方式,可以在确保作者对于自己发布媒体数据的权利的情况下,便于应用110的其他用户获取具有更好可读性的搜索结果。
根据本公开的一个示例性实现方式,可以基于用户230与应用110的历史交互240相关的自然语言来确定用户230可以理解的第二自然语言220。图4示出了根据本公开的一些实现方式的基于历史交互来确定第二自然语言的框图400。将会理解,历史交互240可以包括多个类型,例如包括但不限于:用户在应用中设置翻译操作的目标语言;用户在应用中设置用于呈现应用的应用语言;用户在用于运行应用的操作系统中设置系统语言;用户在用于运行应用的操作系统中设置首选语言顺序;用户在用于运行应用的操作系统中设置地区;用户在应用中执行发布;用户在应用中执行评论;用户在应用中执行转发;用户在应用中与应用的其他用户执行沟通;用户在应用中执行搜索,等等。
此时,基于不同类型的历史交互240,所涉及的自然语言可以包括如图4所示的目标语言420、应用语言421、系统语言422、发布语言423、评论语言424、转发语言425、沟通语言426以及搜索语言427,等等。在下文中将具体描述与不同类型的历史交互240所涉及的自然语言的具体示例。
根据本公开的一个示例性实现方式,在应用110中可以提供用于设置各种语言的页面。具体地,图5A示出了根据本公开的一些实现方式的用于在应用110中执行语言设置的界面的框图500A。如图5A所示,用户230可以在应用110的中选择语言设置菜单,以便呈现语言设置页面510。在语言设置页面510中,可以提供用于设置应用语言的选择框512。在此应用语言可以表示在应用110中设置用于呈现应用的应用界面的语言。如图5A所示,当用户230在选择框512中选择“English(英语)”之后,则应用110中的界面(例如,菜单、按钮、对话框,等等)将以英语呈现。备选地和/或附加地,语言设置页面510可以提供用于设置翻译操作的目标语言的选择框516。在此,目标语言可以表示用户期望将搜索到的媒体数据中的语言数据翻译为哪种语言。
用户230可以在上述界面中设置相应的语言,并且可以将设置的语言来作为翻译操作的目标语言。如图所示,当用户230在选择框516中选择“中文”之后,搜索结果中的媒体数据中的语言数据将被翻译成中文,并且以中文形式与媒体数据一起呈现。备选地和/或附加地,假设用户230没有设置目标语言(也即,选择框516为“空”),则可以将选择框512中的应用语言作为翻译操作的目标语言。
根据本公开的一个示例性实现方式,语言设置页面510可以进一步包括指示用户230是否期望启动翻译功能的选择框514。如果确定用户230已经启动翻译功能(也即,选择框514被设置为“开”),则可以将媒体数据中以第一自然语言210表示的语言数据翻译为以第二自然语言220表示的语言数据。根据本公开的一个示例性实现方式,如果确定用户230已经关闭翻译功能(也即,选择框514被设置为“关”),则可以在应用110中直接呈现检索到的原始媒体数据。
根据本公开的一个示例性实现方式,可以在语言设置页面510中设置针对全部搜索操作启用或者禁用翻译功能,也可以在输入具体关键字的界面中提供“开/关”选项,以便针对特定搜索来确定是否提供翻译功能。利用本公开的示例性实现方式,可以以更为灵活的方式来支持用户启用或者禁用翻译功能,从而提供更好的用户体验。
根据本公开的一个示例性实现方式,历史交互240可以进一步包括用户230与运行应用110的终端设备的操作系统之间的历史交互。图5B示出了根据本公开的一些实现方式的用于在操作系统中执行语言设置的界面的框图500B。如图5B所示,操作系统可以提供系统设置页面520,并且该系统设置页面520可以包括用于设置“语言和地区”的选项。此时,系统设置页面520可以提供用于设置系统语言的选择框522,在此系统语言是指用于提供操作系统相关内容的语言。进一步,系统设置页面520可以提供设置首选语言顺序的选择框524。用户230可以向该选择框中添加一个或多个候选语言。以此方式,可以按照用户设置的顺序来呈现由不同语言表示的顺序。备选地和/或附加地,系统设置页面可以提供用于选择用户230所在地区的选择框526。
根据本公开的一个示例性实现方式,可以基于图5B所示的用户界面中设置的一个或多个自然语言或者用户230所在地区所使用的主流语言,来执行翻译操作。通常而言,用户230在操作系统的设置页面中设置的语言是自己熟悉并且可理解的语言。以此方式,在用户没有在应用110中进行单独设置的情况下,仍然可以将用户不能理解的媒体数据翻译为用户可以理解的语言。由此,可以简化用户在应用110中的设置步骤,并且提高利用跨语言搜索来获取更多期望信息的能力。
返回图4,根据本公开的一个示例性实现方式,历史交互240可以进一步包括以下至少任一项:用户在应用中执行发布;用户在应用中执行搜索;用户在应用中执行评论;用户在应用中执行转发;用户在应用中与应用的其他用户执行沟通、用于在应用中执行搜索,等等。通常而言,用户230在应用中执行上述交互所使用的语言是自己熟悉并且能够理解的语言,因而可以基于上述交互所使用的语言来作为翻译操作的目标语言。以此方式,可以提高确定目标语言的准确性,进而提高向用户呈现可理解的搜索结果的效率。
根据本公开的一个示例性实现方式,可以按照如图4所示的各个语言的优先级顺序来确定翻译操作的目标语言。将会理解,用户执行搜索时所使用的搜索语言(也即,关键字的语言)并不一定是用户230熟练掌握的语言(例如,母语)。在某些情况下,当用户230搜索某些特定术语(例如,人名、地名或者某个产品)时,通常使用英语或者其他较为通用的语言来执行搜索,以便找到更多搜索结果。如果直接以搜索语言来呈现搜索结果,可能会出现用户230并不能准确理解搜索结果的情况。由此,可以将搜索语言设置为具有较低优先级。
根据本公开的一个示例性实现方式,可以基于如图4所示的多个语言的交集来确定第二自然语言220。备选地和/或附加地,可以基于机器学习技术来开发语言确定模型410,进而使得输出的第二自然语言220更加符合于用户230的自身语言能力。
根据本公开的一个示例性实现方式,语言确定模型410可能会输出用户230能够理解的多个候选第二自然语言。则此时可以向用户230进一步提供用于选择第二自然语言的提示信息。图6示出了根据本公开的一些实现方式的用于选择翻译目标语言的界面的框图600。如图6所示,在返回搜索结果期间,可以在应用110中呈现提示信息610,并且指示用户230从选择框620中的多个候选语言630中选择期望的目标语言。进一步,可以基于用户230针对提示信息610的反馈,从多个候选语言中选择第二自然语言,进而执行相应的翻译操作。
假设用户230期望搜索介绍当前最新发布的电子产品的媒体数据,此时可能在媒体存储库中仅存在利用通用语言(例如,英语)发布的媒体数据而并不存在以其他语言发布的媒体数据,此时用户230可以将当前搜索的翻译目标语言设置为英语。假设用户230期望搜索某个电影明星的介绍,则可以将当前搜索的翻译目标语言设置为中文,等等。利用本公开的示例性实现方式,可以允许用户230在执行每次搜索时单独选择在当前搜索结果中所使用的目标语言。以此方式,可以提供具有更加精细粒度的翻译策略,进而便于用户获得更多期望信息。
根据本公开的一个示例性实现方式,在已经获取语言数据和第二自然语言220的情况下,可以基于目前已知的和/或将在未来开发的多种机器翻译模型,来获得以第二自然语言220表示的第二语言数据。进一步,可以在应用110中呈现媒体数据以及相应的第二语言数据。
根据本公开的一个示例性实现方式,可以在应用110中的搜索结果页面中呈现媒体数据的预览窗口,进一步可以在预览窗口中呈现媒体数据和相应的第二语言数据。在此,搜索结果页面可以进一步包括用于呈现媒体存储库中的与关键字相对应的另一媒体文件的另一预览窗口。参见图7描述搜索结果页面的更多细节,该图7示出了根据本公开的一些实现方式的搜索结果页面的框图700。
如图7所示,搜索结果页面710可以包括针对多个搜索结果的预览窗口,例如,预览窗口720可以以预览方式呈现检索到的媒体数据120,并且预览窗口722可以呈现检索到的媒体数据130。将会理解,此时各个媒体数据中的语言数据已经被翻译为用户230期望的目标语言。例如,在预览窗口720下方可以显示媒体数据120的标题(或者翻译后的字幕数据,等等)。将会理解,尽管图7以示例方式示出了在预览窗口720下方呈现翻译后的语言数据的情况,备选地和/或附加地,可以在预览窗口内部呈现该语言数据。此时,翻译后的语言数据将被叠加在媒体数据之上以半透明方式呈现。
此时,用户230可以以预览方式在单一搜索结果页面710中获得有关多个搜索结果的内容信息,进而可以提高用户230获取信息的速度。利用本公开的示例性实现方式,翻译后的语言数据可以向用户230提供有关搜索结果的更为丰富的信息,可以有助于用户230判断是否需要单独播放某个媒体数据。
根据本公开的一个示例性实现方式,用户230可以与搜索结果页面710中的各个预览窗口执行交互。如图7所示,如果接收到用户230与预览窗口720的交互,则可以在应用110中的播放页面中播放相应的媒体数据。参见图8描述有关播放页面的更多细节,图8示出了根据本公开的一些实现方式的播放页面的框图800。
如图8所示,媒体数据120中的多种类型的语言数据已经被翻译为中文,并且呈现在播放页面中。在图8中,声音数据810可以保留原始自然语言,并且图像数据820、标题数据830、评论数据840、弹幕数据850和字幕数据860可以分别对应于如图3所示的各种语言数据的用户230可理解的翻译字幕(例如,以中文表示)。利用本公开的示例性实现方式,可以以用户230可理解的方式来向该用户230呈现有关媒体数据120的多方面信息,进而提高用户230获得更加符合于自身期望的搜索结果。
根据本公开的一个示例性实现方式,可以随着媒体数据120的播放来不断地获取当前正在被播放部分所包含的语言数据,可以动态地执行翻译过程进而获得以第二自然语言220表示的翻译数据。以此方式,可以实时地向用户230呈现可以理解的媒体数据,进而改进用户体验。
根据本公开的一个示例性实现方式,可以运行用户230定义呈现翻译数据的呈现模式。例如,可以向用户230提供选择页面,以便使得用户230选择用于呈现翻译数据的字体、字号、行间距、翻译数据的长度(例如,一行显示多少单词或者字符),等等。进一步,呈现模式可以包括在媒体数据的播放画面之外呈现翻译后的语言数据,也可以包括在播放画面之上以半透明方式呈现翻译和的语言数据,等等。在用户230选定呈现模式之后,可以利用选择的呈现模式来呈现翻译数据。利用本公开的示例性实现方式,各个用户可以按照自身的要求来设置呈现方式。以此方式,可以向每个用户提供定制功能,进而使得呈现搜索结果的方式更加符合于每个用户的审美要求。
已经参见附图描述了跨越自然语言的媒体搜索方法的具体步骤。利用本公开的示例性实现方式,可以以准确并且有效的方式确定用户能够理解的自然语言。进一步,可以将搜索结果涉及的媒体数据中的语言数据从用户不可理解的自然语言翻译为用户可理解的自然语言。以此方式,可以提高用户的搜索效率并且提高用户获取信息的效率。
利用本公开的示例性实现方式,可以提升用户筛选搜索结果的效率,并且更快地理解视频内容。对于包括大量语言数据的视频数据而言,翻译字幕对于提升筛选效率的增益更加明显。进一步,上文描述的跨语言搜索方法可以支持用户看懂多语言视频,进而更加有助于探索跨语言的发布空间,并且解决以自己熟悉的语言表示的视频数据不足的问题。尤其是,翻译字幕可以消除视频语言理解障碍,让每个视频都能被任意语言背景的人理解,从而将搜索资源池从某特定语种拓展到多语种,进而以更为充分的方式利用视频存储库中的多语言数据。
示例过程
图9示出了根据本公开的一些实现方式的跨越自然语言的媒体搜索方法900的流程图。在框910处,基于用户在应用中输入的关键字,在应用的媒体存储库中搜索与关键词相匹配的媒体数据,媒体数据中的第一语言数据是由第一自然语言所表示的。在框920处,基于用户与应用相关联的历史交互中所涉及的自然语言,确定用户理解的第二自然语言。在框930处,确定第一自然语言是否不同于第二自然语言。如果判断结果为“是”,则方法900前进至框940。在框940处,将第一语言数据翻译为由第二自然语言表示的第二语言数据。在框950处,在应用中呈现媒体数据以及第二语言数据。
根据本公开的一个示例性实现方式,第一语言数据包括以下至少任一项:声音数据、字幕数据、图像数据、标题数据、字幕数据、评论数据、弹幕数据。
根据本公开的一个示例性实现方式,确定第二自然语言进一步包括:响应于确定存在用户理解的多个候选第二自然语言,向用户提供用于选择第二自然语言的提示信息;以及基于用户针对提示信息的反馈,从多个候选第二自然语言中选择第二自然语言。
根据本公开的一个示例性实现方式,在应用中呈现媒体数据以及第二语言数据包括:在应用的搜索结果页面中呈现媒体数据的预览窗口,搜索结果页面进一步包括用于呈现媒体存储库中的与关键字相对应的另一媒体文件的另一预览窗口;以及在预览窗口中呈现媒体数据以及第二语言数据。
根据本公开的一个示例性实现方式,该方法900进一步包括:响应于接收到用户与预览窗口的交互,在应用的播放页面中播放媒体数据;以及在播放媒体数据期间,在播放页面中呈现与媒体数据中的正在被播放部分相关联的语言数据的翻译数据,翻译数据是由第二自然语言所表示的。
根据本公开的一个示例性实现方式,该方法900进一步包括:向用户提供选择用于呈现翻译数据的呈现模式的选择页面,呈现模式包括以下至少任一项:用于呈现翻译数据的字体、字号、行间距、翻译数据的长度。
根据本公开的一个示例性实现方式,呈现翻译数据进一步包括:响应于接收到用户针对呈现模式的选择,利用选择的呈现模式来呈现翻译数据。
根据本公开的一个示例性实现方式,搜索媒体数据包括:响应于确定媒体数据的作者允许媒体数据中的语言数据被翻译为第一自然语言以外的其他语言,获取媒体数据。
根据本公开的一个示例性实现方式,将第一语言数据翻译为第二语言数据包括:响应于确定用户启动翻译功能,将第一语言数据翻译为第二语言数据。
根据本公开的一个示例性实现方式,用户与应用相关联的历史交互包括以下至少任一项:用户在应用中设置翻译操作的目标语言;用户在应用中设置用于呈现应用的应用语言;用户在用于运行应用的操作系统中设置系统语言;用户在用于运行应用的操作系统中设置首选语言顺序;用户在用于运行应用的操作系统中设置地区;用户在应用中执行发布;用户在应用中执行评论;用户在应用中执行转发;用户在应用中与应用的其他用户执行沟通;用户在应用中执行搜索。
示例装置和设备
图10示出了根据本公开的一些实现方式的跨越自然语言的媒体搜索装置1000的框图。该装置1000包括:搜索模块1010,被配置用于基于用户在应用中输入的关键字,在应用的媒体存储库中搜索与关键词相匹配的媒体数据,媒体数据中的第一语言数据是由第一自然语言所表示的;确定模块1020,被配置用于基于用户与应用相关联的历史交互中所涉及的自然语言,确定用户理解的第二自然语言;翻译模块1030,被配置用于响应于确定第一自然语言不同于第二自然语言,将第一语言数据翻译为由第二自然语言表示的第二语言数据;以及呈现模块1040,被配置用于在应用中呈现媒体数据以及第二语言数据。
根据本公开的一个示例性实现方式,第一语言数据包括以下至少任一项:声音数据、字幕数据、图像数据、标题数据、字幕数据、评论数据、弹幕数据。
根据本公开的一个示例性实现方式,确定模块1020包括:提示模块,被配置用于响应于确定存在用户理解的多个候选第二自然语言,向用户提供用于选择第二自然语言的提示信息;以及选择模块,被配置用于基于用户针对提示信息的反馈,从多个候选第二自然语言中选择第二自然语言。
根据本公开的一个示例性实现方式,呈现模块1040包括:预览窗口呈现模块,被配置用于在应用的搜索结果页面中呈现媒体数据的预览窗口,搜索结果页面进一步包括用于呈现媒体存储库中的与关键字相对应的另一媒体文件的另一预览窗口;以及预览模块,被配置用于在预览窗口中呈现媒体数据以及第二语言数据。
根据本公开的一个示例性实现方式,该装置1000进一步包括:播放模块,被配置用于响应于接收到用户与预览窗口的交互,在应用的播放页面中播放媒体数据;以及动态呈现模块,被配置用于在播放媒体数据期间,在播放页面中呈现与媒体数据中的正在被播放部分相关联的语言数据的翻译数据,翻译数据是由第二自然语言所表示的。
根据本公开的一个示例性实现方式,该装置1000进一步包括:模式呈现模块,被配置用于向用户提供选择用于呈现翻译数据的呈现模式的选择页面,呈现模式包括以下至少任一项:用于呈现翻译数据的字体、字号、行间距、翻译数据的长度;以及动态呈现模块包括:基于选择模式的呈现模块,被配置用于响应于接收到用户针对呈现模式的选择,利用选择的呈现模式来呈现翻译数据。
根据本公开的一个示例性实现方式,搜索1010包括:获取模块,被配置用于响应于确定媒体数据的作者允许媒体数据中的语言数据被翻译为第一自然语言以外的其他语言,获取媒体数据。
根据本公开的一个示例性实现方式,翻译模块1030包括:启动模块,被配置用于响应于确定用户启动翻译功能,将第一语言数据翻译为第二语言数据。
根据本公开的一个示例性实现方式,用户与应用相关联的历史交互包括以下至少任一项:用户在应用中设置翻译操作的目标语言;用户在应用中设置用于呈现应用的应用语言;用户在用于运行应用的操作系统中设置系统语言;用户在用于运行应用的操作系统中设置首选语言顺序;用户在用于运行应用的操作系统中设置地区;用户在应用中执行发布;用户在应用中执行评论;用户在应用中执行转发;用户在应用中与应用的其他用户执行沟通;用户在应用中执行搜索。
图11示出了能够实施本公开的多个实现方式的设备1100的框图。应当理解,图11所示出的计算设备1100仅仅是示例性的,而不应当构成对本文所描述的实现方式的功能和范围的任何限制。图11所示出的计算设备1100可以用于实现上文描述的方法。
如图11所示,计算设备1100是通用计算设备的形式。计算设备1100的组件可以包括但不限于一个或多个处理器或处理单元1110、存储器1120、存储设备1130、一个或多个通信单元1140、一个或多个输入设备1150以及一个或多个输出设备1160。处理单元1110可以是实际或虚拟处理器并且能够根据存储器1120中存储的程序来执行各种处理。在多处理器系统中,多个处理单元并行执行计算机可执行指令,以提高计算设备1100的并行处理能力。
计算设备1100通常包括多个计算机存储介质。这样的介质可以是计算设备1100可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器1120可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储设备1130可以是可拆卸或不可拆卸的介质,并且可以包括机器可读介质,诸如闪存驱动、磁盘或者任何其他介质,其可以能够用于存储信息和/或数据(例如用于训练的训练数据)并且可以在计算设备1100内被访问。
计算设备1100可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性存储介质。尽管未在图11中示出,可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中,每个驱动可以由一个或多个数据介质接口被连接至总线(未示出)。存储器1120可以包括计算机程序产品1125,其具有一个或多个程序模块,这些程序模块被配置为执行本公开的各种实现方式的各种方法或动作。
通信单元1140实现通过通信介质与其他计算设备进行通信。附加地,计算设备1100的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接进行通信。因此,计算设备1100可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个网络节点的逻辑连接来在联网环境中进行操作。
输入设备1150可以是一个或多个输入设备,例如鼠标、键盘、追踪球等。输出设备1160可以是一个或多个输出设备,例如显示器、扬声器、打印机等。计算设备1100还可以根据需要通过通信单元1140与一个或多个外部设备(未示出)进行通信,外部设备诸如存储设备、显示设备等,与一个或多个使得用户与计算设备1100交互的设备进行通信,或者与使得计算设备1100与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。
根据本公开的示例性实现方式,提供了一种计算机可读存储介质,其上存储有计算机可执行指令,其中计算机可执行指令被处理器执行以实现上文描述的方法。根据本公开的示例性实现方式,还提供了一种计算机程序产品,计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,而计算机可执行指令被处理器执行以实现上文描述的方法。根据本公开的示例性实现方式,提供了一种计算机程序产品,其上存储有计算机程序,程序被处理器执行时实现上文描述的方法。
这里参照根据本公开实现的方法、装置、设备和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实现,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文公开的各个实现方式。

Claims (12)

1.一种跨越自然语言的媒体搜索方法,包括:
基于用户在应用中输入的关键字,在所述应用的媒体存储库中搜索与所述关键词相匹配的媒体数据,所述媒体数据中的第一语言数据是由第一自然语言所表示的;
基于所述用户与所述应用相关联的历史交互中所涉及的自然语言,确定所述用户理解的第二自然语言;
响应于确定所述第一自然语言不同于所述第二自然语言,将所述第一语言数据翻译为由所述第二自然语言表示的第二语言数据;以及
在所述应用中呈现所述媒体数据以及所述第二语言数据。
2.根据权利要求1所述的方法,其中所述第一语言数据包括以下至少任一项:声音数据、字幕数据、图像数据、标题数据、字幕数据、评论数据、弹幕数据。
3.根据权利要求1所述的方法,其中确定所述第二自然语言进一步包括:
响应于确定存在所述用户理解的多个候选第二自然语言,向所述用户提供用于选择所述第二自然语言的提示信息;以及
基于所述用户针对所述提示信息的反馈,从所述多个候选第二自然语言中选择所述第二自然语言。
4.根据权利要求1所述的方法,其中在所述应用中呈现所述媒体数据以及所述第二语言数据包括:
在所述应用的搜索结果页面中呈现所述媒体数据的预览窗口,所述搜索结果页面进一步包括用于呈现所述媒体存储库中的与所述关键字相对应的另一媒体文件的另一预览窗口;以及
在所述预览窗口中呈现所述媒体数据以及所述第二语言数据。
5.根据权利要求4所述的方法,进一步包括:响应于接收到所述用户与所述预览窗口的交互,
在所述应用的播放页面中播放所述媒体数据;以及
在播放所述媒体数据期间,在所述播放页面中呈现与所述媒体数据中的正在被播放部分相关联的语言数据的翻译数据,所述翻译数据是由所述第二自然语言所表示的。
6.根据权利要求5所述的方法,进一步包括:向所述用户提供选择用于呈现所述翻译数据的呈现模式的选择页面,所述呈现模式包括以下至少任一项:用于呈现所述翻译数据的字体、字号、行间距、所述翻译数据的长度;以及呈现所述翻译数据进一步包括:
响应于接收到所述用户针对所述呈现模式的选择,利用选择的所述呈现模式来呈现所述翻译数据。
7.根据权利要求1所述的方法,其中搜索所述媒体数据包括:响应于确定所述媒体数据的作者允许所述媒体数据中的语言数据被翻译为所述第一自然语言以外的其他语言,获取所述媒体数据。
8.根据权利要求1所述的方法,其中将所述第一语言数据翻译为所述第二语言数据包括:响应于确定所述用户启动翻译功能,将所述第一语言数据翻译为所述第二语言数据。
9.根据权利要求1所述的方法,其中所述用户与所述应用相关联的所述历史交互包括以下至少任一项:
所述用户在所述应用中设置翻译操作的目标语言;
所述用户在所述应用中设置用于呈现所述应用的应用语言;
所述用户在用于运行所述应用的操作系统中设置系统语言;
所述用户在用于运行所述应用的操作系统中设置首选语言顺序;
所述用户在用于运行所述应用的操作系统中设置地区;
所述用户在所述应用中执行发布;
所述用户在所述应用中执行评论;
所述用户在所述应用中执行转发;
所述用户在所述应用中与所述应用的其他用户执行沟通;
所述用户在所述应用中执行搜索。
10.一种跨越自然语言的媒体搜索装置,包括:
搜索模块,被配置用于基于用户在应用中输入的关键字,在所述应用的媒体存储库中搜索与所述关键词相匹配的媒体数据,所述媒体数据中的第一语言数据是由第一自然语言所表示的;
确定模块,被配置用于基于所述用户与所述应用相关联的历史交互中所涉及的自然语言,确定所述用户理解的第二自然语言;
翻译模块,被配置用于响应于确定所述第一自然语言不同于所述第二自然语言,将所述第一语言数据翻译为由所述第二自然语言表示的第二语言数据;以及
呈现模块,被配置用于在所述应用中呈现所述媒体数据以及所述第二语言数据。
11.一种电子设备,包括:
至少一个处理单元;以及
至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令在由所述至少一个处理单元执行时使所述电子设备执行根据权利要求1至9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时使所述处理器实现根据权利要求1至9中任一项所述的方法。
CN202310266118.8A 2023-03-14 2023-03-14 跨越自然语言的媒体搜索方法、装置、设备和介质 Pending CN116304126A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310266118.8A CN116304126A (zh) 2023-03-14 2023-03-14 跨越自然语言的媒体搜索方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310266118.8A CN116304126A (zh) 2023-03-14 2023-03-14 跨越自然语言的媒体搜索方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN116304126A true CN116304126A (zh) 2023-06-23

Family

ID=86833875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310266118.8A Pending CN116304126A (zh) 2023-03-14 2023-03-14 跨越自然语言的媒体搜索方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN116304126A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102770859A (zh) * 2009-11-20 2012-11-07 谷歌公司 跨语言搜索选项
CN105378775A (zh) * 2013-03-14 2016-03-02 微软技术许可有限责任公司 多语言信息检索与广告
CN108255940A (zh) * 2017-12-08 2018-07-06 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN110134973A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 基于人工智能的视频字幕实时翻译方法、介质和设备
CN111143659A (zh) * 2018-11-02 2020-05-12 声音猎手公司 用于执行智能跨域搜索的系统和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102770859A (zh) * 2009-11-20 2012-11-07 谷歌公司 跨语言搜索选项
CN105378775A (zh) * 2013-03-14 2016-03-02 微软技术许可有限责任公司 多语言信息检索与广告
CN108255940A (zh) * 2017-12-08 2018-07-06 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN111143659A (zh) * 2018-11-02 2020-05-12 声音猎手公司 用于执行智能跨域搜索的系统和方法
CN110134973A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 基于人工智能的视频字幕实时翻译方法、介质和设备

Similar Documents

Publication Publication Date Title
JP6942821B2 (ja) 複数のコーパスからの応答情報取得
US10346537B2 (en) Universal translation
EP4462425A2 (en) Analyzing graphical user interfaces to facilitate automatic interaction
JP2025524735A (ja) デジタルヒューマンを生成する方法、モデルのトレーニング方法、装置、機器及び媒体
CN115769220B (zh) 经由自动化助理交互的文档创建和编辑
US9342233B1 (en) Dynamic dictionary based on context
US9196251B2 (en) Contextual conversion platform for generating prioritized replacement text for spoken content output
US12067055B2 (en) Information display method and electronic apparatus
CN115942005A (zh) 用于生成解说视频的方法、装置、设备和存储介质
WO2023040692A1 (zh) 语音控制方法、装置、设备及介质
RU2668721C1 (ru) Способ для отображения субтитров в процессе воспроизведения медиаконтента (варианты)
CN116304126A (zh) 跨越自然语言的媒体搜索方法、装置、设备和介质
US20250139358A1 (en) Creating a digital assistant
US20240419677A1 (en) Methods and apparatus for donating in-app search queries, events, and/or actions
CN117829101A (zh) 用于转换文本风格的方法、装置、设备和介质
CN117708317A (zh) 用于翻译页面截图的方法及相关产品
US20210216709A1 (en) Apparatus and method
US20250372127A1 (en) Content generation
CN118627496B (zh) 基于配置表的分词搜索方法、装置、设备、介质及产品
US20250044913A1 (en) Dynamically providing a macro to a user based on previous user interactions
KR102251513B1 (ko) 기계학습을 이용한 셀럽의 소셜미디어 정보 기반 학습용 콘텐츠 생성 방법 및 장치
WO2025245799A1 (zh) 计算机实现的方法以及电子设备
Jeevitha et al. Multilingual Subtitle Generator Using Machine Learning
CN108509058B (zh) 输入方法与相关设备
CN120541244A (zh) 媒体资源生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination