[go: up one dir, main page]

CN1411579A - 通过数码网络播放多语言语音的方法和设备 - Google Patents

通过数码网络播放多语言语音的方法和设备 Download PDF

Info

Publication number
CN1411579A
CN1411579A CN 01806107 CN01806107A CN1411579A CN 1411579 A CN1411579 A CN 1411579A CN 01806107 CN01806107 CN 01806107 CN 01806107 A CN01806107 A CN 01806107A CN 1411579 A CN1411579 A CN 1411579A
Authority
CN
China
Prior art keywords
speech
text
point
language
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 01806107
Other languages
English (en)
Inventor
威廉·S·梅赛尔
里德雷·M·惠塔克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OIPENN Inc
Original Assignee
OIPENN Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OIPENN Inc filed Critical OIPENN Inc
Publication of CN1411579A publication Critical patent/CN1411579A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种分配语音的方法和设备。该方法和设备可将实况或录制的第一语言的源语音从始发点通过数码网络发送至分配点。源语音在始发点被转化成第一语的文字。该文字再被发送至分配点。发送之后,该文字被还原成第一语的接收语音。另外,源语音还可以被翻译成第二语的接收语音。这可通过以下两种方式完成:1)将上述文字先翻译成第二语言的文字再转换成第二语的语音;或2)将上述文字直接翻译成第二语。这种转换可以在分配点完成,也可以在个人电脑上通过文字接收者的操作来实现。

Description

通过数码网络播放多语言语音的方法和设备
技术领域
本发明涉及播放多语言语音的方法和设备,更确切地讲,这种播放语音的方法和设备可将一种或多种语言的语音从一个始发点通过数码网络播放到远处的接收点。
背景技术
已有一些通过网络(如互联网)以单向的方式播放语音的应用。其中有些应用于公司内部联络,例如跨国公司的首席执行官向所有雇员发布讲话。还有一些用于新闻,运动,或其他与广播电视有关的播放。还有一些根据个人特殊制作的信息传播(例如某个人所持有股票的市场新闻以及当地运动队的记分榜)。由于互联网和无线源容量的日益增加,这种声音信息不断膨胀迭加。由于音像播放成本的降低,这种音像源与日俱增,听众逐渐国际化。例如某巴西足球迷有兴趣听听美国对德国的比赛,这种广播只有通过互联网才能听到。足球迷很可能希望听到巴西葡萄牙语而不是原广播的语言。
这种趋势造成以下一些问题:
-当声音通过国际网络从某地播放给潜在的数十万听众时,用于播放的服务器和网络连线会负担过重,造成声音的断续以至于在极端情况下中止工作。
-支持高速数据传输的声频服务及高速数据传输主干网络的连接成本会使得面对大量听众的声频广播就每个听众来讲不经济,而大量的听众往往是某项应用经济可行的前提。
用熟练于某语言的广播员,特别是在某些主要语言之外的语言来重复多种语言的广播成本昂贵,而在很多情况下不符实际。就总体而言上百种语言和口音代表着巨大的但很难经济合理开发的市场。
本发明通过以下几个方面寻求解决这些问题:
-可通过语音识别系统将语音在声源处转化成文字来解决数据传输率的问题。转化的文字再传送至接收者附近的分配点,这个分配点也可以是接收者的接收器,文字在这里通过文字至语音转换程序转化成语音。
-可将某种语言的广播用另外一种语言播放。
-可播放多种语言的节目或事件从而节省用多种语言广播员的费用。
-可降低由声源处和远处语言不同而引起的语音播放困难。
还有一些系统设想用一个文字至语言合成源连接多个用户。松本(美国专利5673362号)讨论了一项声音合成服务器,用于将语音通过局部区域网(LAN)输送给用户。该服务器的设计考虑到将处理多用户发出要求而造成的负担降至最小并通过接收器能够接受的方式提供语音,而不是用单点广播的方式来解决问题。但松本的方法将请求集中于单一服务器,而不是将这些负担分散至多个服务器,从而使传输更为困难。进一步而言,这个系统并没有考虑多种语言不吻合的问题。
本发明有三项下属技术:文字至语音合成,语音识别,以及文字至文字翻译。以下部份概括了为相关领域人员熟知的现有技术应用。
文字至语音合成
文字至语音的转换(TTS)以有相当成熟的方法以及商用软件(如科可等的美国3704345号专利,Coker,et al.US Patent 3704345,乔纳森·艾伦的“文字至语音转换概述”于1992年,发表在由纽约的玛瑟戴克公司出版,由如古井贞熙和姆安·桑迪编辑的<语音信号处理之进展>一书中,第741-790页,Jonathan Allen,″Overview ofText-to-Speech Systems,″in Advances in Speech Signal Processing,Sadaoki Furui,M.Mohan Sondhi(eds.),Marcel Dekker,Inc.(New York),1992,pp.741-790;或苏·浩茨的“文字至语音转换技术导言”,发表在<语音技术>1997年四五月刊的第18-21页,Sue Hortz,″TheTechnology Of Text-to-Speech-an introduction,″Speech Technology,CIPublishing,April/May 1997,pp.18-21)
现有的绝大多数系统运用字典,并对字典查不到的单词运用词语规则生成的语音来表达输入文字(用符号表达语音,例如用“PHONE”来代表“F-OH-N”)。软件再通过利用模拟人语的方法,或连接零星人语声节来生成语音。连接方法包括用通常称为音节的语音单位来组成单词,以便根据任何语音拼法生成相应的词汇。
一些最近的技术采用大型语音数据库,在更大的词语单元与数据库比较吻合的情况下派生出比上述用以连接合成的音节更大的语音单元(例如安得鲁·亨特和艾兰·布莱克的“利用大型数据库进行连接语音合成的单元选择,于1996年发表在电气电子工程院的<声学,语音和信号处理国际年会学报>第373页”Andrew J.Hunt,Alan W.Black,″Unit Selection in a Concatenative Speech Synthesis System usinga Large Speech Database,″Transactions International Conference OnAcoustics,Speech,and Signal Processing,Volume 1,Page 373,Institute of Electrical and Electronical Engineers,1996)。比如说,如果数据库里包含一句话″It′s a goa″(得分了),合成系统就会采用数据库里的整个句子″It′s a goa″(得分了)作为″It′s a goal,making the scorefive to one″(得分了,比分成了五比一)的一部分,而句子的其他部分则由较小的语音单元而生成。这种途经在文字与数据库相吻合的情况下会造出相当自然的语音。这种形式的文字至语音的转换技术与本发明关系密切,因为本发明的广播应用常常会局限于一个特殊的范围里,如体育报道,它利用建于专用体育语音数据库之上的文字至语音转换系统。其结果是这种语音的质量接近于人声录制的语音。通过这种技术,文字至语音转换软件可以按照广播内容剪辑,这方面已有商业应用。
语音识别
通用的根据话音输入的大型词汇语音识别系统已以商用形式而广泛采用。就多数的应用而言,广播员可预先用其语声通过商用文字至语音转换系统内的高质量近距离话筒来训练该系统。用专业广播员的语音,这种系统可用于广泛的话语内容。这种系统对收听语音很实用,因为最终使接收者听到而不是看到文字至语音合成器的结果,虽然会造成文字相异语音相似的错误,如″cite″与″sight″,但对收听者而言并不会造成接收错误。
不过如上所述,本发明主要用于内容已知并且局限的情况下,如播放网球比赛,这时词汇和内容相当有限。将识别系统调整适于广播的环境将大大增加其准确性。由语音识别技术销售商提供的商用工具包里带有将词汇和语法按需要特殊设置的工具,便于熟悉这个领域的人员使用。
文字至文字翻译
文字材料从一种语言自动翻译成另一种语言或称为“机器翻译”的问题目前还没有完全解决(例如特鲁希略·阿图罗的“翻译机器:机器翻译技术,施普林格出版社,1999,Trujillo,Arturo,TranslationEngines:Techniques for Machine Translation,Springer Verlag,1999)。虽然大多数的通用系统正在改进之中,他们当今还只能用于粗译。内容较为局限情况改进可观,对于一些针对性强的系统应用,诸如学术会议注册和信息方面的应用,以证明效果显著(例如伍泽森纳等的“大范围口语翻译的模块式方法”发表于98年北美机器翻译协会年会论文集,Woszezyna,et al,″A modular approach to spoken languagetranslation for large domains,″Proceedings of AMTA 98)。这项技术的不断改进会使该通用技术使用于本发明。
其实,就某些如上所述的内容局限的广播而言,讲稿或许已经事先准备好,内容或许很局限。这些情况可以通过生成一个对照表格,并对语句与过去建立的文字翻译对比而立即做出处理。本发明的应用大多可以使用这种方式。
发明内容
本发明公开一项可将实况或预先录制的源语音从始发点通过数码网络发送至分配点的系统。源语音在始发点被转化成第一语的文字。该文字发送至分配点并再被转换成第一语的接收语音。在需要的时候,其文字还可以转化成第二语的接收语音。接收语音再通过所述系统的分配点发送到接收者。
根据其一个方面,本发明作为一种设备将第一语音从始发点通过数码网络分配至第一分配点。在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音。所述设备包括一个语音至文字转换器,用于将源语音转化成第一语的文字,并由一个第一语文字发送器通过数码网络将该文字发送至第一分配点。所述语音至文字转换器安装在始发点。
所述设备还包括一个第一文字至语音转换器将接收到的第一语的文字转化成相应的接收语音。所述第一文字至语音转换器安装在第一分配点。另外,所述设备还包括一个第一语音分配器用于将第一语的接收语音分配至众多接收者中的的单一或多个第一语接收者,和一个将第二语的文字转化成第二语的接收语音的第二文字至语言转换器。所述第二文字至语音转换器安装在第一分配点。
再进一步,所述设备还包括一个第二语音分配器将接收到的第二语的语音传送至众多的单一或多个第二语音接收者,这些第二语音接收者不同于上述单一或多个第一语音接收者。
根据其第二个方面,本发明作为一种设备将第一语音从始发点通过数码网络分配至第一分配点。在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音。所述设备包括一个语音至文字转换器,将源语音转化成第一语的文字。所述语音至文字转换器安装在始发点。
所述设备还包括一个第一语文字发送器,用于将所述文字通过数码网络发送至第一分配点,以及一个第一语文字至语音转换器,用于将该文字转化成第一语的接收语音。所述第一语文字至语音转换器安装在第一分配点。
根据其第三个方面,本发明作为一种方法将第一语音从始发点通过数码网络分配至第一分配点。在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音。所述方法包括以下几个步骤:A)在始发点将源语音转化成第一语的文字;B)将所述文字通过数码网络传送至第一分配点;C)在第一分配点将该文字转化成第一语的接收语音。
根据其第四个方面,本发明作为一种设备将第一语的语音从始发点通过数码网络分配至第一分配点。在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音。所述设备包括在始发点将源语音转化成第一语的文字的途径,将所述文字通过数码网络传送至第一分配点的途径,以及在第一分配点将该文字转化成第一语接收语音的途径。
附图说明
图一是本发明第一待选方案的框图
图二是本发明第二待选方案的框图
图三是本发明第三待选方案的框图
图四是本发明第四待选方案的框图
具体实施方式
图一是本发明第一待选方案的框图。系统10包括一个始发服务器12,一个分配服务器14,和一个接收计算装置16。计算装置16可以是个人电脑(PC),掌上装置,视频机顶盒(STB),或其它类似的装置。常规的始发服务器12通过网络18与分配服务器14相连。网络18可以用有线或无线网。作为与本方案相关的特例,网络18可以是数码网络诸如区域或全球计算机网络(如互联网)。
分配服务器14通过网络20与接收计算装置16连接。网络20与网络18相似,可以用有线或无线网。作为与本方案相关的特例,网络20可以是区域或全球计算机网络(如互联网)。
始发服务器12位于始发点;分配服务器14位于第一分配点。计算装置16可位于任何地方,但最好是装在第一分配点附近。在一些应用中,计算装置16最好安装在第一分配点附近而不是在始发点附近。
始发服务器12接收到需要从始发点分配到第一分配点的源语音。第一语的源语音通过一个为相关领域人员熟悉的语音至文字转换器22转化成文字。转化的文字再通过网络18上的一个文字传送器24发送至分配服务器14。在第一待选方案里,接收到的文字在分配服务器14处被第一文字至语音转换器26转化成第一语言的接收语音。第一语文字至语音转换器26位于分配点。第一文字至语音转换器26的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。由第一文字至语音转换器26生成的语音再通过网络20传送到计算装置16。
计算装置16最好是用编程个人电脑,不过也可以用为相关领域人员熟悉的其它方式。计算装置16通过网络20从分配服务器14接收语音。
图二是本发明第二待选方案的框图。图二使用的参考序号与图一相同,因此图二使用的部件与图一的方案相同。在所述第二种方案里,接收文字在分配服务器处通过网络20传送到计算装置16。接收文字再通过计算装置16上的文字至语音转换器26转化成第一语的接收语音。第一文字至语音转换器26的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。
图三是本发明第三待选方案的框图。系统110包括一个始发服务器112,一个分配服务器114,和两个以上的接收计算装置116,116a,116b,和更多的装置(统称为计算装置116)。每个计算装置116可以是个人电脑(PC),掌上装置,视频机顶盒(STB),或其它类似的装置。常规的始发服务器112通过网络118与分配服务器114相连。网络118可以用有线或无线网。作为与本方案相关的特例,网络118可以是数码网络诸如区域或全球计算机网络(如互联网)。
分配服务器114通过网络120与各个接收计算装置116连接。网络120与网络118相似,可以用有线或无线网。作为与本方案相关的特例,网络120可以是区域或全球计算机网络(如互联网)。
始发服务器112位于始发点;分配服务器114位于第一分配点。计算装置116可位于任何地方,但最好装是在第一,第二,第三,和其他更多的分配点附近。在一些应用中,计算装置116最好安装在第一分配点附近而不是在始发点附近。
始发服务器112接收到需要从始发点分配至第一,第二,第三分配点的源语音。由第一语言表达的源语音通过一个为相关领域人员熟悉的语音至文字转换器122转化成文字。转化的文字再通过网络118上的一个文字传送器124发送至分配服务器114。接收到的文字在分配服务器114处被第一文字至语音转换器126转化成第一语言的接收语音。第一语文字至语音转换器126位于分配点。第一文字至语音转换器126的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。由第一文字至语音转换器生成的语音再通过网络120传送到计算装置116。
第一语的接收文字通过位于分配服务器114上的翻译器128转化。翻译器128将第一语的文字翻译成第二语的文字。第二语的文字通过网络120被发送到位于第二接收点的计算装置116a。计算装置116a包括一个第二语的文字至语音转换器132。与第一文字至语音转换器126类似,第二语文字至语音转换器132的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。由第二文字至语音转换器生成的语音由计算装置116a处理。
另外如有必要,第一语的接收文字通过位于分配服务器114上的另一个翻译器130转化成第三语的文字。第三语的文字通过网络120被发送到位于第三接收点的计算装置116b。计算装置116b包括一个第三语的文字至语音转换器134。与第一文字至语音转换器126类似,第三语文字至语音转换器134的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。由第三文字至语音转换器生成的语音由计算装置116b处理。
计算装置116最好是用编程个人电脑,不过也可以使用为相关领域人员熟知的其他方法。计算装置116通过网络120从分配服务器114上接收语音。
图四是本发明第四待选方案的框图。图四使用的参考序号与图三相同,因此图四使用的部件于与图三的方案相同。在所述第四种方案里,接收文字在分配服务器处通过网络120传送到计算装置116,116a,必要时还有116b。接收文字再通过计算装置116上的文字至语音转换器126转化成第一语的接收语音。第一文字至语音转换器的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。
接收文字还通过计算装置116a上的翻译器128转化成第二语的文字。翻译器128将第一语的文字翻译成第二语的文字。第二语的文字再由第二语的文字至语音转换器130转化成第二语的语音。第二语文字至语音转换器130的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。
另外如有必要,接收到的第一文字还可通过计算装置116b上的翻译器134转化成第三语的文字。第三语的文字再由第三语的文字至语音转换器136转化成第三语的语音。第三文字至语音转换器136的操作方式可以基于语音合成,或是为相关领域人员熟知的录音语句变换或其他语音方法。
在许多应用中,语音要与视频信息同步。语音伴随一连串视频场景就是一个为人们熟悉的实例。语音可通过本发明的上述待选方案传送。语音被翻译成第一或第二语之后,再重新与同时传输到接收计算装置的视频信息再同步。再同步需要考虑如何处理由语音至文字转换,文字至语音转换,和文字至文字翻译所造成的滞后。
虽然以上详细描述了本发明的待选方案,还有许多对熟悉本行的人员明显的变化方案也包括在本发明中。因此,本发明由以下权利要求来确定。

Claims (37)

1、一种从始发点通过数码网络向第一分配点发送第一语音的设备,在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音,该设备包括:
一个语音至文字转换器,用于将源语音转化成第一语的文字,该转换器位于始发点;
一个第一文字发送器,用于将文字通过数码网络传送到第一分配点;
一个第一文字至语音转换器,用于将文字转换至第一语言的接收语音,该文字至语音转换器位于第一分配点;
一个第一语音分配器,用于将第一语的接收语音分配至众多个接收者中的单个或多个第一语音接收者;
一个第二文字至语音转换器,用于将第二语的文字转化成第二语的语音,第二文字至语音转换器位于第一分配点;以及
一个第二语音分配器,用于将第二语的接收语音分配至众多个接收者中的单个或多个第二语音接收者,这些单一或多个第二语音接收者不同于上述单一或多个第一语音接收者。
2、根据权利要求1所述的设备,其每个单个或多个第二接收者位于众多的第二接收点其中一个的附近,而这里每个接收点都不同于第一接收点。
3、一种从始发点通过数码网络向第一分配点发送第一语音的设备,在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音,该设备包括:
一个语音至文字转换器,用于将源语音转化成第一语的文字,该转换器位于始发点;
一个第一文字发送器,用于将文字通过数码网络传送到第一分配点;
一个第一文字至语音转换器,用于将文字转换至第一语言的接收语音,该文字至语音转换器位于第一分配点。
4、根据权利要求3所述的设备,进一步包括一个第一语音分配器,用于将第一语的接收语音分配至众多个接收者中的单个或多个第一语音接收者。
5、根据权利要求4所述的设备,其单一或多个接收者位于某第一接收点附近。
6、根据权利要求5所述的设备,其第一接收点离第一分配点比离始发点更近。
7、根据权利要求3所述的设备,进一步包括一个第二文字至语音转换器,用于将第二语的文字转换至第二语的接收语音,该第二语文字至语音转换器位于第一分配点。
8、根据权利要求7所述的设备,进一步包括一个第二语音分配器,用来将第二语的接收语音分配至众多个接收者中的单个或多个第二语音接收者,这些单一或多个第二语音接收者不同于所述单一或多个第一语音接收者。
9、根据权利要求8所述的设备,其每个单一或多个第二语音接收者位于众多的第二接收点其中一个的附近,这里每一个接收点都不同于所述第一接收点。
10、根据权利要求9所述的设备,其每个第二接收点离第一分配点比离始发点更近。
11、根据权利要求3所述的设备,其第一文字发送器包括:
一个文字翻译器,用于将第一语言的文字翻译成与第一语言不同的第二语言的文字;并且
一个第二文字至语言转换器,用于将第二语言的文字转化成第二语接收语音,该第二文字至语音转换器位于第一分配点。
12、根据权利要求3所述的设备,其源语音是预先录制的语音信号。
13、根据权利要求3所述的设备,并用编程个人电脑作为第一文字至语音转换器。
14、根据权利要求3所述的设备,进一步包括:
一个第二语音至文字转换器,用于将源语音转化成第二文字,该第二语音至文字转换器位于始发点;
一个第二文字发送器,用于将第二语的文字通过数码网络发送至第二分配点;以及
一个第二文字至语音转换器,用于将第二文字转化成第二语的接收语音,该第二文字至语音转换器位于第二分配点。
15、一种从始发点通过数码网络向第一分配点发送第一语音的方法,在始发点的源语音既可以是实况也可以是预先录制的语音,而在第一分配点的语音是接收语音,所述方法包括以下步骤:
a)在始发点将源语音转化成第一语的文字;
b)将所述文字通过数码网络传送至第一分配点;
c)在第一分配点将该文字转化成第一语的接收语音。
16、根据权利要求15所述的方法,进一步包括以下步骤:
d)将第一接收语音分配至众多个接收者中的单个或多个第一语音接收者。
17、根据权利要求16所述的方法,其单一或多个接收者位于第一接收点附近。
18、根据权利要求17所述的方法,其第一接收点离第一分配点比离始发点更近。
19、根据权利要求15所述的方法,进一步包括下列步骤:
d)在第一分配点将第二语的文字转化成第二接收语音。
20、根据权利要求19所述的方法,进一步包括下列步骤:
e)将第二接收语音分配至众多接收者中的单一或多个第二语接收者,这些单一或多个第二语音接收者不同于那些单一或多个第一语音接收者。
21、根据权利要求20所述的方法,其每个单个或多个第二接收者位于众多的第二接收点其中一点的附近,而每一个接收点都不同于所述第一接收点。
22、根据权利要求20所述的方法,其每个第二接收点离第一分配点比离始发点更近。
23、根据权利要求15所述的方法,其中权利要求b)包括以下步骤:
b1)将第一语的文字翻译成与第一语不同的第二语文字;并且
b2)在第一分配点将第二语的文字转化成第二语的接收语音。
24、根据权利要求15所述的方法,其源语音是预先录制的语音信号。
25、根据权利要求15所述的方法,其中权利要求c)用编程个人电脑来实现。
26、根据权利要求15所述的方法,进一步包括以下步骤:
d)在始发点点将源语音转化成第二语文字;
e)将第二语文字通过数码网络发送至第二分配点;以及
f)在第二分配点将第二语文字转化成第二语接收语音。
27、一种从始发点通过数码网络向第一分配点发送第一语音的设备,在始发点的源语音既可以是实况也可以是录制的语音,而在第一分配点的语音是接收语音,该设备包括:
在始发点将源语音转换成第一语文字的手段;
将文字通过数码网络传送到第一分配点的手段;
在第一分配点将文字转换至第一语接收语音的手段。
28、根据权利要求27所述的设备,进一步包括:
将第一语的接收语音分配至众多个接收者中的单个或多个第一语音接收者的手段。
29、根据权利要求26所述的设备,其发送文字的手段包括:
从第一文字翻译成与第一文字不同的第二文字的手段;
在第一分配点处将第二文字转化成第二语音的手段。
30、根据权利要求27所述的设备,进一步包括:
在第一分配点处将第二文字转化成第二语音的手段。
31、根据权利要求30所述的设备,进一步包括:
向众多的接收者中的每个单一或多个第二语音接收者分配第二接收语音的手段,这些单一或多个第二语接收者不同于所述单一或多个第一语接收者。
32、根据权利要求27所述的设备,其源语音是预先录制的语音信号。
33、根据权利要求27所述的设备,其将文字转化成第一语接收语音的手段包括一台编程个人电脑。
34、根据权利要求27所述的设备,进一步包括:
在始发点将源语音转化成第二语文字的手段;
将第二语文字通过数码网络传送到第二分配点的手段;
在第二分配点将第二语的文字转换至第二语接收语音的手段。
35、一种从始发点通过数码网络向第一分配点发送第一语音的设备,在始发点的源语音既可以是实况也可以是录制的语音,而在第一分配点的语音是接收语音,源语音与视频信息同步,该设备包括:
一个语音至文字转换器,用于将源语音转化成第一语的文字,该转换器位于始发点;
一个视频发送器,用于将视频信息通过数码网络传送到第一分配点;
一个文字发送器,用于将文字通过数码网络传送到第一分配点;
一个第一文字至语音转换器,用于将文字转换至第一语言的接收语音,该文字至语音转换器位于第一分配点;
一个视频信息接收器,用来接收由视频发送器传送的视频信息,视频发送器位于所述分配点;
一个语音-视频同步器,用来将接收语音与接收视频信息同步。
36、一种从始发点通过数码网络向第一分配点发送第一语音的方法,在始发点的源语音既可以是实况也可以是录制的语音,而在第一分配点的语音是接收语音,源语音与视频信息同步,所述方法包括以下步骤:
a)在始发点将源语音转化成第一语的文字;
b)将视频信息通过数码网络传送到第一分配点;
c)将所述文字通过数码网络传送到第一分配点;
d)在第一分配点将文字转换至第一语接收语音;
e)在分配点接收由视频发送器传送的视频信息;以及
f)将接收语音与接收视频信息同步。
37、一种从始发点通过数码网络向第一分配点发送第一语音的设备,在始发点的源语音即可以是实况也可以是录制的语音,而在第一分配点的语音是接收语音,源语音与视频信息同步,所述设备包括以下步骤:
a)在始发点将源语音转化成第一语的文字的手段;
b)将视频信息通过数码网络传送到第一分配点的手段;
c)将所述文字通过数码网络传送到第一分配点的手段;
d)在第一分配点将文字转换至第一语接收语音的手段;
e)在分配点接收由视频发送器传送的视频信息的手段;
f)将接收语音与接收视频信息同步的手段。
CN 01806107 2000-03-07 2001-03-07 通过数码网络播放多语言语音的方法和设备 Pending CN1411579A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US52002100A 2000-03-07 2000-03-07
US09/520,021 2000-03-07

Publications (1)

Publication Number Publication Date
CN1411579A true CN1411579A (zh) 2003-04-16

Family

ID=24070860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 01806107 Pending CN1411579A (zh) 2000-03-07 2001-03-07 通过数码网络播放多语言语音的方法和设备

Country Status (4)

Country Link
EP (1) EP1266303B1 (zh)
CN (1) CN1411579A (zh)
AU (1) AU2001245534A1 (zh)
WO (1) WO2001067293A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100458772C (zh) * 2005-10-21 2009-02-04 华为技术有限公司 文字信息通信方法及其系统
US7966339B2 (en) 2004-12-15 2011-06-21 Samsung Electronics Co., Ltd. Method and system for globally sharing and transacting contents in local area
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统
CN104575579A (zh) * 2013-10-24 2015-04-29 拓集科技股份有限公司 语音管理方法及语音管理系统
WO2017124294A1 (zh) * 2016-01-19 2017-07-27 王晓光 一种视频网络会议的会议记录方法及系统
CN107480146A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种识别语种语音的会议纪要快速翻译方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949289B2 (en) 2009-05-05 2015-02-03 NoteVault, Inc. System and method for multilingual transcription service with automated notification services
CN107241200A (zh) * 2017-07-17 2017-10-10 澳门理工学院 一种网络会议方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3704345A (en) 1971-03-19 1972-11-28 Bell Telephone Labor Inc Conversion of printed text into synthetic speech
CA1294056C (en) * 1986-10-03 1992-01-07 Frederick Warwick Michael Stentiford Language translation system
US4882681A (en) * 1987-09-02 1989-11-21 Brotz Gregory R Remote language translating device
EP0542628B1 (en) 1991-11-12 2001-10-10 Fujitsu Limited Speech synthesis system
EP0702873B1 (en) * 1992-06-15 1997-10-01 BRITISH TELECOMMUNICATIONS public limited company Service platform
EP0607615B1 (en) * 1992-12-28 1999-09-15 Kabushiki Kaisha Toshiba Speech recognition interface system suitable for window systems and speech mail systems
GB2280820A (en) * 1993-07-29 1995-02-08 Ibm Distributed system for call processing
US5615296A (en) * 1993-11-12 1997-03-25 International Business Machines Corporation Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors
FR2713800B1 (fr) * 1993-12-15 1996-03-15 Jean Gachot Procédé et dispositif pour transformer un premier message vocal dans une première langue, en un second message vocal prononcé dans une seconde langue prédéterminée.
JPH0863478A (ja) * 1994-08-26 1996-03-08 Toshiba Corp 言語処理方法及び言語処理装置
US5900908A (en) 1995-03-02 1999-05-04 National Captioning Insitute, Inc. System and method for providing described television services
US5696879A (en) * 1995-05-31 1997-12-09 International Business Machines Corporation Method and apparatus for improved voice transmission
US5815196A (en) * 1995-12-29 1998-09-29 Lucent Technologies Inc. Videophone with continuous speech-to-subtitles translation
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7966339B2 (en) 2004-12-15 2011-06-21 Samsung Electronics Co., Ltd. Method and system for globally sharing and transacting contents in local area
CN100458772C (zh) * 2005-10-21 2009-02-04 华为技术有限公司 文字信息通信方法及其系统
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统
CN104575579A (zh) * 2013-10-24 2015-04-29 拓集科技股份有限公司 语音管理方法及语音管理系统
WO2017124294A1 (zh) * 2016-01-19 2017-07-27 王晓光 一种视频网络会议的会议记录方法及系统
CN107480146A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种识别语种语音的会议纪要快速翻译方法

Also Published As

Publication number Publication date
EP1266303A4 (en) 2005-09-21
EP1266303B1 (en) 2014-10-22
EP1266303A1 (en) 2002-12-18
WO2001067293A1 (en) 2001-09-13
AU2001245534A1 (en) 2001-09-17

Similar Documents

Publication Publication Date Title
US9547642B2 (en) Voice to text to voice processing
US7035804B2 (en) Systems and methods for automated audio transcription, translation, and transfer
KR100361680B1 (ko) 맞춤형 콘텐츠 제공방법 및 시스템
US6820055B2 (en) Systems and methods for automated audio transcription, translation, and transfer with text display software for manipulating the text
JP4378284B2 (ja) ワールド・ワイド・ウェブからの情報を使用してライブ・スピーチの機能を拡張するためのシステムおよび方法
CN1696923A (zh) 网络上的多种媒体的同步合成存储发布系统及操作该系统的方法
WO2002067537A2 (en) Data streaming system substituting local content for unicasts
KR20130029055A (ko) 청각 장애인을 위해 음성 언어를 수화로 번역하기 위한 시스템
WO2018227761A1 (zh) 一种教学录播数据修正装置
US20120105719A1 (en) Speech substitution of a real-time multimedia presentation
CN116527840B (zh) 一种基于云边协同的直播会议智能字幕显示方法和系统
CN109324811A (zh) 一种用于更新教学录播数据的装置
CN101351838A (zh) 可搜索多媒体流
CN101453591A (zh) 用于呈现交互式多媒体节目的系统和方法
CN1411579A (zh) 通过数码网络播放多语言语音的方法和设备
González-Carrasco et al. Sub-sync: Automatic synchronization of subtitles in the broadcasting of true live programs in spanish
JP2013029684A (ja) 音声データ書き起こし用webサイトシステム
CN101924932A (zh) Cnvs多媒体课件快速制作方法
US20220264193A1 (en) Program production apparatus, program production method, and recording medium
JP2004266551A (ja) ストリームデータ生成装置、ストリームデータ生成システム、ストリームデータ生成方法及びプログラム
JP2020178262A (ja) 生字幕整形処理装置及びプログラム
Artioli et al. Generative AI for Realistic Voice Dubbing Across Languages
Ubik et al. Lessons learned from distance collaboration in live culture
Eizmendi Automatic speech recognition for live TV subtitling for hearing-impaired people
Pražák et al. Captioning of live TV programs through speech recognition and re-speaking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication