CN113868211A - 语音文件格式转换方法及装置 - Google Patents
语音文件格式转换方法及装置 Download PDFInfo
- Publication number
- CN113868211A CN113868211A CN202111137844.7A CN202111137844A CN113868211A CN 113868211 A CN113868211 A CN 113868211A CN 202111137844 A CN202111137844 A CN 202111137844A CN 113868211 A CN113868211 A CN 113868211A
- Authority
- CN
- China
- Prior art keywords
- voice file
- file
- format conversion
- voice
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/178—Techniques for file synchronisation in file systems
- G06F16/1794—Details of file format conversion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种语音文件格式转换方法及装置,所述方法包括:提取目标应用程序中对应的原始语音文件;向所述原始语音文件添加索引,获取第一语音文件;向服务端发送所述第一语音文件,以使得所述服务器端基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件。本发明提供的语音文件格式转换方法及装置,基于提取目标程序中的原始语音文件,通过将为原始语音文件添加索引,获取第一语音文件并上传至服务端,将第一语音文件转换为第二语音文件,能够将特定格式的语音文件,在其他应用程序上进行解码播放,提高特定格式的语音文件的可用性。
Description
技术领域
本发明涉及文件处理技术领域,尤其涉及一种语音文件格式转换方法及装置。
背景技术
即时通讯软件,可以实现用户之间可以通过发送语音文件进行音频交流。
现有技术中,社交软件中进行即时通联的语音文件大多为特定格式(例如amr格式)的音频文件。amr格式是一种高压缩比音频格式,其音质不如其他种类的编码方式,但是其存储容量非常小,是适合移动端的一种编码方式。但是,在查询某一个语音文件时,只能在对应的社交软件界面内逐级筛选,操作繁琐;若直接根据文件名进行查询检索,无法通过常用的音频播放程序对该文件进行解码播放,以确定检索结果是否正确。因此,现有技术对上述特定格式的语音文件的检索不方便,特定格式的语音文件的可用性较低。
发明内容
本发明提供一种语音文件格式转换方法及装置,用以解决现有技术中特定格式的语音文件的检索不方便,特定格式的语音文件的可用性较低的缺陷,实现在对特定格式的语音文件进行格式转换,以使得在其他应用程序获知语音文件的内容。
本发明提供一种语音文件格式转换方法,包括:
提取目标应用程序对应的原始语音文件;
向所述原始语音文件添加索引,获取第一语音文件;
向服务端发送所述第一语音文件,以使得所述服务器端基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第二语音文件的格式与所述第一语音文件的格式不同。
根据本发明提供的一种语音文件格式转换,所述获取第一语音文件之后,还包括:
将所述第一语音文件存储至目标路径;
所述向服务端发送所述第一语音文件之后,还包括:
接收所述服务端反馈上传状态信息;
在所述上传状态信息符合预设条件的情况下,在所述目标路径中清理所述第一语音文件。
本发明还提供一种语音文件格式转换,包括:
接收电子设备发送的第一语音文件;
基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第一语音文件,是向目标应用程序对应的原始语音文件,添加索引后得到的,所述第二语音文件的格式与所述第一语音文件的格式不同。
根据本发明提供的一种语音文件格式转换,所述接收电子设备发送的第一语音文件之后,还包括:向所述电子设备反馈上传状态信息,以使得所述电子设备在所述上传状态信息符合预设条件的情况下,在目标路径中清理所述第一语音文件。
根据本发明提供的一种语音文件格式转换,所述基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件,包括:
基于所述第一语音文件,获取字节流文件;
在所述字节流文件完整的情况下,基于所述目标音频解码库对所述第一语音文件进行格式转换,获取所述第二语音文件。
本发明还提供一种语音文件格式转换装置,包括:
原始文件获取模块,用于提取目标应用程序对应的原始语音文件;
第一获取模块,用于向所述原始语音文件添加索引,获取第一语音文件;
发送模块,用于向服务端发送所述第一语音文件,以使得所述服务器端基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第二语音文件的格式与所述第一语音文件的格式不同。
本发明还提供一种语音文件格式转换装置,包括:
第一接收模块,用于接收电子设备发送的第一语音文件;
格式转换模块,用于基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第一语音文件,是向目标应用程序对应的原始语音文件,添加索引后得到的,所述第二语音文件的格式与所述第一语音文件的格式不同。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音文件格式转换方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音文件格式转换方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音文件格式转换方法的步骤。
本发明提供的语音文件格式转换方法及装置,基于提取目标程序中的原始语音文件,通过将为原始语音文件添加索引,获取第一语音文件并上传至服务端,将第一语音文件转换为第二语音文件,能够将特定格式的语音文件,在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的语音文件格式转换方法的流程示意图之一;
图2是本发明提供的语音文件格式转换方法的流程示意图之二;
图3是本发明提供的语音文件格式转换装置的结构示意图之一;
图4是本发明提供的语音文件格式转换装置的结构示意图之二;
图5是本发明提供的语音文件格式转换装置的总结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
图1是本发明提供的语音文件格式转换方法的流程示意图之一。如图1所示,本发明实施例提供的语音文件格式转换方法,包括:步骤101、提取目标应用程序对应的原始语音文件。
需要说明的是,本发明实施例提供的语音文件格式转换方法的执行主体为语音文件格式转换装置。语音文件格式转换装置可以是运载某种应用程序的移动端设备,例如,移动电话、智能电话、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、智能手环或者智能手表等,以使得在移动端设备执行语音文件格式转换方法。
语音文件格式转换装置的处理对象为在具有社交功能的应用程序中进行即时通讯的音频文件。
目标应用程序,是指能够通过即时通讯技术来实现在线聊天、交流的软件。目标应用程序可以进行文本信息交流、多媒体方式交流(例如音频或者视频)以及传送文件。
具体地,在步骤101中,语音文件格式转换装置在目标应用程序下的文件目录,按照文件的存储格式进行扫描,提取出原始语音文件。
原始语音文件,是指在目标应用程序中进行即时通讯的音频文件,一般存储在目标应用程序对应的文件夹中的某一个文件目录下,本发明实施例对原始语音文件的存储格式不作具体限定。
优选地,语音文件格式转换装置在目标应用程序下的文件目录,提取出文件存储格式amr格式的原始语音文件。
由于原始语音文件用于在通信网络中进行传输,所以需要压缩音频文件的大小,以便于传输。而每秒钟的amr音频大小可控制在1K左右,因此即便是长达1分钟的音频文件,也不超过50K。
示例性地,语音文件格式转换装置对某一社交软件对应的文件夹中,用于存储即时通讯过程中传输的文件的文件目录中进行扫描,识别出该社交软件的amr语音文件。
步骤102、向原始语音文件添加索引,获取第一语音文件。
需要说明的是,在步骤102之前,需要根据目标应用程序,获取与其对应的预设规则。
预设规则,是指对原始语音文件的文件名进行解析识别的规则。预设规则用于将原始语音文件的文件名中逻辑不相关的编码提取出目标信息,以实现该文件添加索引便可获知其相关信息。其中,不同的目标应用程序,对应不同的预设规则。
目标信息,是指区分原始语音文件内容的属性信息。本发明实施例对此不作具体限定,例如,目标信息可以是原始语音文件的时间属性和收发属性中的一种或者多种。
具体地,在步骤102中,语音文件格式转换装置对步骤101中获取的原始语音文件,按照预设规则对原始语音文件的文件名进行解析提取,获取目标信息,将由目标信息构成的新的命名信息赋予原始语音文件作为索引,形成第一语音文件,并将第一语音文件存放至新的目标路径下,以等待上传至服务端。
第一语音文件,是指与原始语音文件内容相同,文件名不同的文件。第一语音文件用于根据第一语音文件的文件名获知该文件的目标信息。
需要说明的是,第一语音文件的格式可以为amr格式。由于原始语音文件的压缩幅度过大,所以原始语音文件仅能在目标应用程序中进行解码播放,以获取对应的音频内容。但是,在原始语音文件所在的文件目录中并不能对该语音文件进行解码播放,同理,即使获取到该文件,也无法在其他应用程序中解码播放。
因此,在步骤101中语音文件格式转换装置获取到原始语音文件后,无法获知该文件的必要属性(例如,时间属性或者内容属性等),只能获知该文件的文件名。并且,原始语音文件的命名通常是不同的目标应用程序根据基本的业务信息以对应规则进行逻辑不相关的编码,所以,语音文件格式转换装置也无法根据文件名获取到该文件的相关信息。本发明实施例对第一语音文件的文件名携带的目标信息不作具体限定。
例如,第一语音文件的文件名可以是以原始语音文件生成的时间命名,其精度可以到秒。
假设原始语音文件是本机发向其他电子设备,则该文件的收发属性为发送,可以用字符“1”表示。反之,若收发属性为接收,则可以用字符“2”表示。所以,第一语音文件的文件名可以是以原始语音文件接收/发送的时间结合收发属性字段命名。
步骤103、向服务端发送第一语音文件,以使得服务器端基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件。
其中,第二语音文件的格式与第一语音文件的格式不同。
具体地,在步骤103中,语音文件格式转换装置将第一语音文件,发送至服务端。以使得部署在服务端的语音文件格式转换装置接收到第一语音文件,并对其转换为第二语音文件。
第二语音文件,是指与第一语音文件的文件内容一样,存储格式不同的文件。第二语音文件用于在任一设备进行解码播放,以获取其文件内容。本发明实施例对第二语音文件的文件格式不作具体限定。
优选地,第二语音文件的文件格式为wav格式,其中,wav格式的语音文件能记录各种单声道或立体声的声音信息,基本无数据压缩,保证声音不失真。并且,可以在其基础上转换成任意其他格式。
本发明实施例对部署在电子设备的语音文件格式转换装置和部署在服务端的语音文件格式转换装置之间的交互方式不作具体限定。
优选地,部署在电子设备的语音文件格式转换装置提取出缓存目录中第一语音文件,按照互联网Http协议的Post方式,向部署在服务端的语音文件格式转换装置进行文件传输请求,以使得部署在服务端的语音文件格式转换装置接收到第一语音文件,并对其转换为第二语音文件。
在用户意图获知某一时刻接收到的语音文件的内容这一场景下,现有技术中,一般是在目标应用程序中,选择该原始语音文件的图标,由目标应用程序对原始语音文件进行解码播放,以获取语音文件的内容。
而在本发明实施例中,语音文件格式转换装置提取原始语音文件,将其识别为第一语音文件,能够通过第一语音文件的文件名中携带的目标信息获知该文件与时间的对应关系,并可以将不同应用程序的第一语音文件存至统一目标路径,等待上传至服务端,使得服务端对时间属性已知的第一语音文件,转换成第二语音文件,实现其他应用程序中也能获取文件内容。避免了无法通过原始语音文件的检索繁琐、无法脱离对应的目标应用程序进行解析。
本发明实施例基于提取目标程序中的原始语音文件,通过将为原始语音文件添加索引,获取第一语音文件并上传至服务端,将第一语音文件转换为第二语音文件,能够将特定格式的语音文件,在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
在上述任一实施例的基础上,获取第一语音文件之后,还包括:将第一语音文件存储至目标路径。
具体地,语音文件格式转换装置将步骤102中获取的第一语音文件,按照索引中的时间属性于文件目录的对应关系,存储至目标路径。
目标路径,是指不同于原始语音文件所处的文件目录的路径。目标路径,用于存放不同目标应用程序的第一语音文件。本发明实施例对此不作具体限定。例如,可以是隶属于语音文件格式转换装置的一个路径。
示例性地,语音文件格式转换装置在对应的文件夹下按照日期+小时构建缓存目录,根据第一语音文件携带的索引中的时间属性,将第一语音文件存放至与该时间属性对应的缓存目录中。
向服务端发送第一语音文件之后,还包括:接收服务端反馈上传状态信息。
需要说明的是,在步骤103之后,部署在服务端的语音文件格式转换装置同样按照日期+小时构建与目标路径对应的缓存目录,该缓存目录用于存储上传成功的第一语音文件存储,以及转换后的第二语音文件。并在成功接收到第一语音文件后,向部署在电子设备的语音文件格式转换装置反馈上传状态信息。
具体地,语音文件格式转换装置接收由服务端根据是否接收到第一语音文件所反馈的上传状态信息。
其中,上传状态信息,用于指示服务端是否接收到第一语音文件。本发明实施例对上传状态信息不作具体限定。
例如,上传信息状态可以包括与每个第一语音文件对应的上传请求成功或失败状态信息。上传信息状态也还可以包括文件日志,该日志记载一段时间内所有的第一语音文件对应的上传请求成功或失败状态信息。
在上传状态信息符合预设条件的情况下,在目标路径中清理第一语音文件。
需要说明的是,预设条件,是指针对上传状态信息进行判断的条件,以使得部署在电子设备的语音文件格式转换装置获知是否上传成功。
具体地,语音文件格式转换装置根据接收到的上传状态信息,结合预设条件进行判断。
若上传状态信息符合预设条件,则说明第一语音文件上传成功,语音文件格式转换装置可以将上传成功的第一语音文件,从目标路径中进行删除清理,以节省存储空间。
若上传状态信息不符合预设条件,则说明第一语音文件上传失败,语音文件格式转换装置可以将上传失败的第一语音文件执行步骤103进行重新上传,直至上传状态信息符合预设条件后,将该文件从目标路径中清理出去,以节省存储空间。
示例性地,假设上传状态信息为文件日志,该文件日志包含10条信息,预设条件为日志文件中任一条信息包含字段“Success”,即该条信息指示对应的第一语音文件上传成功,可删除该第一语音文件。
若第1条信息和第2条信息包含字段“Fail”,其余信息均包含字段“Success”,则部署在电子设备的语音文件格式转换装置根据预设条件可判定,将第3-10条信息从目标路径中删除,并再次上传第1条信息和第2条信息。
本发明实施例基于服务端反馈上传状态信息,通过预设条件进行判定,将符合预设条件的第一语音文件从目标路径中删除清理,能够节约存储空间。进一步地,将特定格式的语音文件,在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
图2是本发明提供的语音文件格式转换方法的流程示意图之二。如图2所示,本发明实施例提供的语音文件格式转换方法,包括:步骤201、接收电子设备发送的第一语音文件。
其中,第一语音文件,是向目标应用程序对应的原始语音文件,添加索引后得到的。
需要说明的是,本发明实施例提供的语音文件格式转换方法的执行主体为语音文件格式转换装置。语音文件格式转换装置可以是运载某种应用程序的服务端设备,本发明实施例对服务端不作具体限定。
例如,服务端可以包括至少一台个人计算机或者个人电脑(Personal Computer,PC),例如传统的台式电脑、DIY电脑、笔记本电脑、一体机电脑、超级本、掌上电脑或者嵌入式计算机,以使得在服务端设备执行语音文件格式转换方法。
服务端还可以是一台云计算服务器,接入互联网网络,用于存储上传的第一语音文件,以及处理后的第二语音文件,同时作为将第一语音文件转换成第二语音文件处理过程的运行载体。
具体地,在步骤201中,语音文件格式转换装置接收由电子设备发送的提交数据的请求,并相应于该请求,获取第一语音文件。
其中,第一语音文件的格式可以为amr格式。
步骤202、基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件。
其中,第二语音文件的格式与第一语音文件的格式不同。
需要说明的是,目标音频解码库,是指一个信号或者一个数据流进行变换所需的对应关系的集合。目标音频解码库用于对输入信息转换为第二语音文件。本发明实施例对目标音频解码库不作具体限定。
例如,可以是根据不同的第二语音文件的文件格式,确定不同的目标音频解码库。
还可以是将目标音频解码库类型确定为wav音频文件编码库,将输入信息转换成wav格式,并作为第二语音文件的文件格式。若第二语音文件的文件格式为其他格式,则根据具有wav格式的第二语音文件压缩成指定格式。
具体地,在步骤202中,语音文件格式转换装置根据第一语音文件和目标音频解码库,按照指定对应关系,将第一语音文件的文件格式进行转换,并由转换后的文件格式作为第二语音文件的文件格式。
优选地,部署在服务端的语音文件格式转换装置根据FFMPEG软件提供wav音频文件编码库,对第一语音文件的帧数据按照.wav音频文件编码库标准进行批量转帧处理,解码为.wav编码库标准帧文件,以生成第二语音文件。
在步骤202之后,语音文件格式转换装置提供多线程文件写入接口,按照日期+小时构建.wav文件缓存目录,将解码后的第二语音文件批量写入数.wav文件缓存目录。
在用户意图获知某一时刻接收到的语音文件的内容这一场景下,现有技术中,一般是在目标应用程序中,选择该原始语音文件的图标,由目标应用程序对原始语音文件进行解码播放,以获取语音文件的内容。
但是,对于具有amr格式的原始语音文件,无论是从电子设备,还是服务端,都无法通过其他应用程序对其进行解码播放。在无法对该文件解码播放的前提下,也无法通过原始语音文件的文件名确认该原始文件是否于用户所需要在某一时刻接收的语音文件对应。
而在本发明实施例中,语音文件格式转换装置对时间属性已知的第一语音文件,转换成第二语音文件,实现其他应用程序中也能获取正确文件中的文件内容。
本发明实施例基于获取第一语音文件,通过第一语音文件和目标音频解码库进行批量处理,获取第二语音文件,能够将特定格式的语音文件,在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
在上述任一实施例的基础上,接收电子设备发送的第一语音文件之后,还包括:向电子设备反馈上传状态信息,以使得电子设备在上传状态信息符合预设条件的情况下,在目标路径中清理第一语音文件。
需要说明的是,部署在服务端的语音文件格式转换装置同样按照日期+小时构建与目标路径对应的缓存目录,该缓存目录用于存储上传成功的第一语音文件存储,以及转换后的第二语音文件。
具体地,在步骤201之后,语音文件格式转换装置根据第一语音文件是否存在于服务端的缓存目录,获取上传状态信息,并反馈给电子设备。
电子设备在接收到上传状态信息后,根据上传状态信息和预设条件,判定第一语音文件是否上传成功,对上传成功的第一语音文件进行删除清理。
优选地,语音文件格式转换装置提供多线程文件读取接口,批量获取第一语音文件。
本发明实施例基于向电子设备反馈上传状态信息,进而,使电子设备通过上传状态信息和预设条件进行文件清理,能够节约存储空间。进一步地,能够将特定格式的语音文件在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
在上述任一实施例的基础上,基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件,包括:基于第一语音文件,获取字节流文件。
需要说明的是,在步骤202中,在获取第二语音文件之前,需要获取另一种音频/视频编解码库。该音频/视频编解码库用于对第一语音文件解码为字节流文件。本发明实施例对此不作具体限定。
例如,在服务端安装开源FFMPEG软件包,由FFMPEG软件提供音频/视频编解码库libavcodec,保证第一语音文件的高可移植性和编解码质量。
具体地,语音文件格式转换装置将第一语音文件按照音频/视频编解码库进行初步解码,获取字节流文件。
本发明实施例对字节流文件的获取方式不作具体限定。
示例性地,语音文件格式转换装置提供多线程文件读取接口,批量获取第一语音文件,并将转化处理为Inputstream字节输入流文件。
在字节流文件完整的情况下,基于字节流文件和目标音频解码库,获取第二语音文件。
具体地,语音文件格式转换装置根据字节流文件对第一语音文件的完整性进行判断,若字节流文件完整,则说明第一语音文件在移植过程中不存在数据丢失,语音文件格式转换装置可以根据字节流文件和目标音频解码库进行解码,获取第二语音文件。
若字节流文件不完整,则说明第一语音文件在移植过程中存在数据丢失,语音文件格式转换装置不可以根据字节流文件和目标音频解码库进行解码,获取第二语音文件。
本发明实施例对字节流文件的处理过程不作具体限定。
优选地,语音文件格式转换装置读取字节流文件首帧,根据帧头计算标准帧的大小,读取帧头字节用于判断是否坏帧,依据标准帧判定结构,以表征第一语音文件是否被部署在服务端的语音文件格式转换装置完整读取。
本发明实施例基于第一语音文件获取字节流文件,通过判断字节流文件完整的情况下,根据字节流文件和目标音频解码库获取第二语音文件。能够向电子设备反馈上传状态信息,进而,使电子设备通过上传状态信息和预设条件进行文件清理,能够能够节约存储空间。进一步地,能够保证第一语音文件的可移植性和编解码质量,进一步地,能够将特定格式的语音文件在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
图3是本发明提供的语音文件格式转换装置的结构示意图之一。如图3所示,本发明实施例提供的语音文件格式转换装置,包括:原始文件获取模块310、第一获取模块320和发送模块330,其中:
原始文件获取模块310,用于提取目标应用程序对应的原始语音文件。
第一获取模块320,用于向原始语音文件添加索引,获取第一语音文件。
发送模块330,用于向服务端发送第一语音文件,以使得服务器端基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件。
其中,第二语音文件的格式与第一语音文件的格式不同。
具体地,原始文件获取模块310、第一获取模块320和发送模块330顺次电连接。
原始文件获取模块310在目标应用程序下的文件目录,按照文件的存储格式进行扫描,提取出原始语音文件。
第一获取模块320对原始文件获取模块310中获取的原始语音文件,按照预设规则对原始语音文件的文件名进行解析提取,获取新的命名信息,并将新的命名信息赋予原始语音文件作为索引,形成第一语音文件,并将第一语音文件存放至新的目标路径下,以等待上传至服务端。
发送模块330将第一语音文件,发送至服务端。以使得部署在服务端的语音文件格式转换装置接收到第一语音文件,并对其转换为第二语音文件。
可选地,该装置还包括存储模块、第二接收模块和清理模块,其中:
存储模块,用于将第一语音文件存储至目标路径。
第二接收模块,用于接收服务端反馈上传状态信息。
清理模块,用于在上传状态信息符合预设条件的情况下,在目标路径中清理第一语音文件。
本发明实施例提供的语音文件格式转换装置为移动端的电子设备。
本发明实施例提供的语音文件格式转换装置,用于执行本发明上述基于语音文件格式转换方法,其实施方式与本发明提供的语音文件格式转换方法的实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本发明实施例基于提取目标程序中的原始语音文件,通过将为原始语音文件添加索引,获取第一语音文件并上传至服务端,将第一语音文件转换为第二语音文件,能够将特定格式的语音文件,在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
图4是本发明提供的语音文件格式转换装置的结构示意图之二。如图4所示,本发明实施例提供的语音文件格式转换装置,包括:第一接收模块410和格式转换模块420,其中:
第一接收模块410,用于接收电子设备发送的第一语音文件。
格式转换模块420,用于基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件。
其中,第一语音文件,是向目标应用程序对应的原始语音文件,添加索引后得到的,第二语音文件的格式与第一语音文件的格式不同。
具体地,第一接收模块410和格式转换模块420顺次电连接。
第一接收模块410接收由电子设备发送的提交数据的请求,并相应于该请求,获取第一语音文件。
格式转换模块420根据第一语音文件和目标音频解码库,按照指定对应关系,将第一语音文件的文件格式进行转换,并由转换后的文件格式作为第二语音文件的文件格式。
可选地,该装置还包括反馈模块,其中:
反馈模块,用于向电子设备反馈上传状态信息,以使得电子设备在上传状态信息符合预设条件的情况下,在目标路径中清理第一语音文件。
可选地,格式转换模块420包括字节流文件获取单元和解码单元,其中:
字节流文件获取单元,用于基于第一语音文件,获取字节流文件。
解码单元,用于在字节流文件完整的情况下,基于字节流文件和目标音频解码库,获取第二语音文件。
本发明实施例提供的语音文件格式转换装置为服务端的电子设备。
本发明实施例提供的语音文件格式转换装置,用于执行本发明上述基于语音文件格式转换方法,其实施方式与本发明提供的语音文件格式转换方法的实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本发明实施例基于获取第一语音文件,通过第一语音文件和目标音频解码库进行批量处理,获取第二语音文件,能够将特定格式的语音文件,在其他应用程序上进行解析播放,提高特定格式的语音文件的可用性。
图5是本发明提供的语音文件格式转换装置的总结构示意图。如图5所示,本发明实施例提供的语音文件格式转换装置500由部署在移动端的电子设备上的语音文件格式转换装置510和部署在服务端的电子设备上的语音文件格式转换装置520构成,其中:
部署在移动端的电子设备上的语音文件格式转换装置510,由原始文件获取模块511、第一获取模块512和发送模块513顺次电连接,其中:
原始文件获取模块511在目标应用程序下的文件目录,按照文件的存储格式进行扫描,提取出原始语音文件。
第一获取模块512对原始文件获取模块511中获取的原始语音文件,按照预设规则对原始语音文件的文件名进行解析提取,获取新的命名信息,并将新的命名信息赋予原始语音文件,形式第一语音文件,并将第一语音文件存放至新的目标路径下,以等待上传至服务端。
发送模块513将在目标路径下的第一语音文件,发送至服务端。以使得部署在服务端的语音文件格式转换装置接收到第一语音文件,并对其转换为第二语音文件。
部署在服务端的电子设备上的语音文件格式转换装置520,由第一接收模块521和格式转换模块522顺次电连接。
第一接收模块521接收由电子设备发送的提交数据的请求,并相应于该请求,获取第一语音文件。
格式转换模块522根据第一语音文件和目标音频解码库,按照指定对应关系,将第一语音文件的文件格式进行转换,并由转换后的文件格式作为第二语音文件的文件格式。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(CommunicationsInterface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行语音文件格式转换方法,该方法包括:提取目标应用程序对应的原始语音文件;向原始语音文件添加索引,获取第一语音文件;向服务端发送第一语音文件,以使得服务器端基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件;其中,第二语音文件的格式与第一语音文件的格式不同。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的语音文件格式转换方法,该方法包括:提取目标应用程序对应的原始语音文件;向原始语音文件添加索引,获取第一语音文件;向服务端发送第一语音文件,以使得服务器端基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件;其中,第二语音文件的格式与第一语音文件的格式不同。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的语音文件格式转换方法,该方法包括:提取目标应用程序对应的原始语音文件;向原始语音文件添加索引,获取第一语音文件;向服务端发送第一语音文件,以使得服务器端基于目标音频解码库对第一语音文件进行格式转换,获取第二语音文件;其中,第二语音文件的格式与第一语音文件的格式不同。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音文件格式转换方法,其特征在于,包括:
提取目标应用程序对应的原始语音文件;
向所述原始语音文件添加索引,获取第一语音文件;
向服务端发送所述第一语音文件,以使得所述服务器端基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第二语音文件的格式与所述第一语音文件的格式不同。
2.根据权利要求1所述的语音文件格式转换方法,其特征在于,所述获取第一语音文件之后,还包括:
将所述第一语音文件存储至目标路径;
所述向服务端发送所述第一语音文件之后,还包括:
接收所述服务端反馈上传状态信息;
在所述上传状态信息符合预设条件的情况下,在所述目标路径中清理所述第一语音文件。
3.一种语音文件格式转换方法,其特征在于,包括:
接收电子设备发送的第一语音文件;
基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第一语音文件,是向目标应用程序对应的原始语音文件,添加索引后得到的,所述第二语音文件的格式与所述第一语音文件的格式不同。
4.根据权利要求3所述的语音文件格式转换方法,其特征在于,所述接收电子设备发送的第一语音文件之后,还包括:
向所述电子设备反馈上传状态信息,以使得所述电子设备在所述上传状态信息符合预设条件的情况下,在目标路径中清理所述第一语音文件。
5.根据权利要求4所述的语音文件格式转换方法,其特征在于,所述基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件,包括:
基于所述第一语音文件,获取字节流文件;
在所述字节流文件完整的情况下,基于所述目标音频解码库对所述第一语音文件进行格式转换,获取所述第二语音文件。
6.一种语音文件格式转换装置,其特征在于,包括:
原始文件获取模块,用于提取目标应用程序对应的原始语音文件;
第一获取模块,用于向所述原始语音文件添加索引,获取第一语音文件;
发送模块,用于向服务端发送所述第一语音文件,以使得所述服务器端基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第二语音文件的格式与所述第一语音文件的格式不同。
7.一种语音文件格式转换装置,其特征在于,包括:
第一接收模块,用于接收电子设备发送的第一语音文件;
格式转换模块,用于基于目标音频解码库对所述第一语音文件进行格式转换,获取第二语音文件;
其中,所述第一语音文件,是向目标应用程序对应的原始语音文件,添加索引后得到的,所述第二语音文件的格式与所述第一语音文件的格式不同。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述语音文件格式转换方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述语音文件格式转换方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述语音文件格式转换方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111137844.7A CN113868211A (zh) | 2021-09-27 | 2021-09-27 | 语音文件格式转换方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111137844.7A CN113868211A (zh) | 2021-09-27 | 2021-09-27 | 语音文件格式转换方法及装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN113868211A true CN113868211A (zh) | 2021-12-31 |
Family
ID=78991418
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202111137844.7A Pending CN113868211A (zh) | 2021-09-27 | 2021-09-27 | 语音文件格式转换方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN113868211A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117995140A (zh) * | 2023-12-29 | 2024-05-07 | 北京建筑大学 | 一种基于音源分离的自动记谱方法和装置 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20000024318A (ko) * | 2000-02-07 | 2000-05-06 | 한남용 | 인터넷을 이용한 tts 시스템 및 tts 서비스 방법 |
| US20090109333A1 (en) * | 2007-10-25 | 2009-04-30 | Sony Corporation | Data conversion method and data conversion device, data recording device, data playing device, and computer program |
| CN102521400A (zh) * | 2011-12-23 | 2012-06-27 | 中国农业大学 | 畜禽养殖过程海量数据自动处理方法及系统 |
| CN110176256A (zh) * | 2019-04-15 | 2019-08-27 | 平安科技(深圳)有限公司 | 录音文件格式转换方法、装置、计算机设备以及存储介质 |
| US20210185415A1 (en) * | 2019-12-12 | 2021-06-17 | SquadCast, Inc. | Simultaneous recording and uploading of multiple audio files of the same conversation and audio drift normalization systems and methods |
-
2021
- 2021-09-27 CN CN202111137844.7A patent/CN113868211A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20000024318A (ko) * | 2000-02-07 | 2000-05-06 | 한남용 | 인터넷을 이용한 tts 시스템 및 tts 서비스 방법 |
| US20090109333A1 (en) * | 2007-10-25 | 2009-04-30 | Sony Corporation | Data conversion method and data conversion device, data recording device, data playing device, and computer program |
| CN102521400A (zh) * | 2011-12-23 | 2012-06-27 | 中国农业大学 | 畜禽养殖过程海量数据自动处理方法及系统 |
| CN110176256A (zh) * | 2019-04-15 | 2019-08-27 | 平安科技(深圳)有限公司 | 录音文件格式转换方法、装置、计算机设备以及存储介质 |
| US20210185415A1 (en) * | 2019-12-12 | 2021-06-17 | SquadCast, Inc. | Simultaneous recording and uploading of multiple audio files of the same conversation and audio drift normalization systems and methods |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117995140A (zh) * | 2023-12-29 | 2024-05-07 | 北京建筑大学 | 一种基于音源分离的自动记谱方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10249301B2 (en) | Method and system for speech recognition processing | |
| TWI507063B (zh) | 資訊共用方法、終端、伺服器及系統 | |
| CN108540868A (zh) | Hls直播的处理方法、装置、服务器、终端及存储介质 | |
| JP6607968B2 (ja) | ライブビデオストリーミングにプッシュ情報を挿入する方法、サーバ及び端末 | |
| CN104392712A (zh) | 一种实现卡拉ok功能的方法及装置 | |
| CN103166681A (zh) | 近距离场景下的信息传输方法及系统 | |
| CN106961421A (zh) | 一种Android系统服务端、远程桌面音频重定向方法及系统 | |
| CN102131114A (zh) | 一种播放列表提供方法及系统 | |
| CN104104999A (zh) | 音视频信息推荐方法及设备 | |
| CN112138376A (zh) | 云游戏存档方法、装置和电子设备 | |
| US11196868B2 (en) | Audio data processing method, server, client and server, and storage medium | |
| CN119343872A (zh) | 跨模态数据补全和压缩 | |
| US20160087928A1 (en) | Collaborative and interactive queuing and playback of content using electronic messaging | |
| CN111782543A (zh) | 一种在云端进行的评测方法、相关设备及系统 | |
| CN102811235A (zh) | 一种媒体文件离线下载方法、装置及离线下载服务器 | |
| CN109600650B (zh) | 用于处理数据的方法和装置 | |
| CN113868211A (zh) | 语音文件格式转换方法及装置 | |
| CN103399737A (zh) | 基于语音数据的多媒体处理方法及装置 | |
| CN108023856B (zh) | 一种信息共享的方法及装置 | |
| CN105760436B (zh) | 音频数据的处理方法及装置 | |
| US11942100B1 (en) | Encoding audio metadata in an audio frame | |
| KR101351264B1 (ko) | 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법 | |
| CN102387177B (zh) | 影音文件的下载方法及装置 | |
| CN105553933A (zh) | 一种笔记处理方法、终端设备及系统 | |
| CN105743897A (zh) | 互联网音频实时同步传输系统及方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211231 |