WO2023213270A1

WO2023213270A1 - 模型训练处理方法、装置、终端及网络侧设备

Info

Publication number: WO2023213270A1
Application number: PCT/CN2023/092028
Authority: WO
Inventors: 孙布勒; 杨昂
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2022-05-06
Filing date: 2023-05-04
Publication date: 2023-11-09
Anticipated expiration: 2024-11-06
Also published as: CN117093858A; US20250061381A1; EP4521309A4; EP4521309A1

Abstract

本申请公开了一种模型训练处理方法、装置、终端及网络侧设备，属于通信技术领域，本申请实施例的模型训练处理方法包括：第一设备获取第一信息，所述第一信息包括第一数据；所述第一设备利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

Description

模型训练处理方法、装置、终端及网络侧设备

相关申请的交叉引用

本申请主张在2022年05月06日在中国提交的中国专利申请No.202210489247.9的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于通信技术领域，具体涉及一种模型训练处理方法、装置、终端及网络侧设备。

背景技术

随着通信技术的发展，在无线通信中引入了基于人工智能(Artificial Intelligence，AI)的通信场景。目前基于AI的在无线通信的很多场景下，很难获取大量的带标签数据。没有大量的带标签数据，则无法通过监督学习训练出合适的模型，从而导致通信的可靠性较低。因此相关技术中，存在基于AI的无线通信的可靠性较低的问题。

发明内容

本申请实施例提供一种模型训练处理方法、装置、终端及网络侧设备，提高了基于AI的无线通信的可靠性。

第一方面，提供了一种模型训练处理方法，包括：

第一设备获取第一信息，所述第一信息包括第一数据；

所述第一设备利用第一模型对第一数据进行处理，获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

第二方面，提供了一种模型训练处理方法，包括：

第二设备向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；

第三方面，提供了一种模型训练处理装置，包括：

获取模块，用于获取第一信息，所述第一信息包括第一数据；

处理模块，用于利用第一模型对第一数据进行处理，获得第二数据；

第四方面，提供了一种模型训练处理装置，包括：

第二发送模块，用于向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；

第五方面，提供了一种模型训练处理装置，包括：

第六方面，提供了一种模型训练处理装置，包括：

第三发送模块，用于向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；

第七方面，提供了一种终端，该终端包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第八方面，提供了一种终端，包括处理器及通信接口，其中，

在终端为第一设备时，所述处理器用于获取第一信息，所述第一信息包括第一数据；利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量；

或者，在终端为第一设备时，所述通信接口用于向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

或者，在终端为第一设备时，所述通信接口用于向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

第九方面，提供了一种网络侧设备，该网络侧设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第二方面所述的方法的步骤。

第十方面，提供了一种网络侧设备，包括处理器及通信接口，其中，

在网络侧设备为第一设备时，所述处理器用于获取第一信息，所述第一信息包括第一数据；利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量；

或者，在网络侧设备为第一设备时，所述通信接口用于向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

或者，在网络侧设备为第一设备时，所述通信接口用于向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

第十一方面，提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤，或者实现如第二方面所述的方法的步骤。

第十二方面，提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法的步骤，或实现如第二方面所述的方法的步骤。

第十三方面，提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤，或实现如第二方面所述的方法的步骤。

本申请实施例中，通过第一设备获取第一信息，所述第一信息包括第一数据；所述第一设备利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。这样，由于利用第一模型可以获得更多带标签的训练数据，从而可以使得第二模型在训练过程有效收敛，提升第二模型的性能。因此，本申请实施例可以提高基于AI的无线通信的可靠性。

附图说明

图1是本申请实施例可应用的一种网络系统的结构图；

图2是神经元的结构示意图；

图3是本申请实施例提供的一种模型训练处理方法的流程图之一；

图4是本申请实施例提供的一种模型训练处理方法的流程图之二；

图5是本申请实施例提供的一种模型训练处理方法的流程图之三；

图6是本申请实施例提供的一种模型训练处理方法的流程图之四；

图7是本申请实施例提供的一种模型训练处理方法的流程图之五；

图8是本申请实施例提供的一种模型训练处理方法的流程图之六；

图9是本申请实施例提供的一种模型训练处理装置的结构图之一；

图10是本申请实施例提供的一种模型训练处理装置的结构图之二；

图11是本申请实施例提供的一种模型训练处理装置的结构图之三；

图12是本申请实施例提供的一种通信设备的结构图；

图13是本申请实施例提供的一种终端的结构图；

图14是本申请实施例提供的另一种网络侧设备的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。

值得指出的是，本申请实施例所描述的技术不限于长期演进型(Long Term Evolution，LTE)/LTE的演进(LTE-Advanced，LTE-A)系统，还可用于其他无线通信系统，诸如码分多址(Code Division Multiple Access，CDMA)、时分多址(Time Division Multiple Access，TDMA)、频分多址(Frequency Division Multiple Access，FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access，OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access，SC-FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用，所描述的技术既可用于以上提及的系统和无线电技术，也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(New Radio，NR)系统，并且在以下大部分描述中使用NR术语，但是这些技术也可应用于NR系统应用以外的应用，如第6代(6^th Generation，6G)通信系统。

图1示出本申请实施例可应用的一种无线通信系统的框图。无线通信系统包括终端11和网络侧设备12。其中，终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal Digital Assistant，PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personal computer，UMPC)、移动上网装置(Mobile Internet Device，MID)、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、机器人、可穿戴式设备(Wearable Device)、车载设备(Vehicle User Equipment，VUE)、行人终端(Pedestrian User Equipment，PUE)、智能家居(具有无线通信功能的家居设备，如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer，PC)、柜员机或者自助机等终端侧设备，可穿戴式设备包括：智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是，在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备或核心网设备，其中，接入网设备也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备可以包括基站、无线局域网(Wireless Local Area Network，WLAN)接入点或WiFi节点等，基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station，BTS)、无线电基站、无线电收发机、基本服务集(Basic Service Set，BSS)、扩展服务集(Extended Service Set，ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point，TRP)或所述领域中其他某个合适的术语，只要达到相同的技术效果，所述基站不限于特定技术词汇，需要说明的是，在本申请实施例中仅以NR系统中的基站为例进行介绍，并不限定基站的具体类型。

为了方便理解，以下对本申请实施例涉及的一些内容进行说明：

一、人工智能。

人工智能目前在各个领域获得了广泛的应用。AI模块有多种实现方式，例如神经网络、决策树、支持向量机、贝叶斯分类器等。本申请以神经网络为例进行说明，但是并不限定AI模块的具体类型。

神经网络由神经元组成，神经元的示意图如图2所示。其中，a_i为输入，w为权值(乘性系数)，b为偏置(加性系数)，σ(.)为激活函数。常见的激活函数包括S型函数(Sigmoid)、双曲正切函数(tanh)和线性整流函数ReLU(Rectified Linear Unit)等。

神经网络的参数通过优化算法进行优化。优化算法就是一种能够帮我们最小化或者最大化目标函数(有时候也叫损失函数)的一类算法。而目标函数往往是模型参数和数据的数学组合。例如给定数据X和其对应的标签Y，我们构建一个神经网络模型f(.)，有了模型后，根据输入x就可以得到预测输出f(x)，并且可以计算出预测值和真实值之间的差距(f(x)-Y)，这个就是损失函数。我们的目的是找到合适的W,b使上述的损失函数的值达到最小，损失值越小，则说明我们的模型越接近于真实情况。

目前常见的优化算法，基本都是基于误差反向传播(error Back Propagation，BP)算法。BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时，输入样本从输入层传入，经各隐层逐层处理后，传向输出层。若输出层的实际输出与期望的输出不符，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程，是周而复始地进行的。权值不断调整的过程，也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度，或进行到预先设定的学习次数为止。

根据解决类型不同，选取的AI算法和采用的模型也有所差别。目前，借助AI提升5G网络性能的主要方法是通过基于神经网络的算法和模型增强或者替代目前已有的算法或处理模块。在特定场景下，基于神经网络的算法和模型可以取得比基于确定性算法更好的性能。比较常用的神经网络包括深度神经网络、卷积神经网络和循环神经网络等。借助已有AI工具，可以实现神经网络的搭建、训练与验证工作。

应理解，AI模型的训练需要大量数据的支撑。如果数据量不足，则模型的训练过程可能不收敛，或者训练出来的模型会过拟合。然而，无线通信中很多场景无法拿到带标签的数据，或者带标签的数据量较少(由于采集开销、传输开销等导致)。因此，在无线通信中需要解决带标签数据不足时的模型训练问题。为此提出了本申请的模型训练处理方法。

下面结合附图，通过一些实施例及其应用场景对本申请实施例提供的模型训练处理方法进行详细地说明。

如图3所示，本申请实施例提供了一种模型训练处理方法，包括：

步骤301，第一设备获取第一信息，所述第一信息包括第一数据；

步骤302，所述第一设备利用第一模型对第一数据进行处理，获得第二数据；

本申请实施例中，上述第一设备可以为网络侧设备，也可以为终端，上述第一数据可以为用于训练第二模型的至少部分数据。第一数据可以为带标签的数据，也可以为不带标签的数据。上述第一模型可以理解为对第二模型的训练数据进行增强的模型，例如，当第一数据为带标签的数据时，上述第一模型用于对第一数据进行扩展，从而获得数据量更多的第二数据；当第一数据为未带标签的数据时，上述第一模型用于对第一数据进行打标签处理，从而可以获得更多的带标签的训练数据。这样通过第一模型对第一数据进行处理后，可以获得更多的带标签的训练数据，从而可以保证有足够的带标签的训练数据对第二模型进行训练，进而可以使得第二模型在训练过程有效收敛，提升第二模型的性能。

例如，在一些实施例中，第一数据为带标签的N个数据，则将带标签的N个数据输入到第一模型后可以输出带标签的M个数据(即第二数据为带标签的M个数据)，此时M大于N，通常地，M远大于N。

又例如，在一些实施例中，第一数据为未带标签的M个数据，则将带标签的N个数据输入到第一模型后可以输出带标签的M个数据(即第二数据为带标签的M个数据)。

可选地，上述第一信息可以存储在第一设备中，也可以储存在第二设备中。与此同时，上述第一模型可以存储在第一设备中，也可以储存在第二设备中，由第二设备发送给第一设备。其中，当第一设备为核心网设备时，第二设备可以为基站；当第一设备为基站(如基站A)时，第二设备可以为基站(如基站B)或终端；当第一设备为终端(如终端A)时，第二设备可以为基站或者终端(如终端B)。应理解，在本申请实施例中，上述第一信息和第一模型储存在不同的设备中。

可选地，在一些实施中，上述第一模型存储在第二设备中，则所述第一设备利用第一模型对第一数据进行处理之前，所述方法还包括：

所述第一设备从第二设备接收第二信息，所述第二信息包括所述第一模型。

本申请实施例中，上述第二信息包括所述第一模型可以理解为：第二信息中包括第一模型的参数或者包括第一模型的地址信息，以使第一设备可以获得第一模型。

进一步地，在一些实施例中，所述第二信息还包括配置信息和第一辅助信息中的至少一项，其中，所述配置信息用于指示所述第一模型的使用方式，所述第一辅助信息包括统计信息以及所述第一模型运行所需的环境信息，所述统计信息用于表示所述第一模型的输入的分布特征。

可选地，上述配置信息用于指示第一模型的使用方法，例如可以包括第一模型的数据维度或输入数据格式、输出维度或输出数据格式、输入数据量和输出数据量等。上述环境信息可以理解为与第一模型的数据增强算法有关的环境信息，该环境信息可以包括模型运行需要的软件环境和硬件环境等，例如可以包括需要使用的软件架构、硬件架构、电量需求、存储需求和算力需求等。上述统计信息可以包括模型输入的均值、方差等分布特征信息。

可选地，在一些实施例中，所述第一设备从第二设备接收第二信息之前，所述方法还包括：

所述第一设备向第二设备发送第一请求消息，所述第一请求消息用于请求获取所述第二信息。

本申请实施例中，在第一设备需要进行对第一数据进行扩展时，可以通过请求的方式获取上述第二信息，从而可以提高第二信息获取的针对性。当然在其他实施例中，还可以由第二设备主动向第一设备发送所述第二信息，例如在第二设备与第一设备建立连接时，第二设备将第二信息发送给第一设备，也可以由第二设备广播第二信息，在第一设备需要第二信息时，直接从广播的信息中获取。

可选地，在一些实施例中，所述第一设备利用第一模型对第一数据进行处理，获得第二数据之后，所述方法还包括：

所述第一设备基于所述第二数据对所述第二模型进行训练，得到第三模型。

本申请实施例中，可以由第一设备对第二模型进行训练，得到第三模型。其中第三模型的使用可以在第一设备上，也可以在第二设备上。

应理解，上述第二模型可以是第二设备发送给第一设备的，也可以是协议预配置在第一设备的，在此不做进一步的限定。

可选地，在一些实施例中，若第三模型的使用在第二设备上，则所述第一设备基于所述第二数据对所述第二模型进行训练，得到第三模型之后，所述方法还包括：

所述第一设备向所述第二设备发送所述第三模型。

本申请实施例中，发送第三模型可以理解为发送第三模型的参数或者发送第三模型的地址信息。在此不做进一步的限定。这样利用训练好的第三模型执行相应的业务的推理时，可以提高推理的准确性，从而保证通信的可靠性。

需要说明的是，上述第二模型的初始训练数据可以包括上述第一数据，还可以包括带标签的第三数据，在对第二模型进行训练时，若第一数据为带标签的数据，则对第二模型进行训练时，采用训练数据可以包括第一数据、第二数据和第三数据；若第一数据为未带标签的数据，则对第二模型进行训练时，采用训练数据可以包括第二数据和第三数据。

可选地，基于第一信息存储的位置不同，对应的获取第一信息的方式不同，例如，在一些实施例中，所述第一设备获取第一信息包括以下任一项：

所述第一设备从第二设备接收第一信息；

所述第一设备从本地获取第一信息。

本申请实施例中，当第一信息存储在第二设备时，则第一设备可以从第二设备接收第一信息；当第一信息存储在第一设备时，则第一设备可以从本地获取第一信息。

可选地，所述第一设备从第二设备接收第一信息之前，所述方法还包括：

所述第一设备向所述第二设备发送指示信息，所述指示信息用于指示所述第二设备发送所述第一信息。

本申请实施例中，第一信息储存在第二设备中，需要由第一设备指示第二设备发送第一信息，例如可以由第一设备调度第二设备发送第一信息。

可选地，在一些实施例中，所述第一设备从第二设备接收第一信息之前，所述方法还包括：

所述第一设备从所述第二设备接收第二请求消息，所述第二请求消息用于所述第二设备请求发送所述第一信息。

本申请实施例中，在第二设备发送第一信息之前，第二设备可以向第一设备请求发送第一信息，在此之后，第二设备可以在预配置的资源上进行第一信息的发送，也可以由第一设备动态调度第二设备发送第一信息，例如通过上述指示信息指示第二设备发送第一信息。

可选地，在所述第一设备从第二设备接收第一信息的情况下，所述第一设备利用第一模型对第一数据进行处理，获得第二数据之后，所述方法还包括：

所述第一设备向所述第二设备发送第三信息，所述第三信息包括所述第二数据。

本申请实施例中，上述第二模型的训练的过程由第二设备执行，则第一设备需要向第二设备发送第二数据，以供第二设备进行第二模型的训练，得到第三模型。第二设备对第二模型的训练与第一设备对第二模型的训练类似，训练数据的定义可以参照上述实例，在此不再赘述。

进一步地，在一些实施例中，所述第三信息还包括标识信息，所述标识信息用于指示所述第二数据基于所述第一模型获得。

可选地，在一些实施例中，所述第一信息还包括第二辅助信息，所述第二辅助信息用于表示所述第一数据的分布特征。

本申请实施例中，上述第二辅助信息可以包括第一数据的均值和方差等表示分布特征的信息。

为了更好的理解本申请，以下通过一些实例进行说明。

在一些实施例中，设备A把第一模型发给设备B，设备B用接收到的第一模型和自己的第一数据进行数据增强，获得第二数据，设备B再基于第二数据训练第二模型。如图4所示，具体包括以下流程：

步骤401，设备B向设备A发送第一消息，第一消息用于请求第一模型、配置参数和第一辅助信息。

步骤402，设备A向设备B发送第一模型、配置参数和第一辅助信息。

步骤403，设备B基于第一模型、配置参数和第一辅助信息对第一数据进行增强，获得第二数据。

步骤404，设备B基于第二数据训练第二模型，得到第三模型。

在一些实施例中，设备B把第一数据发送给设备A，设备A用接收到的第一模型和自己训练好的第一模型进行数据增强，获得第二数据，设备A再基于第二数据训练第二模型，得到第三模型。最后将第三模型发送给设备B。如图5所示，具体包括以下流程：

步骤501，设备B向设备A发送第二消息，第二消息用于请求发送第一数据；

步骤502，设备A向设备B发送第三消息，第三消息用于指示发送第一数据。

步骤503，设备B向设备A发送第一数据。

步骤504，设备A基于自己的第一模型、配置参数和第一辅助信息对第一数据进行增强，获得第二数据。

步骤505，设备A基于第二数据训练第二模型，得到第三模型。

步骤506，设备A向设备B发送第三模型。

在一些实施例中，设备B把第一数据发送给设备A，设备A用接收到的第一模型和自己训练好的第一模型进行数据增强，获得第二数据，设备A再将第二数据发送给设备B，设备B用接收到的第二数据训练第二模型。如图6所示，具体包括以下流程：

步骤601，设备B向设备A发送第二消息，第二消息用于请求发送第一数据；

步骤602，设备A向设备B发送第三消息，第三消息用于指示发送第一数据。

步骤603，设备B向设备A发送第一数据。

步骤604，设备A基于自己的第一模型、配置参数和第一辅助信息对第一数据进行增强，获得第二数据。

步骤605，设备A向设备B发送第二数据。

步骤606，设备B基于第二数据训练第二模型，得到第三模型。

参照图7，本申请实施例还提供了一种模型训练处理方法，包括：

步骤701，第二设备向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；

可选地，所述第二信息还包括配置信息和第一辅助信息中的至少一项，其中，所述配置信息用于指示所述第一模型的使用方式，所述第一辅助信息包括统计信息以及所述第一模型运行所需的环境信息，所述统计信息用于表示所述第一模型的输入的分布特征。

可选地，所述第一设备从第二设备接收第二信息之前，所述方法还包括：

所述第二设备从所述第一设备接收第一请求消息，所述第一请求消息用于请求获取所述第二信息。

参照图8，本申请实施例还提供了一种模型训练处理方法，包括：

步骤801，第二设备向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；

可选地，所述第二设备向第一设备发送第一信息之后，所述方法还包括：

所述第二设备从第一设备接收第三模型，所述第三模型所述第一设备基于所述第二数据对所述第二模型进行训练得到。

所述第二设备从第一设备接收第三信息，所述第三信息包括所述第二数据。

可选地，所述第三信息还包括标识信息，所述标识信息用于指示所述第二数据基于所述第一模型获得。

可选地，所述第二设备从第一设备接收第三信息之后，所述方法还包括：

所述第二设备基于所述第二数据对所述第二模型进行训练，获得第三模型。

可选地，所述第二设备向第一设备发送第一信息之前，所述方法还包括：

所述第二设备从所述第一设备接收指示信息，所述指示信息用于指示所述第二设备发送所述第一信息。

所述第二设备向所述第一设备发送第二请求消息，所述第二请求消息用于所述第二设备请求发送所述第一信息。

可选地，所述第一信息还包括第二辅助信息，所述第二辅助信息用于表示所述第一数据的分布特征。

本申请实施例提供的模型训练处理方法，执行主体可以为模型训练处理装置。本申请实施例中以模型训练处理装置执行模型训练处理方法为例，说明本申请实施例提供的模型训练处理装置。

参照图9，本申请实施例还提供了一种模型训练处理装置，如图9所示，该模型训练处理装置900，包括：

获取模块901，用于获取第一信息，所述第一信息包括第一数据；

处理模块902，用于利用第一模型对第一数据进行处理，获得第二数据；

可选地，所述模型训练处理装置900还包括：

第一接收模块，用于从第二设备接收第二信息，所述第二信息包括所述第一模型。

可选地，所述模型训练处理装置900还包括：

第一发送模块，用于向第二设备发送第一请求消息，所述第一请求消息用于请求获取所述第二信息。

可选地，所述模型训练处理装置900还包括：

第一训练模块，用于基于所述第二数据对所述第二模型进行训练，得到第三模型。

可选地，所述模型训练处理装置900还包括：

第一发送模块，用于向所述第二设备发送所述第三模型。

可选地，所述获取模块901包括以下以下任一项：

接收单元，用于从第二设备接收第一信息；

获取单元，用于从本地获取第一信息。

可选地，所述模型训练处理装置900还包括：

第一发送模块，向所述第二设备发送指示信息，所述指示信息用于指示所述第二设备发送所述第一信息。

可选地，所述接收单元还用于：从所述第二设备接收第二请求消息，所述第二请求消息用于所述第二设备请求发送所述第一信息。

可选地，所述模型训练处理装置900还包括：

第一发送模块，用于向所述第二设备发送第三信息，所述第三信息包括所述第二数据。

参照图10，本申请实施例还提供了一种模型训练处理装置，如图10所示，该模型训练处理装置1000，包括：

第二发送模块1001，用于向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；

可选地，所述模型训练处理装置1000还包括：

第二接收模块，用于从所述第一设备接收第一请求消息，所述第一请求消息用于请求获取所述第二信息。

参照图11，本申请实施例还提供了一种模型训练处理装置，如图11所示，该模型训练处理装置1100，包括：

第三发送模块1101，用于向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；

可选地，所述模型训练处理装置1100还包括：

第三接收模块，用于从第一设备接收第三模型，所述第三模型所述第一设备基于所述第二数据对所述第二模型进行训练得到。

可选地，所述模型训练处理装置1100还包括：

第三接收模块，用于从第一设备接收第三信息，所述第三信息包括所述第二数据。

可选地所述模型训练处理装置1100还包括：

第二训练模块，用于基于所述第二数据对所述第二模型进行训练，获得第三模型。

可选地，所述模型训练处理装置1100还包括：

第三接收模块，用于从所述第一设备接收指示信息，所述指示信息用于指示所述第二设备发送所述第一信息。

可选地，所述第三发送模块1101，还用于向所述第一设备发送第二请求消息，所述第二请求消息用于所述第二设备请求发送所述第一信息。

本申请实施例中的模型训练处理装置可以是电子设备，例如具有操作系统的电子设备，也可以是电子设备中的部件，例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，终端可以包括但不限于上述所列举的终端11的类型，其他设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)等，本申请实施例不作具体限定。

本申请实施例提供的模型训练处理装置能够实现图3至图8的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

可选的，如图12所示，本申请实施例还提供一种通信设备1200，包括处理器1201和存储器1202，存储器1202上存储有可在所述处理器1201上运行的程序或指令，该程序或指令被处理器1201执行时实现上述模型训练处理方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供一种终端，包括处理器和通信接口，在终端为第一设备时，所述处理器用于获取第一信息，所述第一信息包括第一数据；利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量；

该终端实施例与上述终端侧方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中，且能达到相同的技术效果。具体地，图13为实现本申请实施例的一种终端的硬件结构示意图。

该终端1300包括但不限于：射频单元1301、网络模块1302、音频输出单元1303、输入单元1304、传感器1305、显示单元1306、用户输入单元1307、接口单元1308、存储器1309以及处理器1310等中的至少部分部件。

本领域技术人员可以理解，终端1300还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器1310逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图13中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

应理解的是，本申请实施例中，输入单元1304可以包括图形处理单元(Graphics Processing Unit，GPU)13041和麦克风13042，图形处理器13041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1306可包括显示面板13061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板13061。用户输入单元1307包括触控面板13071以及其他输入设备13072中的至少一种。触控面板13071，也称为触摸屏。触控面板13071可包括触摸检测装置和触摸控制器两个部分。其他输入设备13072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

本申请实施例中，射频单元1301接收来自网络侧设备的下行数据后，可以传输给处理器1310进行处理；另外，射频单元1301可以向网络侧设备发送上行数据。通常，射频单元1301包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。

存储器1309可用于存储软件程序或指令以及各种数据。存储器1309可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器1309可以包括易失性存储器或非易失性存储器，或者，存储器1309可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请实施例中的存储器1309包括但不限于这些和任意其它适合类型的存储器。

处理器1310可包括一个或多个处理单元；可选的，处理器1310集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器1310中。

其中，在终端为第一设备时，所述处理器1310用于获取第一信息，所述第一信息包括第一数据；利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量；

或者，在终端为第一设备时，所述射频单元1301用于向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

或者，在终端为第一设备时，所述射频单元1301用于向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。

本申请实施例还提供一种网络侧设备，包括处理器和通信接口，在网络侧设备为第一设备时，所述处理器用于获取第一信息，所述第一信息包括第一数据；利用第一模型对第一数据进行处理，获得第二数据；其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量；

该网络侧设备实施例与上述网络侧设备方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中，且能达到相同的技术效果。

具体地，本申请实施例还提供了一种网络侧设备。如图14所示，该网络侧设备1400包括：天线1401、射频装置1402、基带装置1403、处理器1404和存储器1405。天线1401与射频装置1402连接。在上行方向上，射频装置1402通过天线1401接收信息，将接收的信息发送给基带装置1403进行处理。在下行方向上，基带装置1403对要发送的信息进行处理，并发送给射频装置1402，射频装置1402对收到的信息进行处理后经过天线1401发送出去。

以上实施例中网络侧设备执行的方法可以在基带装置1403中实现，该基带装置1403包括基带处理器。

基带装置1403例如可以包括至少一个基带板，该基带板上设置有多个芯片，如图14所示，其中一个芯片例如为基带处理器，通过总线接口与存储器1405连接，以调用存储器1405中的程序，执行以上方法实施例中所示的网络设备操作。

该网络侧设备还可以包括网络接口1406，该接口例如为通用公共无线接口(common public radio interface，CPRI)。

具体地，本发明实施例的网络侧设备1400还包括：存储在存储器1405上并可在处理器1404上运行的指令或程序，处理器1404调用存储器1405中的指令或程序执行图9至11所示各模块执行的方法，并达到相同的技术效果，为避免重复，故不在此赘述。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述模型训练处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述模型训练处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片，系统芯片，芯片系统或片上系统芯片等。

本申请实施例另提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现上述模型训练处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种模型训练处理方法，包括：

第一设备获取第一信息，所述第一信息包括第一数据；

所述第一设备利用第一模型对第一数据进行处理，获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。
根据权利要求1所述的方法，其中，所述第一设备利用第一模型对第一数据进行处理之前，所述方法还包括：

所述第一设备从第二设备接收第二信息，所述第二信息包括所述第一模型。
根据权利要求2所述的方法，其中，所述第二信息还包括配置信息和第一辅助信息中的至少一项，其中，所述配置信息用于指示所述第一模型的使用方式，所述第一辅助信息包括统计信息以及所述第一模型运行所需的环境信息，所述统计信息用于表示所述第一模型的输入的分布特征。
根据权利要求2所述的方法，其中，所述第一设备从第二设备接收第二信息之前，所述方法还包括：

所述第一设备向第二设备发送第一请求消息，所述第一请求消息用于请求获取所述第二信息。
根据权利要求1所述的方法，其中，所述第一设备利用第一模型对第一数据进行处理，获得第二数据之后，所述方法还包括：

所述第一设备基于所述第二数据对所述第二模型进行训练，得到第三模型。
根据权利要求5所述的方法，其中，所述第一设备基于所述第二数据对所述第二模型进行训练，得到第三模型之后，所述方法还包括：

所述第一设备向第二设备发送所述第三模型。
根据权利要求1所述的方法，其中，所述第一设备获取第一信息包括以下任一项：

所述第一设备从第二设备接收第一信息；

所述第一设备从本地获取第一信息。
根据权利要求7所述的方法，其中，所述第一设备从第二设备接收第一信息之前，所述方法还包括：

所述第一设备向所述第二设备发送指示信息，所述指示信息用于指示所述第二设备发送所述第一信息。
根据权利要求7所述的方法，其中，所述第一设备从第二设备接收第一信息之前，所述方法还包括：

所述第一设备从所述第二设备接收第二请求消息，所述第二请求消息用于所述第二设备请求发送所述第一信息。
根据权利要求7所述的方法，其中，在所述第一设备从第二设备接收第一信息的情况下，所述第一设备利用第一模型对第一数据进行处理，获得第二数据之后，所述方法还包括：

所述第一设备向所述第二设备发送第三信息，所述第三信息包括所述第二数据。
根据权利要求10所述的方法，其中，所述第三信息还包括标识信息，所述标识信息用于指示所述第二数据基于所述第一模型获得。
根据权利要求1所述的方法，其中，所述第一信息还包括第二辅助信息，所述第二辅助信息用于表示所述第一数据的分布特征。
一种模型训练处理方法，包括：

第二设备向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。
根据权利要求13所述的方法，其中，所述第二信息还包括配置信息和第一辅助信息中的至少一项，其中，所述配置信息用于指示所述第一模型的使用方式，所述第一辅助信息包括统计信息以及所述第一模型运行所需的环境信息，所述统计信息用于表示所述第一模型的输入的分布特征。
根据权利要求13所述的方法，其中，所述第一设备从第二设备接收第二信息之前，所述方法还包括：

所述第二设备从所述第一设备接收第一请求消息，所述第一请求消息用于请求获取所述第二信息。
一种模型训练处理方法，包括：

第二设备向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。
根据权利要求16所述的方法，其中，所述第二设备向第一设备发送第一信息之后，所述方法还包括：

所述第二设备从第一设备接收第三模型，所述第三模型所述第一设备基于所述第二数据对所述第二模型进行训练得到。
根据权利要求16所述的方法，其中，所述第二设备向第一设备发送第一信息之后，所述方法还包括：

所述第二设备从第一设备接收第三信息，所述第三信息包括所述第二数据。
根据权利要求18所述的方法，其中，所述第三信息还包括标识信息，所述标识信息用于指示所述第二数据基于所述第一模型获得。
根据权利要求18所述的方法，其中，所述第二设备从第一设备接收第三信息之后，所述方法还包括：

所述第二设备基于所述第二数据对所述第二模型进行训练，获得第三模型。
根据权利要求16所述的方法，其中，所述第二设备向第一设备发送第一信息之前，所述方法还包括：

所述第二设备从所述第一设备接收指示信息，所述指示信息用于指示所述第二设备发送所述第一信息。
根据权利要求16所述的方法，其中，所述第二设备向第一设备发送第一信息之前，所述方法还包括：

所述第二设备向所述第一设备发送第二请求消息，所述第二请求消息用于所述第二设备请求发送所述第一信息。
根据权利要求16所述的方法，其中，所述第一信息还包括第二辅助信息，所述第二辅助信息用于表示所述第一数据的分布特征。
一种模型训练处理装置，包括：

获取模块，用于获取第一信息，所述第一信息包括第一数据；

处理模块，用于利用第一模型对第一数据进行处理，获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。
一种模型训练处理装置，包括：

第二发送模块，用于向第一设备发送第二信息，所述第二信息包括第一模型，所述第一模型用于所述第一设备基于第一数据获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。
一种模型训练处理装置，包括：

第三发送模块，用于向第一设备发送第一信息，所述第一信息包括第一数据，所述第一数据用于所述第一设备基于第一模型获得第二数据；

其中，所述第一数据和所述第二数据均可用于训练第二模型，所述第二模型为业务模型，且所述第二数据满足以下至少一项：在所述第一数据为未带标签的数据的情况下，所述第二数据为带标签的数据；在所述第一数据为带标签数据的情况下，所述第二数据的数据量大于所述第一数据的数据量。
一种终端，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，其中，所述程序或指令被所述处理器执行时实现如权利要求1至23任一项所述的模型训练处理方法的步骤。
一种网络侧设备，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，其中，所述程序或指令被所述处理器执行时实现如权利要求1至23任一项所述的模型训练处理方法的步骤。
一种可读存储介质，所述可读存储介质上存储程序或指令，其中，所述程序或指令被处理器执行时实现如权利要求1至23任一项所述的模型训练处理方法的步骤。