[go: up one dir, main page]

CN118277046A - 一种计算任务的处理方法及相关装置 - Google Patents

一种计算任务的处理方法及相关装置 Download PDF

Info

Publication number
CN118277046A
CN118277046A CN202211733515.3A CN202211733515A CN118277046A CN 118277046 A CN118277046 A CN 118277046A CN 202211733515 A CN202211733515 A CN 202211733515A CN 118277046 A CN118277046 A CN 118277046A
Authority
CN
China
Prior art keywords
computing
information
task
node
management unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211733515.3A
Other languages
English (en)
Inventor
李奎奎
曾清海
孙飞
娄崇
陈卫民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202211733515.3A priority Critical patent/CN118277046A/zh
Priority to EP23910220.5A priority patent/EP4625167A1/en
Priority to PCT/CN2023/139207 priority patent/WO2024140290A1/zh
Publication of CN118277046A publication Critical patent/CN118277046A/zh
Priority to US19/251,963 priority patent/US20250321788A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • G06F9/4893Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues taking into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5055Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering software capabilities, i.e. software resources associated or available to the machine
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/501Performance criteria
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5015Service provider selection
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5017Task decomposition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/503Resource availability
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/506Constraint
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/509Offload

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Multi Processors (AREA)
  • Power Sources (AREA)

Abstract

提供了一种计算任务的处理方法及相关装置,该方法包括:管理单元根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的至少一个计算任务,N为大于或等于1的整数;向一个或多个目标计算节点中的每个目标计算节点发送各自对应的至少一个计算任务的标识信息。在分配计算任务时,通过综合考虑任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,有利于提高计算任务分配的合理性。

Description

一种计算任务的处理方法及相关装置
技术领域
本申请涉及通信领域,尤其涉及一种计算任务的处理方法及相关装置。
背景技术
目前,无线网络中计算负载逐渐增加,如虚拟现实(virtual reality,VR)、增强现实(augmented reality,AR)、云游戏等第三方应用业务、人工智能(artificialintelligence,AI)推理业务等,一种解决的方式是通过移动边缘计算(mobile edgecomputing,MEC)机制,将接入网侧或终端侧的计算负载卸载至网络边缘的计算服务器。
在已有的MEC网络架构下,网络在接收到计算请求时,一般都是直接将计算任务分配给能够提供计算服务的节点来执行,导致计算任务的分配不合理。
因此,亟需提供一种方法,以期提高计算任务分配的合理性。
发明内容
本申请提供了一种计算任务的处理方法及相关装置,以期提高计算任务分配的合理性。
第一方面,本申请提供了一种计算任务的处理方法,该方法可以由管理单元执行,或者,也可以由配置在管理单元中的部件(如芯片、芯片系统等)执行,或者,还可以由能够实现全部或部分管理单元功能的逻辑模块或软件实现,本申请对此不作限定。
上述管理单元可以是通信系统中的管理单元,该通信系统包括上述管理单元、请求节点和至少一个计算节点。
示例性地,该方法包括:根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的N个计算任务中的至少一个计算任务,N为大于或等于1的整数;向上述一个或多个目标计算节点中的每个目标计算节点发送各自对应的至少一个计算任务的标识信息。
在上述技术方案中,管理单元在确定用于执行N个计算任务的一个或多个目标计算节点时,综合考虑了上述N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,有利于提高计算任务分配的合理性。
例如,在某些计算节点均满足计算任务的任务需求信息和/或任务特征信息的情况下,管理单元可以进一步对比这些计算节点的算力状态和/或网络状态,比方说管理单元可以选择这些计算节点中计算时间和传输时间之和最低的计算节点来执行计算任务,其中,计算时间是根据算力状态得到的,传输时间是根据网络状态得到的,这样有利于提高计算任务的处理效率,进而有利于提高计算服务体验。
本申请中所提及的管理单元可以部署在不同层级,位于不同层级的管理单元管理的计算节点的范围不同。
示例性地,上述管理单元部署于以下至少一种类型的设备中:终端设备、接入网设备、核心网设备、或MEC平台。
其中,终端设备、接入网设备、核心网设备和MEC平台属于不同的层级。
可选地,至少一个计算节点包括以下至少一种类型:终端设备、接入网设备、核心网设备、接入网侧的MEC平台、或核心网侧的MEC平台。
针对位于不同的层级的管理单元所管理的计算节点的范围可采用如下之一的设计:
设计一、管理单元部署于核心网设备中,该管理单元用于管理以下至少一种类型的计算节点上的计算资源:终端设备、接入网设备、接入网侧的MEC平台、或核心网侧的MEC平台。
设计二、管理单元部署于接入网设备中,该管理单元用于管理以下至少一种类型的计算节点上的计算资源:终端设备、接入网设备、或接入网侧的MEC平台。
设计三、管理单元部署于MEC平台中,该管理单元用于管理以下至少一种类型的计算节点上的计算资源:终端设备、接入网侧的MEC平台、或核心网侧的MEC平台。
其中,管理单元可以部署在MEC平台的边缘配置服务器(edge configurationserver,ECS)中,或者终端设备的边缘使能客户端(edge enable client,EEC)中。
可以理解,管理单元对至少一个计算节点上的计算资源进行管理,可以理解为:对至少一个计算节点进行认证、注册、注销、维护、查询算力状态和/或网络状态、更新等操作,还包括根据该至少一个计算节点的算力状态和/或网络状态以及N个计算任务的任务需求信息和/或任务特征信息,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的至少一个计算任务,以使其执行对应的至少一个计算任务等。
结合第一方面,在第一方面的某些可能的实现方式中,每个计算节点的算力状态通过以下至少一项来度量:计算节点所提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
可选地,上述联合服务能力包括:存储能力、网络能力、编解码能力、或每秒传输帧数(frames per second,FPS)。
可选地,上述资源利用率包括:中央处理器的利用率、图形处理器的利用率、内存的利用率、磁盘的利用率、会话数量、或请求队列数量。
可选地,上述算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。
在本申请中,算力是计算能力的简称,算力大小可以理解为计算能力的大小。算力大小的表示方法包括以下任一种:处理器每秒可执行多少次操作(operations persecond,OPS)、每秒可执行多少次浮点数操作(floating-point operations per second,FLOPS)、主频多少赫兹、输入(input)/输出(output)(I/O)带宽和时延(例如每秒进行读写操作的次数)是多少、散热设计功耗是多少、内存容量是多少、计算完成概率、或出错概率是多少等。
结合第一方面,在第一方面的某些可能的实现方式中,每个计算节点的网络状态包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
可选地,上述任务需求信息包括以下至少一项:端到端时延、服务质量(qualityof service,QoS)、扩展现实(extended reality,XR)质量分数(quality index)(记为XQI)、或用户体验质量(quality of experience,QoE)、或算力需求。
其中,端到端时延是指从计算节点发起一个计算请求到接收到计算结果的时长。算力需求例如可以是执行计算任务所需的计算资源的类型、算力大小、计算节点的位置、联合服务能力、或资源利用率等。
可选地,上述任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度。
其中,失真类型例如包括但不限于:幅度失真、频率失真、相位失真等,本申请对此不作限定。
结合第一方面,在第一方面的某些可能的实现方式中,所述方法还包括:接收来自请求节点的计算请求,计算请求中携带所述N个计算任务的任务需求信息和/或任务特征信息;以及,所述方法还包括:向一个或多个目标计算节点中每个目标计算节点发送上述任务需求信息和/或所述任务特征信息。
其中,上述计算请求可以用于请求执行上述N个计算任务,或者,上述计算请求用于请求分配用于执行上述N个计算任务的目标计算节点等。
管理单元可以向每个目标计算节点发送上述任务需求信息和/或任务特征信息,以便于目标计算节点配置执行计算任务所需的程序环境。
结合第一方面,在第一方面的某些可能的实现方式中,计算请求中还携带第一计算任务的拆分指示信息,该拆分指示信息用于管理单元将第一计算任务拆分为多个第二计算任务,该第一计算任务是未被拆分的计算任务,该第二计算任务是拆分得到的计算任务。
由上可以看出,计算任务可以由管理单元来拆分,计算请求中可以携带拆分指示信息,管理单元可以根据拆分指示信息来拆分计算任务。
其中,拆分指示信息中例如包括将第一计算任务拆分成几个第二计算任务的指示信息,和/或,每个第二计算任务的大小的指示信息等。例如,对于神经网络模型来说,拆分指示信息中可以包括将其拆分为几个第二计算任务的指示信息,拆分指示信息中还可以包括拆分点信息,也即,从哪些层拆分,如,拆分点包括第二层,第五层,则,第一层和第二层可以属于一个计算任务,第三层至第五层可以属于另一计算任务。
可选地,计算任务也可以由请求节点来拆分,本申请对此不作限定。
可选地,上述N个计算任务包括:一个第一计算任务和/或多个第二计算任务。例如,上述N个计算任务可以包括一个未拆分的第一计算任务,也可以包括多个拆分得到的第二计算任务。
可选地,管理单元可以通过以下两种方式中的一种获取到计算节点的算力状态和网络状态:
方式一:管理单元向至少一个计算节点中的各个计算节点发送查询请求,该查询请求用于请求查询计算节点的算力状态和网络状态;接收来自各个计算节点的查询响应,该查询响应中携带计算节点的算力状态和网络状态。
方式二:上述至少一个计算节点中各个计算节点在满足第一预设条件的情况下,自动上报各自的算力状态和网络状态,例如,第一预设条件可以是计算节点上报算力状态和网络状态的周期,各个计算节点可以每隔一段时间上报一次算力状态和网络状态,或者,第一预设条件可以是触发计算节点上报算力状态和网络状态的其他条件,如用于表征网络状态的参数达到对应的阈值等,本申请对此不作限定。
结合第一方面,在第一方面的某些可能的实现方式中,所述方法还包括:向请求节点发送第一信息,该第一信息指示所述一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息。
管理单元可以向请求节点指示目标计算节点及其执行的至少一个计算任务的对应关系,如<目标计算节点1,计算任务1>、<目标计算节点2,计算任务3>和<目标计算节点3,计算任务2>等,以便于请求节点给相应的目标计算节点发送计算数据和/或应用程序的信息。
不难理解,对于多个目标计算节点协同作业,且多个目标计算节点串行工作(也即某一目标计算节点执行计算任务时需要上一跳目标计算节点输出的计算结果)的情况下,管理单元可以向一个或多个目标计算节点中的第一计算节点发送第二信息,该第二信息用于确定第一计算节点的下一跳节点,该第一计算节点的下一跳节点用于基于来自第一计算节点输出的计算结果执行计算任务,第一计算节点是一个或多个目标计算节点中的任意一个。
其中,第一计算节点的下一跳节点可以是一个或多个目标计算节点中的至少一个目标计算节点。第二信息中具体可以包括第一计算节点的下一跳节点的标识信息。
结合第一方面,在第一方面的某些可能的实现方式中,所述方法还包括:获取如下至少一种信息:实时的应用体验信息、实时的应用特征信息,或实时的网络状态信息;根据上述至少一种信息,向一个或多个目标计算节点中的第二计算节点发送指示信息,该指示信息用于第二计算节点调整相关的应用配置参数和/或相关的网络配置参数;其中,上述实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE;上述实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;上述实时的网络状态信息包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态;上述相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;上述相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、或带宽。
管理单元根据获取到的上述至少一种信息,来向一个或多个目标计算节点中的第二计算节点指示调整相关的应用配置参数和/或相关的网络配置参数,有利于提高用户的业务体验。
可选地,根据上述至少一种信息,向一个或多个目标计算节点中的第二计算节点发送指示信息,包括:在至少一种信息满足预设条件的情况下,向一个或多个目标计算节点中的第二计算节点发送上述指示信息,其中,上述预设条件包括以下至少一项:上述实时的应用体验信息中的参数低于第一阈值,上述实时的应用特征信息中的参数低于第二阈值,或,上述实时的网络状态信息中的参数低于第三阈值。
每个目标计算节点可以上报自身的至少一种信息:实时的应用体验信息、实时的应用特征信息,或实时的网络状态信息,如果该目标计算节点的上述至少一种信息满足预设条件(可记为第二预设条件),则管理单元向该目标计算节点发送指示信息,以使其调整相关的应用配置参数和/或相关的网络配置参数,进而提高用户的业务体验。
可选地,上述至少一种信息中的一种或多种来自一个或多个目标计算节点中的至少一个,或者,上述至少一种信息中的一种或多种来自请求节点。
结合第一方面,在第一方面的某些可能的实现方式中,请求节点、管理单元以及至少一个计算节点之间传输的数据可以包含在无线资源控制(radio resource control,RRC)协议消息中,和/或新增加的边缘资源控制(edge resource control,ERC)协议消息中。
可选地,上述RRC协议消息和/或ERC协议消息可以承载在计算专用的无线承载中,该计算专用的无线承载包括计算无线承载(computing radio bearer,CRB)和/或无会话的(session-less)数据无线承载(data radio bearer,DRB)。
可选地,在接收来自请求节点的计算请求之前,所述方法还包括:接收来自第三计算节点的认证请求,该认证请求携带第三计算节点的身份信息,第三计算节点是至少一个计算节点中的任意一个;对第三计算节点进行身份认证;向第三计算节点发送认证响应,该认证响应中携带对第三计算节点的认证结果,该认证结果包括认证成功或认证失败。
管理单元通过对各个计算节点进行身份认证,有利于提高安全性。
可选地,在接收来自所述请求节点的计算请求之前,所述方法还包括:接收来自第三计算节点的注册请求,该注册请求中携带以下至少一项:第三计算节点所提供的计算资源的类型、算力大小、第三计算节点的位置、支持的任务类型、或联合服务能力;向第三计算节点发送注册响应,其中,第三计算节点是至少一个计算节点中的任意一个。
其中,上述联合服务能力包括:存储能力、网络能力、编解码能力、每秒传输帧数等,上述算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。
上述算力是计算能力的简称,算力大小可以理解为计算能力的大小。算力大小的表示方法包括以下任一种:处理器每秒可执行多少次操作、每秒可执行多少次浮点数操作、主频多少赫兹、I/O带宽和时延(例如每秒进行读写操作的次数)是多少、散热设计功耗是多少、内存容量是多少、计算完成概率、或出错概率是多少等。
可选地,上述注册响应中携带触发计算节点向管理单元上报算力状态和网络状态的第一预设条件。
第二方面,本申请提供了一种计算任务的处理方法,该方法可以由计算节点执行,或者,也可以由配置在计算节点中的部件(如芯片、芯片系统等)执行,或者,还可以由能够实现全部或部分计算节点功能的逻辑模块或软件实现,本申请对此不作限定。
上述计算节点可以是通信系统的至少一个计算节点中的任意一个计算节点,该算力网络系统包括上述至少一个计算节点、管理单元和请求节点。
示例性地,该方法包括:确定计算节点的算力状态和/或网络状态,所述算力状态和/或网络状态用于确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的N个计算任务中的至少一个计算任务,每个目标计算节点用于执行所对应的至少一个计算任务,N为大于或等于1的整数;向管理单元发送计算节点的算力状态和/或网络状态。
在上述技术方案中,计算节点可以上报自身的算力状态和网络状态,以便于确定用于执行计算任务的目标计算节点,也就是说,在确定目标计算节点时充分考虑了至少一个计算节点中各个计算节点的算力状态和网络状态,这样有利于提高计算任务分配的合理性。
结合第二方面,在第二方面的某些可能的实现方式中,在计算节点为目标计算节点的情况下,接收来自管理单元的所述计算节点对应的至少一个计算任务的标识信息。
可选地,在上述计算节点为目标计算节点的情况下,该计算节点还可以获取至少一个计算任务的计算数据和第三信息;基于计算数据和第三信息,执行至少一个计算任务,该第三信息包括任务需求信息和/或任务特征信息。
可选地,上述任务需求信息包括以下至少一项:端到端时延、QoS、XQI、QoE或算力需求。
可选地,上述任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度。
结合第二方面,在第二方面的某些可能的实现方式中,上述任务需求信息、上述任务特征信息携带在请求节点向管理单元发送的计算请求中。
结合第二方面,在第二方面的某些可能的实现方式中,所述方法还包括:接收来自管理单元的第二信息,该第二信息用于确定计算节点的下一跳节点,该计算节点的下一跳节点用于基于来自计算节点输出的计算结果执行计算任务。
其中,第二信息中具体可以包括计算节点的下一跳节点的标识信息。该计算节点的下一跳节点可以是一个或多个目标计算节点中的至少一个目标计算节点。
不难理解,对于多个目标计算节点协同作业,且多个目标计算节点串行工作(也即某一目标计算节点执行计算任务时需要上一跳目标计算节点输出的计算结果)的情况下,对于每个用于执行计算任务的计算节点来说,可以接收来自管理单元的第二信息,该第二信息用于确定计算节点的下一跳节点。
结合第二方面,在第二方面的某些可能的实现方式中,计算节点的算力状态通过以下至少一项来度量:计算节点所提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
可选地,上述联合服务能力包括:存储能力、网络能力、编解码能力、每秒传输帧数等。
可选地,上述资源利用率包括:中央处理器的利用率、图形处理器的利用率、内存的利用率、磁盘的利用率、会话数量、或请求队列数量。
可选地,算力大小包括以下至少一项:所述计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。
可选地,上述计算节点的网络状态包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
向管理单元发送计算节点的算力状态和网络状态包括如下可能的设计:
一种可能的设计是,接收来自管理单元的查询请求,该查询请求用于请求查询计算节点的算力状态和网络状态;向管理单元发送查询响应,该查询响应中携带计算节点的算力状态和网络状态。
另一种可能的设计是,在满足第一预设条件的情况下,向管理单元发送计算节点的算力状态和网络状态。
结合第二方面,在第二方面的某些可能的实现方式中,所述方法还包括:向管理单元发送以下至少一种信息:实时的应用体验信息、实时的应用特征信息、或实时的网络状态信息;其中,上述实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE;实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;实时的网络状态信息包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
结合第二方面,在第二方面的某些可能的实现方式中,所述方法还包括:在至少一种信息满足预设条件的情况下,接收来自管理单元的指示信息,该指示信息用于计算节点调整相关的应用配置参数和/或相关的网络配置参数;基于上述指示信息,调整相关的应用配置参数和/或相关的网络配置参数;其中,上述相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;上述相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、或带宽。
可选地,所述预设条件包括以下至少一项:实时的应用体验信息中的参数低于第一阈值,实时的应用特征信息中的参数低于第二阈值,或,实时的网络状态信息中的参数低于第三阈值。
可选地,所述方法还包括:向管理单元发送认证请求,该认证请求携带计算节点的身份信息,该身份信息用于管理单元对计算节点进行身份认证;接收来自管理单元的认证响应,该认证响应中携带对计算节点的认证结果,该认证结果包括认证成功或认证失败。通过对计算节点进行身份认证,有利于提高安全性。
结合第二方面,在第二方面的某些可能的实现方式中,所述方法还包括:向管理单元发送注册请求,该注册请求中携带以下至少一项:计算节点所提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、或联合服务能力;接收来自管理单元的注册响应。
其中,联合服务能力包括:存储能力、网络能力、编解码能力、或每秒传输帧数等。
算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。
可选地,注册响应中携带触发计算节点向管理单元上报算力状态和网络状态的第一预设条件。
第三方面,本申请提供了一种计算任务的处理方法,该方法可以由请求节点执行,或者,也可以由配置在请求节点中的部件(如芯片、芯片系统等)执行,或者,还可以由能够实现全部或部分请求节点功能的逻辑模块或软件实现,本申请对此不作限定。
上述请求节点可以是通信系统的请求节点,该通信系统包括上述请求节点、至少一个计算节点和管理单元。
示例性地,该方法包括:向管理单元发送计算请求,该计算请求中携带N个计算任务的任务需求信息和/或任务特征信息,N为大于或等于1的整数;接收来自管理单元的第一信息,该第一信息指示一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息,每个目标计算节点用于执行所对应的至少一个计算任务;根据上述第一信息,向一个或多个目标计算节点发送各自对应的至少一个计算任务的计算数据。
在上述技术方案中,计算节点向管理单元发送计算请求时携带上述N个计算任务的任务需求信息和/或任务特征信息,以便于确定用于执行计算任务的目标计算节点,也就是说,在确定目标计算节点时充分考虑了计算任务的任务需求信息和/或任务特征信息,这样有利于提高计算任务分配的合理性。
可选地,所述方法还包括:向一个或多个目标计算节点发送应用程序的信息。
结合第三方面,在第三方面的某些可能的实现方式中,上述计算请求中还携带第一计算任务的拆分指示信息,该拆分指示信息用于管理单元将第一计算任务拆分为多个第二计算任务,该第一计算任务是未被拆分的计算任务,第二计算任务是拆分得到的计算任务。
由上可以看出,计算任务可以由管理单元来拆分,计算请求中可以携带拆分指示信息,管理单元可以根据拆分指示信息来拆分计算任务。
可选地,计算任务也可以由请求节点来拆分,本申请对此不作限定。
可选地,上述N个计算任务包括:一个第一计算任务和/或多个第二计算任务,其中,第一计算任务是未被拆分的计算任务,第二计算任务是拆分得到的计算任务。
结合第三方面,在第三方面的某些可能的实现方式中,所述方法还包括:向管理单元发送以下至少一种信息:实时的应用体验信息、实时的应用特征信息、或实时的网络状态信息;其中,实时的应用体验信息包括以下至少一项:端到端时延、服务质量QoS、XQI、QoE;实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;实时的网络状态信息包括以下至少一项:计算节点到所述请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
第四方面,本申请提供了一种通信系统,包括用于执行第一方面或第一方面任一种可能实现方式中所述的方法的管理单元、用于执行第二方面或第二方面任一种可能实现方式中所述的方法的计算节点、以及用于执行第三方面或第三方面任一种可能实现方式中所述的方法的请求节点;或者,包括用于执行第一方面或第一方面任一种可能实现方式中所述的方法的管理单元、用于执行第二方面或第二方面任一种可能实现方式中所述的方法的计算节点。
第五方面,本申请提供了一种计算任务的处理装置,可以实现第一方面至第三方面以及第一方面至第三方面任一种可能实现方式中所述的方法。该装置包括用于执行上述方法的相应的单元。该装置包括的单元可以通过软件和/或硬件方式实现。
第六方面,本申请提供了一种计算任务的处理装置,该装置包括处理器。该处理器与存储器耦合,可用于执行存储器中的计算机程序,以实现第一方面至第三方面以及第一方面至第三方面任一种可能实现方式中所述的方法。
可选地,该装置还包括通信接口,处理器与通信接口耦合。所述通信接口用于接收来自所述装置之外的其它通信装置的信号并传输至所述处理器,或将来自所述处理器的信号发送给所述装置之外的其它通信装置,示例性地,通信接口可以是收发器、电路、总线、模块或其它类型的通信接口。
可选地,该装置还包括存储器,处理器与存储器耦合。所述存储器用于保存程序指令和数据。
第七方面,本申请提供了一种计算机可读存储介质,该计算机存储介质中存储有计算机程序或指令,当所述计算机程序或指令在计算机上运行时,使得上述第一方面至第三方面以及第一方面至第三方面任一种可能实现方式中的方法被执行。
第八方面,本申请提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序(也可以称为代码,或指令),当所述计算机程序被运行时,使得上述第一方面至第三方面以及第一方面至第三方面任一种可能实现方式中的方法被执行。
第九方面,本申请提供了一种芯片系统,该芯片系统包括至少一个处理器,用于支持实现上述第一方面至第三方面以及第一方面至第三方面任一种可能的实现方式中所涉及的功能,例如,接收或处理上述方法中所涉及的数据等。
在一种可能的设计中,所述芯片系统还包括存储器,所述存储器用于保存程序指令和数据,存储器位于处理器之内或处理器之外。
该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
应当理解的是,本申请的第四方面至第九方面与本申请的第一方面至第三方面的技术方案相对应,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。
附图说明
图1是本申请实施例提供的已有的MEC网络架构的示意图;
图2是适用于本申请实施例提供的方法的通信系统的系统架构示意图;
图3是适用于本申请实施例提供的方法的通信系统的一种可能的系统架构示意图;
图4是本申请实施例提供的管理单元和近实时RIC(near real-time RIC,NRT-RIC)的部署方式的示意图;
图5是本申请实施例提供的管理单元部署在基站内部的示意图;
图6是本申请实施例提供的位于核心网设备侧和接入网设备侧的管理单元所管理的计算资源的示意图;
图7是本申请实施例提供的位于MEC平台侧的管理单元所管理的计算资源的示意图;
图8是本申请实施例提供的计算任务的处理方法的示意性流程图;
图9是本申请实施例提供的计算任务的处理方法的详细流程示意图;
图10是本申请实施例提供的计算任务的处理装置的示意性框图;
图11是本申请实施例提供的计算任务的处理装置的另一示意性框图;
图12是本申请实施例提供的接入网设备的结构示意图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
本申请提供的方法可以应用于各种通信系统,例如:长期演进(long termevolution,LTE)系统、LTE频分双工(frequency division duplex,FDD)系统、LTE时分双工(time division duplex,TDD)系统、第五代(5th generation,5G)移动通信系统或新无线接入技术(new radio access technology,NR)。其中,5G移动通信系统可以包括非独立组网(non-standalone,NSA)和/或独立组网(standalone,SA)。
本申请提供的技术方案还可以应用于机器类通信(machine typecommunication,MTC)、机器间通信长期演进技术(long term evolution-machine,LTE-M)、设备到设备(device-to device,D2D)网络、机器到机器(machine to machine,M2M)网络、物联网(internet of things,IoT)网络或者其他网络。其中,IoT网络例如可以包括车联网。其中,车联网系统中的通信方式统称为车到其他设备(vehicle to X,V2X,X可以代表任何事物)系统,例如,该V2X可以包括:车辆到车辆(vehicle to vehicle,V2V)通信,车辆与基础设施(vehicle to infrastructure,V2I)通信、车辆与行人之间的通信(vehicle topedestrian,V2P)或车辆与网络(vehicle to network,V2N)通信等。
本申请提供的技术方案还可以应用于未来的通信系统,如第六代(6thGeneration,6G)移动通信系统等。本申请对此不作限定。
本申请实施例中,无线接入网(radio access network,RAN)设备(以下可以简称为“接入网设备”)可以是任意一种具有无线收发功能的设备。无线接入网设备可以是采用第三代合作伙伴计划(3rd generation partnership project,3GPP)技术接入网络的设备,例如包括但不限于:基站(base station)、节点B(NodeB或NB)、LTE中的演进型节点B(evolved Node B,eNB)、5G(如NR)系统中的gNB或收发点(transmission receptionpoint,TRP)、第六代(6th generation,6G)移动通信系统中的下一代基站、未来移动通信系统中的基站等;也可以是完成基站部分功能的模块或单元,例如,可以是集中式单元(central unit,CU),也可以是分布式单元(distributed unit,DU)。无线接入网设备还可以是宏基站、微基站、微微基站、小站、气球站、室内站、中继站、无线中继节点、无线回传节点等等。该无线接入网设备也可以是采用非3GPP技术接入网络的设备,例如包括但不限于无线保真(wireless fidelity,Wi-Fi)系统中的接入点(access point,AP)等。可以理解,本申请中的无线接入网设备的全部或部分功能也可以通过在硬件上运行的软件功能来实现,或者通过平台(例如云平台)上实例化的虚拟化功能来实现。本申请对于无线接入网设备的具体形式不作限定。
核心网设备可用于完成注册、连接、会话管理三大功能,主要包括网络开放功能(network exposure function,NEF)网元、策略控制功能(policy control function,PCF)网元、应用功能(application function,AF)网元、接入与移动性管理功能(access andmobility management function,AMF)网元、会话管理功能模块(session managementfunction,SMF)网元以及用户平面功能(user plane function,UPF)网元等。
其中,UPF网元是数据网络的接口,可以完成用户面数据转发、基于会话/流级的计费统计、带宽限制等功能,用户数据可通过该网元接入到网络中。
NEF网元可用于向AF网元开放由3GPP网络功能提供的业务和能力,同时也可以让AF向3GPP网络功能提供信息。
AF网元主要传递应用侧对网络侧的需求,可视为应用服务器的代理。
SMF网元主要进行会话管理、用户设备互联网协议(internet protocol,IP)地址分配和管理、UPF选择等。
PCF网元主要进行计费策略与QoS策略的策略控制等。
AMF网元主要进行移动性管理、接入鉴权/授权等功能。此外,AMF网元还可负责在终端设备与PCF间传递用户策略。
各网元之间通过接口通信。例如,NEF网元和AF网元之间的接口为N33接口。终端设备和AMF网元间的信令面接口为N1接口,由于终端设备不能直接与核心网交互,需经过接入层(access stratum,AS)、透传非接入层(non-access stratum,NAS)信息。AMF向接入网(access network,AN)请求为协议数据单元(protocol data unit,PDU)会话分配资源等的信令面接口为N2接口。
上文关于核心网设备中的各个网元以及各个网元之间的接口仅为示例性说明,不应对本申请构成任何限定。
数据网络(data network,DN)可以提供运营商服务、互联网接入或第三方服务。
终端设备,也可以称为用户设备(user equipment,UE)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。
终端设备可以包括但不限于:手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、VR设备、AR设备、混合现实(mixed reality,MR)设备、XR设备、工业控制(industrial control)中的无线终端、车载设备、无人驾驶中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、可穿戴设备、视频播放器、全系投影仪等。本申请对于终端设备的具体形式均不做限定。
在本申请中,下文所述的通信系统中的请求节点可以是终端设备或接入网设备等,本申请对此不作限定。
目前,无线网络中计算负载逐渐增加,如VR、AR、云游戏等第三方应用业务、AI推理业务等,一种解决的方式是通过MEC机制,将接入网侧或终端侧的计算负载卸载至网络边缘的计算服务器。
为了便于理解,以下结合图1对已有的MEC网络架构进行详细描述。
图1是本申请实施例提供的已有的MEC网络架构的示意图。
如图1所示,5G网络可以包括终端设备部分、DN和运营商网络部分。其中,运营商网络可包括以下网元中的一个或多个:鉴权服务器功能(authentication server function,AUSF)网元、NEF网元、统一数据管理(unified Ddata management,UDM)网元、网络存储功能(network repository function,NRF)网元、AMF网元、SMF网元、RAN网元、UPF网元、网络切片选择功能(network slice selection function,NSSF)网元等。上述运营商网络中,除无线接入网部分之外的部分可以称为核心网络部分。其中,UPF网元属于MEC系统的一部分。MEC系统分为两层,分别为MEC系统级(system level)和MEC主机级(distributed hostlevel),其中,MEC系统级包括MEC编排器(orchestrator),MEC主机级包括MEC平台网管(platformmanager)、MEC平台(platform)、MEC服务(service)、MEC应用(App)以及虚拟化基础设施(virtualization infrastructure)。MEC平台、MEC服务和MEC应用均是面向MEC业务服务提供,可以统称为MEC业务系统。在5G核心网协议中,SMF可以控制PDU会话(session)的数据路由使得PDU会话可同时有多个N6接口,连接每个N6接口的UPF网元称为PDU会话锚点(PDU session anchor,PSA),每个PDU会话锚点提供了一条到同一个DN的不同路径。终端设备与DN之间的PDU会话数据传输要经过相应的PSA锚点到达相应的MEC平台。
MEC平台能够在移动网边缘提供互联网技术(internet technology,IT)服务环境和云计算能力,强调应用、服务和内容可以实现本地化、近距离、分布式部署,从而在一定程度上解决了5G增强移动宽带、低时延高可靠以及大规模机器通信类终端连接等场景的业务需求。
当前的MEC架构可能存在以下缺点:
第一、从计算资源协同的角度来看,单MEC站点资源有限,多MEC站点间缺乏协同与计算资源共享的能力,计算资源利用率较低,且集中式调度可扩展性较差。
第二、从任务需要的角度来看,XR、云游戏等任务有低时延、大带宽、高算力的需求,当前5G网络架构仅引入通信质量指标来提升非计算方面的性能。并且,应用层与网络层解耦,无法感知网络状态,无法保证用户体验;从终端到DN,端到端任务体验被分割成RAN到UPF、UPF到DN两部分,无法全局优化。
第三、从网络架构上看,在当前的MEC服务模式下,终端请求的计算任务需要经过UPF功能或者UPF上的PSA锚点,还有可能需要域名服务器(domain name server,DNS)域名解析以到达不同DN中的MEC服务器。终端与边缘服务器之间的输入或输出数据需要经过多个网关或网元路由转发,交互时延大。
第四、从数据安全角度来看,若采用现有MEC机制来实现RAN智能化,RAN AI搜集的数据需要经过UPF传输至DN中的服务器进行处理,增加了将网络内部数据暴露给第三方的风险。
应理解,移动边缘计算也可以称为多接入边缘计算(multi-access edgecomputing,MEC),本申请对其中文名称和英文名称的缩写不作具体限定。
MEC平台可以部署在无线接入网侧(可以称为接入网侧的MEC平台),例如,MEC平台可以部署在单个基站节点之后,也可以部署在多个基站的汇聚节点之后,本申请对此不作限定。MEC平台也可以部署在核心网侧(可以称为核心网侧的MEC平台)。具体的部署方式可以参看已知的技术,此处不再详述。
在已有的MEC网络架构下,网络在接收到计算请求时,一般都是直接将计算任务分配给能够提供计算服务的节点来执行,导致计算任务的分配不合理。
为解决计算任务的分配不合理的问题,本申请提供了一种计算任务的处理方法,管理单元在分配N个计算任务时,综合考虑了上述N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,有利于提高计算任务分配的合理性。例如,管理单元可以从上述至少一个计算节点中选择算力状态和网络状态最好的计算节点来执行计算任务,这样也能提高计算任务的处理效率,进而有利于提高计算服务体验。
为了更好地理解本申请实施例,下面首先对本申请实施例涉及到的几个术语进行说明。
1、计算任务:在本申请中,计算任务例如包括但不限于:图像渲染增强、AI推理、目标检测、目标识别、目标分类、行为预测、控制系统中的动作决策等等。本申请包含但不限于此。上述计算任务可以是VR、AR、云游戏等第三方应用业务中的计算任务。
在本申请中,某些计算任务可以被拆分,例如通过神经网络模型执行的任务,如果将神经网络模型中的多个神经网络层进行拆分成多个部分,该神经网络模型所对应的计算任务也就随之被拆分成多个计算任务,例如记为计算任务1至计算任务N。那么,与神经网络模型对应的计算任务可通过执行计算任务1至计算任务N(N为大于1的整数)来实现。又例如,某些类型的计算任务还可以被拆分成多个并行的任务,也即,被拆分成的多个任务互不影响,可以独立执行。本申请对此不作限定。
应理解,在本申请中,对计算任务进行拆分也可以理解为对计算任务进行分解、分段、分割等,表达的含义相同,本申请对此不作限定。
2、计算数据:计算节点执行计算任务所需的数据。计算数据可以分为原始数据、中间数据或计算结果等。其中,原始数据可以是未经处理的数据,例如可以是被输入至AI模型的数据;计算结果是原始数据经由计算节点执行计算任务后输出的数据;中间数据可以是指计算任务被拆分的情况下,各个计算节点串行工作时,某一中间节点输出的数据。例如,神经网络模型中具体可以是从除了输入层和输出层之外的其他层输出的数据。
3、计算节点:用于提供计算服务、执行计算任务的节点。例如,计算节点可以包括以下至少一种类型:终端设备、接入网设备、或核心网设备或MEC平台等,具体可以是以上设备上的中央处理器(central processing unit,CPU)、图形处理器(graph processingunit,GPU)、神经网络处理器(neural network processing unit,NPU)、张量处理器(tensor processing unit,TPU)等。本申请对此不作限定。
4、管理单元:可以用于对一个或多个计算节点进行统一管理。在本申请实施例中,管理单元也可以称为计算管理功能(computing management function,CMF)。
另外,在本申请中,管理单元对一个或多个计算节点进行统一管理,可以理解为:对一个或多个计算节点进行认证、注册、注销、维护、查询算力状态和/或网络状态、更新等操作,还包括根据一个或多个计算节点的算力状态和/或网络状态以及N个计算任务的任务需求信息和/或任务特征信息,确定上述一个或多个计算节点中的至少一个目标计算节点和每个目标计算节点待执行的至少一个计算任务,以使其执行对应的至少一个计算任务等。
下面将结合附图详细说明本申请提供的方法。
为方便理解,首先做出如下几点说明:
第一,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一计算节点和第二计算节点仅仅是为了区分不同的计算节点,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
第二,在本申请实施例中,各术语及英文缩略语,如网络状态、算力状态、计算任务、CMF等均为方便描述而给出的示例性举例,不应对本申请构成任何限定。本申请并不排除在已有或未来的协议中定义其它能够实现相同或相似功能的术语的可能。
第三,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b和c中的至少一项(个),可以表示:a,或b,或c,或a和b,或a和c,或b和c,或a、b和c,其中a,b,c可以是单个,也可以是多个。
第四,在本申请实施例中,“当……时”、“在……的情况下”、“若”以及“如果”等描述均指在某种客观情况下设备(如,下文所述的计算节点或者管理单元)会做出相应的处理,并非是限定时间,且也不要求设备(如,下文所述的计算节点或者管理单元)在实现时一定要有判断的动作,也不意味着存在其它限定。需要说明的是,在本申请实施例中如上几种描述可以相关替换,对此不做限制。
第五,在本申请实施例中,QoS可以是指5G系统定义的QoS,QoS可以通过QoS分类标识(QoS class identifier,QCI)来标识,其中,QoS定义的参数包括但不限于资源类型、优先级、时延、丢包率、保证速率、最大速率等等。需要说明的是,本申请中QoS也可以是未来系统定义的QoS,即QoS还可以通过其他性能指标来表示,本申请对QoS定义的参数的具体内容不作限定。
第六,在本申请实施例中,AI可以是面向无线网络内部的AI,例如,联邦学习分布式部署训练和推理。
下面将对本申请实施例提供的通信系统进行详细描述。
图2是适用于本申请实施例提供的方法的通信系统的系统架构示意图。
如图2所示,该通信系统包括请求节点、至少一个计算节点(如图中所示的计算节点1至计算节点M,其中,M为正整数)以及管理单元。其中,请求节点可以用于请求一个或多个计算任务;至少一个计算节点中的各个计算节点可以用于执行计算任务;管理单元可以用于对至少一个计算节点进行管理。管理单元对至少一个计算节点进行管理例如包括但不限于:对至少一个计算节点进行认证、注册、注销、维护、查询算力状态和/或网络状态、更新、分配计算任务等操作。
上述请求节点例如可以是终端设备或接入网设备等,计算节点例如可以是终端设备、接入网设备、核心网设备、接入网侧的MEC平台或核心网侧的MEC平台等,本申请对请求节点和计算节点的具体形态不作限定。
下面将结合图3详细描述管理单元的部署方式和具体功能。在图3所示的通信系统中,请求节点例如可以是终端设备,计算节点例如可以是基站、接入网侧的MEC平台、核心网侧的MEC平台。
如图3所示,该通信系统包括终端设备(如手机)、接入网设备(如基站)、核心网设备以及MEC(包括MEC 1至MEC N),其中,N为正整数。应理解,本申请对终端设备、接入网设备的具体类型不做限定。终端设备、接入网设备、核心网设备以及MEC上的计算资源均可以用于执行计算任务。
由图3可以看出,在本申请中,终端侧的计算业务和基站本地计算业务都可以通过网络卸载到网络内的计算资源上,该通信系统中新增了管理单元,也可以称为CMF,该管理单元可以对终端设备、接入网设备、核心网设备以及MEC平台中的一个或多个计算节点进行管理,下面将对其具体功能和部署方式进行详细描述。
管理单元的具体功能包括以下几项:
1、感知计算任务的任务需求信息和/或任务特征信息,其中,任务需求信息例如包括但不限于:任务类型、端到端时延需求、QoS需求、XQI、QoE、算力需求等;任务特征信息包括但不限于帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度等。
2、感知计算节点的网络状态,例如包括RAN状态、核心网状态,更具体地,可以包括上行和/或下行空口信道状态、网络拥塞状况、可用带宽、传输速率、吞吐量等。其中,拥塞状况可以是各层协议栈缓存(buffer)中的数据包的队列长度的相关信息,即缓存状态报告(buffer state report,BSR)相关信息。
3、感知计算节点的算力状态,例如包括计算资源的类型、算力大小、计算节点的位置、支持的任务类型、联合服务能力、或资源利用率等。
其中,联合服务能力包括:存储能力、网络能力、编解码能力、每秒传输帧数等。
资源利用率包括:中央处理器的利用率、图形处理器的利用率、内存的利用率、磁盘的利用率、会话数量、或请求队列数量。
算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。
4、对计算任务进行分配,例如包括将计算任务拆分成不同大小的计算任务;根据至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的至少一个计算任务。
5、对计算节点进行管理,例如包括计算节点和所提供的业务/服务标识(serviceID,SID)的注册、维护、查询和更新等。
管理单元的部署方式如下:
总的来说,管理单元可以部署在RAN设备侧,由RAN设备控制;管理单元也可以部署在核心网设备侧,由核心网设备控制;CMF还可以部署在MEC平台侧,由MEC平台的ECS控制。其中,当管理单元部署在RAN设备侧时,可以部署在RAN设备的内部,也可以作为RAN设备外部的独立模块。
可以理解,在Open-RAN(O-RAN)架构中,基站配置了RAN智能控制器(RANintelligent controller,RIC),RIC包括NRT-RIC和非实时RIC(non-real-time RIC,Non-RT RIC)。下面将以NRT-RIC为例,结合图4详细描述如何在Open-RAN架构中部署管理单元。
一种可能的设计是,如图4中的a)所示,管理单元部署在NRT-RIC内,也即,NRT-RIC中集成计算管理功能,并且运行第三方应用。NRT-RIC中还可以包括通信功能。其中,E2、F1是通信接口。
另一种可能的设计是,如图4中的b)所示,管理单元内部署NRT-RIC,也即,管理单元内集成NRT-RIC功能,并且运行第三方应用。管理单元中还可以包括通信功能。其中,E2、F1是通信接口。
类似地,管理单元部署在Non-RT RIC内,也即,Non-RT RIC中集成计算管理功能,并且运行第三方应用。或者,管理单元内部署Non-RT RIC,也即,管理单元内集成Non-RTRIC功能,并且运行第三方应用。
可选地,终端设备中也可以部署管理单元,例如,可以部署在终端设备的通信模块,如调制解调器(modem)。
图5是本申请实施例提供的管理单元部署在基站内部的示意图。
如图5所示,管理单元可以部署在基站内部,例如可以部署在基站中的CU内,也即,CU内集成计算管理功能。可以看出,CU还可以负责连接管理、QoS管理、移动管理等,本申请对此不作限定。
由上可知,管理单元可以位于不同的网络层级或位置(如核心网设备侧、接入网设备侧等),可以理解,位于不同层级的管理单元可以管理不同层级或范围的计算节点,以构建分层级的通信架构,具体如下:
一、管理单元部署在核心网设备侧(可以称为非接入侧CMF(non-access stratumCMF,NAS-CMF)或CN-CMF)。
这种设计下,NAS-CMF管理以下至少一种计算节点上的计算资源:接入网设备、接入网侧的MEC平台、核心网侧的MEC平台、或终端设备。例如,NAS-CMF可以管理基站基带处理单元(baseband unit,BBU)或者基站中的CU中的计算资源。
二、管理单元部署在接入网设备侧(可以称为接入侧CMF(access stratum CMF,AS-CMF)或AN-CMF)。
这种设计下,AS-CMF管理以下至少一种类型的计算节点上的计算资源:接入网设备、接入网侧的MEC平台、或终端设备。例如,AS-CMF可以管理基站BBU、基站中的CU、基站中DU的计算资源。
可选地,AS-CMF包括基站内CMF和跨基站CMF。其中,基站内CMF可以用于对同一个分布式无线接入(distributed RAN,D-RAN)或云无线接入网(cloud RAN,C-RAN)架构下计算节点的管理;跨基站CMF可以用于对不同D-RAN架构或C-RAN架构下计算节点的统一管理。
管理单元部署在接入网设备侧的情况下,终端设备、基站以及接入网设备侧MEC之间传输的数据可以包含在RRC协议消息中,和/或新增加的ERC协议消息中。其中,RRC协议消息和/或ERC协议消息可以承载在计算专用的无线承载中,该计算专用的无线承载包括CRB和/或session-less DRB。
可以看出,上述数据可以在RAN侧本地闭环,不需要经过核心网功能绕行以及建立PDU会话等,因此有利于降低时延。
三、管理单元部署在MEC平台侧。
管理单元可集成在MEC的ECS中、或者终端设备的EEC。
这种设计下,管理单元可以用于管理接入网侧的MEC平台、核心网侧的MEC平台、边缘云、或终端设备上的计算资源。
可选地,管理单元还可以部署在终端设备的通信模块,终端设备之间传输数据需要预定义一系列AT(attention)命令。AT命令用于控制调制解调器,每个调制解调器中使用的命令行都以“AT”开头。
下面结合图6和图7详细描述位于不同层级的管理单元所管理的计算资源的范围。
图6是本申请实施例提供的位于核心网设备侧和接入网设备侧的管理单元所管理的计算资源的示意图。
如图6所示,核心网侧的管理单元可以管理接入网设备、接入网侧的MEC平台、核心网侧的MEC平台、或终端设备上的计算资源。接入网侧的管理单元可以管理接入网设备、接入网侧的MEC平台、或终端设备上的计算资源。位于终端设备的通信模块的管理单元可以管理终端粒度的计算资源,例如包括通信模块内的计算资源、通信模块外的计算资源。
图7是本申请实施例提供的位于MEC平台侧的管理单元所管理的计算资源的示意图。
如图7所示,管理单元可集成在MEC的ECS、终端设备的EEC。管理单元可以用于管理接入网设备侧的MEC平台、核心网侧的MEC平台、或终端设备上的计算资源。
下面将结合附图详细描述本申请实施例提供的计算任务的处理方法。
下文所示出的实施例从管理单元、计算节点和请求节点之间交互的角度示出了本申请提供的计算任务的处理方法,但不应对本申请提供的方法构成任何限定。
图8是本申请实施例提供的计算任务的处理方法800的示意性流程图。下面详细说明方法800中的各个步骤。
步骤810,根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的至少一个计算任务。
其中,上述一个或多个目标计算节点中的每个目标计算节点与一个或多个计算任务中的至少一个计算任务对应,每个目标计算节点用于执行所对应的至少一个计算任务。N为大于或等于1的整数。
每个计算节点的算力状态通过以下至少一项来度量:计算节点所提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
其中,联合服务能力包括:存储能力、网络能力、编解码能力、每秒传输帧数等;资源利用率包括:中央处理器的利用率、图形处理器的利用率、内存的利用率、磁盘的利用率、会话数量、或请求队列数量;算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。
上述编解码能力是指编码和解码的能力。上述未来一段时间内的可用算力中的一段时间可以是协议预设的一段时间,或者,可以是通信双方协商确定的一段时间,本申请对此不作限定。
计算资源的类型例如可以按物理硬件类型来分类,例如包括但不限于:CPU、GPU、NPU、TPU。可选地,关于计算资源的类型的信息中还可以包括这些硬件的型号、内存、主频等参数信息。
应理解,在本申请实施例中,算力是计算能力的简称,算力大小可以理解为计算能力的大小。算力大小可以直接表示为处理器每秒可执行多少次操作或每秒执行多少次浮点数操作。可选地,算力大小还可以包括:主频多少赫兹、I/O带宽和时延(例如每秒进行读写操作的次数)是多少、散热设计功耗多少瓦特、内存容量多少字节、计算完成概率是多少、出错概率是多少等。支持的任务类型例如包括但不限于:图像视频渲染类、AI训练、AI推理类、感知处理类、高性能计算类、大数据离线分析类等。
可以理解,每个计算节点的算力状态,可以通过上述多个维度加权的结果表示,一种可能的实现中,可以通过上述多个维度的参数加权的和表示,例如可以将不同芯片所提供的计算资源通过预设的度量函数映射到统一的量纲;或者直接通过多个维度中每个维度的数值来表示。本申请实施例对此不作限定。
每个计算节点的网络状态包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
管理单元根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中确定一个或多个目标计算节点和每个目标计算节点待执行的至少一个计算任务,包括以下几种可能的设计:
一种可能的设计是,管理单元可以从上述至少一个计算节点中确定出满足任务需求信息和/或任务特征信息的计算节点,对于这些计算节点,根据算力状态确定计算时间,根据网络状态确定传输时间,按照计算时间和传输时间之和由低到高排序,将排序靠前的计算节点作为目标计算节点来执行计算任务,每个目标计算节点用于执行一个或多个计算任务中的至少一个计算任务。目标计算节点与计算任务的对应关系,例如可以为<目标计算节点1,计算任务1>,<目标计算节点2,计算任务3>,<目标计算节点3,计算任务2>等。
示例性地,计算任务包括计算任务1和计算任务2,计算任务1的任务需求包括计算节点上的计算资源剩余超过20%,计算任务2的任务需求包括计算节点上的计算资源剩余超过50%,则管理单元可以从上述至少一个计算节点中确定出满足任务需求的计算节点,如计算节点1和计算节点2满足计算任务1的需求,计算节点3和计算节点4满足计算任务2的需求,但是,计算节点1和计算节点3计算时间和传输时间之和较小,则由计算节点1执行计算任务1,计算节点3执行计算任务2。
另一种可能的设计是,管理单元可以从上述至少一个计算节点中确定出满足任务需求信息和/或任务特征信息的计算节点,对于这些计算节点,管理单元基于预定义的映射函数,将上述各个计算节点的算力状态映射成一个函数值,也即映射成统一的量纲,将计算节点按照函数值的大小进行排序,将排序靠前的计算节点作为目标计算节点来执行计算任务,如果函数值一样,可以继续对比网络状态,选择网络状态较好的计算节点作为目标计算节点。
示例性地,计算任务包括计算任务1和计算任务2,计算任务1的任务需求包括计算节点上的计算资源剩余超过20%,计算任务2的任务需求包括计算节点上的计算资源剩余超过50%,则管理单元可以从上述至少一个计算节点中确定出满足任务需求的计算节点,如计算节点1和计算节点2满足计算任务1的需求,计算节点3和计算节点4满足计算任务2的需求,但是,计算节点1的网络状态优于计算节点2的网络状态,计算节点3的网络状态优于计算节点4的网络状态,则由计算节点1执行计算任务1,计算节点3执行计算任务2。其中,管理单元可以通过对比用于表征网络状态的参数,来确定计算节点1的网络状态优于计算节点2的网络状态,计算节点3的网络状态优于计算节点4的网络状态。
又一种可能的设计是,管理单元可以从上述至少一个计算节点中确定出满足任务需求信息和/或任务特征信息的计算节点,对于这些计算节点,计算节点的算力状态和网络状态的各个参数预定义优先级,管理单元按照优先级由高到低的顺序对比各个计算节点的算力状态、网络状态。例如,计算节点的算力大小的优先级高于计算节点的位置的优先级,则管理单元优先对比各个计算节点的算力大小,优先选择算力较大的计算节点来执行计算任务,如果算力大小一致,则继续对比计算节点的位置等。
应理解,本申请实施例对管理单元确定一个或多个目标计算节点时所采取的具体策略不作具体限定。
可选地,在步骤810之前,上述方法800还可以包括步骤815:请求节点向管理单元发送计算请求,相应地,管理单元接收来自请求节点的计算请求,该计算请求中携带上述N个计算任务的任务需求信息和/或任务特征信息;以及,在步骤820之后,上述方法800还包括步骤821:向一个或多个目标计算节点中每个目标计算节点发送任务需求信息和/或任务特征信息。相应地,目标计算节点接收来自管理单元的任务需求信息和/或任务特征信息。
上述计算请求可以用于请求执行上述N个计算任务,或者,上述计算请求可以用于请求分配用于执行N个计算任务的目标计算节点等。上述请求节点例如可以是终端设备、接入网设备等。
可选地,上述N个计算任务的类型例如包括但不限于:图像渲染增强、AI推理、目标检测、目标识别、目标分类、行为预测、控制系统中的动作决策等,本申请对计算任务的类型不作限定。
示例性地,请求节点向管理单元发起计算请求,以请求执行一个或多个计算任务,相应地,管理单元接收来自请求节点的计算请求。
可以理解,对于各个计算节点来说,需要知道计算任务的任务需求信息和/或任务特征信息,该任务需求信息和/或任务特征信息用于配置执行对应的计算任务所需的程序环境。
一种可能的设计是,上述计算请求中携带一个或多个计算任务的任务需求信息和/或任务特征信息,管理单元确定出用于执行一个或多个计算任务的目标计算节点后,将上述任务需求信息和/或任务特征信息发送给对应的目标计算节点,以便于目标计算节点配置执行计算任务所需的程序环境。
可选地,上述任务需求信息包括以下至少一项:端到端时延、QoS、XQI、QoE、或算力需求。其中,端到端时延是指从计算节点发起一个计算请求到接收到计算结果的时长。算力需求例如可以是执行计算任务所需的计算资源的类型、算力大小、计算节点的位置、联合服务能力、或资源利用率等。
可选地,上述任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度。其中,失真类型例如包括但不限于:幅度失真、频率失真、相位失真等,本申请对此不作限定。
可选地,上述一个或多个计算任务包括:一个第一计算任务和/或多个第二计算任务,第一计算任务是未被拆分的计算任务,第二计算任务是拆分得到的计算任务。
上述计算请求中还可以携带第一计算任务的拆分指示信息,拆分指示信息用于管理单元将第一计算任务拆分为多个第二计算任务。
例如,拆分指示信息可以包括将第一计算任务拆分成几个计算任务的指示信息,和/或,拆分指示信息可以包括第二计算任务的大小的指示信息等。例如,第一计算任务是关于神经网络模型的计算任务,拆分指示信息可以包括第一计算任务拆分为几个第二计算任务的指示信息、神经网络模型中的拆分点信息,也即,在哪几层进行拆分等,如,拆分点包括第二层,第五层,则,第一层和第二层可以属于一个计算任务,第三层至第五层可以属于另一计算任务。
可以理解,神经网络模型可以包括多个神经网络层,上述第一层、第二层等是指神经网络模型的神经网络层。基于不同的类别,神经网络模型可以分为:深度神经网络(deepneural networks,DNN)模型、卷积神经网络(convolutional neuron network,CNN)模型、循环神经网络(recurrent neural network,RNN)模型等。本申请包含但不限于此。以DNN模型为例,该DNN模型包括多个神经网络层,该多个神经网络层可以包括一个或多个卷积层、一个或多个池化层、一个或多个全连接层以及一个或多个激活层等。本申请对各种神经网络模型所包括的神经网络层不作限定。
也就是说,计算任务可以由请求节点来拆分,也可以由管理单元来拆分,本申请对此不作限定。
例如,计算请求中携带第一计算任务的任务需求信息和/或任务特征信息、以及拆分指示信息,管理单元接收到计算请求后,可以根据第一计算任务和拆分指示信息,将其拆分为多个第二计算任务,例如,计算请求中携带神经网络模型的结构和拆分指示信息,管理单元可以根据神经网络模型的结构和拆分指示信息,将其拆分为多个第二计算任务(例如包括第一层和第二层属于一个计算任务,第三层至第五层属于另一个计算任务等),其中,第一层和第二层由某一目标计算节点来执行,第三层至第五层由另一目标计算节点来执行等。
可选地,管理单元可以通过以下两种方式中的一种获取到计算节点的算力状态和网络状态:
方式一:管理单元还可以执行图8中所示的步骤816和步骤817,以获取计算节点的算力状态和网络状态:向至少一个计算节点中的各个计算节点发送查询请求,查询请求用于请求查询计算节点的算力状态和网络状态;接收来自各个计算节点的查询响应,查询响应中携带计算节点的算力状态和网络状态。
方式二:至少一个计算节点中各个计算节点在满足第一预设条件的情况下,自动上报各自的算力状态和网络状态,例如,第一预设条件可以是计算节点上报算力状态和网络状态的周期,各个计算节点可以每隔一段时间上报一次算力状态和网络状态,或者,第一预设条件可以是触发计算节点上报算力状态和网络状态的其他条件,本申请对此不作限定。
针对各个目标计算节点执行对应的计算任务所需的计算数据,请求节点接收到管理单元发送的执行各个计算任务对应的目标计算节点后,可以再将执行计算任务所需的计算数据发送给相应的目标计算节点,以便于目标计算节点执行计算任务。
可选地,请求节点还可以向一个或多个目标计算节点发送应用程序的信息。其中,应用程序的信息是计算任务对应的应用程序的信息,例如,操作指令集等。
可选地,在步骤820之后,上述方法800还可以包括步骤822:管理单元还可以向请求节点发送第一信息,相应地,请求节点接收来自管理单元的第一信息,该第一信息指示一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息。
例如,管理单元可以向请求节点指示目标计算节点及其执行的至少一个计算任务的对应关系,如<目标计算节点1,计算任务1>,<目标计算节点2,计算任务3>,<目标计算节点3,计算任务2>等,以便于请求节点给相应的目标计算节点发送计算数据和/或应用程序的信息。例如,请求节点在向目标计算节点发送计算数据和/或应用程序的信息时,需要知道发送给哪一个目标计算节点,并且,请求节点发送的计算数据中还可以携带上目标计算节点的标识。
可以理解,对于多个目标计算节点协同作业,且多个目标计算节点串行工作(也即某一目标计算节点执行计算任务时需要上一跳目标计算节点输出的计算结果)的情况下,方法800还可以包括步骤823:管理单元可以向一个或多个目标计算节点中的第一计算节点发送第二信息,该第二信息用于确定第一计算节点的下一跳节点,该第一计算节点的下一跳节点用于基于来自第一计算节点输出的计算结果执行计算任务,第一计算节点是一个或多个目标计算节点中的任意一个。
其中,第一计算节点的下一跳节点可以是一个或多个目标计算节点中的至少一个目标计算节点。第二信息中具体可以包括第一计算节点的下一跳节点的标识信息。
其中,本申请对步骤821、步骤822以及步骤823的先后顺序不作限定。
步骤820,向一个或多个目标计算节点中每个目标计算节点发送各自对应的至少一个计算任务的标识信息。
管理单元确定出用于执行一个或多个计算任务的一个或多个目标计算节点后,向每个目标计算节点发送各自对应的至少一个计算任务的标识信息,以指示目标计算节点执行各自对应的计算任务。其中,计算任务的标识信息例如可以是计算任务的编号等,本申请对此不作限定,只要能够标识计算任务即可。
可以理解,请求节点后续可以将计算任务的内容和所需的计算数据发送给目标计算节点。
可选地,在接收来自请求节点的计算请求之前,方法800还包括步骤811:接收来自第三计算节点的认证请求,该认证请求携带第三计算节点的身份信息,该第三计算节点是至少一个计算节点中的任意一个;对第三计算节点进行身份认证;上述方法800还包括步骤812:向第三计算节点发送认证响应,该认证响应中携带对第三计算节点的认证结果,该认证结果包括认证成功或认证失败。
示例性地,对于某一计算节点来说,该计算节点可以向管理单元发送认证请求,该认证请求中携带该计算节点的身份信息,管理单元接收来自该计算节点的认证请求。进一步地,管理单元对其进行身份认证,并向其发送认证结果,例如,认证成功或认证失败。
可选地,在接收来自请求节点的计算请求之前,上述方法800还包括步骤813:接收来自第三计算节点的注册请求,注册请求中携带以下至少一项:第三计算节点所提供的计算资源的类型、算力大小、第三计算节点的位置、支持的任务类型、或联合服务能力;上述方法800还包括步骤814:向第三计算节点发送注册响应。
其中,联合服务能力包括:存储能力、网络能力、编解码能力、每秒传输帧数等。算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力,第三计算节点是至少一个计算节点中的任意一个。其中,一段时间可以是协议预设的一段时间,或者,可以是通信双方协商确定的一段时间,本申请对此不作限定。
示例性地,对于某一计算节点来说,该计算节点可以向管理单元发送注册请求,该注册请求中携带第三计算节点所提供的计算资源的类型、算力大小、第三计算节点的位置、支持的任务类型、或联合服务能力等,相应地,管理单元接收来自该计算节点的注册请求。进一步地,管理单元向该计算节点发送注册响应。
可选地,上述注册响应中携带触发第三计算节点向管理单元上报算力状态和网络状态的第一预设条件。
也就是说,管理单元发送的注册响应中携带有触发第三计算节点向管理单元上报算力状态和网络状态的第一预设条件。该第三计算节点在满足第一预设条件的情况下,可以主动上报自身的算力状态和网络状态。
上述第一预设条件可以是计算节点上报算力状态和网络状态的周期,各个计算节点可以每隔一段时间上报一次算力状态和网络状态,或者,第一预设条件可以是触发计算节点上报算力状态和网络状态的其他条件,如用于表征网络状态的参数达到对应的阈值等,本申请对此不作限定。
可选地,上述方法800还包括步骤824:管理单元获取如下至少一种信息:实时的应用体验信息、实时的应用特征信息,或实时的网络状态信息;根据所述至少一种信息,向所述一个或多个目标计算节点中的第二计算节点发送指示信息,所述指示信息用于所述第二计算节点调整相关的应用配置参数和/或相关的网络配置参数;其中,所述实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE;所述实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;所述实时的网络状态信息包括以下至少一项:计算节点到所述请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态;所述相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;所述相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、或带宽。
示例性地,管理单元接收到某一目标计算节点上报的如下至少一种信息:实时的应用体验信息、实时的应用特征信息,或实时的网络状态信息,进而根据上述至少一种信息,向该目标计算节点发送指示信息,以指示调整相关的应用配置参数和/或相关的网络配置参数。该目标计算节点接收到指示信息后,便可以调整相关的应用配置参数和/或相关的网络配置参数,这样一来,有利于提高用户的业务体验。
可选地,方法800还可以步骤825:管理单元根据上述至少一种信息,向一个或多个目标计算节点中的第二计算节点发送指示信息,包括:在上述至少一种信息满足预设条件的情况下,向一个或多个目标计算节点中的第二计算节点发送上述指示信息,其中,上述预设条件包括以下至少一项:实时的应用体验信息中的参数低于第一阈值,实时的应用特征信息中的参数低于第二阈值,或,实时的网络状态信息中的参数低于第三阈值。
一种可能的示例中,管理单元接收到某一目标计算节点上报的上述至少一种信息后,确定网络状态信息中的带宽低于对应的阈值,则可以指示该目标计算节点将码率降为一半。
可选地,上述至少一种信息中的一种或多种来自一个或多个目标计算节点中的至少一个,或者,上述至少一种信息中的一种或多种来自请求节点。
可以理解,目标计算节点可以上报上述至少一种信息,另外,请求节点,如终端设备,也可以上报上述至少一种信息,本申请对此不作限定。
还需理解,上述实时的应用体验信息中的参数和任务需求信息中的参数可以相同,实时的应用特征信息和任务特征信息中的参数可以相同,实时的网络状态信息和网络状态中的参数可以相同,但是对于每个参数的具体数值可以是不同的。例如,任务特征信息中的分辨率需求是1920×1080,但是实时的应用特征信息中的分辨率可能未达到需求,例如只达到1280×720。
可选地,上述请求节点、管理单元以及至少一个计算节点之间传输的数据可以包含在RRC协议消息中,和/或新增加的ERC协议消息中。
其中,ERC也可以与RRC协议层并列,ERC也可以属于新引入的计算面(computeplane)的某一层协议。在本申请中,ERC协议消息可以用于携带计算任务的请求、计算节点的算力状态和/或网络状态、计算任务的分配结果、或计算数据等。
上述RRC协议消息和/或ERC协议消息可以承载在计算专用的无线承载中,计算专用的无线承载包括CRB和/或session-less DRB。
CRB与ERC协议消息对应,ERC协议消息可以承载在CRB中,其中,ERC协议消息可以用于携带计算任务的请求、计算节点的算力状态和/或网络状态、计算任务的分配结果、或计算数据等,换言之,CRB既可以承载计算任务的请求、计算节点的算力状态和/或网络状态、计算任务的分配结果控制面数据,也可以承载计算任务所需的计算数据等用户面数据,本申请对此不作限定。例如,与计算资源管理、计算请求、编排、分配相关的消息等控制面消息可使用一个CRB传输;与计算任务所需的计算数据、应用程序的信息等用户面数据可以通过一个或多个其它CRB传输。
图9是本申请实施例提供的计算任务的处理方法的详细流程示意图。在图9所示的实施例中,请求节点以终端设备为例。另外,图9中示例性地示出了一个计算节点,但不应对本申请构成任何限定,计算节点的个数可以为一个或多个,各个计算节点可以执行图9所示的计算节点所执行的步骤。
步骤901,计算节点向管理单元发送认证请求。相应地,管理单元接收来自计算节点的认证请求。
该认证请求中可以携带计算节点的身份信息,该身份信息用于对计算节点进行身份认证。
管理单元接收到认证请求后,对计算节点进行身份认证。
步骤902,管理单元向计算节点发送认证响应。相应地,计算节点接收来自管理单元的认证响应。
该认证响应中携带对计算节点的认证结果,该认证结果包括认证成功或认证失败。
步骤901和步骤902为可选的步骤,管理单元也可以直接采用网元间初始握手的认证,或者核心网设备对终端设备的认证,本申请对此不作限定。
步骤903,计算节点向管理单元发送注册请求。相应地,管理单元接收来自计算节点的注册请求。
其中,该注册请求中可以携带以下至少一项:计算资源的类型、算力大小、计算节点的位置、支持的任务类型、或联合服务能力。
其中,联合服务能力包括:存储能力、网络能力、编解码能力、每秒传输帧数等,算力大小包括以下至少一项:计算节点固有的算力、当前的可用算力、或未来一段时间内的可用算力。其中,一段时间可以是协议预设的一段时间,或者,可以是通信双方协商确定的一段时间,本申请对此不作限定。关于计算节点向管理单元注册的过程更详细的描述可以参看图8的相关描述,此处不再赘述。
步骤904,管理单元向计算节点发送注册响应。相应地,计算节点接收来自管理单元的注册响应。
可选地,该注册响应中可以携带触发计算节点向管理单元上报算力状态和网络状态的第一预设条件。
一种可能的示例,该注册响应中可以携带计算节点向管理单元上报算力状态和网络状态的周期,计算节点可以每隔一段时间上报一次算力状态和网络状态。
又一种可能的示例,第一预设条件可以是触发计算节点上报算力状态和网络状态的其他条件,如用于表征网络状态的参数的阈值,本申请对此不作限定。
可以理解,步骤903和步骤904为可选的步骤,也即,各个计算节点可以不预先注册,管理单元在分配计算任务之前,可以通过步骤906和步骤907来获取到各个计算节点的算力状态,如计算节点可提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、或联合服务能力等。
步骤905,终端设备向管理单元发送计算请求。相应地,管理单元接收来自终端设备的计算请求。
上述计算请求用于请求执行一个或多个计算任务。
上述计算请求中可以携带任务需求信息和/或任务特征信息。其中,任务需求信息包括以下至少一项:端到端时延、QoS、XQI、QoE、或算力需求。
任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度。
上述计算请求中可以携带计算任务的拆分指示信息,该拆分指示信息用于指示将所请求的计算任务拆分成多个计算任务。其中,关于拆分指示信息的更详细的描述可以参见图8中对应的描述,此处不再赘述。该请求中还可以携带拆分得到的计算任务之间的中间数据传输吞吐量、时延、可靠性指标等。
步骤906,管理单元向计算节点发送查询请求。相应地,计算节点接收来自管理单元的查询请求。
该查询请求用于请求查询计算节点的算力状态和网络状态。关于算力状态和网络状态更详细的描述可以参看图8的相关介绍。
步骤907,计算节点向管理单元发送查询响应。相应地,管理单元接收来自计算节点的查询响应。
该查询响应中携带计算节点的算力状态和网络状态。
可选地,步骤906和步骤907也可以替换为:计算节点在满足第一预设条件的情况下,主动上报自身的算力状态和网络状态。关于第一预设条件的描述可以参看上文,此处不再赘述。
步骤908,管理单元根据任务需求信息和/或任务特征信息,以及计算节点的算力状态和网络状态,分配计算任务。
管理单元可以根据任务需求信息和/或任务特征信息以及自身管理的至少一个计算节点中各个计算节点的算力状态和网络状态,分配计算请求中请求的一个或多个计算任务。具体的方法可以参看图8的相关描述,此处不再赘述。示例性地,可以通过{<计算节点,计算任务编号>,…}的关联关系表示分配结果。例如:管理单元将计算任务切分成计算任务1、计算任务2、计算任务3,分配结果可以为{<终端设备,计算任务1>、<基站,计算任务2>、<MEC,计算任务3>},即端边云协同计算任务。
计算任务也可以由终端设备来拆分,管理单元根据任务需求信息和/或任务特征信息以及自身管理的至少一个计算节点中各个计算节点的算力状态和网络状态,确定用于执行多个计算任务的多个目标计算节点即可。
步骤909,管理单元下发分配结果。
具体包括:步骤909a,管理单元向计算节点发送分配结果,其中,该计算节点是执行计算任务的节点;和步骤909b,管理单元向终端设备发送分配结果,以便于终端设备向相应的计算节点发送计算数据和/或应用程序的信息。
可以理解,管理单元也可以只将计算节点的下一跳告知计算节点即可,该下一跳用于基于来自该计算节点输出的计算结果执行计算任务。
可选地,管理单元还可以将计算任务的任务需求信息和/或任务特征信息发送给计算节点,以便于计算节点配置执行计算任务所需的程序环境。
步骤910,计算节点向管理单元发送配置响应。
计算节点配置好用于执行计算任务所需的程序环境后,可以向管理单元发送配置响应。
步骤911,终端设备向计算节点发送计算数据。
终端设备可以根据分配结果将计算数据上传到一个或多个协同的计算节点,如果是多个计算节点,则计算数据可通过一个节点转发给其他节点。
可选地,终端设备还可以向计算节点发送应用程序的信息。具体的参看图8的相关描述。
步骤912,计算节点向终端设备发送计算结果。
步骤913,计算节点和/或终端设备向管理单元发送实时的应用体验信息、实时的应用特征信息、实时的网络状态信息。
其中,上述实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE,实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;实时的网络状态信息包括以下至少一项:计算节点到所述请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
步骤914,管理单元下发优化结果。
管理单元根据实时的应用体验信息、实时的应用特征信息、实时的网络状态信息,确定推荐的相关的应用配置参数和/或相关的网络配置参数,以提升用户体验。
上述优化结果包括管理单元推荐的相关的应用配置参数和/或相关的网络配置参数,其中,相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、带宽。
具体包括:步骤914a,管理单元向计算节点发送优化结果;和,步骤914b,管理单元向终端设备发送优化结果。
基于上述技术方案,管理单元在确定用于执行一个或多个计算任务的一个或多个目标计算节点时,综合考虑了一个或多个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,有利于提高计算任务分配的合理性。例如,管理单元可以从上述至少一个计算节点中选择算力状态和网络状态更优的计算节点来执行计算任务,这样也能提高计算任务的处理效率,进而有利于提高计算服务体验。
下面结合图10至图12详细说明本申请实施例提供的装置。
图10是本申请实施例提供的计算任务的处理装置的示意性框图。如图10所示,该装置1000可以包括:收发单元1010和处理单元1020。该装置1000可以用于执行图8或图9所示的方法中管理单元、计算节点或请求节点执行的步骤。
示例性地,该装置1000用于执行图8所示的方法中管理单元执行的步骤时,处理单元1020可以用于根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的N个计算任务中的至少一个计算任务,N为大于或等于1的整数;收发单元1010用于向一个或多个目标计算节点中的每个目标计算节点发送各自对应的至少一个计算任务的标识信息。可以理解,上述方法可以通过一个或多个单元来实现,这一个或多个单元可以集中放置在一起,也可以放置在不同装置中。
可选地,每个计算节点的算力状态通过以下至少一项来度量:计算节点所提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
可选地,任务需求信息包括以下至少一项:任务类型、端到端时延、QoS、XQI、QoE、或算力需求。
可选地,任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度。
可选地,收发单元1010还用于:接收来自请求节点的计算请求,该计算请求中携带N个计算任务的任务需求信息和/或任务特征信息;以及,收发单元1010还用于:向一个或多个目标计算节点中每个目标计算节点发送任务需求信息和/或任务特征信息。
可选地,上述计算请求中还携带第一计算任务的拆分指示信息,该拆分指示信息用于装置1000将第一计算任务拆分为多个第二计算任务,第一计算任务是未被拆分的计算任务,第二计算任务是拆分得到的计算任务。
可选地,上述N个计算任务包括:一个第一计算任务和/或多个第二计算任务。
可选地,收发单元1010还用于:向至少一个计算节点中的各个计算节点发送查询请求,该查询请求用于请求查询计算节点的算力状态和/或网络状态;接收来自各个计算节点的查询响应,该查询响应中携带计算节点的算力状态和/或网络状态。
可选地,收发单元1010还用于:向请求节点发送第一信息,该第一信息指示一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息。
可选地,收发单元1010还用于:向一个或多个目标计算节点中的第一计算节点发送第二信息,该第二信息用于确定第一计算节点的下一跳节点,第一计算节点的下一跳节点用于基于来自第一计算节点输出的计算结果执行计算任务,第一计算节点是一个或多个目标计算节点中的任意一个。
可选地,收发单元1010还用于:获取如下至少一种信息:实时的应用体验信息、实时的应用特征信息,或实时的网络状态信息;根据上述至少一种信息,向一个或多个目标计算节点中的第二计算节点发送指示信息,该指示信息用于第二计算节点调整相关的应用配置参数和/或相关的网络配置参数;其中,实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE;实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;实时的网络状态信息包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态;相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、或带宽。
可选地,收发单元1010具体用于:在至少一种信息满足预设条件的情况下,向一个或多个目标计算节点中的第二计算节点发送指示信息,其中,预设条件包括以下至少一项:实时的应用体验信息中的参数低于第一阈值,实时的应用特征信息中的参数低于第二阈值,或,实时的网络状态信息中的参数低于第三阈值。
可选地,上述至少一种信息中的一种或多种来自一个或多个目标计算节点中的至少一个,或者,上述至少一种信息中的一种或多种来自请求节点。
示例性地,该装置1000用于执行计算节点执行的步骤时,处理单元1020用于确定算力状态和/或网络状态,上述算力状态和/或网络状态用于确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的请求节点请求的N个计算任务中的至少一个计算任务,N为大于或等于1的整数;收发单元1010用于向管理单元发送算力状态和网络状态。可以理解,上述方法可以通过一个或多个单元来实现,这一个或多个单元可以集中放置在一起,也可以放置在不同装置中。
可选地,收发单元1010还用于:在装置1000为目标计算节点的情况下,接收来自管理单元的装置1000对应的至少一个计算任务的标识信息。
可选地,处理单元1020还用于:获取至少一个计算任务的计算数据和第三信息;基于计算数据和第三信息,执行至少一个计算任务,第三信息包括任务需求信息和/或任务特征信息。
可选地,上述任务需求信息包括以下至少一项:端到端时延、QoS、XQI、QoE、或算力需求。
可选地,上述任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度。
可选地,上述任务需求信息、所述任务特征信息携带在请求节点向所述管理单元发送的计算请求中。
可选地,收发单元1010还用于接收来自管理单元的第二信息,第二信息用于确定计算节点的下一跳节点,计算节点的下一跳节点用于基于来自计算节点输出的计算结果执行计算任务。
可选地,上述算力状态通过以下至少一项来度量:计算资源的类型、算力大小、所述计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
可选地,收发单元1010具体用于接收来自管理单元的查询请求,该查询请求用于请求查询装置1000的算力状态和/或网络状态;向管理单元发送查询响应,该查询响应中携带装置1000的算力状态和/或网络状态。
可选地,收发单元1010还用于向管理单元发送以下至少一种信息:实时的应用体验信息、实时的应用特征信息、或实时的网络状态信息;其中,所述实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE;实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;实时的网络状态信息包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
可选地,处理单元1020还用于在至少一种信息满足预设条件的情况下,接收来自管理单元的指示信息,该指示信息用于计算节点调整相关的应用配置参数和/或相关的网络配置参数;基于指示信息,调整相关的应用配置参数和/或相关的网络配置参数;其中,相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、带宽。
可选地,上述预设条件包括以下至少一项:实时的应用体验信息中的参数低于第一阈值,实时的应用特征信息中的参数低于第二阈值,或,实时的网络状态信息中的参数低于第三阈值。
示例性地,该装置1000用于执行请求节点执行的步骤时,收发单元1010用于向管理单元发送计算请求,计算请求中携带N个计算任务的任务需求信息和/或任务特征信息,N为大于或等于1的整数;接收来自管理单元的第一信息,该第一信息指示一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息,每个目标计算节点用于执行所对应的至少一个计算任务;根据第一信息,向一个或多个目标计算节点发送各自对应的至少一个计算任务的计算数据。可以理解,上述方法可以通过一个或多个单元来实现,这一个或多个单元可以集中放置在一起,也可以放置在不同装置中。
可选地,收发单元1010还用于向一个或多个目标计算节点发送应用程序的信息。
可选地,计算请求中还携带第一计算任务的拆分指示信息,该拆分指示信息用于管理单元将第一计算任务拆分为多个第二计算任务,第一计算任务是未被拆分的计算任务,第二计算任务是拆分得到的计算任务。
可选地,上述N个计算任务包括:一个第一计算任务和/或多个第二计算任务,第一计算任务是未被拆分的计算任务,第二计算任务是拆分得到的计算任务。
可选地,收发单元1010还用于向管理单元发送以下至少一种信息:实时的应用体验信息、实时的应用特征信息、或实时的网络状态信息;其中,实时的应用体验信息包括以下至少一项:端到端时延、QoS、XQI、QoE;实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或AI模型精度;实时的网络状态信息包括以下至少一项:计算节点到所述请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
应理解,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能单元可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
图11是本申请实施例提供的计算任务的处理装置的又一示意性框图。
如图11所示,该装置1100可以包括至少一个处理器1110,用于实现本申请实施例提供的方法中管理单元的功能、计算节点或请求节点的功能。
该装置1100还可以包括至少一个存储器1120,用于存储程序指令和/或数据。存储器1120和处理器1110耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器1110可能和存储器1120协同操作。处理器1110可能执行存储器1120中存储的程序指令。所述至少一个存储器中的至少一个可以包括于处理器中。
该装置1100还可以包括通信接口1130,用于通过传输介质和其它设备进行通信,从而用于通信装置1100可以和其它设备进行通信。所述通信接口1130例如可以是收发器、接口、总线、电路或者能够实现收发功能的装置。处理器1110可利用通信接口1130收发数据和/或信息,并用于实现图8或图9对应的实施例中的管理单元、计算节点或请求节点所执行的方法。
例如,当该装置1100用于实现图8所示的方法中管理单元的功能时,处理器1110可用于根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的N个计算任务中的至少一个计算任务,N为大于或等于1的整数;向一个或多个目标计算节点中的每个目标计算节点发送各自对应的至少一个计算任务的标识信息。
本申请实施例中不限定上述处理器1110、存储器1120以及通信接口1130之间的具体连接介质。本申请实施例在图11中以处理器1110、存储器1120以及通信接口1130之间通过总线1140连接。总线1140在图11中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
图12是本申请实施例提供的接入网设备的结构示意图,例如可以为基站的结构示意图。如图所示,该基站1200可包括一个或多个DU 1210和一个或多个CU 1220。CU 1220可以与下一代核心网(NG core,NC)通信。所述DU 1210可以包括至少一个天线1211,至少一个射频单元1212,至少一个处理器1213和至少一个存储器1214。所述DU 1210部分主要用于射频信号的收发以及射频信号与基带信号的转换,以及部分基带处理。CU 1220可以包括至少一个处理器1222和至少一个存储器1221。CU 1220和DU 1210之间可以通过接口进行通信,其中,控制面(control plane,CP)接口可以为Fs-C,比如F1-C,用户面(user plane,UP)接口可以为Fs-U,比如F1-U。
所述CU 1220部分主要用于进行基带处理,对基站进行控制等。所述DU 1210与CU1220可以是物理上设置在一起,也可以物理上分离设置的,即分布式基站。所述CU 1220为基站的控制中心,也可以称为处理单元,主要用于完成基带处理功能。例如所述CU 1220可以用于控制基站执行上述方法实施例中关于接入网设备的操作流程。
在一个实例中,所述CU 1220可以由一个或多个单板构成,多个单板可以共同支持单一接入指示的无线接入网(如5G网),也可以分别支持不同接入制式的无线接入网(如LTE网,5G网或其他网)。所述存储器1221和处理器1222可以服务于一个或多个单板。也就是说,可以每个单板上单独设置存储器和处理器。也可以是多个单板共用相同的存储器和处理器。此外每个单板上还可以设置有必要的电路。所述DU 1210可以由一个或多个单板构成,多个单板可以共同支持单一接入指示的无线接入网(如5G网),也可以分别支持不同接入制式的无线接入网(如LTE网,5G网或其他网)。所述存储器1214和处理器1213可以服务于一个或多个单板。也就是说,可以每个单板上单独设置存储器和处理器。也可以是多个单板共用相同的存储器和处理器。此外每个单板上还可以设置有必要的电路。
应理解,图12所示出的基站1200仅为接入网设备的一种可能的架构,而不应对本申请构成任何限定。本申请所提供的方法可适用于其他架构的接入网设备。例如,包含CU、DU和有源天线处理单元(active antenna anit,AAU)的接入网设备等。本申请对于接入网设备的具体架构不作限定。
本申请还提供了一种通信系统,包括如前所述的管理单元、至少一个计算节点和请求节点。
本申请还提供了一种芯片系统,所述芯片系统包括至少一个处理器,用于实现上述图8或图9所示实施例中所述的方法中所涉及的功能,例如,接收或处理上述方法中所涉及的数据和/或信息。
在一种可能的设计中,所述芯片系统还包括存储器,所述存储器用于保存程序指令和数据,存储器位于处理器之内或处理器之外。
该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
本申请还提供了一种计算机可读存储介质,所述计算机存储介质上存储有计算机程序(也可以称为代码,或指令),当所述计算机程序在被处理器运行时,使得上述图8或图9所示实施例中所述的方法被执行。
本申请还提供一种计算机程序产品,所述计算机程序产品包括:计算机程序(也可以称为代码,或指令),当所述计算机程序被运行时,使得计算机执行图8或图9所示实施例中所述的方法。
应理解,本申请实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
还应理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本说明书中使用的术语“单元”、“模块”等,可用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。本申请实施例中的单元和模块含义相同,可以交叉使用。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step),能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。在本申请所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
在上述实施例中,各功能单元的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令(程序)。在计算机上加载和执行计算机程序指令(程序)时,全部或部分地产生按照本申请实施例所述的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state drive,SSD))等。
本申请实施例提供的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (37)

1.一种计算任务的处理方法,其特征在于,应用于管理单元,所述方法包括:
根据N个计算任务的任务需求信息和/或任务特征信息、以及至少一个计算节点的算力状态和/或网络状态,确定所述至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的所述N个计算任务中的至少一个计算任务,N为大于或等于1的整数;
向所述一个或多个目标计算节点中的每个目标计算节点发送各自对应的至少一个计算任务的标识信息。
2.如权利要求1所述的方法,其特征在于,所述管理单元部署于以下至少一种类型的设备中:终端设备、接入网设备、核心网设备、或移动边缘计算平台。
3.如权利要求2所述的方法,其特征在于,所述至少一个计算节点包括以下至少一种类型:终端设备、接入网设备、核心网设备、接入网侧的移动边缘计算平台、或核心网侧的移动边缘计算平台。
4.如权利要求3所述的方法,其特征在于,所述管理单元部署于核心网设备中,所述管理单元用于管理以下至少一种类型的计算节点上的计算资源:终端设备、接入网设备、接入网侧的移动边缘计算平台、或核心网侧的移动边缘计算平台;或,
所述管理单元部署于接入网设备中,所述管理单元用于管理以下至少一种类型的计算节点上的计算资源:终端设备、接入网设备、或接入网侧的移动边缘计算平台;或,
所述管理单元部署于移动边缘计算平台中,所述管理单元用于管理以下至少一种类型的计算节点上的计算资源:终端设备、接入网侧的移动边缘计算平台、或核心网侧的移动边缘计算平台。
5.如权利要求1至4中任一项所述的方法,其特征在于,每个计算节点的算力状态通过以下至少一项来度量:计算节点所提供的计算资源的类型、算力大小、计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
6.如权利要求1至5中任一项所述的方法,其特征在于,所述任务需求信息包括以下至少一项:任务类型、端到端时延、服务质量QoS、扩展现实质量分数、用户体验质量、或算力需求。
7.如权利要求1至6中任一项所述的方法,其特征在于,所述任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或人工智能模型精度。
8.如权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:
接收来自请求节点的计算请求,所述计算请求中携带所述N个计算任务的任务需求信息和/或任务特征信息;以及,
所述方法还包括:
向所述一个或多个目标计算节点中每个目标计算节点发送所述任务需求信息和/或所述任务特征信息。
9.如权利要求8所述的方法,其特征在于,所述计算请求中还携带第一计算任务的拆分指示信息,所述拆分指示信息用于所述管理单元将所述第一计算任务拆分为多个第二计算任务,所述第一计算任务是未被拆分的计算任务,所述第二计算任务是拆分得到的计算任务。
10.如权利要求8或9所述的方法,其特征在于,所述N个计算任务包括:一个第一计算任务和/或多个第二计算任务。
11.如权利要求1至10中任一项所述的方法,其特征在于,在确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的所述N个计算任务中的至少一个计算任务之前,所述方法还包括:
向所述至少一个计算节点中的各个计算节点发送查询请求,所述查询请求用于请求查询所述计算节点的算力状态和/或网络状态;
接收来自各个计算节点的查询响应,所述查询响应中携带所述计算节点的算力状态和/或网络状态。
12.如权利要求1至11中任一项所述的方法,其特征在于,所述方法还包括:
向请求节点发送第一信息,所述第一信息指示所述一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息。
13.如权利要求1至12中任一项所述的方法,其特征在于,所述方法还包括:
向所述一个或多个目标计算节点中的第一计算节点发送第二信息,所述第二信息用于确定所述第一计算节点的下一跳节点,所述第一计算节点的下一跳节点用于基于来自所述第一计算节点输出的计算结果执行计算任务,所述第一计算节点是所述一个或多个目标计算节点中的任意一个。
14.如权利要求1至13中任一项所述的方法,其特征在于,所述方法还包括:
获取如下至少一种信息:实时的应用体验信息、实时的应用特征信息,或实时的网络状态信息;
根据所述至少一种信息,向所述一个或多个目标计算节点中的第二计算节点发送指示信息,所述指示信息用于所述第二计算节点调整相关的应用配置参数和/或相关的网络配置参数;
其中,所述实时的应用体验信息包括以下至少一项:端到端时延、QoS、扩展现实质量分数、用户体验质量;
所述实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或人工智能模型精度;
所述实时的网络状态信息包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态;
所述相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;
所述相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、或带宽。
15.如权利要求14所述的方法,其特征在于,所述根据所述至少一种信息,向所述一个或多个目标计算节点中的第二计算节点发送指示信息,包括:
在所述至少一种信息满足预设条件的情况下,向所述一个或多个目标计算节点中的第二计算节点发送所述指示信息,
其中,所述预设条件包括以下至少一项:所述实时的应用体验信息中的参数低于第一阈值,所述实时的应用特征信息中的参数低于第二阈值,或,所述实时的网络状态信息中的参数低于第三阈值。
16.如权利要求14或15所述的方法,其特征在于,所述至少一种信息中的一种或多种来自所述一个或多个目标计算节点中的至少一个,或者,所述至少一种信息中的一种或多种来自请求节点。
17.一种计算任务的处理方法,其特征在于,包括:
确定计算节点的算力状态和/或网络状态,所述算力状态和/或网络状态用于确定至少一个计算节点中的一个或多个目标计算节点和每个目标计算节点待执行的请求节点请求的N个计算任务中的至少一个计算任务,N为大于或等于1的整数;
向管理单元发送所述计算节点的算力状态和/或网络状态。
18.如权利要求17所述的方法,其特征在于,所述方法还包括:
在所述计算节点为目标计算节点的情况下,接收来自所述管理单元的所述计算节点对应的至少一个计算任务的标识信息。
19.如权利要求18所述的方法,其特征在于,所述方法还包括:
获取所述至少一个计算任务的计算数据和第三信息;
基于所述计算数据和所述第三信息,执行所述至少一个计算任务,所述第三信息包括任务需求信息和/或任务特征信息。
20.如权利要求19所述的方法,其特征在于,所述任务需求信息包括以下至少一项:端到端时延、服务质量QoS、扩展现实质量分数、用户体验质量、或算力需求。
21.如权利要求19或20所述的方法,其特征在于,所述任务特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或人工智能模型精度。
22.如权利要求19至21中任一项所述的方法,其特征在于,所述任务需求信息、所述任务特征信息携带在所述请求节点向所述管理单元发送的计算请求中。
23.如权利要求18至22中任一项所述的方法,其特征在于,所述方法还包括:
接收来自所述管理单元的第二信息,所述第二信息用于确定所述计算节点的下一跳节点,所述计算节点的下一跳节点用于基于来自所述计算节点输出的计算结果执行计算任务。
24.如权利要求17至23中任一项所述的方法,其特征在于,所述计算节点的算力状态通过以下至少一项来度量:所述计算节点所提供的计算资源的类型、算力大小、所述计算节点的位置、支持的任务类型、联合服务能力、或资源利用率。
25.如权利要求17至24中任一项所述的方法,其特征在于,所述向管理单元发送所述计算节点的算力状态和/或网络状态,包括:
接收来自所述管理单元的查询请求,所述查询请求用于请求查询所述计算节点的算力状态和/或网络状态;
向所述管理单元发送查询响应,所述查询响应中携带所述计算节点的算力状态和/或网络状态。
26.如权利要求17至25中任一项所述的方法,其特征在于,所述方法还包括:
向所述管理单元发送以下至少一种信息:实时的应用体验信息、实时的应用特征信息、或实时的网络状态信息;
其中,所述实时的应用体验信息包括以下至少一项:端到端时延、QoS、扩展现实质量分数、用户体验质量;
所述实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或人工智能模型精度;
所述实时的网络状态信息包括以下至少一项:所述计算节点到所述请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
27.如权利要求26所述的方法,其特征在于,所述方法还包括:
在所述至少一种信息满足预设条件的情况下,接收来自所述管理单元的指示信息,所述指示信息用于所述计算节点调整相关的应用配置参数和/或相关的网络配置参数;
基于所述指示信息,调整所述相关的应用配置参数和/或相关的网络配置参数;
其中,所述相关的应用配置参数包括以下任意一项:帧率、码率、分辨率、I帧和/或P帧的发送位置、图像或视频失真度、图像或视频失真类型;
所述相关的网络配置参数包括以下任意一项:比特速率、吞吐量、传输时延、优先级、或带宽。
28.如权利要求27所述的方法,其特征在于,所述预设条件包括以下至少一项:所述实时的应用体验信息中的参数低于第一阈值,所述实时的应用特征信息中的参数低于第二阈值,或,所述实时的网络状态信息中的参数低于第三阈值。
29.一种计算任务的处理方法,其特征在于,包括:
向管理单元发送计算请求,所述计算请求中携带N个计算任务的任务需求信息和/或任务特征信息,N为大于或等于1的整数;
接收来自所述管理单元的第一信息,所述第一信息指示一个或多个目标计算节点中每个目标计算节点以及每个目标计算节点对应的至少一个计算任务的标识信息,每个目标计算节点用于执行所对应的至少一个计算任务;
根据所述第一信息,向所述一个或多个目标计算节点发送各自对应的至少一个计算任务的计算数据。
30.如权利要求29所述的方法,其特征在于,所述方法还包括:
向所述一个或多个目标计算节点发送应用程序的信息。
31.如权利要求29或30所述的方法,其特征在于,所述计算请求中还携带第一计算任务的拆分指示信息,所述拆分指示信息用于所述管理单元将所述第一计算任务拆分为多个第二计算任务,所述第一计算任务是未被拆分的计算任务,所述第二计算任务是拆分得到的计算任务。
32.如权利要求31所述的方法,其特征在于,所述N个计算任务包括:一个第一计算任务和/或多个第二计算任务,所述第一计算任务是未被拆分的计算任务,所述第二计算任务是拆分得到的计算任务。
33.如权利要求29至32中任一项所述的方法,其特征在于,所述方法还包括:
向所述管理单元发送以下至少一种信息:实时的应用体验信息、实时的应用特征信息、或实时的网络状态信息;
其中,所述实时的应用体验信息包括以下至少一项:端到端时延、服务质量QoS、扩展现实质量分数、用户体验质量;
所述实时的应用特征信息包括以下至少一项:帧率、码率、分辨率、I帧和P帧的相对位置关系、图像或视频失真度、图像或视频失真类型、或人工智能模型精度;
所述实时的网络状态信息包括以下至少一项:计算节点到请求节点之间的信道状态信息、传输速率、吞吐量、传输时延、网络拥塞状况、可用带宽、或节点之间的接口状态。
34.一种计算任务的处理装置,其特征在于,包括用于实现如权利要求1至16中任一项所述的方法的单元,或包括用于实现如权利要求17至28中任一项所述的方法的单元,或包括用于实现如权利要求29至33中任一项所述的方法的单元。
35.一种计算任务的处理装置,其特征在于,包括处理器和存储器,其中,
所述存储器用于存储计算机程序;
所述处理器用于调用所述计算机程序,以使得所述装置执行权利要求1至16中任一项所述的方法,或,执行如权利要求17至28中任一项所述的方法,或,执行如权利要求29至33中任一项所述的方法。
36.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序或指令,当所述计算机程序或指令被计算机执行时,实现如权利要求1至16中任一项所述的方法,或,实现如权利要求17至28中任一项所述的方法,或,实现如权利要求29至33中任一项所述的方法。
37.一种计算机程序产品,其特征在于,所述计算机程序产品包括指令,当所述指令被计算机运行时,实现如权利要求1至16中任一项所述的方法,或,实现如权利要求17至28中任一项所述的方法,或,实现如权利要求29至33中任一项所述的方法。
CN202211733515.3A 2022-12-30 2022-12-30 一种计算任务的处理方法及相关装置 Pending CN118277046A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202211733515.3A CN118277046A (zh) 2022-12-30 2022-12-30 一种计算任务的处理方法及相关装置
EP23910220.5A EP4625167A1 (en) 2022-12-30 2023-12-15 Method for processing computing task, and related apparatus
PCT/CN2023/139207 WO2024140290A1 (zh) 2022-12-30 2023-12-15 一种计算任务的处理方法及相关装置
US19/251,963 US20250321788A1 (en) 2022-12-30 2025-06-27 Computing task processing method and related apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211733515.3A CN118277046A (zh) 2022-12-30 2022-12-30 一种计算任务的处理方法及相关装置

Publications (1)

Publication Number Publication Date
CN118277046A true CN118277046A (zh) 2024-07-02

Family

ID=91634952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211733515.3A Pending CN118277046A (zh) 2022-12-30 2022-12-30 一种计算任务的处理方法及相关装置

Country Status (4)

Country Link
US (1) US20250321788A1 (zh)
EP (1) EP4625167A1 (zh)
CN (1) CN118277046A (zh)
WO (1) WO2024140290A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118803065A (zh) * 2024-07-15 2024-10-18 中国移动通信有限公司研究院 调度方法、装置、网关、存储介质及计算机程序产品
WO2026021353A1 (zh) * 2024-07-26 2026-01-29 华为技术有限公司 一种通信方法及装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN121418921A (zh) * 2024-07-24 2026-01-27 华为技术有限公司 一种通信方法以及相关装置
CN119728783A (zh) * 2024-12-06 2025-03-28 中国联合网络通信集团有限公司 一种业务处理方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2728490B1 (en) * 2012-10-31 2017-07-12 Fujitsu Limited Application execution method in computing
CN111651253B (zh) * 2020-05-28 2023-03-14 中国联合网络通信集团有限公司 算力资源的调度方法及装置
CN113079218B (zh) * 2021-04-09 2023-06-27 网络通信与安全紫金山实验室 一种面向服务的算力网络系统、工作方法及存储介质
CN114756340A (zh) * 2022-03-17 2022-07-15 中国联合网络通信集团有限公司 算力调度系统、方法、装置和存储介质
CN115103404B (zh) * 2022-05-11 2025-03-28 北京邮电大学 一种算力网络中节点任务调度方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118803065A (zh) * 2024-07-15 2024-10-18 中国移动通信有限公司研究院 调度方法、装置、网关、存储介质及计算机程序产品
WO2026021353A1 (zh) * 2024-07-26 2026-01-29 华为技术有限公司 一种通信方法及装置

Also Published As

Publication number Publication date
EP4625167A1 (en) 2025-10-01
WO2024140290A1 (zh) 2024-07-04
US20250321788A1 (en) 2025-10-16

Similar Documents

Publication Publication Date Title
US11223976B2 (en) Multiple-slice application delivery based on network slice associations
US11089515B2 (en) Adaptable radio access network
US12402035B2 (en) Communication method and apparatus
CN110149657B (zh) 一种确定QoS描述信息的方法和装置
US20250321788A1 (en) Computing task processing method and related apparatus
CN107637019A (zh) 使用第三方提供的基础设施或网络连接服务的方法和设备
CN113906783A (zh) 通信方法、装置及系统
WO2024041117A1 (zh) 一种计算任务的分割方法及相关装置
US20250126522A1 (en) Network slice controller for a wireless communication network
CN119729641A (zh) 通信方法及装置
CN116782307A (zh) 业务速率调整方法及通信装置
CN110999371B (zh) 无锚移动网络中的虚拟锚
WO2024075130A1 (en) Optimizing user equipment service level agreement violations for network slice allocation
CN120730379A (zh) 无线通信方法、网元和装置
CN119095103A (zh) 通信方法和通信装置
US20250317906A1 (en) Artificial intelligence based network slicing management in wireless communication networks
US20260046322A1 (en) Enhancements of radio access network to facilitate federated learning
US20250380222A1 (en) Smart uplink power control considering timing advance, differentiating near , far users and resource allocation optimization to avoid and eliminate uplink interference improving uplink system capacity
US20240292196A1 (en) Metaverse service orchestration in wireless communication networks
CN120475436A (zh) 一种通信方法及装置
WO2025236258A1 (zh) 通信方法和装置、通信设备、通信系统及存储介质
WO2025082133A1 (zh) 一种方法、网络装置、通信系统、存储介质和程序产品
WO2025167526A1 (zh) 一种通信方法及装置
WO2026033644A1 (ja) ネットワークスライス管理装置及び管理方法
KR20250148688A (ko) 연합 학습

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination