CN109886416A - 集成人工智能模块的系统芯片及机器学习方法 - Google Patents
集成人工智能模块的系统芯片及机器学习方法 Download PDFInfo
- Publication number
- CN109886416A CN109886416A CN201910104560.4A CN201910104560A CN109886416A CN 109886416 A CN109886416 A CN 109886416A CN 201910104560 A CN201910104560 A CN 201910104560A CN 109886416 A CN109886416 A CN 109886416A
- Authority
- CN
- China
- Prior art keywords
- module
- memory
- weight coefficient
- bus
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000013473 artificial intelligence Methods 0.000 claims description 18
- 230000003139 buffering effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 238000000151 deposition Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004804 winding Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 1
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 1
- 108700012361 REG2 Proteins 0.000 description 1
- 101150108637 REG2 gene Proteins 0.000 description 1
- 101100120298 Rattus norvegicus Flot1 gene Proteins 0.000 description 1
- 101100412403 Rattus norvegicus Reg3b gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- QGVYYLZOAMMKAH-UHFFFAOYSA-N pegnivacogin Chemical compound COCCOC(=O)NCCCCC(NC(=O)OCCOC)C(=O)NCCCCCCOP(=O)(O)O QGVYYLZOAMMKAH-UHFFFAOYSA-N 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000000352 storage cell Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Logic Circuits (AREA)
Abstract
一种集成人工智能AI模块的系统芯片及机器学习方法。在实施例中,系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上;AI模块包括具有第一存储器的处理单元;FPGA模块,通过总线接口模块连接到总线上,为AI模块提供机器学习用的数据;非易失性存储器,通过总线接口模块连接到总线上,用于存储权重系数。通过将机器学习过程中的权重系数保存在非易失性存储器中,可以加快机器学习进程,还可以避免因为意外事件导致的学习中断。
Description
技术领域
本发明涉及集成电路技术领域,尤其涉及一种集成人工智能模块的系统芯片及机器学习方法。
背景技术
近年来,人工智能迎来一波发展浪潮。人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。
当前,人工智能模块由处理器通过总线来进行访问控制,而总线是有一定的带宽限制,这样的架构难以适应AI模块的大带宽需求。
发明内容
根据第一方面,提供一种系统芯片,包括:处理器,配置有总线;至少一个AI模块,通过总线接口模块连接到总线上;至少一个AI模块中的各AI模块包括具有第一存储器的处理单元;至少一个FPGA模块,通过总线接口模块连接到总线上,为AI模块提供机器学习用的数据;非易失性存储器,通过总线接口模块连接到总线上,用于存储权重系数;其中,在处理器控制下,AI模块从非易失性存储器读取权重系数并且写入第一存储器,并且利用第一存储器中的权重系数进行机器学习;处理器还控制将基于机器学习后更新的权重系数写入非易失性存储器。
优选地,系统芯片包括第二存储器,所述第二存储器用作缓冲器;其中,所述权重系数可以从非易失性存储器读出经第二存储器写入第一存储器,或者从第一存储器读出经第二存储器写入非易失性存储器。
优选地,至少一个FPGA模块中的一个模块提供寄存器,用作缓冲器;其中,所述权重系数可以从非易失性存储器读出经寄存器写入第一存储器,或者从第一存储器读出经寄存器写入非易失性存储器。
优选地,FPGA模块为AI模块提供机器学习用的数据。
根据第二方面,提供一种机器学习方法,由系统芯片实施,所述系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上,AI模块包括具有第一存储器的处理单元;FPGA模块,通过总线接口模块连接到总线上;非易失性存储器,用于存储权重系数;所述方法包括:从非易失性存储器读取权重系数;将权重系数写入AI模块的各处理单元的第一存储器中;启动AI模块利用第一存储器中的权重系数进行机器学习。
优选地,所述方法包括在从非易失性存储器读取权重系数之后,利用处理器的存储器或者FPGA的寄存器进行数据读取的缓冲。
根据第三方面,提供一种机器学习方法,由系统芯片实施,所述系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上,AI模块包括具有第一存储器的处理单元,所述第一存储器存储机器学习用的权重系数;FPGA模块,通过总线接口模块连接到总线上;非易失性存储器;所述方法包括:AI模块利用其自身各处理单元的存储器中存储的权重系数进行机器学习;根据机器学习更新所述存储器中的权重系数;根据处理器的控制指令,将权重系数写入非易失性存储器。
优选地,所述方法包括在从非易失性存储器读取权重系数之后,利用处理器的存储器或者FPGA模块的寄存器进行数据读取的缓冲。
根据第四方面,提供一种机器学习方法,由系统芯片实施,所述系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上,AI模块包括具有第一存储器的处理单元;FPGA模块,通过总线接口模块连接到总线上;非易失性存储器,用于存储权重系数;所述方法包括:从非易失性存储器读取权重系数;将权重系数写入AI模块的各处理单元的第一存储器中;启动AI模块利用权重系数进行机器学习;AI模块利用其自身各处理单元的第一存储器中存储的权重系数进行机器学习;根据机器学习结果更新所述第一存储器中的权重系数;定期将权重系数写入非易失性存储器。
通过将机器学习过程中的权重系数保存在非易失性存储器中,可以加快机器学习进程,还可以避免因为意外事件导致的学习中断。
附图说明
图1是根据本发明实施例的集成人工智能模块的系统芯片结构示意图;
图2是FPGA电路的结构示意图;
图3是人工智能模块的结构示意图;
图4是处理单元的示意图;
图5是图4的处理单元中的存储器MEM以字式访问实现的示意图;
图6是图4的处理单元中的存储器MEM以比特式访问实现的示意图;
图7是对AI模块的各处理单元写权重和读权重的示意图。
具体实施方式
为使本发明实施例的技术方案以及优点表达的更清楚,下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
在本申请的描述中,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“东”、“南”、“西”、“北”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
图1是根据本发明实施例的集成人工智能模块的系统芯片结构示意图。如图1所示,系统芯片上集成有至少一个FPGA模块和至少一个人工智能模块。
各FPGA模块可实现逻辑、计算、控制等各种功能。FPGA利用小型查找表(例如,16×1RAM)来实现组合逻辑,每个查找表连接到一个D触发器的输入端,触发器再来驱动其他逻辑电路或驱动I/O,由此构成了既可实现组合逻辑功能又可实现时序逻辑功能的基本逻辑单元模块,这些模块间利用金属连线互相连接或连接到I/O模块。FPGA的逻辑是通过向内部静态存储单元加载编程数据来实现的,存储在存储器单元中的值决定了逻辑单元的逻辑功能以及各模块之间或模块与I/O间的联接方式,并最终决定了FPGA所能实现的功能。FPGA模块可以配置有可配置输入输出(C.IO)。
各人工智能模块可实现或加速经预先选定的特定AI功能,包括人工智能(Artificial Intelligence AI)、深度学习(Deep Learning DL)、机器学习(MachineLearning ML)等各种算法或加速算法中某一步骤的特定功能(如卷积Convolution、矩阵Matrix/张量运算Tensor Operation等)。人工智能(AI)模块可包含由多个功能模块(FU)组成的阵列,各功能模块可包含类似ALU或乘累加器(MAC)的功能单元、寄存器、复用器MUX等。人工智能模块配置有固定的输入/输出(F.IO),当然也可以包含可配置的输出入输出(Configurable IO)。
FPGA模块和人工智能模块的大小并无限定,在设计时由实际应用决定。
在占用芯片布局方面,一般是安排FPGA模块与人工智能模块相邻。FPGA模块和AI模块可以并排放置,此时FPGA模块可以为AI模块传输数据,提供控制。AI模块也可以嵌入FPGA模块之中;比如,FPGA模块较大,人工智能模块较小的情况时,亦可在大片的FPGA模块中挖空一窗口,内置入人工智能模块;此时,AI模块需要复用FPGA模块的绕线架构,以便通过复用的FPGA模块的绕线架构接收和发送数据。
系统芯片上还集成有处理器。处理器例如采用ARM+8051、ARM+RISC_V、RISC_V+8051等架构。处理器有总线BUS,可以通过总线访问其它器件。处理器可以有片上本地存储器。
各FPGA模块用各自的总线接口模块BIM,分别连接到BUS。同样,AI模块也用各自的BIM分别连接到BUS。
在一个例子中,系统芯片上还设置有与AI模块相对应的接口,FPGA模块和AI模块通过接口模块连通。接口模块可以是绕线(XBAR)模块,XBAR模块例如由多个选择器(Multiplexer)和选择位元组成。接口模块也可以是FIFO(先进先出)。接口模块还可以是同步器(Synchronizer),同步器例如由2个触发器(Flip-Flop或FF)串连而成。FPGA模块可以为AI模块传输数据,提供控制。接口模块可以是额外的电路模块,也可以是FPGA内带的接口模块,或者同时有两者。
在实施例中,当应用在机器学习时,根据运算结果持续更新AI模块中存储器MEM内存的权重(weight)参数,以实现学习目标。
在初始时,处理器将AI模块内的各处理单元PE的存储单元MEM设定为初始学习状态,将(权重weight写入各PE的存储器MEM模块)。
当正常学习时,经由处理大量数据,并观测输出结果,系统决定逐步更新权重,逐步优化输出结果。通常,一般应用在学习时要用大量数据,过程费时持久。
在学习时,可以定期(比如设定的checkpoint)暂停,并将AI模块的各PE内的MEM内容(权重)数据存写到NVM(非易失性存储器,Non-Volatile Memory),如闪存FLASH、磁存储器(MRAM)、可变电阻式存储器(ReRAM)中。
在学习训练结束后,权重系数将被确定。AI模块可以基于机器学习所优化后的权重系数实施相关的计算机应用。
通常,在学习过程中如遇断电、中断等各种问题后,系统需要重新启动。由于预先将参数存储在NVM中,如果重新启动,就此时无需从头再开始学习,只需将所存最新学习结果由NVM取回,再置入AI模块的各PE的MEM内,即可回复原已学习的状态,即可再继续余下的学习过程。
在一个实施例中,实际读写NVM时可以由SRAM或寄存器文件(Register File)做缓冲(Buffer)。在一个例子中,FPGA内的EMB可用作缓冲。
在一种情形下,在处理器的控制下,从NVM读取权重参数经总线、BIM写入AI模块。也可以沿相反的路径将更新后的权重从AI模块读出写入NVM中。
在另一种情形下,在处理器的控制下,经总线从NVM读取权重参数写入SRAM,然后再写入AI模块。也可以沿相反的路径将更新后的权重从AI模块读出写入NVM中。
在另一种情形下,首先处理器将FPGA模块中的部分EMB配置为缓冲器;在处理器的控制下,经总线从NVM读取权重参数写入FPGA的EMB,然后再写入AI模块。也可以沿相反的路径将更新后的权重从AI模块读出写入NVM中。
图2是FPGA电路的结构示意图。如图2所示,FPGA电路可包含有多个可编程逻辑模块(LOGIC)、嵌入式存储块(EMB)、乘累加器(MAC)等模块和相应的绕线(XBAR)。当然,FPGA电路还设有时钟/配置模块(主干spine/支干seam)等相关资源。若需要EMB或MAC模块时,因其面积比PLB大许多,故以此EMB/MAC模块取代若干PLB模块。
LOGIC模块可以包含,例如,8个6输入查找表,18个寄存器。
EMB包含若干个可扩充的存储小块,其可连成一大块例如36Kb的存储,包含各种宽度/深度的选择。
MAC模块可以是,例如,25x18乘法器,或2个18x18乘法器。MAC模块还可以搭配例如48位的累加器。
FPGA阵列中,LOGIC、MAC、EMB各模块数量的占比并无限制,阵列的大小也根据需要,在设计时由实际应用决定。
绕线资源(XBAR)是各模块间互联的接点,均匀地分布在FPGA模块内。FPGA模块内所有的资源,PLB、EMB、MAC、IO相互之间的绕线都是经有一个相同的界面,即绕线XBAR单元来实现。由绕线方式来看,整个阵列是相同一致,整齐排列的XBAR单元形成网格,将FPGA内所有模块相连。
图3是人工智能模块的结构示意图。如图3所示,人工智能AI模块是一个二维阵列,例如包括4X4个执行单元EU。AI模块可分为两个维度,彼此垂直的第一维度和第二维度。以第一执行单元、第二执行单元和第三执行单元为例。第一执行单元和第二执行单元沿第一维度沿第一方向相邻排列;第一执行单元沿第一方向的第一输出端耦合到第二执行单元沿第一方向的相反方向的第一输入端。第一执行单元和第三执行单元沿第二维度且沿第二方向相邻排列,第一执行单元沿第二方向的第二输出端耦合到第三执行单元沿第二方向的相反方向的第二输入端。
一维数据a可以沿第一维度在同一时钟下并行输入相同第二维度值的各处理单元;数据在各处理单元中和存储在单元中的另一维数据(系数)W相乘;乘积沿第二维度沿第二方向通过各处理单元传输,并且彼此相加。为理解方便起见,下文将以水平维度为第一维度、左向右为第一方向,以垂直维度为第二维度、上向下为第二方向。
执行单元在接收数据后,对数据进行各种运算,例如加减乘除,逻辑运算等等。执行单元将运算结果沿第一维度第一方向或者第二维度第二方向输出。
当然,通过控制,同一个数据或者由其衍生的数据可以在不同的时钟下流经所有的PE单元。
需要注意,图3中的每条数据线既可代表单比特的信号,也可代表8(或16,32)比特的信号。
在一个例子中,人工智能模块可以实现矩阵乘法。在另一个例子中,二维阵列可以实现卷积算法。
虽然图3中示意了单向流动的AI模块,但是本发明实施例适用于其它类型的AI模块,比如双向数据流动的AI模块。
图4是处理单元的示意图。如图4所示,处理单元包括乘法器MUL,加法器ADD。数据沿第一维度第一方向自第一数据输入端口DI输入,在乘法器MUL处和存储在系数存储器MEM中的权重(weight)系数W相乘;然后,该乘积在加法器ADD处和来自第二数据输入端口PI的数据P相加,相加之后的和值寄存在寄存器REG1中。在下一个时钟时,和值S经第二输出端PO沿第二维度第二方向输出。和值S经第二输出端PO输出后可以经输入端口PI输入位于下方的另一个PE。
当然,数据a还可以寄存在寄存器REG2中,并且在时钟控制下经第一输出端DO沿第一维度第一方向输出到在右侧的处理单元PE。
时钟CK用于控制各处理单元同步工作。
使能信号EN用于启动或暂停处理单元的处理进程。
图5是图4的处理单元中的存储器MEM以字式访问实现的示意图。可以通过专用的路径来访问存储器。如图5所示,存储器包括多个D触发器,这些D触发器彼此级联,即前一个D触发器的输出端串联连接到后一个D触发器的输入端;系数数据按比特从第一个D触发器的D输入端输入,然后经各输出端Q输出为Q0-Q7。Q0-Q7可以北提供作为系数数据。时钟CK控制各D触发器的同步工作。使能信号EN用于确定D触发器是否启动或暂停。需要注意,不同部件的使能信号EN是不同,由此不同部件的启动或暂停也并不同步。
图6是图4的处理单元中的存储器MEM以比特式访问实现的示意图。不同于图5的地方仅在于存储器MEM的访问采用比特方式。
图7是对AI模块的各处理单元写权重和读权重的示意图。当需要写权重时,可以利用左侧的写权重模块从NVM中读取权重,然后向AI模块写入权重。当需要从AI模块中读取权重时,可以将AI模块中的权重数据依次写入读权重模块,继而写入NVM中。写权重模块和读权重模块可以采用单独的电路模块实现,也可以采用FPGA模块的子模块实现。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种系统芯片,包括:
处理器,配置有总线;
至少一个人工智能AI模块,通过总线接口模块连接到总线上;至少一个AI模块中的各AI模块包括具有第一存储器的处理单元;
至少一个FPGA模块,通过总线接口模块连接到总线上,为AI模块提供机器学习用的数据;
非易失性存储器,通过总线接口模块连接到总线上,用于存储权重系数;
其中,在处理器控制下,AI模块从非易失性存储器读取权重系数并且写入第一存储器,并且利用第一存储器中的权重系数进行机器学习;处理器还控制将基于机器学习后更新的权重系数写入非易失性存储器。
2.根据权利要求1所述的系统芯片,其特征在于,包括第二存储器,所述第二存储器用作缓冲器;其中,所述权重系数可以从非易失性存储器读出经第二存储器写入第一存储器,或者从第一存储器读出经第二存储器写入非易失性存储器。
3.根据权利要求1所述的系统芯片,其特征在于,至少一个FPGA模块中的一个模块提供寄存器,用作缓冲器;其中,所述权重系数可以从非易失性存储器读出经寄存器写入第一存储器,或者从第一存储器读出经寄存器写入非易失性存储器。
4.根据权利要求1所述的系统芯片,其特征在于,FPGA模块为AI模块提供机器学习用的数据。
5.一种机器学习方法,由系统芯片实施,所述系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上,AI模块包括具有第一存储器的处理单元;FPGA模块,通过总线接口模块连接到总线上;非易失性存储器,用于存储权重系数;所述方法包括:从非易失性存储器读取权重系数;将权重系数写入AI模块的各处理单元的第一存储器中;启动AI模块利用第一存储器中的权重系数进行机器学习。
6.如权利要求5所述的机器学习方法,其特征在于,所述方法包括在从非易失性存储器读取权重系数之后,利用处理器的存储器或者FPGA的寄存器进行数据读取的缓冲。
7.一种机器学习方法,由系统芯片实施,所述系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上,AI模块包括具有第一存储器的处理单元,所述第一存储器存储机器学习用的权重系数;FPGA模块,通过总线接口模块连接到总线上;非易失性存储器;所述方法包括:AI模块利用其自身各处理单元的存储器中存储的权重系数进行机器学习;根据机器学习更新所述存储器中的权重系数;根据处理器的控制指令,将权重系数写入非易失性存储器。
8.如权利要求7所述的机器学习方法,其特征在于,所述方法包括在从非易失性存储器读取权重系数之后,利用处理器的存储器或者FPGA模块的寄存器进行数据读取的缓冲。
9.一种机器学习方法,由系统芯片实施,所述系统芯片包括:处理器,配置有总线;AI模块,通过总线接口模块连接到总线上,AI模块包括具有第一存储器的处理单元;FPGA模块,通过总线接口模块连接到总线上;非易失性存储器,用于存储权重系数;所述方法包括:
从非易失性存储器读取权重系数;将权重系数写入AI模块的各处理单元的第一存储器中;启动AI模块利用权重系数进行机器学习;AI模块利用其自身各处理单元的第一存储器中存储的权重系数进行机器学习;根据机器学习结果更新所述第一存储器中的权重系数;定期将权重系数写入非易失性存储器。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910104560.4A CN109886416A (zh) | 2019-02-01 | 2019-02-01 | 集成人工智能模块的系统芯片及机器学习方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910104560.4A CN109886416A (zh) | 2019-02-01 | 2019-02-01 | 集成人工智能模块的系统芯片及机器学习方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN109886416A true CN109886416A (zh) | 2019-06-14 |
Family
ID=66927772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910104560.4A Pending CN109886416A (zh) | 2019-02-01 | 2019-02-01 | 集成人工智能模块的系统芯片及机器学习方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109886416A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110321319A (zh) * | 2019-09-02 | 2019-10-11 | 广东高云半导体科技股份有限公司 | 片上系统 |
| CN114341826A (zh) * | 2019-07-09 | 2022-04-12 | 麦姆瑞克斯公司 | 基于非易失性存储器的处理器和数据流技术 |
Citations (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102971754A (zh) * | 2010-07-07 | 2013-03-13 | 高通股份有限公司 | 用于神经处理器中的可替代突触权重存储的方法和系统 |
| US9542643B2 (en) * | 2013-05-21 | 2017-01-10 | Qualcomm Incorporated | Efficient hardware implementation of spiking networks |
| CN106462803A (zh) * | 2014-10-16 | 2017-02-22 | 谷歌公司 | 增强具有外部存储器的神经网络 |
| CN106447034A (zh) * | 2016-10-27 | 2017-02-22 | 中国科学院计算技术研究所 | 一种基于数据压缩的神经网络处理器、设计方法、芯片 |
| CN106529670A (zh) * | 2016-10-27 | 2017-03-22 | 中国科学院计算技术研究所 | 一种基于权重压缩的神经网络处理器、设计方法、芯片 |
| CN107102962A (zh) * | 2017-04-27 | 2017-08-29 | 科大讯飞股份有限公司 | 基于可编程逻辑器件的板卡电路和计算机设备 |
| CN107292342A (zh) * | 2017-06-21 | 2017-10-24 | 广东欧珀移动通信有限公司 | 数据处理方法及相关产品 |
| CN107368886A (zh) * | 2017-02-23 | 2017-11-21 | 奥瞳系统科技有限公司 | 基于重复使用小规模卷积神经网络模块的神经网络系统 |
| CN107548492A (zh) * | 2015-04-30 | 2018-01-05 | 密克罗奇普技术公司 | 具有增强指令集的中央处理单元 |
| CN107797935A (zh) * | 2016-09-06 | 2018-03-13 | 三星电子株式会社 | 存储装置和用于非易失性存储器装置的访问方法 |
| CN108108810A (zh) * | 2016-11-24 | 2018-06-01 | 三星电子株式会社 | 包括非易失性存储器件的存储装置及访问方法 |
| CN108415331A (zh) * | 2018-03-13 | 2018-08-17 | 算丰科技(北京)有限公司 | Ai深度学习板卡及其电源供电方法 |
| CN109032987A (zh) * | 2018-07-05 | 2018-12-18 | 山东超越数控电子股份有限公司 | 一种基于fpga使国产处理器加速的计算机系统及方法 |
-
2019
- 2019-02-01 CN CN201910104560.4A patent/CN109886416A/zh active Pending
Patent Citations (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102971754A (zh) * | 2010-07-07 | 2013-03-13 | 高通股份有限公司 | 用于神经处理器中的可替代突触权重存储的方法和系统 |
| US9542643B2 (en) * | 2013-05-21 | 2017-01-10 | Qualcomm Incorporated | Efficient hardware implementation of spiking networks |
| CN106462803A (zh) * | 2014-10-16 | 2017-02-22 | 谷歌公司 | 增强具有外部存储器的神经网络 |
| CN107548492A (zh) * | 2015-04-30 | 2018-01-05 | 密克罗奇普技术公司 | 具有增强指令集的中央处理单元 |
| CN107797935A (zh) * | 2016-09-06 | 2018-03-13 | 三星电子株式会社 | 存储装置和用于非易失性存储器装置的访问方法 |
| CN106447034A (zh) * | 2016-10-27 | 2017-02-22 | 中国科学院计算技术研究所 | 一种基于数据压缩的神经网络处理器、设计方法、芯片 |
| CN106529670A (zh) * | 2016-10-27 | 2017-03-22 | 中国科学院计算技术研究所 | 一种基于权重压缩的神经网络处理器、设计方法、芯片 |
| CN108108810A (zh) * | 2016-11-24 | 2018-06-01 | 三星电子株式会社 | 包括非易失性存储器件的存储装置及访问方法 |
| CN107368886A (zh) * | 2017-02-23 | 2017-11-21 | 奥瞳系统科技有限公司 | 基于重复使用小规模卷积神经网络模块的神经网络系统 |
| CN107102962A (zh) * | 2017-04-27 | 2017-08-29 | 科大讯飞股份有限公司 | 基于可编程逻辑器件的板卡电路和计算机设备 |
| CN107292342A (zh) * | 2017-06-21 | 2017-10-24 | 广东欧珀移动通信有限公司 | 数据处理方法及相关产品 |
| CN108415331A (zh) * | 2018-03-13 | 2018-08-17 | 算丰科技(北京)有限公司 | Ai深度学习板卡及其电源供电方法 |
| CN109032987A (zh) * | 2018-07-05 | 2018-12-18 | 山东超越数控电子股份有限公司 | 一种基于fpga使国产处理器加速的计算机系统及方法 |
Non-Patent Citations (1)
| Title |
|---|
| 唐翔 等: "《微机原理与接口技术》", 31 July 2011, 中国铁道出版社 * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114341826A (zh) * | 2019-07-09 | 2022-04-12 | 麦姆瑞克斯公司 | 基于非易失性存储器的处理器和数据流技术 |
| CN110321319A (zh) * | 2019-09-02 | 2019-10-11 | 广东高云半导体科技股份有限公司 | 片上系统 |
| CN110321319B (zh) * | 2019-09-02 | 2020-09-29 | 广东高云半导体科技股份有限公司 | 片上系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5617512A (en) | Triangular scalable neural array processor | |
| CN107590085B (zh) | 一种具有多级缓存的动态可重构阵列数据通路及其控制方法 | |
| CN110390384A (zh) | 一种可配置的通用卷积神经网络加速器 | |
| CN109190756A (zh) | 基于Winograd卷积的运算装置及包含该装置的神经网络处理器 | |
| CN105027109A (zh) | 具有用于提供多模向量处理的可编程数据路径配置的向量处理引擎、以及相关向量处理器、系统和方法 | |
| US20180089117A1 (en) | Reconfigurable fabric accessing external memory | |
| CN115803754A (zh) | 用于在神经网络中处理数据的硬件架构 | |
| KR20130090147A (ko) | 신경망 컴퓨팅 장치 및 시스템과 그 방법 | |
| US5065339A (en) | Orthogonal row-column neural processor | |
| CN108182959B (zh) | 基于阻变器件交叉阵列结构实现逻辑计算的方法 | |
| CN110163338A (zh) | 具有运算阵列的芯片运算方法、装置、终端及芯片 | |
| CN115796236B (zh) | 一种基于存内cnn中间缓存调度的存储器 | |
| CN109902040A (zh) | 一种集成fpga和人工智能模块的系统芯片 | |
| CN109886416A (zh) | 集成人工智能模块的系统芯片及机器学习方法 | |
| CN109902836A (zh) | 人工智能模块的故障容错方法及系统芯片 | |
| JPH0792790B2 (ja) | ベクトル並列計算機 | |
| KR101000099B1 (ko) | 프로그래머블 논리 디바이스 | |
| CN110059797A (zh) | 一种计算装置及相关产品 | |
| CN100492342C (zh) | 在阵列处理器上的划分 | |
| Paul et al. | Reconfigurable computing using content addressable memory for improved performance and resource usage | |
| CN109902063A (zh) | 一种集成有二维卷积阵列的系统芯片 | |
| CN109902835A (zh) | 处理单元设置有通用算法单元的人工智能模块及系统芯片 | |
| Giles | Jacobi iteration for a Laplace discretisation on a 3D structured grid | |
| CN117951427A (zh) | 一种支持多算法的全连接伊辛模型可重构处理电路 | |
| CN109933369A (zh) | 集成单指令多数据流架构人工智能模块的系统芯片 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190614 |