KR102819972B1 - 동기식 프로세서를 위한 샤딩 - Google Patents
동기식 프로세서를 위한 샤딩 Download PDFInfo
- Publication number
- KR102819972B1 KR102819972B1 KR1020227004916A KR20227004916A KR102819972B1 KR 102819972 B1 KR102819972 B1 KR 102819972B1 KR 1020227004916 A KR1020227004916 A KR 1020227004916A KR 20227004916 A KR20227004916 A KR 20227004916A KR 102819972 B1 KR102819972 B1 KR 102819972B1
- Authority
- KR
- South Korea
- Prior art keywords
- tiles
- candidate
- tile
- layer
- synchronous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/82—Architectures of general purpose stored program computers data or demand driven
- G06F15/825—Dataflow computers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/44—Encoding
- G06F8/445—Exploiting fine grain parallelism, i.e. parallelism at instruction level
- G06F8/4451—Avoiding pipeline stalls
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/45—Exploiting coarse grain parallelism in compilation, i.e. parallelism between groups of instructions
- G06F8/451—Code distribution
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5044—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5066—Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/48—Indexing scheme relating to G06F9/48
- G06F2209/483—Multiproc
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/48—Indexing scheme relating to G06F9/48
- G06F2209/485—Resource constraint
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5017—Task decomposition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/506—Constraint
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Neurology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Devices For Executing Special Programs (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Multi Processors (AREA)
- Complex Calculations (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
도 2a-2b는 서브계층 샤딩의 예를 도시한다.
도 3a 내지 도 3d는 평행사변형 시간 슬라이싱의 예를 도시한다.
도 4a 내지 도 4c는 오버샤딩의 예를 도시한다.
도 5a 내지 도 5c는 지그재그 샤딩으로 지칭되는 다른 버전의 오버샤딩의 예를 도시한다.
도 6은 다수의 동기식 프로세서를 갖는 시스템의 프로세싱을 구현하는데 사용될 수 있는 타일의 예를 도시한다.
다양한 도면에서 유사한 참조 번호 및 명칭은 유사한 요소를 나타낸다.
Claims (20)
- 시스템으로서,
하나 이상의 컴퓨터 및 하나 이상의 컴퓨터에 의해 실행될 때 하나 이상의 컴퓨터로 하여금 동작들을 수행하게 하는 명령들을 저장한 하나 이상의 저장 디바이스를 포함하고, 상기 동작들은,
복수의 동기식 타일을 갖는 디바이스에 의해 수행될 개별 행렬 연산을 각각 나타내는 복수의 노드를 포함하는 데이터 흐름(dataflow) 그래프의 표현을 수신하는 동작;
프로그램의 특정 노드에 대한 행렬의 서브계층 샤딩(sharding)에 기초하여, 복수의 동기식 타일의 각 타일에 대한 데이터 흐름 그래프의 개별 부분의 복수의 후보 할당을 생성하는 동작 - 상기 서브계층 샤딩은 행렬의 상이한 블록을 상이한 각각의 동기식 타일에 할당하는 것을 포함함 -;
디바이스의 하나 이상의 자원 제약에 따라 복수의 후보 할당의 각각의 후보 할당을 평가하는 동작; 및
각각의 후보 할당을 평가하는 것에 기초하여 후보 할당들 중 하나를 선택하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 복수의 동기식 타일의 각 타일은,
독립적인 프로세싱 엘리먼트의 계산 어레이를 포함하는 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 복수의 후보 할당을 생성하는 동작은,
관련 연산들의 가중치 크기가 해당 동기식 타일에 로컬인 로컬 SRAM(Static Random Access Memory)의 용량을 초과해서는 안 됨을 지정하는 SRAM 제약에 따라 후보 할당을 생성하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제3항에 있어서,
각 로컬 SRAM은 동작들을 수행할 동일한 동기식 타일에 통합된 상주 메모리인 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 복수의 후보 할당을 생성하는 동작은,
상이한 개별 계층의 행렬을 상이한 개별 타일에 할당하는 동작을 포함하는 것을 특징으로 하는 시스템. - 삭제
- 제1항에 있어서,
상기 행렬의 상이한 블록을 상이한 개별 동기식 타일에 할당하는 것은,
행 또는 열을 따라 행렬을 분할하는 동작 또는 행렬을 대각선으로 분할하는 것을 포함하는 것을 특징으로 하는 시스템. - 제7항에 있어서,
상기 동작들은,
크기 임계값을 초과하는 임의의 행렬에 대해 서브계층 샤딩을 수행하는 동작을 더 포함하는 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 복수의 후보 할당을 생성하는 동작은,
초기에 상이한 실행 슬로프를 갖는 상이한 경로가 대응하는 실행 슬로프를 갖도록 평행사변형 시간 슬라이싱을 수행하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제9항에 있어서,
상기 평행사변형 시간 슬라이싱을 수행하는 동작은,
2개의 상이한 경로 각각에 대한 개별 실행 슬로프를 계산하는 동작;
제1 경로가 제2 경로보다 더 작은 실행 슬로프를 갖는다고 결정하는 동작; 및
이에 응답하여, 제1 경로가 더 얕은 실행 슬로프를 갖도록 후보 할당을 수정하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제10항에 있어서,
상기 후보 할당을 수정하는 동작은,
버퍼링 또는 스톨을 후보 할당에 삽입하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 복수의 후보 할당을 생성하는 동작은,
타일들 중 하나에 의해 완전히 수행될 수 있는 데이터 흐름 그래프의 노드가 다수의 상이한 타일로 분할되도록 오버샤딩을 수행하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제12항에 있어서,
상기 오버샤딩을 수행하는 동작은,
하나의 개별 계층을 각 타일에 할당하는 동작 및 모든 타일 중에서 마지막 계층을 분할하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제12항에 있어서,
상기 오버샤딩을 수행하는 동작은,
모든 타일에 걸쳐 복수의 행렬을 분할하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 복수의 후보 할당을 생성하는 동작은,
상이한 메모리 및 계산 요구사항을 갖는 상이한 계층들을 함께 페어링함으로써 지그재그 샤딩을 수행하는 동작을 포함하는 것을 특징으로 하는 시스템. - 제15항에 있어서,
상기 상이한 계층들을 함께 페어링하는 것은,
동일한 타일이 제1 계층 및 마지막 계층 모두를 실행하도록 제1 계층을 마지막 계층과 페어링하는 것을 포함하는 것을 특징으로 하는 시스템. - 제16항에 있어서,
상기 제1 계층은 가장 큰 계산 요구사항을 가지며 그리고 마지막 계층은 가장 큰 메모리 요구사항을 갖는 것을 특징으로 하는 시스템. - 제1항에 있어서,
상기 타일들은 각 타일이 하나 또는 두 개의 인접 타일에만 데이터를 제공하도록 구성되도록 선형 어레이로 배열되는 것을 특징으로 하는 시스템. - 컴퓨터 구현 방법으로서,
데이터 처리 장치에 의해, 복수의 동기식 타일을 갖는 디바이스에 의해 수행될 개별 행렬 연산을 각각 나타내는 복수의 노드를 포함하는 데이터 흐름 그래프의 표현을 수신하는 단계;
데이터 처리 장치에 의해 프로그램의 특정 노드에 대한 행렬의 서브계층 샤딩에 기초하여, 복수의 동기식 타일의 각 타일에 대한 데이터 흐름 그래프의 개별 부분의 복수의 후보 할당을 생성하는 단계 - 상기 서브계층 샤딩은 행렬의 상이한 블록을 상이한 각각의 동기식 타일에 할당하는 것을 포함함 -;
데이터 처리 장치에 의해, 디바이스의 하나 이상의 자원 제약에 따라 복수의 후보 할당의 각각의 후보 할당을 평가하는 단계; 및
데이터 처리 장치에 의해, 각각의 후보 할당을 평가하는 것에 기초하여 후보 할당들 중 하나를 선택하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 구현 방법. - 동작들을 수행하도록 데이터 처리 장치에 의해 실행될 수 있는 명령들을 포함하는 컴퓨터 프로그램으로 인코딩된 컴퓨터 저장 매체로서, 상기 동작들은,
복수의 동기식 타일을 갖는 디바이스에 의해 수행될 개별 행렬 연산을 각각 나타내는 복수의 노드를 포함하는 데이터 흐름 그래프의 표현을 수신하는 동작;
프로그램의 특정 노드에 대한 행렬의 서브계층 샤딩에 기초하여, 복수의 동기식 타일의 각 타일에 대한 데이터 흐름 그래프의 개별 부분의 복수의 후보 할당을 생성하는 동작 - 상기 서브계층 샤딩은 행렬의 상이한 블록을 상이한 각각의 동기식 타일에 할당하는 것을 포함함 -;
디바이스의 하나 이상의 자원 제약에 따라 복수의 후보 할당의 각각의 후보 할당을 평가하는 동작; 및
각각의 후보 할당을 평가하는 것에 기초하여 후보 할당들 중 하나를 선택하는 동작을 포함하는 것을 특징으로 하는 컴퓨터 저장 매체.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020257018524A KR20250086806A (ko) | 2019-08-22 | 2020-08-20 | 동기식 프로세서를 위한 샤딩 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962890471P | 2019-08-22 | 2019-08-22 | |
| US62/890,471 | 2019-08-22 | ||
| PCT/US2020/047206 WO2021035055A1 (en) | 2019-08-22 | 2020-08-20 | Sharding for synchronous processors |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020257018524A Division KR20250086806A (ko) | 2019-08-22 | 2020-08-20 | 동기식 프로세서를 위한 샤딩 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20220031717A KR20220031717A (ko) | 2022-03-11 |
| KR102819972B1 true KR102819972B1 (ko) | 2025-06-13 |
Family
ID=72474370
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227004916A Active KR102819972B1 (ko) | 2019-08-22 | 2020-08-20 | 동기식 프로세서를 위한 샤딩 |
| KR1020257018524A Pending KR20250086806A (ko) | 2019-08-22 | 2020-08-20 | 동기식 프로세서를 위한 샤딩 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020257018524A Pending KR20250086806A (ko) | 2019-08-22 | 2020-08-20 | 동기식 프로세서를 위한 샤딩 |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US12147793B2 (ko) |
| EP (1) | EP3987394A1 (ko) |
| JP (2) | JP7423757B2 (ko) |
| KR (2) | KR102819972B1 (ko) |
| CN (1) | CN114270307A (ko) |
| TW (1) | TWI776212B (ko) |
| WO (1) | WO2021035055A1 (ko) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12436915B2 (en) | 2022-07-13 | 2025-10-07 | SambaNova Systems, Inc. | Operating a cost estimation tool for placing and routing an operation unit graph on a reconfigurable processor |
| CN115796041B (zh) * | 2022-12-05 | 2025-09-19 | 杭州海康威视数字技术股份有限公司 | 神经网络模型部署方法、系统、设备及存储介质 |
| CN119416850B (zh) * | 2024-10-18 | 2025-12-12 | 北京航空航天大学 | 一种适配硬件张量指令及内存的神经网络推理优化方法 |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AUPQ131399A0 (en) | 1999-06-30 | 1999-07-22 | Silverbrook Research Pty Ltd | A method and apparatus (NPAGE02) |
| JPH02190934A (ja) * | 1989-01-20 | 1990-07-26 | Hitachi Ltd | 並列計算機向けプログラム生成方法 |
| US5682107A (en) * | 1994-04-01 | 1997-10-28 | Xilinx, Inc. | FPGA architecture with repeatable tiles including routing matrices and logic matrices |
| TWI353521B (en) | 2006-09-28 | 2011-12-01 | Sandisk Corp | Soft-input soft-output decoder for nonvolatile mem |
| US8862625B2 (en) | 2008-04-07 | 2014-10-14 | Teradata Us, Inc. | Accessing data in a column store database based on hardware compatible indexing and replicated reordered columns |
| JP5036523B2 (ja) | 2007-12-21 | 2012-09-26 | 三菱電機株式会社 | プログラム並列化装置 |
| KR101710910B1 (ko) | 2010-09-27 | 2017-03-13 | 삼성전자 주식회사 | 프로세싱 유닛의 동적 자원 할당을 위한 방법 및 장치 |
| US9176794B2 (en) | 2010-12-13 | 2015-11-03 | Advanced Micro Devices, Inc. | Graphics compute process scheduling |
| US9336146B2 (en) | 2010-12-29 | 2016-05-10 | Empire Technology Development Llc | Accelerating cache state transfer on a directory-based multicore architecture |
| KR20120079498A (ko) * | 2011-01-05 | 2012-07-13 | 정동규 | 청소할 필요없는 키보드 |
| JP5798378B2 (ja) | 2011-05-30 | 2015-10-21 | キヤノン株式会社 | 装置、処理方法、およびプログラム |
| US9229983B2 (en) | 2012-11-30 | 2016-01-05 | Amazon Technologies, Inc. | System-wide query optimization |
| US9563399B2 (en) | 2013-08-30 | 2017-02-07 | Cavium, Inc. | Generating a non-deterministic finite automata (NFA) graph for regular expression patterns with advanced features |
| CN105630441B (zh) | 2015-12-11 | 2018-12-25 | 中国航空工业集团公司西安航空计算技术研究所 | 一种基于统一染色技术的gpu系统 |
| US12118451B2 (en) | 2017-01-04 | 2024-10-15 | Stmicroelectronics S.R.L. | Deep convolutional network heterogeneous architecture |
| US10387298B2 (en) | 2017-04-04 | 2019-08-20 | Hailo Technologies Ltd | Artificial neural network incorporating emphasis and focus techniques |
| KR102172866B1 (ko) * | 2017-04-17 | 2020-11-02 | 딥시그 인크. | 라디오 신호 프로세싱 데이터플로 연산들의 배치 및 스케줄링 |
| WO2018193377A1 (en) | 2017-04-17 | 2018-10-25 | Cerebras Systems Inc. | Control wavelet for accelerated deep learning |
| US10452452B2 (en) * | 2017-04-17 | 2019-10-22 | Wave Computing, Inc. | Reconfigurable processor fabric implementation using satisfiability analysis |
| US10380063B2 (en) * | 2017-09-30 | 2019-08-13 | Intel Corporation | Processors, methods, and systems with a configurable spatial accelerator having a sequencer dataflow operator |
-
2020
- 2020-08-20 US US17/636,805 patent/US12147793B2/en active Active
- 2020-08-20 KR KR1020227004916A patent/KR102819972B1/ko active Active
- 2020-08-20 JP JP2022511309A patent/JP7423757B2/ja active Active
- 2020-08-20 EP EP20771947.7A patent/EP3987394A1/en active Pending
- 2020-08-20 WO PCT/US2020/047206 patent/WO2021035055A1/en not_active Ceased
- 2020-08-20 KR KR1020257018524A patent/KR20250086806A/ko active Pending
- 2020-08-20 CN CN202080058480.0A patent/CN114270307A/zh active Pending
- 2020-08-21 TW TW109128609A patent/TWI776212B/zh active
-
2024
- 2024-01-17 JP JP2024005431A patent/JP7787212B2/ja active Active
- 2024-10-18 US US18/920,341 patent/US20250045032A1/en active Pending
Non-Patent Citations (2)
| Title |
|---|
| Chang-Yi Gui et al., A Survey on Graph Processing Accelarators: Challenges and Opportunities(https://link.springer.com/article/10.1007/s11390-019-1914-z,2019.03.22.) 1부.* |
| 미국공개특허 제2012-0079498호(2012.03.29.) 1부.* |
Also Published As
| Publication number | Publication date |
|---|---|
| TW202111562A (zh) | 2021-03-16 |
| CN114270307A (zh) | 2022-04-01 |
| KR20220031717A (ko) | 2022-03-11 |
| KR20250086806A (ko) | 2025-06-13 |
| JP7423757B2 (ja) | 2024-01-29 |
| EP3987394A1 (en) | 2022-04-27 |
| US20220300450A1 (en) | 2022-09-22 |
| US20250045032A1 (en) | 2025-02-06 |
| JP7787212B2 (ja) | 2025-12-16 |
| US12147793B2 (en) | 2024-11-19 |
| WO2021035055A1 (en) | 2021-02-25 |
| TWI776212B (zh) | 2022-09-01 |
| JP2022544842A (ja) | 2022-10-21 |
| JP2024040198A (ja) | 2024-03-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6898496B2 (ja) | 計算グラフの処理 | |
| JP7787212B2 (ja) | 同期プロセッサのためのシャーディング | |
| CN111476344B (zh) | 计算装置、资源分配的方法及多径神经网络分析器 | |
| KR102081952B1 (ko) | 계산 그래프들의 스트림-기반 가속기 프로세싱 | |
| Sheikhalishahi et al. | A multi-dimensional job scheduling | |
| JP7476299B2 (ja) | 同期プロセッサのためのコンパイル | |
| CN114217930A (zh) | 一种基于混合任务调度的加速器系统资源优化管理方法 | |
| JP7541163B2 (ja) | 伝搬レイテンシの短縮 | |
| Meng et al. | An acceleration framework for deep reinforcement learning using heterogeneous systems | |
| HK40071879A (en) | Sharding for synchronous processors | |
| Ma et al. | Reducing code size in scheduling synchronous dataflow graphs on multicore systems | |
| Uwizeyimana | Tackling Resource Utilization in Deep Neural Network Accelerators | |
| Cao | Performance Optimization of Big Data Computing Workflows for Batch and Stream Data Processing in Multi-Clouds | |
| Youness et al. | A design space exploration methodology for allocating task precedence graphs to multi-core system architectures |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20220214 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230930 Patent event code: PE09021S01D |
|
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240629 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20250326 |
|
| A107 | Divisional application of patent | ||
| PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20250604 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20250609 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20250610 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |