JP2019036298A - 知能型高帯域幅メモリシステム及びそのための論理ダイ - Google Patents
知能型高帯域幅メモリシステム及びそのための論理ダイ Download PDFInfo
- Publication number
- JP2019036298A JP2019036298A JP2018139930A JP2018139930A JP2019036298A JP 2019036298 A JP2019036298 A JP 2019036298A JP 2018139930 A JP2018139930 A JP 2018139930A JP 2018139930 A JP2018139930 A JP 2018139930A JP 2019036298 A JP2019036298 A JP 2019036298A
- Authority
- JP
- Japan
- Prior art keywords
- logic
- host
- bandwidth memory
- high bandwidth
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/023—Free address space management
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0862—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with prefetch
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
- G06F13/1673—Details of memory controller using buffers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0611—Improving I/O performance in relation to response time
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/062—Securing storage systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0658—Controller construction arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0679—Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
-
- H10W90/00—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1008—Correctness of operation, e.g. memory ordering
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1016—Performance improvement
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1056—Simplification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/60—Details of cache memory
- G06F2212/602—Details relating to cache prefetching
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
- G11C5/025—Geometric lay-out considerations of storage- and peripheral-blocks in a semiconductor storage device
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
- G11C5/04—Supports for storage elements, e.g. memory modules; Mounting or fixing of storage elements on such supports
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Neurology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Advance Control (AREA)
- Memory System (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
一部の実施形態において、コマンド出力論理部645は、コマンドを出力する。オフロード処理論理部610は、出力されたコマンドに応答してオフロード処理演算を実行する。オフロード処理論理部610は、演算論理ユニット(ALU)655、浮動小数点ユニット(FPU)660、固定論理670、又は再設定可能な論理665の少なくとも1つを含む。一部の実施形態において、オフロード処理論理部610は、HBM2モジュールスタック630に格納されたデータに応じてオフロード処理演算を実行する。また、コアアーキテクチャ605は、有限状態機械(Finite State Machine:FSM)650を含む。
105 論理ダイ
110 HBM2モジュール
115 ホスト
120 知能型HBMスタック
205 インタポーザ
210 パッケージ基板
300 ブロック図
305 人工知能アプリケーション
310 CUDA
315 GPU命令集合アーキテクチャ
320、420 GPU
325 ライブラリ
330 メモリISA
335 ライブラリ関数呼び出し部
340、345 アーキテクチャ
400、500 システム
405 CPU
410 DRAMバッファ
415 PCI−Eインタフェース
502 図面
510 カーネル
605 コアアーキテクチャ
610 オフロード処理論理部
615 ホストマネージャ
620 SRAMコントローラ
625 HBMコントローラ
630 HBM2モジュールスタック
635 SRAM
640 コマンド復号論理部
645 コマンド出力論理部
650 有限状態機械
655 演算論理ユニット
660 浮動小数点ユニット
665 再設定可能な論理
670 固定論理
675 インタフェース物理層
680 ホストキューマネージャ
685 プリフェッチエンジン
690 キャッシュコントローラ
695 エラー訂正コード論理部
698、745 メモリコントローラ
700 コンピューティングシステム
705 システムバス
710 クロック
715 ランダムアクセスメモリ及び/若しくはフラッシュメモリ
720 ユーザーインタフェース
725 モデム
735 自動試験装置
740 バッテリー
Claims (25)
- 中央処理装置(CPU)、グラフィック処理装置(GPU)、注文型集積回路(ASIC)、又はフィールドプログラマブルゲートアレイ(FPGA)の少なくとも1つを含むホストと、
積層された複数の高帯域幅メモリモジュール及び前記複数の高帯域幅メモリモジュールの下方に配置された論理ダイを有する知能型高帯域幅メモリスタックと、を含むことを特徴とする知能型高帯域幅メモリシステム。 - 前記論理ダイは、前記ホストから処理演算をオフロードすることを特徴とする請求項1に記載の知能型高帯域幅メモリシステム。
- さらに、前記ホスト及び前記論理ダイに連結されたインタポーザを有することを特徴とする請求項1に記載の知能型高帯域幅メモリシステム。
- さらに、前記インタポーザに連結された基板を有することを特徴とする請求項3に記載の知能型高帯域幅メモリシステム。
- 前記複数の高帯域幅メモリモジュールは、前記論理ダイと通信可能に連結され、前記論理ダイは、前記ホストと通信可能に連結されることを特徴とする請求項4に記載の知能型高帯域幅メモリシステム。
- 前記知能型高帯域幅メモリスタックは、第1知能型高帯域幅メモリスタックと呼ばれ、
前記複数の高帯域幅メモリモジュールは、第1の複数の高帯域幅メモリモジュールと呼ばれ、
前記論理ダイは、第1論理ダイと呼ばれ、
前記知能型高帯域幅メモリシステムは、さらに、積層された第2の複数の高帯域幅メモリモジュールと、前記第2の複数の高帯域幅メモリモジュールの下方に配置された第2論理ダイと、を有する第2知能型高帯域幅メモリスタックを有することを特徴とする請求項1に記載の知能型高帯域幅メモリシステム。 - 前記第1論理ダイ及び第2論理ダイは、各々前記ホストから処理演算をオフロードし、
前記第1の複数の高帯域幅メモリモジュールは、前記第1論理ダイに通信可能に連結され、前記第1論理ダイは、前記ホストに通信可能に連結され、
前記第2の複数の高帯域幅メモリモジュールは、前記第2論理ダイに通信可能に連結され、前記第2論理ダイは、前記ホストに通信可能に連結され、
前記知能型高帯域幅メモリシステムは、さらに、前記ホストと前記第1論理ダイ及び第2論理ダイに連結されたインタポーザと、
前記インタポーザに連結された基板と、を有することを特徴とする請求項6に記載の知能型高帯域幅メモリシステム。 - さらに、メモリを含み、
前記論理ダイは、
インタフェース物理層(PHY)とホストキューマネージャとを有し、前記インタフェース物理層(PHY)を介して前記ホストとインタフェースし、前記ホストから受信した情報をキューイングするホストマネージャと、
プリフェッチエンジンとキャッシュコントローラとを有し、前記プリフェッチエンジン及び前記キャッシュコントローラを介して前記メモリとインタフェースするメモリコントローラと、
前記複数の高帯域幅メモリモジュールとインタフェースするメモリコントローラを有する高帯域幅メモリコントローラと、
前記ホストから処理演算をオフロードするオフロード処理論理部と、をさらに有することを特徴とする請求項1に記載の知能型高帯域幅メモリシステム。 - 前記オフロード処理論理部は、
前記ホストマネージャを介して前記ホストから前記オフロードされた処理演算に関する情報を受信し、
前記オフロードされた処理演算に関する前記受信した情報に応じて前記オフロードされた処理演算を実行することを特徴とする請求項8に記載の知能型高帯域幅メモリシステム。 - 前記受信した情報は、フラグを含むことを特徴とする請求項9に記載の知能型高帯域幅メモリシステム。
- 前記受信した情報は、コマンドを含むことを特徴とする請求項9に記載の知能型高帯域幅メモリシステム。
- 前記論理ダイは、さらに、
前記コマンドを復号するコマンド復号論理部と、
前記コマンドを出力するコマンド出力論理部と、を有することを特徴とする請求項11に記載の知能型高帯域幅メモリシステム。 - 前記オフロード処理論理部は、前記出力されたコマンドに応答して前記オフロードされた処理演算を実行することを特徴とする請求項12に記載の知能型高帯域幅メモリシステム。
- 前記オフロード処理論理部は、演算論理ユニット(ALU)、浮動小数点ユニット(FPU)、固定論理、又は再設定可能な論理の少なくとも1つを有することを特徴とする請求項8に記載の知能型高帯域幅メモリシステム。
- 前記オフロード処理論理部は、前記複数の高帯域幅メモリモジュールに格納したデータに応じて前記オフロードされた処理演算を実行することを特徴とする請求項8に記載の知能型高帯域幅メモリシステム。
- 前記メモリコントローラは、SRAMコントローラであり、
前記メモリは、SRAMであることを特徴とする請求項8に記載の知能型高帯域幅メモリシステム。 - インタフェース物理層(PHY)とホストキューマネージャとを有し、前記インタフェース物理層(PHY)を介してホストとインタフェースし、前記ホストから受信した情報をキューイングするホストマネージャと、
プリフェッチエンジンとキャッシュコントローラとを有し、前記プリフェッチエンジン及び前記キャッシュコントローラを介してメモリとインタフェースするメモリコントローラと、
高帯域幅メモリモジュールスタックとインタフェースするメモリコントローラを有する高帯域幅メモリコントローラと、
前記ホストから処理演算をオフロードするオフロード処理論理部と、を含むことを特徴とする論理ダイ。 - 前記オフロード処理論理部は、
前記ホストマネージャを介して前記ホストから前記オフロードされた処理演算に関する情報を受信し、
前記オフロードされた処理演算に関する前記受信した情報に応じて前記オフロードされた処理演算を実行することを特徴とする請求項17に記載の論理ダイ。 - 前記受信した情報は、フラグを含むことを特徴とする請求項17に記載の論理ダイ。
- 前記受信した情報は、コマンドを含むことを特徴とする請求項17に記載の論理ダイ。
- さらに、前記コマンドを復号するコマンド復号論理部と、
前記コマンドを出力するコマンド出力論理部と、を含むことを特徴とする請求項20に記載の論理ダイ。 - 前記オフロード処理論理部は、前記出力したコマンドに応答して前記オフロードされた処理演算を実行することを特徴とする請求項21に記載の論理ダイ。
- 前記オフロード処理論理部は、演算論理ユニット、浮動小数点ユニット、固定論理、又は再設定可能な論理の少なくとも1つを含むことを特徴とする請求項21に記載の論理ダイ。
- 前記オフロード処理論理部は、前記高帯域幅メモリモジュールスタックに格納されたデータに応じて前記オフロードされた処理演算を実行することを特徴とする請求項21に記載の論理ダイ。
- 前記メモリコントローラは、SRAMコントローラであり、
前記メモリは、SRAMであることを特徴とする請求項17に記載の論理ダイ。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762543918P | 2017-08-10 | 2017-08-10 | |
| US62/543918 | 2017-08-10 | ||
| US15/796743 | 2017-10-27 | ||
| US15/796,743 US10545860B2 (en) | 2017-08-10 | 2017-10-27 | Intelligent high bandwidth memory appliance |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2019036298A true JP2019036298A (ja) | 2019-03-07 |
| JP2019036298A5 JP2019036298A5 (ja) | 2021-08-12 |
| JP6974270B2 JP6974270B2 (ja) | 2021-12-01 |
Family
ID=65275225
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018139930A Active JP6974270B2 (ja) | 2017-08-10 | 2018-07-26 | 知能型高帯域幅メモリシステム及びそのための論理ダイ |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US10545860B2 (ja) |
| JP (1) | JP6974270B2 (ja) |
| KR (1) | KR102368970B1 (ja) |
| CN (1) | CN109388595B (ja) |
| TW (1) | TWI746878B (ja) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021082246A (ja) * | 2019-11-18 | 2021-05-27 | エスケーハイニックス株式会社SK hynix Inc. | ニューラルネットワーク処理回路を含むメモリ装置 |
| JP2022523909A (ja) * | 2019-03-15 | 2022-04-27 | インテル・コーポレーション | マルチタイルメモリ管理 |
| JP2024502279A (ja) * | 2020-12-29 | 2024-01-18 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | オフロードされた命令とオフロードされていない命令との間のメモリ順序付けの保持 |
| US12056059B2 (en) | 2019-03-15 | 2024-08-06 | Intel Corporation | Systems and methods for cache optimization |
| US12141578B2 (en) | 2017-04-28 | 2024-11-12 | Intel Corporation | Instructions and logic to perform floating point and integer operations for machine learning |
| US12175252B2 (en) | 2017-04-24 | 2024-12-24 | Intel Corporation | Concurrent multi-datatype execution within a processing resource |
| US12198222B2 (en) | 2019-03-15 | 2025-01-14 | Intel Corporation | Architecture for block sparse operations on a systolic array |
| US12361600B2 (en) | 2019-11-15 | 2025-07-15 | Intel Corporation | Systolic arithmetic on sparse data |
| JP2025523323A (ja) * | 2023-06-02 | 2025-07-23 | グーグル エルエルシー | 大規模言語モデルへの3d-dramチップレットの適用 |
| US12493922B2 (en) | 2019-11-15 | 2025-12-09 | Intel Corporation | Graphics processing unit processing and caching improvements |
Families Citing this family (46)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9997232B2 (en) * | 2016-03-10 | 2018-06-12 | Micron Technology, Inc. | Processing in memory (PIM) capable memory device having sensing circuitry performing logic operations |
| GB2553102B (en) * | 2016-08-19 | 2020-05-20 | Advanced Risc Mach Ltd | A memory unit and method of operation of a memory unit to handle operation requests |
| US11301412B2 (en) * | 2017-12-22 | 2022-04-12 | Intel Corporation | Scaling interface architecture between memory and programmable logic |
| US10770129B2 (en) * | 2018-08-21 | 2020-09-08 | Intel Corporation | Pseudo-channeled DRAM |
| US11204819B2 (en) * | 2018-12-21 | 2021-12-21 | Samsung Electronics Co., Ltd. | System and method for offloading application functions to a device |
| US10642946B2 (en) | 2018-12-28 | 2020-05-05 | Intel Corporation | Modular periphery tile for integrated circuit device |
| US10915451B2 (en) * | 2019-05-10 | 2021-02-09 | Samsung Electronics Co., Ltd. | Bandwidth boosted stacked memory |
| US11152343B1 (en) * | 2019-05-31 | 2021-10-19 | Kepler Computing, Inc. | 3D integrated ultra high-bandwidth multi-stacked memory |
| US11841803B2 (en) * | 2019-06-28 | 2023-12-12 | Advanced Micro Devices, Inc. | GPU chiplets using high bandwidth crosslinks |
| CN112151526B (zh) * | 2019-06-28 | 2024-12-03 | 桑迪士克科技股份有限公司 | 包括高速异质集成控制器和高速缓存的半导体设备 |
| US11211378B2 (en) * | 2019-07-18 | 2021-12-28 | International Business Machines Corporation | Heterogeneous integration structure for artificial intelligence computing |
| US12039430B2 (en) * | 2019-11-15 | 2024-07-16 | Samsung Electronics Co., Ltd. | Electronic device and method for inference binary and ternary neural networks |
| KR102791004B1 (ko) * | 2019-12-26 | 2025-04-02 | 삼성전자주식회사 | 셀 단위로 액세스 가능한 스토리지 장치 및 그 동작방법 |
| US11056179B2 (en) * | 2020-01-08 | 2021-07-06 | Intel Corporation | Techniques to couple high bandwidth memory device on silicon substrate and package substrate |
| KR102844113B1 (ko) * | 2020-01-13 | 2025-08-11 | 삼성전자주식회사 | 메모리 장치, 메모리 모듈 및 메모리 장치의 동작 방법 |
| KR102845463B1 (ko) * | 2020-01-15 | 2025-08-11 | 삼성전자주식회사 | 병렬 연산 처리를 수행하는 메모리 장치 및 그 동작방법, 그리고 메모리 장치를 제어하는 메모리 컨트롤러의 동작방법 |
| KR102831057B1 (ko) * | 2020-01-20 | 2025-07-07 | 삼성전자주식회사 | 고대역폭 메모리 및 이를 포함하는 시스템 |
| WO2021241048A1 (ja) * | 2020-05-28 | 2021-12-02 | パナソニックIpマネジメント株式会社 | Aiチップ |
| KR102911993B1 (ko) | 2020-09-07 | 2026-01-12 | 삼성전자 주식회사 | 가변적인 모드 설정을 수행하는 메모리 장치 및 그 동작방법 |
| CN115868023B (zh) * | 2020-09-17 | 2025-07-01 | 阿里巴巴集团控股有限公司 | 三维堆叠处理系统 |
| US11238940B1 (en) * | 2020-11-19 | 2022-02-01 | Micron Technology, Inc. | Initialization techniques for memory devices |
| US12347818B2 (en) * | 2021-03-26 | 2025-07-01 | Intel Corporation | Logic die in a multi-chip package having a configurable physical interface to on-package memory |
| KR102430982B1 (ko) * | 2021-06-10 | 2022-08-11 | 삼성전자주식회사 | 프로세싱부를 포함하는 이종 메모리 시스템을 억세스하는 데이터 처리 시스템 및 방법 |
| CN115469800A (zh) | 2021-06-10 | 2022-12-13 | 三星电子株式会社 | 数据处理系统以及用于访问异构存储器系统的方法 |
| CN113760796B (zh) * | 2021-09-01 | 2023-12-22 | 山东华芯半导体有限公司 | 一种基于hbm缓存的ssd固态盘 |
| US20230077933A1 (en) * | 2021-09-14 | 2023-03-16 | Advanced Micro Devices, Inc. | Supporting processing-in-memory execution in a multiprocessing environment |
| US12274058B2 (en) * | 2022-03-21 | 2025-04-08 | Macronix International Co., Ltd. | Memory device |
| CN114706679A (zh) * | 2022-03-30 | 2022-07-05 | 深圳致星科技有限公司 | 融合计算和通信的计算网络单元、计算节点及计算网络 |
| CN114709205B (zh) * | 2022-06-02 | 2022-09-09 | 西安紫光国芯半导体有限公司 | 一种三维堆叠芯片及其数据处理方法 |
| CN117673013A (zh) * | 2022-08-10 | 2024-03-08 | 长鑫存储技术有限公司 | 半导体结构和半导体结构的制造方法 |
| CN115394768B (zh) * | 2022-09-06 | 2025-05-30 | 华进半导体封装先导技术研发中心有限公司 | 一种多层高带宽存储器及其制造方法 |
| KR102896243B1 (ko) | 2022-10-25 | 2025-12-08 | 삼성전자주식회사 | 호스트와 주변 장치 간의 오프 칩 액세스을 최소화하는 장치 및 방법 |
| US20240371410A1 (en) * | 2023-05-02 | 2024-11-07 | Micron Technology, Inc. | Apparatus including multiple high bandwidth memory cubes |
| US12450178B2 (en) | 2023-06-02 | 2025-10-21 | Avago Technologies International Sales Pte. Limited | Aggregation of multiple memory modules for a system-on-chip |
| US20240403254A1 (en) * | 2023-06-02 | 2024-12-05 | Google Llc | Serving Large Language Models with 3D-DRAM Chiplets |
| US12525540B1 (en) * | 2023-06-05 | 2026-01-13 | Eliyan Corp. | Multi-chip module (MCM) with scalable high bandwidth memory |
| US12517664B2 (en) | 2023-10-11 | 2026-01-06 | Micron Technology, Inc. | Apparatus including an array of pre-configurable memory and storage |
| KR102874491B1 (ko) * | 2023-12-07 | 2025-10-23 | 주식회사 코코링크 | 인공지능 연산처리 시스템 및 이의 제어 방법 |
| US20250231877A1 (en) * | 2024-01-12 | 2025-07-17 | Micron Technology, Inc. | Cache memories in vertically integrated memory systems and associated systems and methods |
| US12481608B2 (en) | 2024-01-12 | 2025-11-25 | Google Llc | Tree-based network architecture for accelerating machine learning collective operations |
| US20250298523A1 (en) * | 2024-03-21 | 2025-09-25 | Samsung Electronics Co., Ltd. | Systems and methods of incorporating artificial intelligence accelerators on memory base dies |
| CN120929419A (zh) * | 2024-05-11 | 2025-11-11 | 华为技术有限公司 | 计算装置、内存模块组、计算设备及计算设备集群 |
| KR102888680B1 (ko) * | 2024-06-17 | 2025-11-26 | 국립한밭대학교 산학협력단 | 메모리 모듈 및 그 제조방법 |
| US20260003628A1 (en) * | 2024-06-28 | 2026-01-01 | Samsung Electronics Co., Ltd. | Systems and methods of concurrent execution in processing in memory systems |
| WO2026015391A1 (en) * | 2024-07-09 | 2026-01-15 | Micron Technology, Inc. | Memory in package devices and associated systems and methods |
| CN119046184B (zh) * | 2024-08-27 | 2025-03-21 | 沐曦科技(成都)有限公司 | 一种gpu固件日志的存储方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010080802A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 半導体装置 |
| JP2015533009A (ja) * | 2012-09-25 | 2015-11-16 | インテル・コーポレーション | パフォーマンスおよび電力のために構成可能な3dメモリ |
| WO2016209406A1 (en) * | 2015-06-26 | 2016-12-29 | Advanced Micro Devices, Inc. | Computer architecture using rapidly reconfigurable circuits and high-bandwidth memory interfaces |
| JP2018198017A (ja) * | 2017-05-24 | 2018-12-13 | ルネサスエレクトロニクス株式会社 | 半導体装置及びデータ処理システム |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100174858A1 (en) * | 2009-01-05 | 2010-07-08 | Taiwan Semiconductor Manufacturing Co., Ltd. | Extra high bandwidth memory die stack |
| EP2550661A4 (en) * | 2010-03-22 | 2013-10-09 | Mosaid Technologies Inc | COMPOSITE SEMICONDUCTOR MEMORY DEVICE WITH ERROR CORRECTION |
| US20130073755A1 (en) * | 2011-09-20 | 2013-03-21 | Advanced Micro Devices, Inc. | Device protocol translator for connection of external devices to a processing unit package |
| JP5970078B2 (ja) * | 2011-12-02 | 2016-08-17 | インテル・コーポレーション | デバイス相互接続の変化を可能にする積層メモリ |
| DE112011105990T5 (de) * | 2011-12-22 | 2014-09-11 | Intel Corporation | Integriertes 3D-Schaltungspaket mit Fensterinterposer |
| US8922243B2 (en) * | 2012-12-23 | 2014-12-30 | Advanced Micro Devices, Inc. | Die-stacked memory device with reconfigurable logic |
| US20140040532A1 (en) * | 2012-08-06 | 2014-02-06 | Advanced Micro Devices, Inc. | Stacked memory device with helper processor |
| KR20140131623A (ko) * | 2013-05-06 | 2014-11-14 | 에스케이하이닉스 주식회사 | 반도체 장치 |
| KR20140147218A (ko) * | 2013-06-19 | 2014-12-30 | 에스케이하이닉스 주식회사 | 메모리 장치 및 이를 포함하는 시스템 |
| US20150106574A1 (en) * | 2013-10-15 | 2015-04-16 | Advanced Micro Devices, Inc. | Performing Processing Operations for Memory Circuits using a Hierarchical Arrangement of Processing Circuits |
| US9535831B2 (en) * | 2014-01-10 | 2017-01-03 | Advanced Micro Devices, Inc. | Page migration in a 3D stacked hybrid memory |
| US20160188519A1 (en) * | 2014-12-27 | 2016-06-30 | Intel Corporation | Method, apparatus, system for embedded stream lanes in a high-performance interconnect |
| KR102275812B1 (ko) * | 2015-09-04 | 2021-07-14 | 삼성전자주식회사 | 센터 패드 타입의 스택드 칩 구조에서 신호 완결성 이슈를 개선할 수 있는 온다이 터미네이션 스키마를 갖는 반도체 메모리 장치 |
| US10691634B2 (en) * | 2015-11-30 | 2020-06-23 | Pezy Computing K.K. | Die and package |
| US11397687B2 (en) * | 2017-01-25 | 2022-07-26 | Samsung Electronics Co., Ltd. | Flash-integrated high bandwidth memory appliance |
-
2017
- 2017-10-27 US US15/796,743 patent/US10545860B2/en active Active
-
2018
- 2018-06-07 KR KR1020180065482A patent/KR102368970B1/ko active Active
- 2018-07-26 JP JP2018139930A patent/JP6974270B2/ja active Active
- 2018-08-09 CN CN201810903592.6A patent/CN109388595B/zh active Active
- 2018-08-09 TW TW107127706A patent/TWI746878B/zh active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010080802A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 半導体装置 |
| JP2015533009A (ja) * | 2012-09-25 | 2015-11-16 | インテル・コーポレーション | パフォーマンスおよび電力のために構成可能な3dメモリ |
| WO2016209406A1 (en) * | 2015-06-26 | 2016-12-29 | Advanced Micro Devices, Inc. | Computer architecture using rapidly reconfigurable circuits and high-bandwidth memory interfaces |
| JP2018530025A (ja) * | 2015-06-26 | 2018-10-11 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッドAdvanced Micro Devices Incorporated | 高速で再構成可能な回路及び高帯域幅のメモリインタフェースを用いたコンピュータアーキテクチャ |
| JP2018198017A (ja) * | 2017-05-24 | 2018-12-13 | ルネサスエレクトロニクス株式会社 | 半導体装置及びデータ処理システム |
Cited By (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12411695B2 (en) | 2017-04-24 | 2025-09-09 | Intel Corporation | Multicore processor with each core having independent floating point datapath and integer datapath |
| US12175252B2 (en) | 2017-04-24 | 2024-12-24 | Intel Corporation | Concurrent multi-datatype execution within a processing resource |
| US12141578B2 (en) | 2017-04-28 | 2024-11-12 | Intel Corporation | Instructions and logic to perform floating point and integer operations for machine learning |
| US12217053B2 (en) | 2017-04-28 | 2025-02-04 | Intel Corporation | Instructions and logic to perform floating point and integer operations for machine learning |
| US12066975B2 (en) | 2019-03-15 | 2024-08-20 | Intel Corporation | Cache structure and utilization |
| US12182035B2 (en) | 2019-03-15 | 2024-12-31 | Intel Corporation | Systems and methods for cache optimization |
| US12056059B2 (en) | 2019-03-15 | 2024-08-06 | Intel Corporation | Systems and methods for cache optimization |
| JP2022523909A (ja) * | 2019-03-15 | 2022-04-27 | インテル・コーポレーション | マルチタイルメモリ管理 |
| US12079155B2 (en) | 2019-03-15 | 2024-09-03 | Intel Corporation | Graphics processor operation scheduling for deterministic latency |
| US12093210B2 (en) | 2019-03-15 | 2024-09-17 | Intel Corporation | Compression techniques |
| US12099461B2 (en) | 2019-03-15 | 2024-09-24 | Intel Corporation | Multi-tile memory management |
| US12124383B2 (en) | 2019-03-15 | 2024-10-22 | Intel Corporation | Systems and methods for cache optimization |
| US12013808B2 (en) | 2019-03-15 | 2024-06-18 | Intel Corporation | Multi-tile architecture for graphics operations |
| US12141094B2 (en) | 2019-03-15 | 2024-11-12 | Intel Corporation | Systolic disaggregation within a matrix accelerator architecture |
| US12153541B2 (en) | 2019-03-15 | 2024-11-26 | Intel Corporation | Cache structure and utilization |
| US12007935B2 (en) | 2019-03-15 | 2024-06-11 | Intel Corporation | Graphics processors and graphics processing units having dot product accumulate instruction for hybrid floating point format |
| US12182062B1 (en) | 2019-03-15 | 2024-12-31 | Intel Corporation | Multi-tile memory management |
| JP7513354B2 (ja) | 2019-03-15 | 2024-07-09 | インテル・コーポレーション | マルチタイルメモリ管理 |
| US12198222B2 (en) | 2019-03-15 | 2025-01-14 | Intel Corporation | Architecture for block sparse operations on a systolic array |
| US12204487B2 (en) | 2019-03-15 | 2025-01-21 | Intel Corporation | Graphics processor data access and sharing |
| US12210477B2 (en) | 2019-03-15 | 2025-01-28 | Intel Corporation | Systems and methods for improving cache efficiency and utilization |
| US12386779B2 (en) | 2019-03-15 | 2025-08-12 | Intel Corporation | Dynamic memory reconfiguration |
| US12242414B2 (en) | 2019-03-15 | 2025-03-04 | Intel Corporation | Data initialization techniques |
| US12293431B2 (en) | 2019-03-15 | 2025-05-06 | Intel Corporation | Sparse optimizations for a matrix accelerator architecture |
| US12321310B2 (en) | 2019-03-15 | 2025-06-03 | Intel Corporation | Implicit fence for write messages |
| US12361600B2 (en) | 2019-11-15 | 2025-07-15 | Intel Corporation | Systolic arithmetic on sparse data |
| US12493922B2 (en) | 2019-11-15 | 2025-12-09 | Intel Corporation | Graphics processing unit processing and caching improvements |
| JP2021082246A (ja) * | 2019-11-18 | 2021-05-27 | エスケーハイニックス株式会社SK hynix Inc. | ニューラルネットワーク処理回路を含むメモリ装置 |
| JP2024502279A (ja) * | 2020-12-29 | 2024-01-18 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | オフロードされた命令とオフロードされていない命令との間のメモリ順序付けの保持 |
| JP2025523323A (ja) * | 2023-06-02 | 2025-07-23 | グーグル エルエルシー | 大規模言語モデルへの3d-dramチップレットの適用 |
Also Published As
| Publication number | Publication date |
|---|---|
| TW201918883A (zh) | 2019-05-16 |
| KR20190017639A (ko) | 2019-02-20 |
| US20190050325A1 (en) | 2019-02-14 |
| US10545860B2 (en) | 2020-01-28 |
| KR102368970B1 (ko) | 2022-03-02 |
| TWI746878B (zh) | 2021-11-21 |
| CN109388595B (zh) | 2023-12-01 |
| CN109388595A (zh) | 2019-02-26 |
| JP6974270B2 (ja) | 2021-12-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6974270B2 (ja) | 知能型高帯域幅メモリシステム及びそのための論理ダイ | |
| CN110546654B (zh) | 通过构造接口的带宽控制来增强dnn模块的处理性能 | |
| CN110007961B (zh) | 一种基于risc-v的边缘计算硬件架构 | |
| US11461651B2 (en) | System on a chip with deep learning accelerator and random access memory | |
| US20210089871A1 (en) | Processing system and method for binary weight convolutional neural network | |
| WO2020073211A1 (zh) | 运算加速器、处理方法及相关设备 | |
| CN110147251A (zh) | 用于计算神经网络模型的架构、芯片及计算方法 | |
| CN104915322A (zh) | 一种卷积神经网络硬件加速方法及其axi总线ip核 | |
| US20210320967A1 (en) | Edge Server with Deep Learning Accelerator and Random Access Memory | |
| US20200073702A1 (en) | Method and system for performing parallel computation | |
| WO2023124428A1 (zh) | 芯片、加速卡以及电子设备、数据处理方法 | |
| CN111209243B (zh) | 数据处理装置、方法及相关产品 | |
| CN117632844A (zh) | 一种可重构ai算法硬件加速器 | |
| CN110888824A (zh) | 多级存储器层级结构 | |
| CN114492729B (zh) | 卷积神经网络处理器、实现方法、电子设备及存储介质 | |
| CN107678781A (zh) | 处理器以及用于在处理器上执行指令的方法 | |
| US11907144B1 (en) | Early semaphore update | |
| CN111813449A (zh) | 运算方法、装置及相关产品 | |
| CN116521088A (zh) | 数据处理方法、装置、设备及存储介质 | |
| CN111382856A (zh) | 数据处理装置、方法、芯片及电子设备 | |
| WO2023207295A1 (zh) | 数据处理方法、数据处理单元、系统及相关设备 | |
| CN114489496A (zh) | 基于fpga人工智能加速器的数据存储和传输方法 | |
| CN111382852A (zh) | 数据处理装置、方法、芯片及电子设备 | |
| TW202540836A (zh) | 減少記憶體中處理操作中之延時 | |
| CN111813376A (zh) | 运算方法、装置及相关产品 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210702 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210702 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210702 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210727 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211005 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211019 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211104 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6974270 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |