KR102815186B1 - 이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 - Google Patents
이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 Download PDFInfo
- Publication number
- KR102815186B1 KR102815186B1 KR1020220032933A KR20220032933A KR102815186B1 KR 102815186 B1 KR102815186 B1 KR 102815186B1 KR 1020220032933 A KR1020220032933 A KR 1020220032933A KR 20220032933 A KR20220032933 A KR 20220032933A KR 102815186 B1 KR102815186 B1 KR 102815186B1
- Authority
- KR
- South Korea
- Prior art keywords
- parameter value
- neural network
- artificial neural
- parameter
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 2는 실시예에 따른 인공 신경망 연산에서의 이력 현상을 이용한 양자화를 설명하기 위한 도면이다.
도 3은 실시예에 따른 인공 신경망 연산 장치의 블록도이다.
도 4는 실시예에 따른 인공 신경망 연산 방법의 흐름도이다.
도 5는 실시예에 따른 인공 신경망 연산 방법에 의한 학습 과정의 예시적인 흐름도이다.
도 6은 실시예에 따른 이력 현상을 이용한 파라미터 양자화 결과를 예시적으로 도시한다.
도 7은 실시예에 따른 인공 신경망 연산 방법에 의한 추론 과정의 예시적인 흐름도이다.
110: 프로세서
120: 메모리
Claims (15)
- 프로세서를 포함한 인공 신경망 연산 장치에 의해 실행되는 파라미터 양자화에 기반한 인공 신경망 연산 방법으로서,
인공 신경망의 파라미터의 제 1 양자화 파라미터 값에 기반하여 상기 파라미터의 파라미터 기울기를 결정하는 제 1 단계;
상기 파라미터 기울기 및 상기 제 1 양자화 파라미터 값과 연계된 제 1 원본 파라미터 값에 기반하여 상기 파라미터의 제 2 원본 파라미터 값을 결정하는 제 2 단계; 및
상기 제 1 양자화 파라미터 값과 상기 제 2 원본 파라미터 값의 비교 결과에 기반하여 상기 제 2 원본 파라미터 값과 연계된 제 2 양자화 파라미터 값을 결정하는 제 3 단계를 포함하되,
상기 제 1 양자화 파라미터 값 및 상기 제 2 양자화 파라미터 값은 저-정밀도(low-precision) 값이고, 상기 제 1 원본 파라미터 값 및 상기 제 2 원본 파라미터 값은 고-정밀도(high-precision) 값인, 인공 신경망 연산 방법.
- 삭제
- 제 1 항에 있어서,
상기 파라미터는 상기 인공 신경망의 가중치(weight)를 포함하는,
인공 신경망 연산 방법.
- 제 1 항에 있어서,
학습 데이터를 복수의 미니 배치(mini-batch) 데이터로 분할하는 단계; 및
상기 복수의 미니 배치 데이터의 각각에 대하여 상기 제 1 단계, 상기 제 2 단계 및 상기 제 3 단계를 실행하는 단계를 더 포함하는,
인공 신경망 연산 방법.
- 제 4 항에 있어서,
상기 복수의 미니 배치 데이터는 제 1 미니 배치 데이터 및 상기 제 1 미니 배치 데이터에 후속한 제 2 미니 배치 데이터를 포함하고,
상기 제 3 단계는,
상기 제 1 미니 배치 데이터에 대하여 상기 제 1 단계, 상기 제 2 단계 및 상기 제 3 단계를 실행함으로써 획득한 제 2 양자화 파라미터를 제 2 미니 배치 데이터에 대한 제 1 양자화 파라미터로 설정하는 단계를 더 포함하는,
인공 신경망 연산 방법.
- 제 4 항에 있어서,
상기 복수의 미니 배치 데이터는 제 1 미니 배치 데이터 및 상기 제 1 미니 배치 데이터에 후속한 제 2 미니 배치 데이터를 포함하고,
상기 제 3 단계는,
상기 제 1 미니 배치 데이터에 대하여 상기 제 1 단계 및 상기 제 2 단계를 실행함으로써 획득한 제 2 원본 파라미터 값을 제 2 미니 배치 데이터에 대한 제 1 원본 파라미터 값으로 설정하는 단계를 더 포함하는,
인공 신경망 연산 방법.
- 제 1 항에 있어서,
상기 제 3 단계는,
상기 제 2 원본 파라미터 값이 상기 제 1 양자화 파라미터 값보다 큰 경우 상기 제 2 원본 파라미터 값을 내림연산한 값을 상기 제 2 양자화 파라미터 값으로 결정하고, 상기 제 2 원본 파라미터 값이 상기 제 1 양자화 파라미터 값보다 작거나 같은 경우 상기 제 2 원본 파라미터 값을 올림연산한 값을 상기 제 2 양자화 파라미터 값으로 결정하는 단계를 포함하는,
인공 신경망 연산 방법.
- 제 1 항에 있어서,
입력 데이터에 대하여 상기 제 2 양자화 파라미터 값을 이용하여 상기 인공 신경망의 출력 값을 연산하는 단계를 더 포함하는,
인공 신경망 연산 방법.
- 파라미터 양자화에 기반한 인공 신경망 연산 장치로서,
적어도 하나의 명령어를 저장하는 메모리; 및
프로세서를 포함하고, 상기 적어도 하나의 명령어는 상기 프로세서에 의해 실행되어 상기 프로세서로 하여금,
인공 신경망의 파라미터의 제 1 양자화 파라미터 값에 기반하여 상기 파라미터의 파라미터 기울기를 결정하는 제 1 동작;
상기 파라미터 기울기 및 상기 제 1 양자화 파라미터 값과 연계된 제 1 원본 파라미터 값에 기반하여 상기 파라미터의 제 2 원본 파라미터 값을 결정하는 제 2 동작; 및
상기 제 1 양자화 파라미터 값과 상기 제 2 원본 파라미터 값의 비교 결과에 기반하여 상기 제 2 원본 파라미터 값과 연계된 제 2 양자화 파라미터 값을 결정하는 제 3 동작을 실행하도록 구성되되,
상기 제 1 양자화 파라미터 값 및 상기 제 2 양자화 파라미터 값은 저-정밀도 값이고, 상기 제 1 원본 파라미터 값 및 상기 제 2 원본 파라미터 값은 고-정밀도 값인, 인공 신경망 연산 장치.
- 삭제
- 제 9 항에 있어서,
상기 제 3 동작은,
상기 제 2 원본 파라미터 값이 상기 제 1 양자화 파라미터 값보다 큰 경우 상기 제 2 원본 파라미터를 내림연산한 값을 상기 제 2 양자화 파라미터 값으로 결정하고, 상기 제 2 원본 파라미터 값이 상기 제 1 양자화 파라미터 값보다 작거나 같은 경우 상기 제 2 원본 파라미터를 올림연산한 값을 상기 제 2 양자화 파라미터 값으로 결정하는 동작을 포함하는
인공 신경망 연산 장치.
- 제 9 항에 있어서,
상기 적어도 하나의 명령어는 상기 프로세서에 의해 실행되어 상기 프로세서로 하여금,
상기 인공 신경망의 순방향 경로상의 적어도 하나의 연결과 연계된 적어도 하나의 파라미터에 대하여 상기 제 1 동작, 상기 제 2 동작 및 상기 제 3 동작을 실행하도록 구성되는,
인공 신경망 연산 장치.
- 제 9 항에 있어서,
상기 적어도 하나의 명령어는 상기 프로세서에 의해 실행되어 상기 프로세서로 하여금,
상기 인공 신경망의 적어도 하나의 계층의 적어도 일부의 연결과 연계된 적어도 하나의 파라미터에 대하여 상기 제 1 동작, 상기 제 2 동작 및 상기 제 3 동작을 실행하도록 구성되는,
인공 신경망 연산 장치.
- 제 9 항에 있어서,
상기 적어도 하나의 명령어는 상기 프로세서에 의해 실행되어 상기 프로세서로 하여금,
입력 데이터에 대하여 상기 제 2 양자화 파라미터 값을 이용하여 상기 인공 신경망의 출력 값을 연산하도록 구성되는,
인공 신경망 연산 장치.
- 프로세서를 포함한 인공 신경망 연산 장치에 의해 제 1 항 및 제 3 항 내지 제 8 항 중 어느 한 항에 따른 인공 신경망 연산 방법을 실행하도록 구성된 적어도 하나의 명령어를 저장한 컴퓨터 판독가능한 비 일시적 기록 매체.
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020220032933A KR102815186B1 (ko) | 2022-03-16 | 2022-03-16 | 이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 |
| PCT/KR2022/010829 WO2023177025A1 (ko) | 2022-03-16 | 2022-07-22 | 이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 |
| EP22932392.8A EP4462311A4 (en) | 2022-03-16 | 2022-07-22 | METHOD AND APPARATUS FOR CALCULATING AN ARTIFICIAL NEURAL NETWORK BASED ON PARAMETER QUANTIFICATION USING HYSTERESIS |
| US18/795,315 US20240394534A1 (en) | 2022-03-16 | 2024-08-06 | Artificial neural network calculation method and device based on parameter quantization using hysteresis |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020220032933A KR102815186B1 (ko) | 2022-03-16 | 2022-03-16 | 이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20230135435A KR20230135435A (ko) | 2023-09-25 |
| KR102815186B1 true KR102815186B1 (ko) | 2025-05-30 |
Family
ID=88023590
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020220032933A Active KR102815186B1 (ko) | 2022-03-16 | 2022-03-16 | 이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US20240394534A1 (ko) |
| EP (1) | EP4462311A4 (ko) |
| KR (1) | KR102815186B1 (ko) |
| WO (1) | WO2023177025A1 (ko) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN120181158A (zh) * | 2023-12-19 | 2025-06-20 | 深圳云天励飞技术股份有限公司 | 一种模型量化方法、装置、设备及介质 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150220336A1 (en) | 2010-09-23 | 2015-08-06 | International Business Machines Corporation | Systems and methods for identifying software performance influencers |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11321609B2 (en) * | 2016-10-19 | 2022-05-03 | Samsung Electronics Co., Ltd | Method and apparatus for neural network quantization |
| JP6227813B1 (ja) * | 2017-01-25 | 2017-11-08 | 株式会社Preferred Networks | 分散深層学習装置及び分散深層学習システム |
| KR102152374B1 (ko) * | 2019-02-25 | 2020-09-07 | 주식회사 딥엑스 | 인공신경망의 비트 양자화 방법 및 시스템 |
| US11676028B2 (en) * | 2019-06-12 | 2023-06-13 | Shanghai Cambricon Information Technology Co., Ltd | Neural network quantization parameter determination method and related products |
| KR102505946B1 (ko) * | 2020-09-02 | 2023-03-08 | 네이버 주식회사 | 인공신경망 모델 학습 방법 및 시스템 |
-
2022
- 2022-03-16 KR KR1020220032933A patent/KR102815186B1/ko active Active
- 2022-07-22 EP EP22932392.8A patent/EP4462311A4/en active Pending
- 2022-07-22 WO PCT/KR2022/010829 patent/WO2023177025A1/ko not_active Ceased
-
2024
- 2024-08-06 US US18/795,315 patent/US20240394534A1/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150220336A1 (en) | 2010-09-23 | 2015-08-06 | International Business Machines Corporation | Systems and methods for identifying software performance influencers |
Also Published As
| Publication number | Publication date |
|---|---|
| EP4462311A4 (en) | 2026-01-28 |
| EP4462311A1 (en) | 2024-11-13 |
| US20240394534A1 (en) | 2024-11-28 |
| WO2023177025A1 (ko) | 2023-09-21 |
| KR20230135435A (ko) | 2023-09-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102788531B1 (ko) | 고정 소수점 뉴럴 네트워크를 생성하는 방법 및 장치 | |
| TWI791610B (zh) | 對人工神經網路及浮點神經網路進行量化的方法及裝置 | |
| KR102505946B1 (ko) | 인공신경망 모델 학습 방법 및 시스템 | |
| CN112085186A (zh) | 一种神经网络的量化参数确定方法及相关产品 | |
| KR20210032140A (ko) | 뉴럴 네트워크에 대한 프루닝을 수행하는 방법 및 장치 | |
| KR102891571B1 (ko) | 중첩된 비트 표현 기반의 뉴럴 네트워크 처리 방법 및 장치 | |
| CN111105017A (zh) | 神经网络量化方法、装置及电子设备 | |
| JP2019139338A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
| WO2019223250A1 (zh) | 一种确定剪枝阈值的方法及装置、模型剪枝方法及装置 | |
| CN111542838B (zh) | 一种卷积神经网络的量化方法、装置及电子设备 | |
| CN118886508A (zh) | 一种模型推理方法、装置、设备及介质 | |
| CN119272234A (zh) | 算子融合方法、系统、设备及介质 | |
| CN118839774A (zh) | 模型推理方法、装置、电子设备及存储介质 | |
| KR102815186B1 (ko) | 이력 현상을 이용한 파라미터 양자화 기반 인공 신경망 연산 방법 및 장치 | |
| CN115481562B (zh) | 多并行度优化方法、装置、识别方法和电子设备 | |
| KR20230123309A (ko) | 프루닝 방법 및 장치 | |
| CN118114735A (zh) | 神经网络模型的量化方法及装置、设备和介质 | |
| KR102885931B1 (ko) | 인공 신경망의 양자화 방법 및 인공 신경망을 이용한 연산 방법 | |
| KR20220166176A (ko) | 딥 뉴럴 네트워크를 양자화하는 방법 및 장치 | |
| CN113408704A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
| JPWO2018135516A1 (ja) | ニューラルネットワーク学習装置、ニューラルネットワーク学習方法、及び、ニューラルネットワーク学習プログラム | |
| KR20200135059A (ko) | 데이터를 처리하는 방법 및 장치 | |
| CN120218259A (zh) | 量子计算方法、装置、设备、存储介质及程序产品 | |
| KR20200139071A (ko) | 뉴럴 네트워크에서 파라미터를 양자화하는 방법 및 장치 | |
| CN115293330A (zh) | 神经网络权重的量化方法、装置、系统及可读存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-2-2-P10-P22-nap-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18 | Changes to party contact information recorded |
Free format text: ST27 STATUS EVENT CODE: A-5-5-R10-R18-OTH-X000 (AS PROVIDED BY THE NATIONAL OFFICE) |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |