WO2025219918A1

WO2025219918A1 - Duplication d'un sous-élément stockable d'un premier élément stockable

Info

Publication number: WO2025219918A1
Application number: PCT/IB2025/054023
Authority: WO
Inventors: Eshcar Hillel; Moshe Twitto; Aryeh Mergi
Original assignee: Pliops Ltd
Current assignee: Pliops Ltd
Priority date: 2024-04-16
Filing date: 2025-04-16
Publication date: 2025-10-23
Anticipated expiration: 2026-10-16

Abstract

L'invention concerne un procédé d'inférence de transformeur, le procédé consistant à (a) recevoir une ou plusieurs invites ; et (b) répondre à la ou aux invites en exécutant de multiples itérations de préremplissage et de décodage. Une exécution d'une itération de préremplissage qui nécessite du contenu d'attention calculé précédemment consiste à récupérer le contenu d'attention calculé précédemment à partir d'un stockage matériel de clé-valeur qui est désagrégé d'unités de traitement graphique utilisées pour effectuer des calculs associés au transformeur pendant les multiples itérations de préremplissage et de décodage.