[go: up one dir, main page]

JP2008140380A - プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法) - Google Patents

プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法) Download PDF

Info

Publication number
JP2008140380A
JP2008140380A JP2007281412A JP2007281412A JP2008140380A JP 2008140380 A JP2008140380 A JP 2008140380A JP 2007281412 A JP2007281412 A JP 2007281412A JP 2007281412 A JP2007281412 A JP 2007281412A JP 2008140380 A JP2008140380 A JP 2008140380A
Authority
JP
Japan
Prior art keywords
processor
performance
weighted
event
events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007281412A
Other languages
English (en)
Other versions
JP5186178B2 (ja
Inventor
C Rubio Juan
ジュアン・カルロス・ルビオ
Stephen Floyd Michael
マイケル・ステファン・フロイド
Ghiasi Soraya
ソラヤ・ギアシ
Karthick Rajamani
カルシック・ラジャマニ
W Keller Thomas Jr
トーマス・ウォルター・ケラー・ジュニア
Leigh Rawson Freeman Iii
フリーマン・レイ・ローソン・サード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008140380A publication Critical patent/JP2008140380A/ja
Application granted granted Critical
Publication of JP5186178B2 publication Critical patent/JP5186178B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/348Circuit details, i.e. tracer hardware
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/88Monitoring involving counting

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Abstract

【課題】短い待ち時間と、低い誤り性能測定能力とを提供する。
【解決手段】プロセッサの性能を測定するための重み付けされたイベント計数システムおよび方法において、重み付け性能カウンタ(WPC)は、プロセッサ内の機能部から与えられる複数のイベント信号に従って性能カウントを累積する。各イベントとプロセッサ性能との相関に従って、互いに異なる重みがイベント信号に印加される。重みは、プログラム制御で調整可能なように、プログラム可能なレジスタから与えられてもよい。イベント信号を合成して、互いに排他的なイベントは組み合わせ結果の単一のフィールドにマージさせ、同一の重みを有するイベントは小計に従ってマージさせて、イベント信号のセットのビット幅を減少させてもよい。重みは、組み合わせ結果に印加され、性能カウントを更新するために使用される。その後、性能カウントを、プロセッサの動作パラメータの調整のために、電源管理ソフトウェアまたはハードウェアが使用することができる。
【選択図】図1

Description

本発明は、一般的には、プロセッサ性能計測システムに関し、より特定的には、待ち時間および誤りが低い性能計数システムに関する。
処理部の性能計測は、典型的には、プロセッサ内の部品の使用についての情報を累積するカウンタのセットによって行われる。そのような使用情報を得ることによって、高度な電力管理アルゴリズムが、プロセッサ周波数および電圧、アイドル時間、または他のエネルギ使用制御機構などの動作条件を調整して、電力消費または損失を減少させることができる一方で、理想的には、処理性能に対する影響を最小限にすることができる。
高精度の性能評価システムが複雑な多項式による計量に基づいて提案されているが、数多くの並行イベントを計測する必要がある。性能計測に寄与するイベントが、上述のような処理部の個別の使用である場合には、使用を計測しているカウンタが各部に提供される。そのような実施においては、数十の処理部、キャッシュ部、およびプロセッサの性能全体に寄与する他の部を有する複数のパイプラインを有することもある現代のプロセッサにおいて性能を計測するには、数多くのカウンタが必要となる。しかしながら、既存の性能計測の実施は、典型的には、計量が行われるごとに別個のカウンタが必要となり、典型的には、数多くのイベントを並行して処理することができない。したがって、そのような性能計測の実施では、電力管理制御がプロセッサの動作パラメータを変更する場合に、性能変化の正確な予測を提供することができなくなる。
計量毎に使用カウンタを提供する上述の手法に対する一代替策は、少ないセットのカウンタ(または単一のカウンタ)を時間多重して個別の計測を行うことである。しかしながら、そのような手法の総待ち時間は、きめの細かい制御を要するエネルギ管理システムにとって大きすぎる。さらに、内部計量による計測遅延によって、計測値に誤りが生じる。個別のカウンタを使用する場合であっても、典型的には、これらのカウンタを同時にアクセスすることはなく、これによっても、内部計量による遅延誤りおよび待ち時間の両方が生じる。
したがって、誤りおよび待ち時間の少ない使用情報を提供する性能計数方法およびシステムを提供することが望ましい。さらに、性能計測に寄与する計量毎にカウンタを必要としないシステムおよび方法を提供することが望ましい。
計量毎にカウンタを必要としない、待ち時間および誤りの少ない性能計測を提供するという目的は、重み付けされた性能カウンタ回路および方法において達成され、これらはプロセッサ内に内蔵されていてもよい。
重み付けされた性能カウンタは、プロセッサ内の複数の機能部において生じるイベントを示す複数のイベント信号を受信する。信号は、イベントとプロセッサの性能との相関性に従って重み付けされ、結果生じた重み付けされたイベント値が性能カウンタによって累積される。カウントは、プロセッサのクロック周期毎に累積されてもよい。重みは、プログラム制御下で調整可能なように、プログラム可能なレジスタから提供されてもよいし、または、回路内で提供される固定値であってもよい。
組み合わせ論理が、同一の重みを有するイベントを小計フィールドに累積して、複数のイベント信号を結合してもよい。互いに排他的なイベントは、組み合わせ結果内の単一のフィールドにマージされてもよい。
結果生じた重み付けされた性能カウントは、性能を最大限にするためにプロセッサの動作パラメータを調整し、電力消費を推測し、または電力消費の変化を予想するために、システム管理ソフトウェアまたはハードウェアもしくはその両方によって使用されてもよい。
本発明の上記および他の目的、特徴、および利点は、添付の図面に示すように、以下の特に本発明の好ましい実施形態の説明から明らかだろう。
本発明の特徴と思われる新規の特徴を添付の請求項に記載する。しかしながら、本発明自体は、その好ましい使用態様、目的および利点と共に、例示の実施形態についての以下の詳細な説明を参照して添付の図面と共に読むと、最もよく理解されるだろう。図面において、同様の参照番号は、同様の構成要素を示す。
本発明は、単一の性能カウンタを使用して複数のイベント型のイベントを同時に計測することによって、少ない性能測定誤りおよび待ち時間を提供する、性能計測のための回路および方法に関する。各イベント型のシステムまたはプロセッサ性能に対する相関を正確に反映するために、イベントは、計測する前に重み付けされる。すなわち、これに基づいて、単一のプロセッサ周期または各イベントが計測される他の期間でイベントが計測される。カウンタが増分される値は、各イベント型の数およびイベント型それ自体の両方によって異なる。例えば、L1キャッシュ・ミスは、L2キャッシュ・ミスとは異なる性能ペナルティを示すので、性能カウントが異なる変化を表すように、互いに異なるように重み付けがなされることになる。イベントの総レートは、一般的には、性能に対して単調である。しかしながら、完了した命令などの他のイベントに比例したキャッシュ・ミスなどというあるイベントの増加は、性能の低下を示す。
プロセッサまたは他の装置/システムの性能は、別個の計測を使用して、性能との相関に従ってイベントを調節することによって、プロセッサ内の未処理の各性能依存型のイベントのカウントを結合するという、複雑な多項式による計量から判断できる。しかしながら、上述のように、そのようなイベント計測は、数多くのカウンタを必要とし、または、全体としての測定待ち時間と内部イベント・カウント遅延誤りとを生じさせる多重手法を必要とする。したがって、本発明の重み付けされた性能カウンタによってサポートされる複雑な多項式による計量は、回路領域と監視のために必要な電力との削減と、多重化手法に対する測定待ち時間と誤りとの削減と伴う、互いに異なるイベントについての性能カウントに対して異なる効果を提供することによって、改良された性能モデルを提供する。そして、結果生じた性能情報は、米国特許出願第11/538131号である「METHOD AND SYSTEM FOR IMPROVING PROCESSING PERFORMANCE BY USING ACTIVITY FACTOR HEADROOM」に記載されているような電力管理制御システムに対する入力として印加できる。
今度は図面を参照して、特に図1を参照すると、本発明の一実施形態に係る、プロセッサを内蔵するシステムのブロック図が示されている。本システムは、プロセッサ・グループ8を含み、スーパー・スカラ・プロセッサを形成するブリッジ17を介して他のプロセッサ・グループに結合されていてもよい。プロセッサ・グループ8は、システム・ローカル・メモリ19と、2つのサービス・プロセッサ6Aおよび6Bと共に様々な周辺機器15に接続される。サービス・プロセッサ6Aおよび6Bは、故障の監視、支援、およびテスト機能をプロセッサ・グループ8に対して提供し、すべてのプロセッサ12A〜12Dを接続すると共に他のプロセッサ・グループへの自身の相互接続パスを有してもよい。さらに、サービス・プロセッサ6Aおよび6Bのうちの1つまたは両方は、性能および電力測定/管理を行ってもよく、そのような制御を、本発明の一実施形態に係る1つ以上の重み付けされた性能カウンタから読み出された性能カウントと整合するように行ってもよい。
プロセッサ・グループ8の内部には、複数のプロセッサ12A〜12Dがあり、それぞれ、通常、単一の部で製造され、L2キャッシュ14およびメモリ・コントローラ16とに結合された複数のプロセッサ・コア10Aおよび10Bを含む。プロセッサ・コア10Aおよび10Bは、汎用処理機能に関するデータ値に対する命令実行および動作を提供する。別個のL3キャッシュ18A〜18Dが、各プロセッサ12A〜12Dに提供される。ブリッジ17は、システム内の他のブリッジとともに、他の処理グループを伴う広いバス上の通信を提供し、バス11は、プロセッサ12A〜12Dと、ブリッジ17と、周辺機器15と、L3キャッシュ18A〜18Dと、システム・ローカル・メモリ19の接続を提供する。他のグローバル・システム・メモリをブリッジ17の外部に結合して、すべてのプロセッサ・グループによる対称的なアクセスを行ってもよい。
図2を参照すると、プロセッサ・コア10Aおよび10Bと同一の特徴を有するプロセッサ・コア10の詳細が示されている。バス・インターフェース部33は、プロセッサ・コア10を他のプロセッサおよび周辺機器に接続し、データ値を記憶するためのL1 Dキャッシュ32と、プログラム命令を記憶するためのL1 Iキャッシュ30と、キャッシュ・インターフェース部31とを外部メモリ、プロセッサ、および他の装置に接続する。L1 Iキャッシュ30は、命令フェッチ部IFU26と共に命令ストリームのロードを提供する。命令フェッチ部IFU26は、命令を予め取り出すものであり、見込みロードおよび分岐予測機能を含んでもよい。命令シーケンサ部(ISU)22は、一般的な演算を実行するための固定点部(FXU)24および浮動点演算を実行するための浮動点部(FPU)25などの様々な内部部品に対して発行される命令のシーケンシングを制御する。グローバル完了テーブル(GCT)23は、ISU22によって発行された命令を、命令によって対象となった特定の実行部が命令実行完了を示すまで追跡する。
固定点部24および浮動点部25は、汎用レジスタ(GPR)28A、浮動点レジスタ(FPR)28B、条件レジスタ(CR)28C、再命名バッファ28D、カウント・レジスタ/リンク・レジスタ(CTR/LR)28E、および例外レジスタ(XER)28Fなどの様々なリソースに結合される。GPR28AおよびFPR28Bは、ロード記憶部(LSU)29によってL1 Dキャッシュ22からロードおよび記憶されたデータ値に対してデータ値の記憶を提供する。CR28Cは、条件分岐情報を記憶し、再命名バッファ28D(様々な内部実行部に関連したいくつかの再命名部を備えてもよい)は、実行部にとってのオペランドおよび結果の記憶を提供する。XER28Fは、分岐と固定点例外情報とを記憶し、CTR/LR28Eは、分岐リンク情報とプログラム分岐実行のためのカウント情報とを記憶する。制御論理21は、プロセッサ・コア10内の様々な実行部およびリソースに結合されて、実行部およびリソースの広範な制御を行うために使用される。SCOM/XSCOMインターフェース部35は、外部サービス・プロセッサ34Aおよび34Bに対する接続を提供する。
また、プロセッサ・コア10は、通常の性能カウンタ(PCs)37と、本発明の一実施形態に係る重み付け性能カウンタ(WPC)40Aおよび40Bとのセットによって提供される性能カウント値を収集する性能監視部(PMU)36を含む。性能カウンタ37を使用して、重み付け性能カウンタ40Aおよび40Bによってカウントされない追加のイベントをカウントする。多項式の性能計量は、性能監視部36によって計算することができる。または、性能監視部36は、性能カウンタ37および重み付け性能カウンタ40Aおよび40Bから、図1の処理システム内の1つ以上のプロセッサ12A〜12D内で実行するハイパーバイザーなどの外部ソフトウェアへ、またはサービス・プロセッサ6Aまたは6Bによって実行されるサービス・プロセッサ・プログラムへのカウント値の表示を提供することができる。また、性能測定部36、性能カウンタ37、重み付け性能カウンタ40A,40Bは、プロセッサ・コア10の外部に位置していてもよい。例えば、図1のプロセッサ12A〜12Dは、各コア10Aおよび10Bからイベント信号が提供される性能測定部と、メモリ・コントローラ16と、L2キャッシュ14とをそれぞれ含んでもよい。
性能カウンタ37および重み付けされた性能カウンタ40Aおよび40Bは、プロセッサ・コア10内部での様々なイベントの発生を信号で知らせる入力を受信する。実施形態例において、重み付け性能カウンタ40Aは、ISU22、IFU26、FPU25、およびキャッシュ・インターフェース部31などの様々な機能処理ブロックからイベントを受信する。重み付け性能カウンタ40Bは、イベントバス入力をLSU29から受信する。性能カウンタ37は、一般的には、プロセッサ周期数に対するイベント・カウントすべて評価を行うことができるように、プロセッサ周期をカウントするカウンタを含む。イベント監視手法例は、二重カウンタ重み付けイベント計数手法を例示しており、メモリ待ち時間に依存するイベントは、重み付け性能カウンタ40Bによって計数される一方で、重み付け性能カウンタ40Aは、プロセッサのクロック周波数に依存するイベントをカウントする。主な電力管理手法は、プロセッサのクロック周波数および電圧を調整し、メモリ待ち時間は変更しないので、プロセッサのクロック周期のメモリ待ち時間は、プロセッサのクロック周波数が変更されると変化する。メモリ待ち時間に依存するイベントと、プロセッサのクロック周波数に依存するイベントとについての別個の重み付けされた性能カウンタ40Aおよび40Bを使用することによって、2つの互いに異なる型のイベント上のプロセッサ周波数変化の影響を独立して評価するための機構を提供する。実施形態例は、プロセッサ周期数と、完了命令数と、メモリ階層の各レベルのミス・レートを追跡する。結果生じたカウントから、プロセッサの周波数に依存するメモリ待ち時間が識別でき、プロセッサ周波数に対する性能の推定値が、毎秒の命令または他の性能指数として判断される。そして、電力管理アルゴリズムは、周波数の結果に対する推定性能を使用して、電力管理に関する決定をその場で行うことができる。
図示の実施形態において、性能監視部36は、バス・インターフェース部33およびSCOMインターフェース35に結合される出力を有し、重み付け性能カウンタ40Aおよび40Bならびに性能カウンタ37から結果生じた性能測定値を、サービス・プロセッサ6Aおよび6Bのうちの1つまたはバス11に結合された他のプロセッサによって読み出すことができる。代わりに、プログラム読み出し可能なレジスタを性能監視部36から提供してもよい。重み付け性能カウンタ40Aおよび40Bは、バス・インターフェース部33およびSCOMインターフェース35のうちの1つまたは両方にオプションとしてさらに結合される入力を有し、各イベント型の性能カウントに対する寄与を判断するのに使用される重みは、プログラム制御によって調整されてもよい。調整は、性能監視によって提供される現行の結果の判断に基づいて動的に行われてもよいし、実行中の作業負荷の型の決定と適合するように設定されてもよいし、または、性能推定において使用される固定値のさらなる改良のために提供されてもよい。
今度は図3を参照すると、本発明の一実施形態にかかる重み付け性能カウンタ40の詳細であって、図2の性能カウンタ40Aおよび40Bを実施するために使用されてもよいものが図示されている。組み合わせ論理部42は、プロセッサ10内の機能部から受信されたイベント信号のセット、または性能を測定中の回路またはシステムの型に従った他のイベント信号を組み合わせる。結果生じた出力数値は、イベントを組み合わせ、これは、イベント毎にフィールドを含むバイナリ数値であってもよく、または以下に詳細に述べるように、出力値のビット幅を減少させるフィールドを含んでもよい。組み合わされたイベント結果は、重みのセット{W0’,W1’...WN’}を加算器46の入力に選択的に印加するセレクタ45の制御入力に与えられる。加算器46は、性能カウント・ラッチ47の現在の値と共に組み合わされた重みを加算する。例えば、イベント0が所定のプロセッサ周期で生じ、イベント1が生じない場合に、重みW0がカウントに加算されるが、W1は加算されない。加算器46は、各重み重み{W0’,W1’...WN’}を性能カウント・ラッチ47の現在の値に加算するのに充分な幅の充分な入力を有し、セレクタ45は、組み合わせ回路部42の組み合わせ出力によって与えられる制御信号に従って、ゼロ値入力と各重み入力{W0’,W1’...WN’。}との間で選択をおこなう
重み{W0’,W1’...WN’}は、重みマッピング器44によって決定される。重みマッピング器44は、上述のようなプログラム制御によって設定されてもよいような重みレジスタ43のセットにプログラムされた値を調節する。性能計測手法の分析を保存するために、イベント毎のカウントに加算される値は、重みの差が性能とイベントの発生との間の相関の差分を真に表すように、調整されなければならない。例えば、イベント重みが1という値に設定され、他のイベントが1.5という相対性能相関を有した場合、他のイベントについての相対重みは、固定点加算によっては正確に表現することができなかったはずである。したがって、重みの範囲{W0’,W1’...WN’}は、性能に対するイベントの相対相関の細かい差を表現するのに充分なほど大きくあるべきである。しかしながら、0〜3(2ビット)のような小さな重みの範囲であっても、少ない数のイベントをカウントするシステムに対して誤りの減少を提供し、ここにおいて、イベントは、一様にカウントされるか、多項式による性能計量への個々の寄与を同一に収集しないように、多重化されたやり方でカウントされる。
組み合わせ論理(ユニット)42は、出力選択信号のビット幅を減少させてもよいので、セレクタ45の複雑性およびサイズ、ならびに重み付け性能カウンタ40を実施するのに必要な重み数をも減少させる。減少は、同一の重みを有する互いに排他的なイベントによって提供される。同一の重みで互いに排他的なイベント入力は、論理和演算によって組み合わせることができる。なぜならば、当該イベントのセットから結果生じる重みは、常にゼロか、または単一の重み値となるからである。出力選択信号のビット幅が減少するような他のやり方は、互いに排他的ではない同一の重みのイベントを加算して、同一の重みのイベントに対応するフィールドがイベント数を表す2進数であるようにすることである。この型のフィールドについて、セレクタ45は、重み値の選択を受信して、重み値と単一のフィールドにおいて組み合わせられている同一の重みのイベント数との積を表す数を加算器46に与えるのに充分な重み値を決定する。
本発明をその好ましい実施形態を参照して特に図示および説明してきたが、形式および詳細についての上記および他の変更を本発明の精神および範囲から逸脱することなく行ってもよいことは、当業者によって理解されるだろう。
本発明の一実施形態に係るプロセッサを内蔵する処理システムのブロック図である。 本発明の一実施形態に係るプロセッサ・コアのブロック図である。 本発明の一実施形態に係る重み付けされた性能カウンタの回路図である。
符号の説明
6A サービス・プロセッサA
6B サービス・プロセッサB
8 プロセッサ・グループ
10A,10B コア
12A,12B,12C,12D プロセッサ
14 L2キャッシュ
15 周辺機器
16 メモリ・コントローラ
17 ブリッジ
18A,18B,18C,18D L3キャッシュ
19 システム・ローカル・メモリ
20A,20B,40A,40B WPC(重み付け性能カウンタ)

Claims (20)

  1. プロセッサの性能レベルを判断する方法であって、
    前記プロセッサ内の互いに異なるイベントに対応する前記プロセッサ内の機能部から、複数のイベント信号を受信するステップと、
    前記複数のイベント信号の総計と適合するように、性能カウンタを更新するステップであって、互いに異なる重みを、前記複数のイベント信号のうちの少なくとも2つに割り当てて、前記イベントに対応する性能計量の収集間の待ち時間が減少し、前記イベントは、前記プロセッサの性能に対する相関に従ってさらに別個に重み付けされる、前記更新するステップと、
    前記性能カウンタを周期的な間隔で読み出して、性能カウントを取得するステップと
    を含む、方法。
  2. 前記受信および更新ステップは、前記プロセッサの各クロック周期におこなわれる、請求項1に記載の方法。
  3. 前記プロセッサに入力される値と適合するように前記重みを調整するステップをさらに含む、請求項1に記載の方法。
  4. 前記複数の受信イベント信号を符号化して、組み合わせ値を提供するステップと、
    前記重みを前記組み合わせ値に印加して更新値を提供するステップであって、前記更新ステップは、前記更新値を前記性能カウントの現在の値に加算して次の性能カウントを取得する、ステップと
    をさらに含む、請求項1に記載の方法。
  5. 前記符号化は、前記重みのうちの等しいものに対応する前記イベントをマージする、請求項4に記載の方法。
  6. 前記符号化は、前記組み合わせ値のフィールド内のコードに従って、互いに排他的なイベントを符号化する、請求項4に記載の方法。
  7. 前記性能カウントと適合するように、前記プロセッサについての電力管理数値を決定するステップと、
    前記決定の結果と適合するように、前記プロセッサの動作パラメータを調整するステップと
    をさらに含む、請求項1に記載の方法。
  8. プロセッサ内の複数のイベントの発生を示すための複数のイベント信号のうちの少なくとも1つの出力イベント信号をそれぞれ有する複数の機能部と、
    前記複数のイベント信号を受信して、前記複数のイベント信号の状態に従って性能カウントを更新するための重み付け性能カウンタとを備え、前記複数のイベントのうちの少なくとも2つに従った前記性能カウントの変更は、互いに異なるように重み付けされる、プロセッサ。
  9. 前記重み付け性能カウンタは、
    前記複数のイベント信号を受信して、前記複数のイベントのうち前記プロセッサの現在の周期で生じたものを表す組み合わせ値を提供するための組み合わせ論理と、
    互いに異なる重みを前記プロセッサの前記現在の周期で生じた前記重みに適合させるための重み付け論理と、
    前記性能カウントを提供するために前記重み付け論理の出力を累積するための加算/累算器とを備える、請求項8に記載のプロセッサ。
  10. 前記重み付け論理は、前記互いに異なる重みがプログラム制御下で変更されてもよいプログラム可能なレジスタを備える、請求項9に記載のプロセッサ。
  11. 前記組み合わせ論理は、前記重みのうちの等しいものに対応するイベント信号をマージする、請求項9に記載のプロセッサ。
  12. 前記組み合わせ論理は、前記組み合わせ値のフィールドにおける前記イベント信号のうちで互いに排他的なものを符号化する、請求項9に記載のプロセッサ。
  13. 前記重み付け性能カウンタに応答して電力管理制御部をさらに備え、これによって、前記プロセッサの動作パラメータが、前記性能カウントに適合するように調整される、請求項8に記載のプロセッサ。
  14. 前記プロセッサは、前記重み付け性能カウンタを読み出し、かつ前記性能カウントに適合するように前記プロセッサの動作パラメータを調整するパラメータ命令を実行する、請求項8に記載のプロセッサ。
  15. 前記重み付け性能カウンタは、前記プロセッサのクロック周期毎に更新される、請求項8に記載のプロセッサ。
  16. 複数の機能部と、
    前記複数の機能部で生じたイベントに従って、さらに前記イベントのうちの少なくとも2つの互いに異なるものに適用する互いに異なる重みに従って、性能計量値を更新するための手段と
    を備える、プロセッサ。
  17. 前記機能部から提供されたイベント信号全体に対応するデータのビット幅を減少させるための手段をさらに備える、請求項16に記載のプロセッサ。
  18. 更新のための前記手段は、前記プロセッサのクロック周期毎の前記性能計量値を更新する、請求項16に記載のプロセッサ。
  19. 重み付けされた性能カウンタ回路であって、
    計測中の性能計量値に対する互いに異なる効果を有するイベントに対応するイベント信号を受信するための複数のイベント入力と、
    前記イベント信号の状態の組み合わせに対応する組み合わせ値を生成するための前記イベント入力に結合される状態符号化器と、
    前記組み合わせ値に従った複数の互いに異なる重みを印加して、重み付けされた総合性能結果を提供するための重み付け論理と、
    規則的な間隔で前記重み付けされた総合性能結果を累積するための加算器/累積器とを備え、これによって、重み付けされた性能カウントが保持される、重み付け性能カウンタ回路。
  20. 前記複数の互いに異なる重みを記憶するためのプログラム可能な重みレジスタをさらに備え、前記プログラム可能な重みレジスタは、プログラム制御に応答して、前記互いに異なる重みを調整するための入力を有する、請求項19に記載の重み付け性能カウンタ回路。
JP2007281412A 2006-11-30 2007-10-30 プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法) Expired - Fee Related JP5186178B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/565,106 US7340378B1 (en) 2006-11-30 2006-11-30 Weighted event counting system and method for processor performance measurements
US11/565106 2006-11-30

Publications (2)

Publication Number Publication Date
JP2008140380A true JP2008140380A (ja) 2008-06-19
JP5186178B2 JP5186178B2 (ja) 2013-04-17

Family

ID=39125518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007281412A Expired - Fee Related JP5186178B2 (ja) 2006-11-30 2007-10-30 プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法)

Country Status (3)

Country Link
US (2) US7340378B1 (ja)
JP (1) JP5186178B2 (ja)
CN (1) CN101192188B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244393A (ja) * 2009-04-08 2010-10-28 Renesas Electronics Corp パフォーマンス評価装置、及びパフォーマンス評価方法
US9026822B2 (en) 2011-07-19 2015-05-05 Fujitsu Limited Dynamically adjusting operating frequency of a arithemetic processing device for predetermined applications based on power consumption of the memory in real time
JP2017102790A (ja) * 2015-12-03 2017-06-08 富士通株式会社 情報処理装置、演算処理装置および情報処理装置の制御方法
US11182297B1 (en) 2020-09-22 2021-11-23 Coupang Corp. Electronic apparatus and information providing method using the same

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519797B1 (en) * 2006-11-02 2009-04-14 Nividia Corporation Hierarchical multi-precision pipeline counters
US8117478B2 (en) 2006-12-29 2012-02-14 Intel Corporation Optimizing power usage by processor cores based on architectural events
US7908493B2 (en) * 2007-06-06 2011-03-15 International Business Machines Corporation Unified management of power, performance, and thermals in computer systems
JP5151685B2 (ja) * 2008-05-23 2013-02-27 富士通株式会社 半導体回路設計支援プログラム
GB2476606B (en) 2008-09-08 2012-08-08 Virginia Tech Intell Prop Systems, devices, and methods for managing energy usage
US8055477B2 (en) * 2008-11-20 2011-11-08 International Business Machines Corporation Identifying deterministic performance boost capability of a computer system
US8261112B2 (en) * 2008-12-08 2012-09-04 International Business Machines Corporation Optimizing power consumption by tracking how program runtime performance metrics respond to changes in operating frequency
GB2473196B (en) * 2009-09-02 2012-01-04 1E Ltd Monitoring the performance of and controlling a computer
US9003206B2 (en) * 2009-12-23 2015-04-07 Bae Systems Information And Electronic Systems Integration Inc. Managing communication and control of power components
US8463456B2 (en) * 2010-03-18 2013-06-11 International Business Machines Corporation Minimizing aggregate cooling and leakage power
WO2012001779A1 (ja) 2010-06-30 2012-01-05 富士通株式会社 情報処理装置の使用量解析方法、情報処理システム及びそのプログラム
US10169187B2 (en) * 2010-08-18 2019-01-01 International Business Machines Corporation Processor core having a saturating event counter for making performance measurements
US9767258B2 (en) 2010-09-27 2017-09-19 Purdue Research Foundation System and method of extending the linear dynamic range of event counting
US8595472B2 (en) 2010-11-22 2013-11-26 International Business Machines Corporation Ganged hardware counters for coordinated rollover and reset operations
US8635483B2 (en) 2011-04-05 2014-01-21 International Business Machines Corporation Dynamically tune power proxy architectures
US9141159B2 (en) 2011-11-03 2015-09-22 International Business Machines Corporation Minimizing aggregate cooling and leakage power with fast convergence
US9329670B2 (en) 2012-06-05 2016-05-03 International Business Machines Corporation Predicting energy savings
KR101991687B1 (ko) * 2012-11-23 2019-06-24 삼성전자 주식회사 동적 라이브러리 프로파일링 방법, 이를 기록한 컴퓨터로 읽을 수 있는 기록 매체 및 동적 라이브러리 프로파일링 시스템
US9424159B2 (en) 2013-10-10 2016-08-23 International Business Machines Corporation Performance measurement of hardware accelerators
US9645626B2 (en) * 2014-11-12 2017-05-09 Qualcomm Incorporated Circuits and methods providing supply voltage control based on transient load prediction
JP6646201B2 (ja) 2015-07-27 2020-02-14 富士通株式会社 情報処理装置、電力推定プログラム及び電力推定方法
CN105487958B (zh) * 2015-11-24 2018-04-10 无锡江南计算技术研究所 处理器内部行为监测方法
JP2017167930A (ja) * 2016-03-17 2017-09-21 富士通株式会社 情報処理装置、電力測定方法及び電力測定プログラム
US11023025B2 (en) * 2016-11-16 2021-06-01 Cypress Semiconductor Corporation Microcontroller energy profiler
US10140574B2 (en) * 2016-12-31 2018-11-27 Via Alliance Semiconductor Co., Ltd Neural network unit with segmentable array width rotator and re-shapeable weight memory to match segment width to provide common weights to multiple rotator segments
CN111209155B (zh) * 2018-11-21 2022-09-23 华夏芯(北京)通用处理器技术有限公司 一种便于扩展和配置的性能检测方法
US10948957B1 (en) * 2019-09-26 2021-03-16 Apple Inc. Adaptive on-chip digital power estimator
US12008398B2 (en) * 2019-12-28 2024-06-11 Intel Corporation Performance monitoring in heterogeneous systems
US11303551B2 (en) 2020-07-10 2022-04-12 Zte Corporation Network error performance measurement
CN117083599A (zh) * 2021-03-25 2023-11-17 英特尔公司 硬件辅助的存储器访问跟踪
US20220398067A1 (en) * 2021-06-10 2022-12-15 Taiwan Semiconductor Manufacturing Company, Ltd. Multiply-accumlate device
US11698671B2 (en) * 2021-09-22 2023-07-11 Apple Inc. Peak power management for processing units
US12035505B2 (en) * 2021-10-18 2024-07-09 Hewlett Packard Enterprise Development Lp System and method for compute system cooling fan control
CN116089183B (zh) * 2022-11-28 2024-07-23 格兰菲智能科技股份有限公司 图形处理器性能测试方法、装置、计算机设备、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11212830A (ja) * 1998-01-29 1999-08-06 Fujitsu Ltd プロセッサ性能測定装置
JP2000222254A (ja) * 1999-01-27 2000-08-11 Sun Microsyst Inc 性能評価のためのヒストグラム計数を行うシステムと方法
JP2002342125A (ja) * 2001-05-18 2002-11-29 Fujitsu Ltd イベント計測装置および方法並びにイベント計測プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体並びにプロセッサシステム
JP2005141466A (ja) * 2003-11-06 2005-06-02 Nomura Research Institute Ltd コンピュータの監視装置および監視対象のコンピュータに関するメッセージの処理方法
JP2005527875A (ja) * 2001-09-28 2005-09-15 インテル コーポレイション 処理の性能を監視する方法及び装置
JP2006155064A (ja) * 2004-11-26 2006-06-15 Ricoh Co Ltd 情報処理装置及び同装置に用いるプログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2005092A (en) * 1935-06-18 Bottle dispensing device
US5657253A (en) 1992-05-15 1997-08-12 Intel Corporation Apparatus for monitoring the performance of a microprocessor
US6539336B1 (en) * 1996-12-12 2003-03-25 Phatrat Technologies, Inc. Sport monitoring system for determining airtime, speed, power absorbed and other factors such as drop distance
US5557548A (en) 1994-12-09 1996-09-17 International Business Machines Corporation Method and system for performance monitoring within a data processing system
US5796637A (en) 1996-09-06 1998-08-18 Intel Corporation Apparatus and method for filtering event signals
US6112318A (en) 1997-08-11 2000-08-29 Digital Equipment Corporation Performance counters controlled by programmable logic
US6233531B1 (en) 1997-12-19 2001-05-15 Advanced Micro Devices, Inc. Apparatus and method for monitoring the performance of a microprocessor
US6275782B1 (en) 1998-05-05 2001-08-14 Advanced Micro Devices, Inc. Non-intrusive performance monitoring
US6460107B1 (en) 1999-04-29 2002-10-01 Intel Corporation Integrated real-time performance monitoring facility
US6546359B1 (en) 2000-04-24 2003-04-08 Sun Microsystems, Inc. Method and apparatus for multiplexing hardware performance indicators
US6792392B1 (en) 2000-06-30 2004-09-14 Intel Corporation Method and apparatus for configuring and collecting performance counter data
US6718403B2 (en) 2000-12-11 2004-04-06 International Business Machines Corporation Hierarchical selection of direct and indirect counting events in a performance monitor unit
US6676777B2 (en) 2001-03-02 2004-01-13 National Institute For Materials Science Postweld heat treatment process of carbon steel and low alloy steel
US7657893B2 (en) 2003-04-23 2010-02-02 International Business Machines Corporation Accounting method and logic for determining per-thread processor resource utilization in a simultaneous multi-threaded (SMT) processor
US7475301B2 (en) 2003-05-09 2009-01-06 Hewlett-Packard Development Company, L.P. Increment/decrement circuit for performance counter
US7424397B2 (en) 2003-05-09 2008-09-09 Hewlett-Packard Development Company, L.P. General purpose performance counter
US7272754B2 (en) 2003-09-27 2007-09-18 International Business Machines Corporation Implementation-efficient multiple-counter value hardware performance counter
US7392370B2 (en) 2004-01-14 2008-06-24 International Business Machines Corporation Method and apparatus for autonomically initiating measurement of secondary metrics based on hardware counter values for primary metrics
US20050177344A1 (en) 2004-02-09 2005-08-11 Newisys, Inc. A Delaware Corporation Histogram performance counters for use in transaction latency analysis
US20050183065A1 (en) 2004-02-13 2005-08-18 Wolczko Mario I. Performance counters in a multi-threaded processor
US7676530B2 (en) 2004-06-03 2010-03-09 Hewlett-Packard Development Company, L.P. Duration minimum and maximum circuit for performance counter
US7594128B2 (en) * 2004-08-04 2009-09-22 Hewlett-Packard Development Company, L.P. Systems and methods to determine processor utilization

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11212830A (ja) * 1998-01-29 1999-08-06 Fujitsu Ltd プロセッサ性能測定装置
JP2000222254A (ja) * 1999-01-27 2000-08-11 Sun Microsyst Inc 性能評価のためのヒストグラム計数を行うシステムと方法
JP2002342125A (ja) * 2001-05-18 2002-11-29 Fujitsu Ltd イベント計測装置および方法並びにイベント計測プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体並びにプロセッサシステム
JP2005527875A (ja) * 2001-09-28 2005-09-15 インテル コーポレイション 処理の性能を監視する方法及び装置
JP2005141466A (ja) * 2003-11-06 2005-06-02 Nomura Research Institute Ltd コンピュータの監視装置および監視対象のコンピュータに関するメッセージの処理方法
JP2006155064A (ja) * 2004-11-26 2006-06-15 Ricoh Co Ltd 情報処理装置及び同装置に用いるプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244393A (ja) * 2009-04-08 2010-10-28 Renesas Electronics Corp パフォーマンス評価装置、及びパフォーマンス評価方法
US9026822B2 (en) 2011-07-19 2015-05-05 Fujitsu Limited Dynamically adjusting operating frequency of a arithemetic processing device for predetermined applications based on power consumption of the memory in real time
JP2017102790A (ja) * 2015-12-03 2017-06-08 富士通株式会社 情報処理装置、演算処理装置および情報処理装置の制御方法
US11182297B1 (en) 2020-09-22 2021-11-23 Coupang Corp. Electronic apparatus and information providing method using the same
KR102366011B1 (ko) * 2020-09-22 2022-02-23 쿠팡 주식회사 전자 장치 및 이를 이용한 정보 제공 방법
US11544195B2 (en) 2020-09-22 2023-01-03 Coupang Corp. Electronic apparatus and information providing method using the same

Also Published As

Publication number Publication date
US7533003B2 (en) 2009-05-12
US20080133180A1 (en) 2008-06-05
CN101192188A (zh) 2008-06-04
JP5186178B2 (ja) 2013-04-17
CN101192188B (zh) 2011-08-24
US7340378B1 (en) 2008-03-04

Similar Documents

Publication Publication Date Title
JP5186178B2 (ja) プロセッサ性能計測のための重み付けされたイベント計数方法、プロセッサ、および重み付け性能カウンタ回路(プロセッサ性能計測のための重み付けされたイベント計数システムおよび方法)
CN100458727C (zh) 同时多线程处理器内核及其核算处理器时间利用的方法
US6708296B1 (en) Method and system for selecting and distinguishing an event sequence using an effective address in a processing system
US7849387B2 (en) Detecting architectural vulnerability of processor resources
US5691920A (en) Method and system for performance monitoring of dispatch unit efficiency in a processing system
US5751945A (en) Method and system for performance monitoring stalls to identify pipeline bottlenecks and stalls in a processing system
US5752062A (en) Method and system for performance monitoring through monitoring an order of processor events during execution in a processing system
JP3531731B2 (ja) 投機的プロセッサ内で非投機的イベントをカウントするための方法およびシステム
US5797019A (en) Method and system for performance monitoring time lengths of disabled interrupts in a processing system
US8635483B2 (en) Dynamically tune power proxy architectures
US11112846B2 (en) Predictive on-chip voltage simulation to detect near-future under voltage conditions
Naithani et al. Reliability-aware scheduling on heterogeneous multicore processors
US8161493B2 (en) Weighted-region cycle accounting for multi-threaded processor cores
US8285973B2 (en) Thread completion rate controlled scheduling
JP6683920B2 (ja) 並列処理装置、電力係数算出プログラムおよび電力係数算出方法
US7519510B2 (en) Derivative performance counter mechanism
US10169187B2 (en) Processor core having a saturating event counter for making performance measurements
US5748855A (en) Method and system for performance monitoring of misaligned memory accesses in a processing system
Sheikh et al. Efficient load value prediction using multiple predictors and filters
US20040024982A1 (en) Method for measuring memory latency in a hierarchical memory system
KR20240024261A (ko) 상호연결된 이벤트 계수기 및 가중 합산 누산기를 이용하여 프로세서 내의 전력 소비를 제어하기 위한 시스템 및 방법
US8001362B2 (en) Processing unit
JP7724850B2 (ja) 電圧制限条件下でのプロセッサ性能の向上
Chen et al. Cost-driven hybrid configuration prefetching for partial reconfigurable coprocessor
Ryabko et al. Estimating the performance of computer systems through computer capacity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

R150 Certificate of patent or registration of utility model

Ref document number: 5186178

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees