最終更新時刻:2008年10月6日(月) 19時43分

6

GRAPE-DRと次世代スパコン

公開日時:
2007/09/18 16:15
著者:
能澤 徹

 始めに、次世代スパコンの概念設計決定のニュースに関連したコメントを一つ。
文科省の京速計算機(次世代スパコン)の性能目標は
i)Linpackで10ペタFLOPSを達成する(平成23年(2011年)6月のスーパーコンピュータサイトTOP500ランキング第1位を奪取)
ii)HPC CHALLENGE 全28項目中、過半数以上の項目で最高性能を達成する。(注:その後、主要4項目に変更)
である。(下記文書の4ページ目参照)
http://www8.cao.go.jp/cstp/project/super/haihu01/siryo2-1.pdf
http://www8.cao.go.jp/cstp/project/super/haihu01/haihu-s01.html
1154億円もの税金の支出を認めた”2010年稼動”のレベルとは、”2011年6月にTop500第1位奪取”を確実にするレベルであることを再確認しておきたい。

《GRAPE-DR》

<”GRAPE-DR”は”GRAPEやMD-GRAPE”とは異なるコンセプトの演算器>

 GRAPE 及び MD-GRAPE は固定特定演算の加速装置で、Non-Programable、つまりアルゴリズム固定の演算器である。イメージ的にはハードウエアによる平方根演算器のようなものと考えればよい。GRAPEは天文学での重力多体問題専用演算器で東大が開発し、MD-GRAPEはGRAPEをもとに分子動力学計算専用演算器として理研において開発がなされたものである。
 一方、GRAPE-DRは、発表文書から解釈すれば、Programableな演算加速器ということである。開発は科学技術振興調整費によるもので、2004年から2008年の5年間で総額15億円(年間3億円)である。プロジェクトの進捗は2006年11月にチップ作成が完了し記者発表を行っており、同12月に中間評価を受けている。機能的には、1チップ512PE、500MHZ駆動で、単精度で1チップ512GFの演算性能と発表されている。倍精度での性能記述は見られないが256GF程度ではないかと想像される。
http://www.u-tokyo.ac.jp/public/public01_181106_01_j.html

<消えた特定処理部>

GRAPEと次世代スパコンの関係は、次世代スパコンに関する2004年9月の”情報科学技術委員会 計算科学技術推進ワーキンググループ(第2回)”でのヒアリングにおいて理研が行った提案で既に特定処理部(専用機)が含まれていた。理研のMD-GRAPEが想定されており、このMD?GRAPEで分子動力学計算分野において10PFを達成する計画であったことがわかる。
http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu2/shiryo/007/05042701/002-5.pdf
同年11月にも理研のMD-GRAPE開発担当者が”将来のスーパーコンピューティング環境について”の説明を行い、10PFの必要性が強調されていた。
http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu2/shiryo/007/05022801/001.pdf

そして2005年6月の第9回の会議で文科省が提出した”国家基幹技術としての世界最高性能のスーパーコンピュータの開発(案)”には”、MD-GRAPEなのか、GRAPE-DRなのか定かでないが、”GRAPE-8”として登場しているのである。
http://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu2/shiryo/007/05081501/s4_1.pdf
この経緯の一端は以下の参考資料(a)の27-28ページに記述されており、”GRAPE-8”は東大が文科省に売り込んだGRAPE-DRまたはその後継と考えてよいのではないかと判断される。
2005年10月の総合科学技術会議 評価専門調査会. 「最先端・高性能汎用コンピュータの開発利用」. 評価検討会(第2回).
(a)http://www8.cao.go.jp/cstp/project/super/sgiji2.pdf
(b)http://www8.cao.go.jp/cstp/project/super/haihu02/siryo3-sanko.pdf
(c)http://www8.cao.go.jp/cstp/project/super/haihu02/siryo3-1.pdf
 ここで注目すべきは参考資料(b)で、東大側がGRAPE-DRを「専用機の性能を持つ”汎用超並列計算機”へ」と汎用機として売り込んでいた点である。資料の内部を見るとFFTは計算対象外とされているが、問題は”汎用機”と題に明記してあることである。
 かくして、理研が”計算科学技術推進ワーキンググループ”に特定処理部として提案していたMD-GRAPEは、正規の検討を経ずして、東大が売り込んだ”汎用機”としてのGRAPE-8/GRAPE-DRに置きかえられ、特定処理部として文科省が次世代スパコン原案に組み込んだものと判断される。
 ところが、2007年4月の理研の概念設計では、何の理由説明もなく、特定処理部は削除されてしまっているのである。削除の最もありそうな理由は、
(1)HPCCベンチマークの主要4項目、G-HPL(Linpack)、G-FFTE(高速フーリエ変換)、G-Random(メモリのランダムアクセス)、STREAM(データのコピー)において、Linpack以外では使用に堪えうる性能は出そうになく、役に立たないと考えられること。つまり”汎用”というのは”嘘”であったということ。
(2)Linpackに関しても、開発側の主張する理論性能や実行性能達成はとても無理といった見解が多いこと。
(3)GRAPE-DRは科学技術振興調整費15億円を得て行われており、2008年までには結果がでるのであるから、無理に取り込まずとも、結果を見てから考えればよいと判断されること。
などであろう。

 上記推測理由からして特定処理部の削除そのものには大きな問題ない。しかし性能目標に関しては大きな問題が残る。特定処理部が達成するはずの10PFを、2010年までにベクタ部か、あるいは、スカラー部が達成せねばならなず、TOP500で1位にならねばならないからである。殆ど不可能といってよいと思う。では、2006年3月の綜合科学技術会議での回答に示されたベクタ部0.5PF、スカラー部1PFに性能を後退させて、1154億円もの税金を支出する意味があるのかというと、意味はない。 以前に述べたとおり、(http://rblog-tech.japan.cnet.com/petaflops/2007/08/blue_genel_4f40.html) BG/Pは1PFで$90M程度、DARPAの3PFプロジェクトはそれぞれ$250Mである。最近の、NSF?NCSAの1PF機(Blue Water:http://www.itwire.com/content/view/13973/53/)は$208Mである。次世代スパコンがベクタとスカラの2機構成であるとしても1154億円は国際価格の2倍以上で高すぎる。何も高い税金を払って無駄な開発などする必要はなく、2009年頃になれば売り出されているであろうはずの市販品を安く購入すれば2010年に1PFなど十分間に合うと思えるからである。

 
<GRAPE-DRの問題点>

専用機の性能を持つ汎用超並列計算機へ
http://www8.cao.go.jp/cstp/project/super/haihu02/siryo3-sanko.pdf
東大、1チップで512G FLOPSを達成する512コアプロセッサ
http://pc.watch.impress.co.jp/docs/2006/1106/tokyou.htm

 GRAPE-DRはいわゆるメニーコアの一種と考えられるが、IntelのPolaris(80コア)、TILERAのTILE64などと比べてみると、その”貧弱さ”が良くわかる。
http://www.tilera.com/products/processors.php
 GRAPE-DRチップの構成は、512の単精度浮動小数点演算器コア(PE)と若干のメモリで構成され、32コアと共有メモリをブロックとして、16のブロックで構成されている。コアにはプログラムを処理するプログラム制御機構は存在せず、外部から信号で演算を指定するらしい。SIMDと記述されているので、ブロック単位で命令を指定し、各演算器は同一命令を各自のレジスタに対して行うものと思える。
(1)”1チップ512コアプロセッサ”は誇大表示
 GRAPE?DRのチップにはプログラムの制御機構が存在せず、外部のFPGAを通してプログラム制御を行うのであるから、1チップではなく、2チップで512の演算器を制御するということになり、”1チップ512コア”というのは誇大表示である。さらにGRAPE-DRはPCのI/Oスロットに装着するアクセラレータであるので、当然PCも必要であることは論を待たない。
 これに対し、Polarisにしろ、Tile64にしろ、これらのコアはプログラム制御と演算器+キャッシュを有する完結した汎用CPUで、これを1チップに80個とか64個組み込んだ自己完結型チップである。
(2)ブロック内共有メモリ方式での、性能維持は?
 1ブロック32演算器ごとに1つの共有メモリということであるが、この32の演算器間での共有メモリのコンテンション制御のメカニズムが不明である。演算命令が32演算器に対するSIMD命令であるとすると、そのSIMD命令は全ての演算器の命令完了を待たないと、次の演算には移れないことになり、最悪の場合、1命令で32メモリサイクル待たなければならない可能性がある。共有メモリ制御がどーなっているか不明なので詳しい議論は出来ないが、パフォーマンス低下の可能性が高い構造である。
 これに対し、PolarisやTile64はそれぞれのコアがI?cache,D?cacheを持って独立して作動し、演算とLOAD/STOREを分離できるので問題はない。しかもCPUコア間やコアーメモリ間はPoint-to-Point方式のチップ内高速ネットワークで結ばれており、Tile64は初期設定の仕方によっては、共通レジスタによるコア間の直接コミュニケーションも可能となっている。
(3)HPCC主要3ベンチマークは壊滅的。
 GRAPE-DRは演算アクセラレータなので、G-Random(メモリのランダムアクセス)、STREAM(データのコピー)などのデータ・ハンドリングでは全く意味がないし、また、演算アクセラレータのリスタートが多いアルゴリズム、たとえばFFTなど、ではセッタアップ・オーバーヘッドが大きく、効果がない。
 LINPACKの場合は、共有メモリ制御、セッタアップ・オーバーヘッドの問題に加えて、512個の演算器に対するデータのバンド・ウィズに起因するストールの問題もあり、筆者は、そもそもGRAPE-DRの理論性能はかなり低いところにあると考えている。
 
 以上の指摘は、あくまで、発表文書等のラフな記述に基ずく第三者の危惧である。DRAPE-DRのチップは完成発表から既に1年近くになるので、既に、多くの実測データがあるはずである。とりあえずは、GRAPE-DR開発参加者からのLINPACK実行データの提示を含む反論を期待し、筆者の判断が杞憂で、目標どおりの性能が示せていることを期待したい。

 さて、GRAPE-DRは2チップで512単精度演算器であるから、実質1チップ256単精度CPUコアということになり、既に指摘した貧弱なるアーキテクチャによる性能低下、汎用性のなさを考慮すると、コンピュータ技術としてはTILE64、Polarisなどの正統派メニーコア方式の方が遥かに本質的であり、安心安全有用である。これらが必要に応じて倍精度、Double Hammerなどに改善されれば、HPC用チップとして遥かに期待できる。
 わが国においても、10PF超を目指すのであれば、正統的メニーコア、及び、チップ・スタッキング技術などの基礎技術の研究開発に力を注がないと、米国との技術力の差は広がるばかりであろう。文科省はスーパーコンピュータの国家戦略とは何かを、根本的に考え直すべきであろう。

<付け足し: GRAPE-DRに対する海外の反応>
GRAPE-DRの2006年11月の東大での発表やSC06での発表に対する海外の反応は英国のchannel registerの短信、
Japanese boffins show off 512-core chip http://www.channelregister.co.uk/2006/11/06/japan_512-core_co-pro/
くらいであろう。
 12月12日に台湾のチップメーカーによる発表 http://www.alchip.com/news_press_06.htm
を受けars technicaが若干長めの記事”GRAPE-DR cluster to host a 512-core chip”を報じている。
http://arstechnica.com/news.ars/post/20061212-8408.html
この記事では天文学での計算におけるGRAPEの意義を解説し、GRAPE-DRをGRAPEの後継機と紹介している。
 12月15日にHPCwireも”Alchip Unveils First Silicon of 512-Core Chip” http://www.hpcwire.com/hpc/1154212.html
として報じている。これはAlchip中心の内容であるが、やはりGRAPE-DRはGRAPEの後継機と報道されている。
 要するに海外では、GRAPE-DRに関する報道数は少なく、また位置付けとしても天文学という特殊分野での特殊計算用のアクセラレータの後継機と認識されているに過ぎないということは頭の隅に入れておいて良いかもしれない。

 なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。

 

 

※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。

このエントリーへのコメント

1

米国 スタンフォード大学で進める 分散スパコン 1PFLOPS達成だそうです。(詳細=>http://www.itmedia.co.jp/news/articles/0709/20/news045.html)

ソニーが開発した Cellが大きく貢献している様ですが ATIのGPUもこれから大きく貢献しそうです

これからも PCグラフィックとゲームマシンは ドンドン早くなるので 10PFLOPSも すぐに達成されてしまいそうですね...

文部省としては 特定のメーカ(それもHard)に金を落とすよりも だまっていても ドンドン早くなるPCやゲームマシンを束ねてTotalの計算能力をかせぐ プロジェクトに金を投入すべきだと思います。

  ただで 1PFLOPS on 2007/09/25

ブログにコメントするにはCNET_IDにログインしてください。

この記事に対するTrackBackのURL: 

このブログについて

ブロガープロフィール

アーカイブ

2008年10月
   1234
567891011
12131415161718
19202122232425
262728293031 

カテゴリ

ブログネットワーク

アルファブロガー

村上敬亮 情報産業の未来図ネットワーク型産業構造への衣替え?
村上敬亮 情報産業の未来図
クロサカタツヤの情報通信インサイトグッバイ、レバレッジ!(1)
クロサカタツヤの情報通信インサイト
末吉隆彦 ロケーションウェアの「空」と「実」9月イベントお知らせ
末吉隆彦 ロケーションウェアの「空」と「実」
ケータイ時代のスタンダードiPhonista Nightの事後報告
ケータイ時代のスタンダード
江島健太郎 / Kenn's Clairvoyance新サービスをローンチしました
江島健太郎 / Kenn's Clairvoyance
鈴木健の天命反転生活日記パラレルワールドとしての電脳コイル
鈴木健の天命反転生活日記

読者ブロガー

それでも開発は続くよすでに土砂降りのIT業界
それでも開発は続くよ
電子政府パブリックコメントの抜粋平成 14 年の、医療体制に関する意見募集を偶然発見
電子政府パブリックコメントの抜粋
レンタルサーバの裏事情割賦販売制度の副産物
レンタルサーバの裏事情

企画特集

エンタメCGM「gooメーカー☆メーカー」エンタメCGM「gooメーカー☆メーカー」
【第1回】開発者に訊く!各機能と開発の狙いとは
KDDI「SaaSソリューション」KDDI「SaaSソリューション」
〜社内コミュニケーションの課題への解決策とは〜

新着コメント

はじめまして。 ご指摘のことは、日本でも行われていると考えられます。 架......
グーグル、社員の個人情報を盗まれる--人事業務の外部委託が原因 (米国)
投稿者:moroi
mugendaiさんコメントありがとうございます。 お金持ちに優しい世の中である......
「誰でもよかった」の匂いがする個室ビデオ放火事件
投稿者:きむこう
みなさん、コメントありがとうございます。今回、個室ビデオ店放火事件を取り......
「誰でもよかった」の匂いがする個室ビデオ放火事件
投稿者:mugendai
まず思うのは  犯人はなんで当事者で解決しないのか? =>その会社に不満......
「誰でもよかった」の匂いがする個室ビデオ放火事件
投稿者:きむこう
なるほどですね、情報ありがとうございます。行事も世界範囲内でコピーされて......
中国の鳥人大会
投稿者:

ブログネットワークとは?

CNET Japan ブログネットワークは、元はCNET Japanの一読者であった読者ブロガーと、編集部の依頼により執筆されているアルファブロガーたちが、ブログを通じてオンタイムに批評や意見を発信する場である「オピニオンプレイス」、また、オピニオンを交換するブロガーたちが集うソサエティです。

広い視野と鋭い目を持ったブロガーたちが、今日のIT業界や製品に対するビジョンや見解について日々熱く語っています。

あなたもブログを書いてみませんか?

CNET Japanやその他サイトが提供するITニュースやコンテンツへの意見や分析、 ビジネスやテクノロジーに対するビジョンや見解について語っていただける方を 募集しています。ご応募はこちらから

ブログの投稿・管理

ブログの投稿はこちらから(※ブロガー専用)

ブログアワード2007開催決定!

今年最も活躍したブロガーを表彰します。詳細はこちらから

αマークって?

これは、CNET Japan 編集部の依頼に基づいて執筆されているCNET Japan アルファブロガーによるブログの印です。

Good!って?

CNET Japan ブログネットワーク内で拍手の代わりに使用する機能です。ブログを読んで、感激した・役に立ったなど、うれしいと思ったときにクリックしてください。多くGood!を獲得した記事は、より多くの人に読まれるように表示されます。

レビュー

[レビュー]2011年画質を備えた高画質、多機能Blu-ray--ソニー「BDZ-X95」
ソニーのBlu-ray Discレコーダー新製品が登場した。2007年から引き継がれる「やりたいことから選ぶ」シリー
今週の新製品総チェック:よりモバイルPCとして進化した「Let's note」が登場
松下電器産業の「Let's note」、デルのデスクトップPCとPC新製品が数多く登場した。Let's noteは9時間駆動
今週の新製品総チェック:フルサイズCMOS搭載のキヤノン「EOS 5D Mark II」が登場
キヤノンからもフルサイズCMOSセンサを搭載した「EOS 5D Mark II」が登場した。合わせてコンパクトデジカメ
今週の新製品総チェック:第4世代iPod nano登場、ソニー「α」、松下「LUMIX」に新機種も
デザインを一新したiPod nano、容量増されたiPod touchなど、新iPodファミリーが登場した。その後を追うよ