2013年7月30日,NVIDIAはGPUコンピューティング関連の学術会議である「GPU Technology Conference」の日本版となる「
GTC Japan 2013」を開催した。GTC Japanは,ここ数年,夏に開催されているが,1000名以上もの参加者を集めた2012年からさらに規模を拡大し,1500名以上もの参加者が見込まれるとのことだ。
今年は直近に目立った新製品がないだけに,4Gamerの関心を引きそうなネタはあまり多くなかったのだが,それでも見るべきものは多々あったので,今回は要点をかいつまんでお伝えしてみたいと思う。
基調講演で米PGIの買収を発表
CUDA関連のソフトウェア部門をさらに強化へ
Ian Buck氏(General Manager, GPU Computing Software, NVIDIA)
 |
GTC Japan 2013で基調講演を行ったのは
Ian Buck(イアン・バック)氏である。
Buck氏は,「CUDAの生みの親」として知られる人物だ。米スタンフォード大学在籍時に,CUDAの原型になったGPU向けのプログラミング言語「BrookGPU」を開発。その後NVIDIAに入社し,現在は「GPU Computing Software」部門のジェネラルマネージャを務めている。
いまさら説明するまでもないだろうが,CUDAはNVIDIAのGPUコンピューティング事業における最大の柱の1つだ。その柱を作った人なのだから,当然,重要人物なのである。
Buck氏は基調講演の中でPGIの買収をアナウンスした。「今後,NVIDIAのグループ会社としてPGIと手を組み,GPUコンピューティングを推進していきたい」とのこと
 |
さて,そんな背景を持つBuck氏だけに,「GPUハードウェアのロードマップをアップデート」などといった,ある意味で華やかな話題はなかったのだが,講演中に行われた,米
The Portland Group(以下,PGI)を,半導体メーカーであるSTMicroelectronicsから買収したという発表は,注目に値しよう。
PGIはSTMicroelectronicsの子会社として,主にスーパーコンピュータ向けの開発環境を提供してきた企業だ。近年はNVIDIAとパートナーを組んでリリースしている製品も多く,たとえばいまNVIDIAが力を入れているOpenAACも,PGIが強力に推進していたりする。
それだけに,「NVIDIAがPGIを買収したこと」それ自体にあまり驚きはなかったりもするのだが,NVIDIAの幹部がよく口にする「ハードウェアメーカーだと思われているが,実はソフトウェアエンジニアの数が半数以上」という方向性で,さらに強化が進んだわけだ。NVIDIAはどんどんと,GPUコンピューティング向けの開発環境を提供するソフトウェアメーカーになってきているのである。
Tesla K20Xで単精度演算性能強化
東工大の松岡教授が「TSUBAME 2.5」を語る
松岡 聡氏(東京工業大学 学術国際情報センター 教授)
 |
Buck氏の基調講演に続いては,東京工業大学 学術国際情報センターが擁するスーパーコンピュータ「TSUBAME」プロジェクトの指揮を執る
松岡 聡教授による招待講演「
TSUBAME 2.0からTSUBAME 2.5,3.0,さらにはエクサへの進化」があった。NVIDIA製GPUを採用するTSUBAMEは,日本を代表するスーパーコンピュータの1つであり,松岡教授は日本におけるGPUコンピューティング界の,紛れもない重鎮だ。
「
TSUBAME 2.5」については,GTC Japan 2013の前日となる29日に
発表があった(※リンクをクリックするとpdfファイルのダウンロードが始まります)ので,概要を把握している読者もいるだろう。簡単にまとめると,TSUBAME 2.5というのは,TSUBAME 2.0で採用されていたFermiアーキテクチャ採用の数値演算用カード「Tesla M2050」を,Keplerアーキテクチャ採用の「
Tesla K20X」へ換装し,演算能力向上を図ってきたものである。
TSUBAME 2.5への導入検討にあたって,製品評価に使ったベンチマークの計算
 |
もちろん,Tesla K20Xの導入にあたっては,他のNVIDIA製GPUや他社製品との比較検討を行ったそうだ。比較には,TSUBAME 2.0が,スーパーコンピュータにおける実アプリケーション処理性能に対して与えられる賞――松岡教授いわく「スパコン界のノーベル賞というより,アカデミー賞に近い賞」――であるゴードン・ベル賞(Gordon Bell Prizes)を受賞することになった研究で使われた,有限差分法を用いた離散化を使ったという。
その結果が下のスライドで,NVIDIA製品以外では「Xeon Phi 5110P」と「Xeon E5-2670」が挙げられているのだが,「超人ではなく,人間レベルでできるチューンを行った結果」(松岡教授),Tesla K20Xは,Xeon Phi 5110P比で最大で2倍以上ものスコア差を見せつけたというのは面白い。
松岡教授の示したテスト結果。最速スコアを叩き出したのは「GeForce GTX TITAN」だが,グラフィックスメモリにECC(Error Correcting Code)対応がなく,エラー検出ができないため,大規模なスーパーコンピュータにはまず導入できない
 |
なお,前世代のサーバークラスタで,演算カードだけ差し替える場合,ノード間インターコネクトの帯域幅とTesla K20X内のメモリバス帯域幅に大きなギャップが生じるが,この点は「ノード間の転送を隠蔽するアルゴリズム上の工夫によって,解決可能と判断した」(松岡教授)とのこと。Tesla M2050をTesla K20Xに換装するだけというシンプルな強化で済ませた背景には,そういった工夫もあるという。
松岡教授によると,ネットワークとメモリの帯域幅比率は地球シミュレータを参考にしているとのこと。TSUBAME 2.5では地球シミュレータにおおよそ近いが(左),TSUBAME 2.5ではメモリバス帯域幅対ネットワーク帯域幅比が76:1にまで広がってしまったという
 |
 |
 演算とノード間転送をオーバーラップさせてノード間の転送のオーバーヘッドを隠蔽するというやり方について,松岡教授のグループは,TSUBAMEの初期からかなり研究を重ねていたようだ |
 FFTを用いて,ノード数(横軸)と性能(縦軸)の相関関係を示したもの。標準的なOpenMPIだとノード数の増加に伴って性能の伸びが鈍る(左)。対して東工大のアルゴリズムで最適化すると,リニアに近い伸びが得られるという(右) |
さらに松岡教授は,2015年から2016年になるという「TSUBAME 3.0」への見通しとして,「Linpackにおいて20 PFLOPS程度の性能は達成できるのではないか」という見解を述べていた。これまでの例からすれば,TSUBAME 3.0でもGPUを導入する公算は高く,これからも日本のGPUコンピューティングを牽引し続ける存在になりそうだ。
過去の伸びと今後の見通しから,東工大に可能な電力枠内という制限の中で,TSUBAME 3.0は20 PFLOPS程度の性能を実現できる見通しだという
 |
TSUBAME 3.0世代に向けた実験の始まった「TSUBAME KFC Project」についての言及もあった。消費電力の増大が足かせとなっているなか,冷却にかかる消費電力を抑えようというプロジェクトで,端的に述べれば,システムを油に浸す,油冷方式の採用検討だ。「うまくいけば(電力あたりの演算性能を競う)Green 500でトップが取れると見ている」とのこと。「油漬けのTSUBAMEだからKFC……だけれども,どこかのチェーンとは関係ありません(笑)」(松岡教授)
 |
 |
NVIDIAは国内に自動車向け組み込み製品を猛アピール
Danny Shapiro氏(Director, Automotive Division, NVIDIA)
 |
GTC Japan 2013では,GTC Japanの歴史上初めて,NVIDIAが「Automotive」(オートモーティヴ)と呼ぶ
自動車向け組み込み製品に関するセッション群が組まれた。基調講演後に開催された報道関係者向け説明会が,基調講演とは話がリンクしていない自動車関連のものだったというあたり,NVIDIA Japanとして,日本でも自動車向けビジネスに力を入れたいということなのだろう。
さて,その説明会には,NVIDIA本社で自動車関連製品部門のディレクターを務める
Danny Shapiro(ダニー・シャピーロ)氏が登場。自動車向けに,Tegra搭載の小型モジュール「
Vehicle Computing Module」(以下,VCM)をリリースしており,すでに独Audi(アウディ)や米Tesla Motors(テスラモーターズ)の車載インフォメーションシステムに採用されているという。
ドライバやアプリケーションインタフェースの標準化によって,VCMに搭載するSoCは用途に応じて選択できるようになっている
 |
VCMはいわゆるボードコンピュータで,Tegraが搭載されている。アプリケーションのインタフェースが標準化されているため,用途に応じてTegra 2,Tegra 3,あるいはTegra 4(や,将来のTegra)と,SoCの選択が可能になっているそうだ。実際,Audiの例だと,開発の途中でTegra 2からTegra 3にアップグレードしたものの開発はスムーズに継続できたとのことである。
NVIDIAが自動車向けに開発したVCM。ノートPC向けのMXMに似た印象を受けるかもしれないが,“グラフィックスカード”のMXMに対して,VCMは,I/O以外の主要機能が搭載されたボードコンピュータのようなものになっている。自動車の中は温度条件が厳しいことが知られるが,VCMはマイナス40℃からプラス85℃という,実に広い温度範囲で動作するよう設計されているという
 |
 |
Audiの車載システムに組み込まれたVCM。分解CGを見ると,1DINタイプのユニットに,I/Oや電源部などが用意された基板とセットで搭載されているのが分かる
 |
 |
 |
Shapiro氏によると,車載向けのソリューションでも,NVIDIAが得意としてきたビジュアルコンピューティングの経験が非常に役立っているとのこと。VCMでは見栄えのよいユーザーインタフェースを開発するフレームワークなどをNVIDIAが提供しているとのことである。
NVIDIAはVCM上で動作するユーザーインタフェースを開発する「UI Composer Studio」などのフレームワークを提供中。「デザイナーとエンジニアが共同してユニークなデザインを作り上げられる環境を整えている」(Shapiro氏)とのことだ
 |
 |
また,将来的にはGPUの演算能力が,たとえば音声の認識や道路上の障害物の検出,果ては自動運転へとつながっていくのではないかという期待もShapiro氏から語られた。NVIDIAが目指すものは大きいようだ。
こちらは将来の車載コンピュータ向けとされる開発プラットフォーム,「Jetson」(ジェットソン,開発コードネーム)。1DINサイズで,Tegra 3搭載のVCMが差さった基板と,「GK208」ベースのGPUが載った基板からなっており,要は,「Mobile Kepler」の搭載が予定される次期Tegra「Logan」(ローガン,開発コードネーム)を想定した開発機というわけである
 |
 |
ご存知のように日本は,世界的に知られる複数の自動車メーカーがひしめく自動車大国。日本の自動車メーカーにNVIDIAのソリューションが採用されれば,ビジネス的にはかなりの大きな成功につながるだろう。
それを意識してか,会場にはNVIDIAのVCMを搭載するTesla Motorsの「MODEL S」実車が展示されていた。従来の車内とはかなり趣が異なる車載システムの様子を,ぜひ下の写真でチェックしてほしい。
 5人乗りセダンで約6万ドルからという電気自動車,MODEL S。展示されていたのは国内向けの試乗車だった |
 展示しながら充電中。GTC Japan 2013の閉会後,NVIDIA Japanのスタッフが自走して返却しに行くそうだ |
 ダッシュボードのメーターパネル部の表示。VCMによるものだ。全面的に液晶パネルというのは,どこを見ていいのか分かりづらい感じもあったが,“未来感”は確実にある |
 センターコンソールには17インチワイドの液晶パネルが埋め込まれ,各種情報の表示や自動車の設定などが行える。操作性,見た目とも良好だが,運転中に操作すると事故を起こしそうな気も |
センターコンソールは3G回線でインターネットに接続されており,Google Mapsを参照したり,Webページを閲覧したりできる。ただ,試乗車には日本語フォントが入っていないのか,4Gamerを開くと,いわゆる“豆腐”のオンパレードになってしまった
 |
 |
(北米市場で)発売直前のSHIELDも触ってきた
会場に用意されたNVIDIAのブースには,北米市場で31日発売予定となっているポータブルゲーム機型Android端末「
SHIELD」の製品版実機が3台展示されており,製品ボックスも置かれていた。
SHIELDの最終製品版(左)とその製品ボックス(右)。製品ボックスを目の当たりにするのは個人的に初めてだ
 |
 |
製品ボックスに書かれていたSHIELDのスペック
 |
NVIDIAの許可を得て確認してみると,Androidバージョンは4.2.1(Jelly Bean)。OSレベルで用意されるメニュー部分は日本語表示となっていた。SHIELDの[NVIDIA]ボタンを押すと表示できるメニュー以下だと,一部が文字化けしていたが,NVIDIA Japanのテクニカルマーケティングエンジニアである
矢戸知得氏にこの点を指摘したところ,「最初は問題なく表示されていた」という答えが返ってきたので,特別,日本語が文字化けしているわけでもなさそうだ。
 |
 |
Android端末としてのホームスクリーン(左)や設定メニュー(右)は,Android OSでサポートされる部分が日本語化されていた |
 |
 |
英語表記となっていた「Controller」メニュー。右のアナログスティックを仮想的なマウスとして使う機能の有効/無効化設定,[LB][RB]ボタンをボリュームコントローラとして使うかどうかの設定,[NVIDIA]ボタンの輝度設定などが行える |
 |
 |
SHIELDにインストールされたゲーム一覧「SHIELD GAMES」や,ストア「SHIELD STORE」で文字化けを確認。ただよく見ると,必ずしも日本語だけ化けているわけではないようだ |
 |
Borderlands 2のストリーミングプレイデモ。「GeForce GTX 780」搭載PCで実行しているゲーム画面を無線LAN経由で写真左下のSHIELDへ飛ばしている |
 |
こちらがSHIELD側の画面。1280×720ドット解像度で5インチのため,日本語表示が潰れないか気になっていたのだが,写真右上を拡大して見てもらうと分かるように,問題なく視認できた |
 |
操作性でちょっと気になったのは,バンパーボタンが押しづらい場所にあったこと。おそらく慣れの問題だと思うが,最初はバンパーボタンを指で探せず,裏から場所を確認することになってしまった |
今回はPC版の「
Borderlands 2」をストリーミングでプレイしてみたが,イベント会場という,ワイヤレスネットワーク的には非常に不利な状況にもかかわらず,シングルプレイでラグを感じることはなかった。マルチプレイだとまた別の話があるかもしれないが,「GeForce搭載のメインマシンでゲームを実行し,それを寝っ転がりながらSHIELDでストリーミングプレイする」という用途には,やはり,十分に堪えそうだ。
矢戸氏によると,Borderlands 2のようにSHIELDを正式サポートするタイトルの場合,直前までキーボードとマウスパッドを利用していても,SHIELDでプレイし始めると,ゲームパッド操作モードに自動的に切り替わるとのこと。また,「競合のGPUに最適化されたタイトルかどうかを問わず,(XInputベースの)ゲームパッドで操作できるように開発されていれば,たいていは動作する」そうだ。また氏によれば,「HAWKEN」のように,メインメニューでゲームパッドが使えないタイトルも,メインメニューだけ画面をタッチ操作することで,なんとかなってしまうことが多いという。
まだNVIDIA Japanに届いて間もないため,十全な検証が済んだわけではないと断りつつも,「最悪,タッチ操作と,マウス操作のエミュレーションが使えるので,まったくどうにもならないケースはあまりないのではないか」と矢戸氏が述べていたことは,押さえておきたいところである。
残念ながら,依然として国内展開に関する明るい話題はないのだが,こうして見せられ続けるのも歯がゆいところ。どんな形でもいいので,関係各法の基準をクリアのうえ,国内市場へ導入してほしいところだが……。