« ハードボイルドな単三型充電池充電器 | トップページ | Google Japanがドイツ・ハノーバーのCeBIT 2017でTensorFlowの事例として”きゅうり仕分け機”などが展示 »

2017年4月 2日 (日)

GeForce GTX 1050Ti買ってディープラーニングを加速してみた

久しぶりの自作パーツねたです。

Img_0785

こんなものを衝動買いしました。玄人志向のGeForce GTX1050Tiです。

Img_0787

GTX 10XXシリーズとしては下から2番目のボード。

GPU仕様一覧表 - NVIDIA GeForce Wiki*

しかし、こちらを見る限り768コアとなかなかのコア数を持ったボード。これで17,000円ほどです。

ちなみに10XXシリーズ最上位のGTX1080Tiは3582コア。ざっと5倍近くのコア数あるそうです。

Img_0789

iPhone 6sと比べるとこんな感じ。グラフィックボードとしてはこれでも小ぶりな方なんでしょうかね。

Img_0788

それにしても2スロット分のグラボなんて初めてじゃないかと

Img_0791

思ってたら、今まで挿さっていたGeForce 210も2スロット分ありました。

ファンレスなので、ヒートシンクが大きくてこうなってます。

Img_0792

旧グラボを引っこ抜いて、新しいの挿せばOK!

ってほど甘いものではありませんで、私のマザボではSATAコネクタ1つとド干渉しました。

よりによって起動ディスクを挿しているSATA0のコネクタと干渉。仕方がないので別の場所に挿しなおし。

Img_0793

早速起動。

自作PCの常で、どこか不具合を起こしたらすぐに対応できるようケース側面は開けっ放しで作業したんですが・・・

Img_0796

このクイックガイドに沿ってドライバインストールまですんなり完了。問題なく終了。

さて、このGTX1050Tiを買った理由ですが。

ずばり”ディープラーニング”のため。

TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみた: EeePCの軌跡など、最近はすっかりTensorFlowでディープラーニングにはまっておりますが。

やはり悩みといえば機械学習に時間がかかるということ。

最近、わけあって”darknet”というフレームワークにも手を出そうとしたんですが、これを使って機械学習させるにはとてつもないパワーがいることがわかってきまして。

ディープラーニングでは、最新のGPUであればたとえ廉価版でもCPUとは桁違いの速度が出ると聞いてたので、思い切って買いました。

ところで、同じ値段でASUS製と玄人志向があったんですが。

ASUS製はファンに高寿命モーターを用いた”安定”を前面に出した製品。

一方、玄人志向の方はややオーバークロックというのが売りになってます。

定格では1290(ブースト時1392)MHzなGPUコアのクロック数ですが、玄人志向のは1302(ブースト時1417)MHzになってます。

高クロックに笑い笑えばフレンズ~(フレンズ~)

が自作ユーザーの性ですから、ここは潔く高クロックにしておこうかと考えた次第。

高負荷がたたって壊れたら・・・また買えばいいかなっと。

このグラフィックボード換装にあたり、一つだけ懸念がありました。

これまで使っていたGeForce 210がファンレスだったんですが、このGTX1050Tiは結構な大きさのファンがついてます。

要するに、うるさくならないかってことなんですが。

結論を言えば、全く気にならないレベルでした。全然静か。

夜中に稼働することが多いので、騒音がないのはありがたいことです。

さてこのGTX1050Ti、挿しただけでは威力を発揮しません。

今度はTensorFlow側をGPU対応にします。

先の記事(TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみた: EeePCの軌跡)の(1) Anaconda for WindowsでのTensorFlowの導入が終わっているという前提で、以下の3つを入れます。

1、 CUDA 8.0 :CUDA 8.0 Downloads | NVIDIA Developer

2、 CuDNN  v5.1:Membership Required | NVIDIA Developer

3、 TensorFlow-GPU

まず1、2を入れてから、Anaconda for Windows上で

$ pip install tensorflow-gpu

と入力すると3は入手できます。

ちょっと厄介なのは、2でユーザー登録が必要なこと。

英文でいくつかのアンケートに答えないとユーザー登録が終わりません。

ところで、特にバージョン指定をしなかったため、TensorFlowは1.0.1になっちゃいました。

が、今使っている「けものフレンズ判別器」などは問題なく動作します。

さて、早速TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみたのディープラーニングを実行してみました。

GPU版TensorFlowだと、実行時に大量のメッセージが出るようになりました。

Gtx1050ti02

いかにも”CUDA使ってる!”って感じのメッセージです。

ちなみに、CPUオンリー(Corei3-3220 3.3GHz 2コア4スレッド)では100サイクルあたり57分かかっているこの計算。

このGeForce GTX1050Tiではなんと

3分

もう一度言います。

57分が3分

です。

今までけもフレ2話分かかっていたのが、なんと焼きそばUFOを作っている間には終わってしまうという、恐ろしいほどの時間短縮ぶりです。

その速度差は19倍

サーバルちゃん「すっごーい!君はディープラーニングが得意なフレンズなんだね!!」

例えるなら11、12話に登場した巨大セルリアンすら粉砕できそうなほどのパワーを手に入れた感じ。

今までCPUオンリーでやってたのが馬鹿らしくなるくらいの爆速ぶりですね。

最近買った自作PC用パーツで、これは久しぶりのクリティカルヒット

こんなことなら、もう少し早く買っておけばよかった・・・と思えるパーツ。

まさに自作PCユーザーのための

言っときますが、これ高々1.7万円のパーツなんですよね。

計算サーバーにかかわってるのでよくわかりますが、CPUだけで19倍速くしようと思ったらこんな金額じゃ済みません

GPGPU、CUDAというやつをずっとウォッチしてきましたが、初めて実用レベルでその恩恵を受けることができました。

しかし、冷静に考えればGTX1050Tiごときでこの速度。

NVIDIA「くっくっく・・・やつはPascalコア四天王の中では最弱・・・」

こいつはシリーズの中ではまだまだ下っ端なんです。

ではシリーズ最上位のGeForce GTX1080Ti買ってたら一体どうなったんでしょうね?

先に挙げた一覧表では約5倍の性能差があるようですが・・・なんだか思わず気になります。

最新のGeForceをお持ちの方なら、一度は体感してほしいですね、GPU版TensorFlow。

時代の最先端を行くディープラーニングに触れることができる上に、グラフィックボードの性能をいかんなく発揮できて圧倒的な速度差を体感できる。

自作PC界隈では最近なかなかないです、このレベルの性能向上事例。

コードや導入方法はこちら(TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみた: EeePCの軌跡)から。ぜひ多くの人に体感してもらいたいですね。

玄人志向 ビデオカードGEFORCE GTX 1050Ti搭載 GF-GTX1050Ti-4GB/OC/SF

« ハードボイルドな単三型充電池充電器 | トップページ | Google Japanがドイツ・ハノーバーのCeBIT 2017でTensorFlowの事例として”きゅうり仕分け機”などが展示 »

パソコン系」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/510034/65082130

この記事へのトラックバック一覧です: GeForce GTX 1050Ti買ってディープラーニングを加速してみた:

« ハードボイルドな単三型充電池充電器 | トップページ | Google Japanがドイツ・ハノーバーのCeBIT 2017でTensorFlowの事例として”きゅうり仕分け機”などが展示 »

当ブログ内検索

  • カスタム検索

スポンサード リンク

ブログ村

無料ブログはココログ