GeForce GTX 1050Ti買ってディープラーニングを加速してみた
久しぶりの自作パーツねたです。
こんなものを衝動買いしました。玄人志向のGeForce GTX1050Tiです。
GTX 10XXシリーズとしては下から2番目のボード。
GPU仕様一覧表 - NVIDIA GeForce Wiki*
しかし、こちらを見る限り768コアとなかなかのコア数を持ったボード。これで17,000円ほどです。
ちなみに10XXシリーズ最上位のGTX1080Tiは3582コア。ざっと5倍近くのコア数あるそうです。
iPhone 6sと比べるとこんな感じ。グラフィックボードとしてはこれでも小ぶりな方なんでしょうかね。
それにしても2スロット分のグラボなんて初めてじゃないかと
思ってたら、今まで挿さっていたGeForce 210も2スロット分ありました。
ファンレスなので、ヒートシンクが大きくてこうなってます。
旧グラボを引っこ抜いて、新しいの挿せばOK!
ってほど甘いものではありませんで、私のマザボではSATAコネクタ1つとド干渉しました。
よりによって起動ディスクを挿しているSATA0のコネクタと干渉。仕方がないので別の場所に挿しなおし。
早速起動。
自作PCの常で、どこか不具合を起こしたらすぐに対応できるようケース側面は開けっ放しで作業したんですが・・・
このクイックガイドに沿ってドライバインストールまですんなり完了。問題なく終了。
さて、このGTX1050Tiを買った理由ですが。
ずばり”ディープラーニング”のため。
TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみた: EeePCの軌跡など、最近はすっかりTensorFlowでディープラーニングにはまっておりますが。
やはり悩みといえば機械学習に時間がかかるということ。
最近、わけあって”darknet”というフレームワークにも手を出そうとしたんですが、これを使って機械学習させるにはとてつもないパワーがいることがわかってきまして。
ディープラーニングでは、最新のGPUであればたとえ廉価版でもCPUとは桁違いの速度が出ると聞いてたので、思い切って買いました。
ところで、同じ値段でASUS製と玄人志向があったんですが。
ASUS製はファンに高寿命モーターを用いた”安定”を前面に出した製品。
一方、玄人志向の方はややオーバークロックというのが売りになってます。
定格では1290(ブースト時1392)MHzなGPUコアのクロック数ですが、玄人志向のは1302(ブースト時1417)MHzになってます。
高クロックに笑い笑えばフレンズ~(フレンズ~)
が自作ユーザーの性ですから、ここは潔く高クロックにしておこうかと考えた次第。
高負荷がたたって壊れたら・・・また買えばいいかなっと。
このグラフィックボード換装にあたり、一つだけ懸念がありました。
これまで使っていたGeForce 210がファンレスだったんですが、このGTX1050Tiは結構な大きさのファンがついてます。
要するに、うるさくならないかってことなんですが。
結論を言えば、全く気にならないレベルでした。全然静か。
夜中に稼働することが多いので、騒音がないのはありがたいことです。
さてこのGTX1050Ti、挿しただけでは威力を発揮しません。
今度はTensorFlow側をGPU対応にします。
先の記事(TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみた: EeePCの軌跡)の(1) Anaconda for WindowsでのTensorFlowの導入が終わっているという前提で、以下の3つを入れます。
1、 CUDA 8.0 :CUDA 8.0 Downloads | NVIDIA Developer
2、 CuDNN v5.1:Membership Required | NVIDIA Developer
3、 TensorFlow-GPU
まず1、2を入れてから、Anaconda for Windows上で
$ pip install tensorflow-gpu
と入力すると3は入手できます。
ちょっと厄介なのは、2でユーザー登録が必要なこと。
英文でいくつかのアンケートに答えないとユーザー登録が終わりません。
ところで、特にバージョン指定をしなかったため、TensorFlowは1.0.1になっちゃいました。
が、今使っている「けものフレンズ判別器」などは問題なく動作します。
さて、早速TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみたのディープラーニングを実行してみました。
GPU版TensorFlowだと、実行時に大量のメッセージが出るようになりました。
いかにも”CUDA使ってる!”って感じのメッセージです。
ちなみに、CPUオンリー(Corei3-3220 3.3GHz 2コア4スレッド)では100サイクルあたり57分かかっているこの計算。
このGeForce GTX1050Tiではなんと
3分
もう一度言います。
57分が3分
です。
今までけもフレ2話分かかっていたのが、なんと焼きそばUFOを作っている間には終わってしまうという、恐ろしいほどの時間短縮ぶりです。
その速度差は19倍。
サーバルちゃん「すっごーい!君はディープラーニングが得意なフレンズなんだね!!」
例えるなら11、12話に登場した巨大セルリアンすら粉砕できそうなほどのパワーを手に入れた感じ。
今までCPUオンリーでやってたのが馬鹿らしくなるくらいの爆速ぶりですね。
最近買った自作PC用パーツで、これは久しぶりのクリティカルヒット。
こんなことなら、もう少し早く買っておけばよかった・・・と思えるパーツ。
まさに自作PCユーザーのための
言っときますが、これ高々1.7万円のパーツなんですよね。
計算サーバーにかかわってるのでよくわかりますが、CPUだけで19倍速くしようと思ったらこんな金額じゃ済みません
GPGPU、CUDAというやつをずっとウォッチしてきましたが、初めて実用レベルでその恩恵を受けることができました。
しかし、冷静に考えればGTX1050Tiごときでこの速度。
NVIDIA「くっくっく・・・やつはPascalコア四天王の中では最弱・・・」
こいつはシリーズの中ではまだまだ下っ端なんです。
ではシリーズ最上位のGeForce GTX1080Ti買ってたら一体どうなったんでしょうね?
先に挙げた一覧表では約5倍の性能差があるようですが・・・なんだか思わず気になります。
最新のGeForceをお持ちの方なら、一度は体感してほしいですね、GPU版TensorFlow。
時代の最先端を行くディープラーニングに触れることができる上に、グラフィックボードの性能をいかんなく発揮できて圧倒的な速度差を体感できる。
自作PC界隈では最近なかなかないです、このレベルの性能向上事例。
コードや導入方法はこちら(TensorFlowで「けものフレンズ」の”フレンズ判別器”作ってみた: EeePCの軌跡)から。ぜひ多くの人に体感してもらいたいですね。
« ハードボイルドな単三型充電池充電器 | トップページ | Google Japanがドイツ・ハノーバーのCeBIT 2017でTensorFlowの事例として”きゅうり仕分け機”などが展示 »
「パソコン系」カテゴリの記事
- ロジクール製小型静音Bluetoothマウスを購入(2024.11.18)
- 例のUSB電力計で会社PCの電力を測ってみた(2024.11.17)
- 我が家の現在のPC・スマホ事情(2024.11.03)
- わりといい感じの椅子を買った(2024.06.15)
- 最大45W出力のUSB-C端子を持つUSB‐A × 2 、USB-C × 2、電源4口タップを購入(2024.05.15)
« ハードボイルドな単三型充電池充電器 | トップページ | Google Japanがドイツ・ハノーバーのCeBIT 2017でTensorFlowの事例として”きゅうり仕分け機”などが展示 »
コメント