数値解析系

2019年12月11日 (水)

PFN、Chainer開発、やめるってよ……

Chainerと言えば国産の深層学習用フレームワークですが、それを開発するPFNが、フレームワークをPyTorchに切り替えると発表しました。

PFN、深層学習フレームワークを自社開発の「Chainer」から「PyTorch」に切り替え - PC Watch

これを受けて、Chainerはメンテナンスフェーズに入るようです。

ついに、国産のフレームワークの一つが消える・・・いや、私は全然使ってないので、これに関してあまり強く言える立場ではないんですけどね。

しかし、PyTorchですか・・・最近、多いですね、PyTorch。うちでも使えるようにするべきなんでしょうか?

私はもっぱらTensorFlow + Kerasです。まあ、慣れちゃったので、こっちが都合がいいというだけなのですが。でも、概ねこのフレームワークで困ることがありません。

が、一つ困るのは、PyTorchで書かれたコードを実装したいなあと思った場合。

これをKerasに書き換えるのは、至難の業です。

PFNですら乗り換えるくらいなら、私もそろそろ検討したほうがいいんですかねぇ。

つくりながら学ぶ! PyTorchによる発展ディープラーニング

2019年11月17日 (日)

Ryzen×2台マシンのレビュー記事

先日紹介した2台を一つにまとめちゃったマシン(2台分のマザボを一つに収めたPC「PUNI-W2」: EeePCの軌跡)のレビュー記事が出てました。

 最強のRyzen PC?Ryzen搭載PC×2台を合体させたデュアルシステムBTO PCをチェック - AKIBA PC Hotline!

一体、どういう構造をしているのかと思いきや、縦に並べてるんですね。メインはフルサイズで、サブの方は、mini ITXですかねぇ?

メイン側は、Ryzen 3700X + GeForce RTX 2080 SUPERを搭載。メモリーも32GBで、結構なパワーマシン。サブ側も、Ryzen 3 3200Gで、メモリー16GBのそこそこのマシン。

元々、どういう想定で作られたマシンなのかはわかりませんが、私ならば機械学習用に使いたいところですかね。

メイン側にUbuntu 18.04を載せて、サブにWindows。これなら一台でディープラーニングと通常の業務ができます。

2台を一人で使うってことは、2台同時にフルパワーで使うシチュエーションでないとなかなか導入しづらいですよね。機械学習ならば、学習と資料作りという2つの用途を同時にこなせますし。

できれば、GTX2080をTitan V辺りに切り替えられるといいんですけどね。お値段は上がりますけど、需要はありそう。

そういう話を抜きにしても、自作PCマニアの心をくすぐる製品であることは間違いありませんね。

AMD Ryzen 5 3600 with Wraith Stealth cooler 3.6GHz 6コア / 12スレッド 35MB 65W【国内正規代理店品】 100-100000031BOX

2019年11月14日 (木)

Jetson nanoの強力版「Jetson Xavier NX」が登場

いきなりですが、「Jetson Xavier NX」の「Xavier」は、”ザビエル”ではなく、”エグゼビア”と読むそうです。

それはともかく、Jetson nanoとピン互換を持ち、より強力なボード「Jetson Xavier NX」が発売されるそうです。

NVIDIA、Jetson Nano互換でさらに高性能なAIボード「Xavier NX」 - PC Watch

6コアCPUにVoltaアーキテクチャの384基のCUDAコアに48基のTensorコアを持つ「Jetson Xavier NX」を発表しました。

発売は2020年3月で、お値段は399ドル。

メモリも8GB搭載していて、エッジ向け推論用としてはかなり強力なボードとなりそうですね。日本円だと、5万弱といったところでしょうか?

まだnanoも手に入れてないですが、気にはなりますね。どちらかというと、会社で使いたいです。これ。


NVIDIA Jetson Xavier開発者キット 945-82972-0000-000

2019年11月 8日 (金)

顔っぽい線図から顔を生成するAI

pix2pixという仕組みを使ってるようです。


【ラクガキから】適当に顔っぽい絵を書くと美女が生成されるAIを作ろうとした(でもテキトウではダメだった)【美女】:電脳ヒッチハイクガイド:電脳空間カウボーイズZZ(電脳空間カウボーイズ) - ニコニコチャンネル:生活



適当に顔っぽい線図を書いて、そこから美人画?を作成してくれるというAI。


上の画像を見ても、なかなかの精度です。


が、その線図すらちゃんと書けない(多分私もそうですが)人のために、リンク先では写真 → 線図 → 写真に変えるという仕組みまで作ってます。


 


その結果できたのがこちら。


男の人の顔が、見事に美人さん(?)に変換されました!


もしTSものを書くとしたら、この画像変換AIを絡めるのも面白いですね。「AIでTSしたら○○になった」というタイトルで・・・いや、面白いか、それ。


転移学習を使ってる(”異世界転移”じゃないですよ)んでしょうけど、それにしても400枚程度でこの精度はなかなか。


顔じゃなくて、他のものでも応用が効きそう。


しかし、TITAN Xで6時間もかかる学習を、私の持っているハードでやったらどうなるんでしょう?


今のところ、業務には使えそうにないですね。でも、面白そう。いつかは試してみたい技術です。


ちなみに、pix2pixのサイトは以下。


Image-to-Image Translation with Conditional Adversarial Networks


ですが、例によってPytorch使ってます・・・やはりそろそろ、Pytorchの環境を整えた方がいいんでしょうか?


物体・画像認識と時系列データ処理入門


2019年10月28日 (月)

CDが売れるとサバが獲れる!?疑似相関に騙されるな!

最近、「疑似相関」というものを調べてます。

音楽CDが売れるとサバの漁獲量が増える?相関関係の不思議な話 - ビッグデータレポート - ヤフー株式会社

つい先日、このブログでも食べログ3.8問題を検証した記事を紹介しましたが、あちらは検証にデータを用いたのに対し、こちらはそのデータが当てにならない場合があるという話です。

曰く、「Yahoo!ショッピングで音楽CDが売れると、サバの漁獲量が上がる」。

もう一つ、似たような話を。

アイスクリームが殺人事件を呼ぶ? | アメリカ | 最新記事 | ニューズウィーク日本版 オフィシャルサイト

「アイスクリームが売れると、殺人事件が増える」。

・・・んなわけないですよね、常識的に考えて。いずれの例も、とても因果関係があるとは思えない事例です。

これは、偶然の一致による疑似相関というやつです。(「疑似」を「擬似」と書く場合もあり)

もっとも、こういう場合があります。

有名な例でいけば、「小学生は身長が高いほど、計算能力が高い」。

これは偶然ではなく、本当にこういうデータが出ます。

ですが、対象が小学1年~6年までとしていて、簡単に言えば「年齢が高いほど、身長も高く、計算能力も高くなる」のを、身長と計算能力だけで見たら相関があるように見えてしまう例です。

つまり、同じ要因に起因する2つの現象に相関があるように見えてしまう。これも疑似相関の一種です。

こんなものに騙されないと思ってはいけません。

世の中に出ているこの手の話題には、結構紛らわしいものもあります。

例えば、最近話題になっているのは、「犬を飼うと寿命が延びる」という話。

とある科学雑誌の論文らしいですが、これも疑似相関じゃないかと疑っている人がいます。

確かに、調査結果はその通りなんですが、例えばここに「収入」や「住環境」など別の因子があると、どうなっていたか?

もしかすると、別の要因との相関が高い者同士が、たまたまこういう結果を招いている可能性があります。

データというものは大事ですが、データをうのみにするのも考えもの。

今やネット時代、ビッグデータ時代といわれており、大量のデータが氾濫する時代。

この手のデータの根拠は、作ろうと思えば作れてしまう時代でもあります。

一つ間違えれば、おかしな投資をしたり、特定の食品ばかり食べたり、犬を飼う羽目になったりします。

なんだかおかしいなと思ったら、一歩引いて根拠を探るという努力も必要ですね。


ニュートン式 超図解 最強に面白い!! 統計

2019年10月26日 (土)

人数カウントに使えそうな顔検出コード「Ultra-Light-Fast-Generic-Face-Detector-1MB」

集会で何人くらい集まっているかを数えたいときなどに活躍しそうな顔検出のプログラムを見つけました。

GitHub - Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB: 💎 1MB轻量级人脸检测模型 

まずは、こちらをご覧ください。

 

いや、すごいです。ほんとに。左上に、人数のカウントが出てます。

さすがに遠くの顔やピンボケしたもの、手などで隠れたものは検出不可ですが、それ以外はほぼ検出してますね。

けっこう動作が軽いらしいです。タイトルにある通り、モデルの大きさも1MB程度しかありません。

で、早速入れて試してみようかと思ったのですが、少々問題が。

このコード、Pytorchなんですよね。なので、Pytorchを入れなきゃいけません。

Anaconda3上にPytorch用の仮想環境を作って入れるだけ・・・なんですが、なんだか面倒くさくなって止まってます。

どのみちPytorchではいじりづらいので、自身の目的用に作り替えるのが辛そうです。

せめて、Keras版がないんですかね・・・

おまけに、Githubのドキュメントは中国語です。読めないことはないのですが、結構解読しづらいです。

にしても中国のコードって、Pytorchが多いですね。欧州でも多いらしいです、Pytorch。TensorFlow、Kerasの多い日本はちょっと、アメリカよりなんでしょうか?

本当に必要な時には、動かせるようにしようかなぁと思ってます。とりあえず、備忘録がわりにご紹介。

PyTorchニューラルネットワーク実装ハンドブック (Pythonライブラリ定番セレクション)

2019年10月15日 (火)

食べログ3.8問題を検証した記事

ネット上で、「食べログで評価3.8以上は、年会費を払っていないと3.6に下げられる」という噂があります。

実際にそう告げられて3.6にされた、というツイートが発端だったらしいですが、そんなことがあるのか?

わざわざそれを確認した人がいます。

 食べログ3.8問題を検証 - クイックノート

ここにのせられているヒストグラムを見ると、確かに異常さが伝わってきます。

3.8に壁があること、そして、3.6の数が異常に多いこと。

通常の分布ではありえませんね。2つのピークのある分布である可能性もありますが、その場合はピークの周辺に裾ができるはず。特に3.6にはそういうものがありません。偏りのないデータであるならば、これは明らかに人為操作が入ったデータです。

もし3.6の分布を3.8以上のところにならしてみれば、何となく正規分布っぽい形になりそうな雰囲気ですね。

実際に、本来なら正規分布になると仮定して、それを先のルールで操作して同じような分布になるかという検証をやった人がいます。

 データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary

ここでは、大阪以外のデータも取り入れてました。いずれも、上のような分布ですね。

会員、非会員の分布から検証を試みたようですが・・・表題にもある通り、それはうまくいかなかったようです。

にしても、変な話ですが、この操作基準に従うと、3.7程度の評価で止まったほうが、年会費を払わない店にとってはむしろ評価が上がるということになります。下手に評判がいいと、3.6に下げられちゃうわけですから。

本当に、変な話です。

ここ最近、私は食べログは見てませんね。なんというか、あまり自身の感想とそこの評価とが一致しないため、いつの間にか使わなくなっちゃいました。

ちょうど今月の末ごろに行く店があるんですが、妙なんですよね。見える評価は皆3以上ばかりなのに、総合評価が3.0という店なんです。新しい店なんですが、実際に行ったことがある人によれば、感覚に合わないと。

そういう操作はしていないと、公表はしてますけど。

 「食べログ」に関する一部報道について | 株式会社カカクコム

ならばなぜ、2山分布にすらならないのか、不思議ですよねぇ。

この評価操作が本当にあったのかどうかは分かりません。不公正な操作があったとするならば、それはいずれ、サイトそのものの評価を下げる結果となりかねませんね。

ちょっと、不安を覚える話題でした。


東海ウォーカー2019年10月号

2019年10月14日 (月)

3次元形状の畳み込みニューラルネットワーク(VoxNet)に用いた3D形状データを見るためのフリーソフト「MeshLab」

会社で、3次元形状を識別できる畳み込みニューラルネットワーク(CNN)のコードを試してます。

下記のサイトと、そのコードのありかは以下。

 3次元畳み込みニューラルネットワークを用いて3次元モデルを分類してみる(ボクセル) - ぽきたに 〜ありきたりな非凡〜

GitHub - tacky0612/classification3dmodel: 3D model classification 

ここの記事にある通りに進めると、「ModelNet10」(10種類の形状セット)、「ModelNet40」(40種類の形状セット)の3D形状を使って学習させてます。いわば、3D版のMNISTといったところのデータセット。

ここから入手できます(「ModelNet10.zip」、「ModelNet40.zip」)

 Princeton ModelNet

で、もちろん私もこの通り進めました。ちゃんと、認識してくれました。

でもひとつ、困ったことが。

それは「3D形状を見るビューアがない」こと。

3面視のようなものは画像で出力されるんですけど、それじゃああまり形状をちゃんと把握できない。

しかも、よくあるIGES形式でも、STL形式でもない、OFF(Object File Format)という、あまり馴染みのない形式です。

本当に、ちゃんと認識できているのか?やはりきちんと確認するには、形状を読み込んでくるくる回せるやつが欲しい・・・

で、ModelNetの配布サイトを見ると、なにやらビューアっぽいものがあるにはあるんですが、どうやらMATLABを使うコードのようなもののようです。

が、MATLABなんて高価なもの、うちの職場にはございません・・・

ちょっと前だったら、3D形状を自在に扱える環境だったんですが(CAD、CAEツール等)、今はそういうのがないんですよね。

てことで、なんとかいいビューアがないか探してみたところ、こんなのを発見。

 MeshLab

「MeshLab」です。

上のサイトで、ちょっと下に「Download」 -「Win64」というのがあるので、それをクリックしてダウンロードします。

Meshlab01

こんな画面が開きます。

予め、ModelNetのサイトから「ModelNet10.zip」をダウンロード、解凍しておきます。

で、「File」-「Import Mesh…」を選び、ModelNet10の一つを適当に開いてみます。

Meshlab02

ここでは、「Chair」-「train」-「chair_0006.off」を開きました。

ちゃんと開きますね。

Meshlab03

左ボタンを押しながらマウスを動かすと「回転」、ホイールボタン(真ん中ボタン)を押しながらだと「移動」、ホイールボタンを回すと「拡大/縮小」できます。

これで、データセットの確認が容易になりますね。

ただ、一点注意です。別のファイルを読ませる時、そのままimportをすると、前の形状データに重なってしまいます。一体、新規(白い書類のアイコン)をクリックしてから読むようにしましょう。

Meshlab04

なお、「File」-「Export Mesh As…」を選んで、別の形式に出力させることができます。

以前、私がよく使ったのは「.igs」と「.stl」ですが、ここには「.stl」がありますね。

先のコードでも、STL形式を読み込むことはできるようです。また、よくあるビューアも、STL形式なら読めるものが多いです。

3次元形状の認識AIを作ってみたいとお考えの方は、とりあえずこのMeshLabでの形状チェックをお勧めします。

でも実際に使うには、3Dのデータを作らなきゃダメですから、やはりCADソフトは必要でしょうね・・・

Fusion 360 マスターズガイド ベーシック編

2019年10月 9日 (水)

水晶雫が”形態素解析”をレクチャーする同人誌!?

そもそも水晶雫という存在を知りませんでした。が、それ以上に、そんな同人キャラが解説をする「自然言語処理」の同人誌があることに驚きです。

 同人誌「入門!水晶雫と学ぶ自然言語処理 ~形態素解析編~」が店頭販売中 (取材中に見つけた○○なもの) - AKIBA PC Hotline!

というかこの水晶雫というキャラは、CrystalDiskMarkを応援するキャラだったんですね。知りませんでした。このアプリには、よくお世話になっております。

さて、自然言語処理。これ、うちの会社でも非常に需要が高い解析分野です。

大量の文書を処理して、法則性を見出したい・・・などという需要は、おそらくカテゴリーを問わず存在する悩みですからね。

とりあえず、とっかかりとして私は最近”KH Coder”というフリーソフトから入るようにしてます。以前紹介した通り、なかなか汎用性高いです、このフリーソフト。

「砲撃手の妻は呪術師(シャーマン)」をKH Coderの「共起ネットワーク」で分析してみた: EeePCの軌跡 

とはいえ、ある程度の要望になると、これではとても応えきれません。

てことで、やはり専門書の登場と相成るのですが・・・

その中間段階の解説書が、なかなかないんですよね。

この同人書、何とかして手に入れたいですね。私個人としては、期待大です。


ゼロから作るDeep Learning ? ―自然言語処理編

2019年10月 6日 (日)

セキュリティレベルの低いパスワードは・・・?

相変わらず、アイツがトップなようです。

 流出待ったなし! セキュリティ企業が発表した最悪のパスワードTOP3 | スタディウォーカー

セキュリティ企業が明かす、がばがばパスワードのランキングが出ております。

それによると、栄えある(?)1位は・・・「123456」です。

昔からありますね、このパスワード。2位は「password」、3位は「123456789」・・・これも昔から多いやつです。

特に「桁が大きいからいいや!」と見逃すわけにはいきませんね、この3位のやつは。

メジャーな単語も、簡単パスワードとして引っかかりやすいようです。

この原因の一つには、定期更新をさせるシステムにもあるようですね。

難しいパスワードを短期間で更新しろって無茶行ってきますけど、大抵の人達はそんなセキュリティの高いパスワードを何種類も思いつくなんてこと、できません。

とはいえ、こういうパスワード、使ってませんか?

一度点検したほうが、よろしいかと思います。


図解まるわかり セキュリティのしくみ

より以前の記事一覧

当ブログ内検索

  • カスタム検索

スポンサード リンク

ブログ村

無料ブログはココログ