数値解析系

2019年12月31日 (火)

2019年まとめ記事

今年も、最後の日です。

恒例の振り返り記事です。

【1月】

TensorFlowの画像認識プログラムをKerasに書き換えてみた: EeePCの軌跡

そういえば、kerasを使ったのって、今年からだったんですね。この記事で思い出しました。

Kerasを使うようになってから、ディープラーニングのコーディングの幅が飛躍的に広がりました。確かにこれは、お手軽です。

【2月】

SONY Neural Network Consoleで独自データの学習・推論をやらせてみた: EeePCの軌跡

一方で、こんなお手軽ソフトも。

ノンプログラミングなSONY Neural Network Consoleです。これはこれで、教育用途で使っております。便利です。

【3月】

ブログ11周年&1500万PV突破!: EeePCの軌跡

このブログも、11年になりました。

で、ほぼ同時に1500万PV達成です。

思えば、いろいろとありましたねぇ、この11年。タイトル通り、最初はネットブックから始まったんですが、いつの間にやらスマホにAI。なりふり構わずですね。

【4月】

 AI用エッジ端末として期待される端末”Jetson nano”はどれくらいの性能か?: EeePCの軌跡

あまり実りのない月でしたね、4月は。

手元にあるわけではないJetson Nanoのベンチマーク記事しか、取り上げる記事がないという、そんな月でした。

まあ、このころは裏でいろいろとあったんですが・・・

【5月】

会社用iPhoneがiPhone Xに!: EeePCの軌跡 

それを象徴するのが、この記事。

iPhone Xを表に出してますが、要するに部署異動という大きな節目を告げる記事です。

おかげさまで、いろいろとありましたねぇ。振り返れば、4月までと比べると、随分と世界が広がりました。

まあ、そんな節目の月でした。

【6月】

Raspberry Pi 4が発表!最大4GBメモリ搭載に!: EeePCの軌跡

さて、6月は気になるRaspberry Piが出た月です。

Raspberry Pi 4が登場。しかもこのRaspberry Pi、4GBメモリー搭載モデルまであります。

このときは、あまり興味なさげな雰囲気ですが、結局12月になって買ってしまったところを見ると、やっぱり気になってたんでしょうね。

【7月】

Amazonプライムデーで最新版Fire 7購入: EeePCの軌跡

新型のFire 7、買いました。

安かったのがきっかけですが、買ってよかったかなぁと。

今も、妻が使ってます。dアニメ見るために。

【8月】

このタイミングでNintendo Switchを購入: EeePCの軌跡

Nitendo Switchを買いました。

思えば、今年一番ビッグな端末系の買い物はこれですね。あとはFire 7だのRaspberry Pi 4くらいしかありませんし。

子供が大喜びで遊んでます。

【9月】

 iOS 13ではマウスが使用可能に!: EeePCの軌跡

9月と言えば、新型のiPhoneの発売月ですが、今年もスルーしたため、私の関心はiOS 13でした。

売りの一つは、マウスが使えるようになったことでしょうか?

ただし、思ったより使い物にならなくて拍子抜けでしたが。せめてコピーペーストがもっと楽になればよかったんですが。

ちなみに一番ありがたいiOS13の機能は、交通系ICを読めるようになったことですね。

【10月】

食べログ3.8問題を検証した記事: EeePCの軌跡

ネット界における信頼が揺らいだ事件だと、個人的には思ってます。

上のような、明らかに食べログの操作を疑わせるヒストグラムが確認されて、ひと騒ぎ合った年です。

いくら何でも、不自然な分布です。統計をやってる人なら、よくわかっていただけると思います。

その後、どうなったんでしょうね・・・?私はすっかり食べログは参考にしなくなりましたけど。

【11月】

AirPods買いました: EeePCの軌跡

Air Podsを買いました。Proではなく、無印の方です。

部署移動して、出張が増えたのがきっかけでもあります。

もっと早く買っておけばよかったと思えるような、快適な使い心地です。

【12月】

manacaの自動チャージ機能付きカードのWellow Card(オリコカード)の自動リボ払いを叩っ切ってみた: EeePCの軌跡

久々に赤太字連発な記事を書いてしまいました。

信用を売りとするべき会社が、やってはならないことをやったわけですから、腹が立つのも当然です。

いや、いくら何でも、3000円の自動リボ払いは悪意ありすぎでしょう。これでは、いつまで経っても元本が減らず、利子ばかりがたまるシステムです。

おまけにネット上で解除する方法がなくて・・・詳しくは、記事をご覧ください。

クレジットカードなんて、安易に信用するなってことですね。

とまあ、今年一年も、何事もなかったようでいろいろと会った年でしたが。

私としては、こんな出来事がありましたね。

【番外編】

 小説家になろう 第7回ネット大賞の1次選考を通過しました!: EeePCの軌跡

去年、MacBook Airを買ったことが、こういう形になって現れました。

私にとって、2つ目のネットコンテンツとなりつつあります。

実は、1次通過は今年だけで2度ありました。2次通過はかないませんが。

これ以上の飛躍があるのか、それとも、この辺りが限界なのか?まだまだ挑戦は続いてます。

2019年。総括すると、運がいいやら悪いやらという年でした。

記事には書いてませんけど、1月に妻がろっ骨を折ったり、こちらもいろいろあって1週間ほど会社を休んだりと、本当に波瀾万丈な年でしたね。

来年くらいは、もうちょっと平穏、いや、飛躍の年にしたいですよねぇ。

というわけで、今年最後の更新となります。

皆さま、よいお年を。


これからの日本の論点2020 日経大予測

2019年12月22日 (日)

Microsoftが海中にデータセンターを作る!?

水中都市にでもクラウドサービスを展開するのか?と思いきや、そこには深い事情があります。海だけに。

マイクロソフトが海中にデータセンターを設置する理由とは - TechCrunch Japan

データセンターの維持には膨大な電力が、そしてその電力のかなりの部分を占めているのが冷却だそうです。

よくデータセンターを寒冷地に作るという話を聞きますが(日本だと北海道に)、それはこういう事情があるみたいです。

なので、一番身近に涼しいところと言えば、それは海中ということになるようで。

周りがすべてに水ですから、冷却という点では有利そうに感じますね。

ただ、そこに人が行き来するのが大変、何かのきっかけで建物が崩壊したら、その時は・・・などなど、デメリットや懸念事項もあるわけで。

ということで、試験的にサーバーを詰め込んだ巨大な気密タンクを海に沈めるようです。数年間、様子見とのこと。

これがうまくいったら、クラウドの電力消費が格段に減りそうですね。しかも、北極圏にデータセンターを作るよりも人口密集地帯に近い場所にデータセンターを作ることも可能。

あまりうまくいく気がしませんが、こういうチャレンジ、個人的には好きです。


IETSノートパソコンCPU冷却ファン USB吸引式クーラー 排気口に取付 ミニサイズ冷却パッド ファンスピード調整ができ 静音タイプ CPUクーラー LED温度デジタル表示 コンパクト 持ち運び便利 扇風機 (ブラック)

2019年12月11日 (水)

PFN、Chainer開発、やめるってよ……

Chainerと言えば国産の深層学習用フレームワークですが、それを開発するPFNが、フレームワークをPyTorchに切り替えると発表しました。

PFN、深層学習フレームワークを自社開発の「Chainer」から「PyTorch」に切り替え - PC Watch

これを受けて、Chainerはメンテナンスフェーズに入るようです。

ついに、国産のフレームワークの一つが消える・・・いや、私は全然使ってないので、これに関してあまり強く言える立場ではないんですけどね。

しかし、PyTorchですか・・・最近、多いですね、PyTorch。うちでも使えるようにするべきなんでしょうか?

私はもっぱらTensorFlow + Kerasです。まあ、慣れちゃったので、こっちが都合がいいというだけなのですが。でも、概ねこのフレームワークで困ることがありません。

が、一つ困るのは、PyTorchで書かれたコードを実装したいなあと思った場合。

これをKerasに書き換えるのは、至難の業です。

PFNですら乗り換えるくらいなら、私もそろそろ検討したほうがいいんですかねぇ。

つくりながら学ぶ! PyTorchによる発展ディープラーニング

2019年11月17日 (日)

Ryzen×2台マシンのレビュー記事

先日紹介した2台を一つにまとめちゃったマシン(2台分のマザボを一つに収めたPC「PUNI-W2」: EeePCの軌跡)のレビュー記事が出てました。

 最強のRyzen PC?Ryzen搭載PC×2台を合体させたデュアルシステムBTO PCをチェック - AKIBA PC Hotline!

一体、どういう構造をしているのかと思いきや、縦に並べてるんですね。メインはフルサイズで、サブの方は、mini ITXですかねぇ?

メイン側は、Ryzen 3700X + GeForce RTX 2080 SUPERを搭載。メモリーも32GBで、結構なパワーマシン。サブ側も、Ryzen 3 3200Gで、メモリー16GBのそこそこのマシン。

元々、どういう想定で作られたマシンなのかはわかりませんが、私ならば機械学習用に使いたいところですかね。

メイン側にUbuntu 18.04を載せて、サブにWindows。これなら一台でディープラーニングと通常の業務ができます。

2台を一人で使うってことは、2台同時にフルパワーで使うシチュエーションでないとなかなか導入しづらいですよね。機械学習ならば、学習と資料作りという2つの用途を同時にこなせますし。

できれば、GTX2080をTitan V辺りに切り替えられるといいんですけどね。お値段は上がりますけど、需要はありそう。

そういう話を抜きにしても、自作PCマニアの心をくすぐる製品であることは間違いありませんね。

AMD Ryzen 5 3600 with Wraith Stealth cooler 3.6GHz 6コア / 12スレッド 35MB 65W【国内正規代理店品】 100-100000031BOX

2019年11月14日 (木)

Jetson nanoの強力版「Jetson Xavier NX」が登場

いきなりですが、「Jetson Xavier NX」の「Xavier」は、”ザビエル”ではなく、”エグゼビア”と読むそうです。

それはともかく、Jetson nanoとピン互換を持ち、より強力なボード「Jetson Xavier NX」が発売されるそうです。

NVIDIA、Jetson Nano互換でさらに高性能なAIボード「Xavier NX」 - PC Watch

6コアCPUにVoltaアーキテクチャの384基のCUDAコアに48基のTensorコアを持つ「Jetson Xavier NX」を発表しました。

発売は2020年3月で、お値段は399ドル。

メモリも8GB搭載していて、エッジ向け推論用としてはかなり強力なボードとなりそうですね。日本円だと、5万弱といったところでしょうか?

まだnanoも手に入れてないですが、気にはなりますね。どちらかというと、会社で使いたいです。これ。


NVIDIA Jetson Xavier開発者キット 945-82972-0000-000

2019年11月 8日 (金)

顔っぽい線図から顔を生成するAI

pix2pixという仕組みを使ってるようです。


【ラクガキから】適当に顔っぽい絵を書くと美女が生成されるAIを作ろうとした(でもテキトウではダメだった)【美女】:電脳ヒッチハイクガイド:電脳空間カウボーイズZZ(電脳空間カウボーイズ) - ニコニコチャンネル:生活



適当に顔っぽい線図を書いて、そこから美人画?を作成してくれるというAI。


上の画像を見ても、なかなかの精度です。


が、その線図すらちゃんと書けない(多分私もそうですが)人のために、リンク先では写真 → 線図 → 写真に変えるという仕組みまで作ってます。


 


その結果できたのがこちら。


男の人の顔が、見事に美人さん(?)に変換されました!


もしTSものを書くとしたら、この画像変換AIを絡めるのも面白いですね。「AIでTSしたら○○になった」というタイトルで・・・いや、面白いか、それ。


転移学習を使ってる(”異世界転移”じゃないですよ)んでしょうけど、それにしても400枚程度でこの精度はなかなか。


顔じゃなくて、他のものでも応用が効きそう。


しかし、TITAN Xで6時間もかかる学習を、私の持っているハードでやったらどうなるんでしょう?


今のところ、業務には使えそうにないですね。でも、面白そう。いつかは試してみたい技術です。


ちなみに、pix2pixのサイトは以下。


Image-to-Image Translation with Conditional Adversarial Networks


ですが、例によってPytorch使ってます・・・やはりそろそろ、Pytorchの環境を整えた方がいいんでしょうか?


物体・画像認識と時系列データ処理入門


2019年10月28日 (月)

CDが売れるとサバが獲れる!?疑似相関に騙されるな!

最近、「疑似相関」というものを調べてます。

音楽CDが売れるとサバの漁獲量が増える?相関関係の不思議な話 - ビッグデータレポート - ヤフー株式会社

つい先日、このブログでも食べログ3.8問題を検証した記事を紹介しましたが、あちらは検証にデータを用いたのに対し、こちらはそのデータが当てにならない場合があるという話です。

曰く、「Yahoo!ショッピングで音楽CDが売れると、サバの漁獲量が上がる」。

もう一つ、似たような話を。

アイスクリームが殺人事件を呼ぶ? | アメリカ | 最新記事 | ニューズウィーク日本版 オフィシャルサイト

「アイスクリームが売れると、殺人事件が増える」。

・・・んなわけないですよね、常識的に考えて。いずれの例も、とても因果関係があるとは思えない事例です。

これは、偶然の一致による疑似相関というやつです。(「疑似」を「擬似」と書く場合もあり)

もっとも、こういう場合があります。

有名な例でいけば、「小学生は身長が高いほど、計算能力が高い」。

これは偶然ではなく、本当にこういうデータが出ます。

ですが、対象が小学1年~6年までとしていて、簡単に言えば「年齢が高いほど、身長も高く、計算能力も高くなる」のを、身長と計算能力だけで見たら相関があるように見えてしまう例です。

つまり、同じ要因に起因する2つの現象に相関があるように見えてしまう。これも疑似相関の一種です。

こんなものに騙されないと思ってはいけません。

世の中に出ているこの手の話題には、結構紛らわしいものもあります。

例えば、最近話題になっているのは、「犬を飼うと寿命が延びる」という話。

とある科学雑誌の論文らしいですが、これも疑似相関じゃないかと疑っている人がいます。

確かに、調査結果はその通りなんですが、例えばここに「収入」や「住環境」など別の因子があると、どうなっていたか?

もしかすると、別の要因との相関が高い者同士が、たまたまこういう結果を招いている可能性があります。

データというものは大事ですが、データをうのみにするのも考えもの。

今やネット時代、ビッグデータ時代といわれており、大量のデータが氾濫する時代。

この手のデータの根拠は、作ろうと思えば作れてしまう時代でもあります。

一つ間違えれば、おかしな投資をしたり、特定の食品ばかり食べたり、犬を飼う羽目になったりします。

なんだかおかしいなと思ったら、一歩引いて根拠を探るという努力も必要ですね。


ニュートン式 超図解 最強に面白い!! 統計

2019年10月26日 (土)

人数カウントに使えそうな顔検出コード「Ultra-Light-Fast-Generic-Face-Detector-1MB」

集会で何人くらい集まっているかを数えたいときなどに活躍しそうな顔検出のプログラムを見つけました。

GitHub - Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB: 💎 1MB轻量级人脸检测模型 

まずは、こちらをご覧ください。

 

いや、すごいです。ほんとに。左上に、人数のカウントが出てます。

さすがに遠くの顔やピンボケしたもの、手などで隠れたものは検出不可ですが、それ以外はほぼ検出してますね。

けっこう動作が軽いらしいです。タイトルにある通り、モデルの大きさも1MB程度しかありません。

で、早速入れて試してみようかと思ったのですが、少々問題が。

このコード、Pytorchなんですよね。なので、Pytorchを入れなきゃいけません。

Anaconda3上にPytorch用の仮想環境を作って入れるだけ・・・なんですが、なんだか面倒くさくなって止まってます。

どのみちPytorchではいじりづらいので、自身の目的用に作り替えるのが辛そうです。

せめて、Keras版がないんですかね・・・

おまけに、Githubのドキュメントは中国語です。読めないことはないのですが、結構解読しづらいです。

にしても中国のコードって、Pytorchが多いですね。欧州でも多いらしいです、Pytorch。TensorFlow、Kerasの多い日本はちょっと、アメリカよりなんでしょうか?

本当に必要な時には、動かせるようにしようかなぁと思ってます。とりあえず、備忘録がわりにご紹介。

PyTorchニューラルネットワーク実装ハンドブック (Pythonライブラリ定番セレクション)

2019年10月15日 (火)

食べログ3.8問題を検証した記事

ネット上で、「食べログで評価3.8以上は、年会費を払っていないと3.6に下げられる」という噂があります。

実際にそう告げられて3.6にされた、というツイートが発端だったらしいですが、そんなことがあるのか?

わざわざそれを確認した人がいます。

 食べログ3.8問題を検証 - クイックノート

ここにのせられているヒストグラムを見ると、確かに異常さが伝わってきます。

3.8に壁があること、そして、3.6の数が異常に多いこと。

通常の分布ではありえませんね。2つのピークのある分布である可能性もありますが、その場合はピークの周辺に裾ができるはず。特に3.6にはそういうものがありません。偏りのないデータであるならば、これは明らかに人為操作が入ったデータです。

もし3.6の分布を3.8以上のところにならしてみれば、何となく正規分布っぽい形になりそうな雰囲気ですね。

実際に、本来なら正規分布になると仮定して、それを先のルールで操作して同じような分布になるかという検証をやった人がいます。

 データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary

ここでは、大阪以外のデータも取り入れてました。いずれも、上のような分布ですね。

会員、非会員の分布から検証を試みたようですが・・・表題にもある通り、それはうまくいかなかったようです。

にしても、変な話ですが、この操作基準に従うと、3.7程度の評価で止まったほうが、年会費を払わない店にとってはむしろ評価が上がるということになります。下手に評判がいいと、3.6に下げられちゃうわけですから。

本当に、変な話です。

ここ最近、私は食べログは見てませんね。なんというか、あまり自身の感想とそこの評価とが一致しないため、いつの間にか使わなくなっちゃいました。

ちょうど今月の末ごろに行く店があるんですが、妙なんですよね。見える評価は皆3以上ばかりなのに、総合評価が3.0という店なんです。新しい店なんですが、実際に行ったことがある人によれば、感覚に合わないと。

そういう操作はしていないと、公表はしてますけど。

 「食べログ」に関する一部報道について | 株式会社カカクコム

ならばなぜ、2山分布にすらならないのか、不思議ですよねぇ。

この評価操作が本当にあったのかどうかは分かりません。不公正な操作があったとするならば、それはいずれ、サイトそのものの評価を下げる結果となりかねませんね。

ちょっと、不安を覚える話題でした。


東海ウォーカー2019年10月号

2019年10月14日 (月)

3次元形状の畳み込みニューラルネットワーク(VoxNet)に用いた3D形状データを見るためのフリーソフト「MeshLab」

会社で、3次元形状を識別できる畳み込みニューラルネットワーク(CNN)のコードを試してます。

下記のサイトと、そのコードのありかは以下。

 3次元畳み込みニューラルネットワークを用いて3次元モデルを分類してみる(ボクセル) - ぽきたに 〜ありきたりな非凡〜

GitHub - tacky0612/classification3dmodel: 3D model classification 

ここの記事にある通りに進めると、「ModelNet10」(10種類の形状セット)、「ModelNet40」(40種類の形状セット)の3D形状を使って学習させてます。いわば、3D版のMNISTといったところのデータセット。

ここから入手できます(「ModelNet10.zip」、「ModelNet40.zip」)

 Princeton ModelNet

で、もちろん私もこの通り進めました。ちゃんと、認識してくれました。

でもひとつ、困ったことが。

それは「3D形状を見るビューアがない」こと。

3面視のようなものは画像で出力されるんですけど、それじゃああまり形状をちゃんと把握できない。

しかも、よくあるIGES形式でも、STL形式でもない、OFF(Object File Format)という、あまり馴染みのない形式です。

本当に、ちゃんと認識できているのか?やはりきちんと確認するには、形状を読み込んでくるくる回せるやつが欲しい・・・

で、ModelNetの配布サイトを見ると、なにやらビューアっぽいものがあるにはあるんですが、どうやらMATLABを使うコードのようなもののようです。

が、MATLABなんて高価なもの、うちの職場にはございません・・・

ちょっと前だったら、3D形状を自在に扱える環境だったんですが(CAD、CAEツール等)、今はそういうのがないんですよね。

てことで、なんとかいいビューアがないか探してみたところ、こんなのを発見。

 MeshLab

「MeshLab」です。

上のサイトで、ちょっと下に「Download」 -「Win64」というのがあるので、それをクリックしてダウンロードします。

Meshlab01

こんな画面が開きます。

予め、ModelNetのサイトから「ModelNet10.zip」をダウンロード、解凍しておきます。

で、「File」-「Import Mesh…」を選び、ModelNet10の一つを適当に開いてみます。

Meshlab02

ここでは、「Chair」-「train」-「chair_0006.off」を開きました。

ちゃんと開きますね。

Meshlab03

左ボタンを押しながらマウスを動かすと「回転」、ホイールボタン(真ん中ボタン)を押しながらだと「移動」、ホイールボタンを回すと「拡大/縮小」できます。

これで、データセットの確認が容易になりますね。

ただ、一点注意です。別のファイルを読ませる時、そのままimportをすると、前の形状データに重なってしまいます。一体、新規(白い書類のアイコン)をクリックしてから読むようにしましょう。

Meshlab04

なお、「File」-「Export Mesh As…」を選んで、別の形式に出力させることができます。

以前、私がよく使ったのは「.igs」と「.stl」ですが、ここには「.stl」がありますね。

先のコードでも、STL形式を読み込むことはできるようです。また、よくあるビューアも、STL形式なら読めるものが多いです。

3次元形状の認識AIを作ってみたいとお考えの方は、とりあえずこのMeshLabでの形状チェックをお勧めします。

でも実際に使うには、3Dのデータを作らなきゃダメですから、やはりCADソフトは必要でしょうね・・・

Fusion 360 マスターズガイド ベーシック編

より以前の記事一覧

当ブログ内検索

  • カスタム検索

スポンサード リンク

ブログ村

無料ブログはココログ