数値解析系

2018年9月29日 (土)

機械学習に立ちはだかる壁に関する記事

職場でもそろそろ機械学習という言葉が出ているところもあるのではないでしょうか?私のところは・・・ノーコメントというところで。

ですがこの機械学習というやつは、いろいろと厄介でそう簡単には業務適用できません。

そのあたりの事情をまとめた記事がありました。

「機械学習」は本当に使えるの?「立ちはだかる壁」は?【「成果」を出すために、あなたができる3つのこと】

機械学習とは?という話から、具体的な実用例まで述べた後、いよいよ壁の話に入っていきます。また、機械学習の活用で陥りやすいパターンについても書かれてます。

この”壁”の部分については3つ述べられており、そのうち2つが私は深刻じゃないかと思っているものです。

一つ目は、数学、知識の壁。どうして機械学習によって現象の学習・推論が可能になるのか?など、数学的、技術的、プログラミング的な知識は当然必要です。

が、最近は市販のツールも充実してきましたし、お試しのコードもかなり出回っており、以前ほどは壁とは言えないかもしれません。

が、2つ目、3つ目の壁は、個人的には大きな障害だと感じてます。

2つ目の壁は、ずばり「時間」。

学習精度を上げるため、実用化までにはどうしても時間がかかるんですよね。AIって。

この辺が分からずに、すぐに「使い物にならない!」とあきらめちゃう人達がいて、あとちょっとでうまくいくかもしれないのに・・・という状況もあるようです。

はたから見てると、もたもたしているように感じるんでしょうかね。前例のないことをするんだから、もたもたするのはある意味で当たり前なんですけどね。そういうのがじれったくて仕方がない人が立ちはだかる場合もあります。経験上。

そして3つ目。必ずしもうまくいくとは限らない、ということ。

これも、前例がないことですから、仕方がないですね。

でも、ある程度の知識がある人ならば、こういうのが揃えばうまくいきそうだという感触というのはあって、大体その通りになるようです。でも、絶対ではないというのがやはりこの日本では致命的ですね。

技術者本人よりも、周りや経営陣の無理解が壁になっていることが多いと感じます。これで本当に世界と戦えるのだろうか?と不安に思うこともあります。

でも、だからこそ多くの人に読んでもらいたいですね、この記事。下手な本を読むよりよっぽどまとまってます。30分もあれば読めますし。

これすら読むひまがないという人は、この先やってられないでしょうね。技術的に追い上げをかける海外企業に太刀打ちできない未来しか待っていないでしょう。私は、そう思います。

マンガでわかる機械学習

2018年9月27日 (木)

いろいろな時系列データの手法のコードがまとめられた記事

機械学習・AIを始めようと思うと、まずやるのはネット上に存在するプログラムコードを入手して、とりあえず試してみるというのが定番でしょうか。

ですが、画像認識はともかく、時系列データを扱う手法というのは意外とサンプルコードが少ない。

ところが、この記事にはコードと、実際に独自データでの結果を並べられています。

時系列データを対象にした機械学習手法の比較

この記事では、近傍法、決定木、ランダムフォレスト、CNNの4手法のコードと実際に使った結果が載せられております。

決定木、ランダムフォレストの結果が悪いですが、この手法が決して悪いわけではなく、この記事で用いたサンプルではたまたまこの手法が相性が悪かっただけのようです。

ケースバイケースで、ランダムフォレストのような手法の方が良い結果を出すこともあります。このあたりは複数の手法を用いて比較するしかありませんが、これを自動的にやってくれるのが先回紹介したDataRobotです。

手近にデータがある人は、このコードで試してみるのもいいかもしれません。

仕事ではじめる機械学習

2018年9月22日 (土)

AI導入企業は国内では47%

最近、AI・機械学習も”幻滅期”に入りつつあるようです。過剰な期待がしぼみ始め、一方で現実的な適用がはじまりつつある、そういう時期です。

とはいえ、実際にその技術はあちらこちらで適用されつつあります。今さら、完全無視はできない技術。

そういう背景を反映するかのように、こんな調査結果が出てきました。

EconomicNews(エコノミックニュース)

日本におけるAI導入済みの会社は、47%だそうです。

導入を検討しているところも含めると、72%になるそうです。一方で導入する気がないと答えた会社は28%になるとのこと。

これがAPAC加入国平均では、導入が55%、検討まで含めると81%、予定なしが19%。日本はやや低いですね。

なお、導入済みと答えた会社では、製品・サービスの改良、マーケティングで成果をあげつつあるようです。

まあ、私は正直これでも多いなぁと思いました。もっと理解がないとばかり思っていたので、これは意外な数字です。

もっとも、「検討中」が「導入」フェーズに移行するところが最もハードル高いですが。しかし、スマホでもそうであったように、乗り遅れたらなかなか追いつけないのが今のIT関連技術の常。あまりうかうかしてはいられないと思っています。

個人的には、コストダウン、効率化のための技術というより、新しい知見のマイニングや新しい概念の創造へと結びつける技術として期待してます。ただ、いきなりそこにはたどり着けないから、まずは効率化から取り組んで、徐々にビジネスモデルの構築を図るというのが現実的な導入プロセスじゃないかと思っています。

GIGABYTE ビデオカード NVIDIA GeForce GTX 1080搭載  オーバークロック ゲーミングモデル GV-N1080G1 GAMING-8GD

2018年9月21日 (金)

IntelとDataRobotが提携

IntelとDataRobot社が提携し、機械学習自動化プラットフォームの強化を推進していくと発表しました。

DataRobotとIntelが提携、Intelのテクノロジーで機械学習自動化プラットフォームの強化を推進 - クラウド Watch

Intelはともかく、DataRobotって何!?というお方が多いと思われるので、補足。

DataRobotとは機械学習用の自動化ソフトであり、画像認識以外の時系列データ等の機械学習を得意とするツールです。

1000種類以上の機械学習アルゴリズムを内包しており、データの特徴に応じて30種類のアルゴリズムを選択、同時に推論を行い、最も良い手法を提示するというソフトです。

例えばですが、「土地の値段」というものは最寄りの駅までの距離、コンビニ、学校、本屋の有無、平坦な土地か否か・・・などなどの様々な要因で決まっています。

ある街では、そのいくつかの要因の内、どれが支配的かどうかを調べたり、あるいは駅の距離などから「土地の値段」を推論する・・・というようなことができるツールがDataRobotです。

といっても、上のようなことは従来手法(多変量解析等)でもできるんですが、要因の数が数千、数万にも及び、データ件数が数十万というビッグデータを扱えるのがDataRobotというわけです。

工場などでは不良品が出る要因を分析して、その源流対策を取りたいと考えるわけですけど、最近はこの数万以上のデータでないと分析できないようなケースが多く、その要因解析や不良品予測などでこのDataRobotが期待されているようです。工場だけでなく、人事評価や経理、売り上げの予測などでも使用可能。

この手の手法の活用は、いわゆるデータサイエンティストと呼ばれるデータ分析専門の人が必要となりますが、このDataRobotはそのあたりの手法選択等を自動化してくれるため、幅広い人々が機械学習を活用できるようにするソフト、いわゆる「AIの民主化」のためのソフトウェアというわけです。

・・・というのが、私が聞いたDataRobotの説明。他の機械学習ツールとは一線を画したソフトなのですが、今のところGPUではなくメニーコアCPUを使うことが前提のツールですね。そのあたり、Intelと相性がよさそう。

この両者が引っ付いて、この機械学習の自動化をより進めてくれるというわけです。

個人的には、AMDあたりと提携してくれるとよかったなぁと思ったりするんですが・・・という話はともかく、世の中機械学習・AIの時代になってきましたねぇ、と感じさせる話題でした。

Pythonで動かして学ぶ! あたらしい機械学習の教科書

2018年9月14日 (金)

無関係では済まされない!社会常識としてのAI知識を身に着ける本

昨今話題のAI・機械学習ですが、少し勢いは下がってきたかなという感じがします。

が、むしろ勢いが下がってきた今というのは、まさに実用例が出始め、普通の技術として認知されつつあることの裏返しです。

こういう時代だからこそ、こういう本をご覧になるのが良いと思われます。

あなたも無関係では済まされない!大人のビジネス教養として知っておきたい「人工知能」 | ガジェット通信 GetNews

「キーワードで読み解く人工知能 『AIの遺電子』から見える未来の世界」という本ですが、漫画による近未来の話から今のAI技術にまつわるキーワード解説まで、分かりやすく解説された本のようです。

AI・機械学習がどういうものかを聞いたことがあるけど、いったい何ができる技術なのか、いまいち理解していない人が多いように思います。

過度に期待している人、あるいは使えない技術だと思っている人、この2パターンが多いですね。特に後者が多いです。私の周囲には。

ですが、海外ではもうかなり活用が進んでいてい、表に出てきている事例だけでも結構なものが見られます。SiriやGoogleアシスタントにしても、まさにこの技術ですし。

コンシューマ向けよりも、産業向けの応用が怖いですね。ディープラーニングによる画像認識を使うと、今まで自動化できなかったものが自動化できちゃいますから、これはかなりの脅威。使えるかどうかという議論ではなく、応用できるところには応用し、次のビジネスモデルを考える、そういう段階に入っていない会社はかなりやばいと思っています。まあ、うちの会社なんですけどね。

日本ではまだまだのところが多いように思いますが、特に日本では少子高齢化による人手不足という事態が発生しつつあります。さっさと取り組むべき技術だと思うんですが、そういう意識のある人が少ないですね。

そんな意識を変えるべく、こういう本の登場はありがたいですよね。漫画だと馬鹿にせず、まずはこの手の入門書から読んでみるのがよさそうです。

キーワードで読み解く人工知能 『AIの遺電子』から見える未来の世界 (漫画キャラで学ぶ大人のビジネス教養シリーズ)

2018年9月10日 (月)

ニューラルネットワークで”サザエさんじゃんけん”勝負に勝つ

実はかれこれ10年以上、サザエさんを見ておりません。

そんな私でも、サザエさんの予告編の後に行われるじゃんけん勝負というものの存在を知っています。

1991年11月から始まってるんですね、あのじゃんけん。実は私はあまり好きではないんですが、世の中あの勝負の傾向と対策を立てて挑んでいる人たちもいるようです。

さて、そのサザエさんのじゃんけん勝負に、機械学習で挑むという試みの記事を発見。

機械学習でサザエさんとじゃんけん勝負(ニューラルネットワーク編)

いろいろな手法でやっているようですが、こちらはニューラルネットワークで挑んだ記事。

時系列変化の予測ということで、この記事がもっとも役立ちそうです。LSTMやSVM、決定木等で挑んだ記事のリンクも張られています。

さて、細かいプログラムコードに関してはリンク先にお任せするとして、ここでは結果だけ書いておきます。

「サザエさんじゃんけん研究所」という有志が分析して立てた傾向と対策で、1996年1月~2018年8月第2週までで勝率70.3%をあげているそうです。

で、このリンク先のコードによる勝負ですが、前回までの手を機械学習して、サザエさんじゃんけん研究所と同じ期間(1996年1月~2018年8月2週目)の予測を行ったそうです。

その結果は・・・71.51%!

本家を超えてしまったそうです。偶然なのか、それとも機械学習の勝利というべきなのか。

ひとつ言えることは、人の長年の経験を、機械学習でも再現できるということですね。

ただ、例えば「FNS27時間テレビの途中で行われる回ではチョキが出やすい」という傾向は、この機械学習では表せなかったようです(データ不足?)。

必ずしも、万能ではないということですね。

とはいえ、ほぼランダムともいうべきサザエさんのじゃんけん勝負に、これだけの精度で予測ができるというのは、なかなかすごいことですよね。

応用すれば、故障予知だったり簡単な需要予測などにも使えそうです。

気になる方は、ぜひ参考まで。

サザエさん 全45巻 完結コミックセット (朝日文庫)

2018年8月25日 (土)

10層のCNNでCIFAR-10を使い90%の精度を達成する記事

ディープラーニングそのものの記事としては、正直あまり役立つとは言い難い事例ですけど、見方によってはなかなか有用な記事なので紹介。

10層の畳み込みニューラルネットワークでCIFAR-10のValidation Accuracy9割を達成する

CIFAR-10という5万枚ほどのデータセットを使い、Varidation Accuracyを9割達成するためにいろいろやっている記事です。

よく「ハイパーパラメータ」のチューニングが必要とは言われますけど、それを地道にいろいろと試してみた記事。

特にドロップアウトを50%で固定している私としては、意外と50%が最適というわけではなさそうだと知り、ショックを受けているところです。今後参考にしてみようかと思います。

こういう試行錯誤の事例って、実はあまり公開されていないんですよね。でも、これこそが機械学習における最大のノウハウであり、作成される人工知能の性能を決める作業なんですよね。

ディープラーニングで試行錯誤している人は、参考になる記事です。ぜひ、ご一読されることをお勧めします。

ディープラーニング やさしく知りたい先端科学シリーズ

2018年8月16日 (木)

コンビニが予測よりも2個多くおにぎりを仕入れる理由とは?

よくAIが人間の仕事を奪うといわれてますが、私は比較的楽観的です。そんなことはないだろうと。

その証左となる話がこちらです。

コンビニがおにぎりを2つ多く仕入れる理由――顧客に“響く”データ活用のコツ - ITmedia エンタープライズ

最近のビッグデータ解析により、かなりコンビニの売り上げ予測って向上したらしいです(まだまだともいわれてますけど)。

ただ、予測通りの数値で仕入れると、上記リンク先にもある通り機会損失を招くということもあるようです。

全てにおいてリンク先のような法則が成り立つわけではないですが、なればこそデータの裏付けと人の経験とを組み合わせる必要があるようです。

もし、AIによって仕事が奪われるとしたら、それは機械学習や分析技術の向上により、それをうのみにして思考停止してしまう人じゃないかと思います。

最近は”AIの民主化”が進み、どこでも誰でもAI技術を使える時代となりつつあります。ということは、そのデータ分析の結論をどう反映するかが、このAI時代に生き残れる否決になるような気がします。

どうでしょうねぇ、そういう人、身の回りにいるでしょうか?ですが、どこまでいっても最後は人、特に社内での影響力の大きい経営者、管理職によって決まるような気がします。AIが10個売れると言ったから、10個仕入れてませんか?特に日本ではそういう指向が強く、結果的に機会損失を招いているような気がします。

ビジュアル図解 コンビニのしくみ (DO BOOKS)

2018年7月27日 (金)

AIで雑草だけを見つけて除去する技術が開発中

田んぼでの雑草除去は、大変な作業です。やったことはないですけど、稲とそうでないものを見分けながら取るわけですからね。しかも、暑い最中に。大変でなかろうはずがありません。

私なんぞは、自宅の狭い敷地の草むしりごときで音を上げてます。

そういう作業を自動化する技術が出てきました。

人工知能で雑草だけをピンポイントで除草するロボット登場

カリフォルニアのスタートアップ企業が進めている、スマート農業機器の研究開発の一環として公表された技術です。ごらんのとおり、雑草とそうでないものを見分けて、最終的には雑草のみを除去しようという試みです。

除草剤をまけば済む話にも見えますが、最近農薬の使い過ぎの結果か、除草剤の効かない”スーパー雑草”なるものがでてきたとか。これに対抗するため、こういう技術がひつようなんだとか。

たしかに、農薬ばかりに頼るというのもよくないですよね。AIを使って、農薬が必要な作物だけをピンポイントで見つけ出すという仕組みも考えられているようですし。

先のトマトを収穫するロボットなんてものも出ましたが、農薬ではなく、機械が持った”知恵”で良質な農作物が収穫される時代がもうすぐそこまで来ているのかもしれません。

ラクラク農作業台車 腰掛けラッキー

2018年7月18日 (水)

「ゼロから作るディープラーニング」を解説した動画が公開

私も読みました、「ゼロから作るディープラーニング」。

第3次AIブームに乗って、この本で勉強しようという方も多いかと思います。

が、やはり難しい本です。これ。文字を追って読むというのが苦痛だという方も多いかと思います。

そこで、これを解説した動画がYouTubeにて公開されています。

「ゼロから作るディープラーニング」を動画でまとめている人がいたので紹介します。|Dai|note

全部で11章。リンク先には学ぶ知識の概要と、動画へのリンクが載せられています。ぜひそちらを参照願います。

大体、1つ10分前後程度の動画でまとめられています。

ここでは、一番最初の導入編と

私が最も難しいと感じた誤差逆伝播法の動画を載せておきます。

決してわかりやすいとは言い難いですが、本だけ読むよりは頭に入りやすいと思われます。

もうちょっと早く、これに出会っていればよかったですね。いや、今からでも復習できますが。

この本を買って挫折しちゃったという方は、ぜひ一度ご覧いただくことをお勧めします。

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

より以前の記事一覧

当ブログ内検索

  • カスタム検索

スポンサード リンク

ブログ村

無料ブログはココログ