「セキュリティに対する重要性は理解したけれど、用語が難しくて」という声を聞くことがよくあります。そんな方に、セキュリティの頻出用語を解説します。今回は、「マシン ラーニング(機械学習)」についてです。
マシン ラーニング(機械学習、Machine Learning)は、人工知能(Artificial Intelligence, AI) における一つの分野です。この数年、AIおよびマシン ラーニングに関する研究が急速な成長を遂げ、さまざまな企業・組織がマシン ラーニングを利用した製品やサービスを提供しています。2016年3月には、Google DeepMind社が開発したAlphaGoが囲碁の対局でトップ棋士に勝つなど、世界中で大きな話題となりました。
この背景には、インターネットの普及により、学習用途に利用できるイメージ、テキストデータなどが入手しやすくなったこと、あらゆる種類の膨大なデータを高速で安価に並列処理できるGPU(Graphics Processing Unit) が普及したこと、クラウドサービスを活用することで大量のコンピュータリソースを一度に利用できるようになったことなどがあります。
マシン ラーニングを利用した製品やサービスは、身近なものとなっています。いくつか応用例を紹介します。
応用例:
- レコメンデーション: アマゾンのショッピングサイトにあるような、ある顧客の購買履歴を基にして、製品データベースからその顧客が興味を持って購入しそうな製品をレコメンド(推奨)するというものです。レコメンドのベースとなるデータには、購買履歴以外にも、よく似た購買傾向を示す別の顧客の購買履歴を利用することもあります。
- 数字・文字認識:例えば、はがきに郵便番号が手書きで書いてあると、その手書き文字の数字を認識し、地域ごとに仕分けることができます。
- 音声認識: 例えば、 人の声などを認識して、その人が話をした内容(質問や要望など)を理解し、それらに対して応えようとします。近年、家庭用家電で音声認識を利用したサービスを提供するものが増えています。
その他にも、医療診断、株式市場の予測、機械の故障予測、コールセンターでの問い合わせ対応など幅広い分野で利用されています。
もちろん、セキュリティ分野においても活用が進んでいます。
- マルウェアの分析
アンチウィルスソフトウェアは、マルウェアの検出スピードの改善や検出率を向上させるために、マシン ラーニングを利用する例が増えています。例えば、インテル セキュリティでは、動的エンドポイント脅威対策の1つとして、エンドポイントで強力なマシン ラーニングとアプリケーション隔離ツールを使用し、高度な脅威を検出してブロックします。プロセスの挙動を追跡し、未知の脅威を数秒で検出します。
- クレジットカード不正検知
ある顧客のクレジットカード取引履歴をみて、それらの取引がその顧客によって行われたかどうかを過去の振る舞い等から識別します。
このようにマシン ラーニングを利用してセキュリティソリューションを強化する動きが進む一方で、McAfee Labs 「2017年の脅威予測」では、攻撃側であるサイバー犯罪者もマシン ラーニングを利用することで能力を高めることを予測しています。
“マシン ラーニング ツールキットやチュートリアルが幅広く普及し、ほぼ誰にでも複雑なデータセットを解析することが可能になりました。サイバー犯罪者は強力なマシン ラーニング技術を利用し、ソーシャル エンジニアリング攻撃の精度を高めています。そして、2015年から、組織内の財務管理者を狙う攻撃が増えており、犯罪者は盗んだ大量の記録や個人情報を解析して標的を特定したうえで、騙すための内容を詳しく記載したeメールを作成し、被害者を非常に効果的に欺くであろうと予想されています。”