ドラゴンを訓練する方法: 機械学習を始める – PromptCloud

公開: 2017-09-19
目次を見る
機械学習システムのコンポーネント
モデルの構築
紛争から学ぶ
学習プロセス
主要産業における ML の適用
機械学習用のトレーニング データ

人工知能は、かなり前から私たちが日常的に使用する技術に取り入れられてきました。 Amazon による製品の推奨事項がどのように自分にとって非常に関連性があるのか​​疑問に思ったことがあるなら、その答えは AI です。 人工知能システムは魔法のように機能しますが、優れた AI システムを作成するには、関連する膨大なデータ セットを自由に使用できる必要があります。 機械学習アルゴリズムにはデータを与える必要があり、与えるデータが多ければ多いほど、その仕事がうまくいきます。 機械学習がどのように機能するかを一目で見てみましょう。

機械学習アルゴリズムのトレーニング方法

機械学習システムのコンポーネント

すべての機械学習システムには、次の 3 つの主要コンポーネントがあります。

モデル:識別と予測を処理するコンポーネント。

パラメーター:決定を形成するために使用される要素またはシグナル。

学習者:予測と結果の違いからヒントを得て、パラメーターを変更し、その結果、モデルが変更されるシステム。

概念をよりよく理解するために、実際の例を見てみましょう。 あなたが教師で、学生が試験で最高の成績を取るために勉強に費やすべき最適な時間を特定しようとしているとします。 機械学習の助けを借りて、これをどのように解決できるかを見てみましょう。

モデルの構築

説明したように、すべてはモデルから始まります。 まず、ML システムを構築する人間は、最初にモデルを提供する必要があります。 この場合、教師は 5 時間勉強すれば最高のテスト スコアが得られると想定できます。

モデルはさらに、提供されたパラメーターに依存して計算を行い、それ自体を調整します。 ここでのパラメータは、受け取ったテストの点数と勉強に費やした時間です。 このようなもの:

0 時間 = 50% のスコア
1 時間 = 60% のスコア
2 時間 = 70% のスコア
3 時間 = 80% のスコア
4 時間 = 90% のスコア
5 時間 = 100% スコア

ML システムは、上記を数式で表現して、予想される結果の傾向線を作成します。

紛争から学ぶ

初期モデルができたので、パラメータを入力します。 モデルにデータを入力する必要があります。これは、さまざまな学生の「テストの点数と学習時間」になります。 予想どおり、入力スコアは手動でプログラムされたモデルと正確には一致しません。 実際の結果は、予測された傾向線よりも高くなるか低くなるでしょう。

この衝突の状況が、機械学習システムにおける学習活動のトリガーとなります。

学習プロセス

機械学習システムに供給されたデータは、私たちが「トレーニング データ セット」と呼んでいるもので、機械学習システムの学習者コンポーネントによって使用され、モデルをトレーニングおよび最適化してモデルを改善します。
私たちの場合、学習者は入力スコアを比較し、初期モデルからどれだけ離れているかを確認します。 次に、学習者は複雑な数学を使用してモデルを修正し、実際のデータとより一致させます。 モデルは次のように変更される場合があります。

0 時間 = 45% のスコア
1 時間 = 55% のスコア
2 時間 = 65% のスコア
3 時間 = 75% のスコア
4 時間 = 85% のスコア
5 時間 = 95% のスコア
6 時間 = 100% スコア

予測が変更され、このテストで最高のスコアを達成するには 6 時間の学習が必要であることが示されています。 このようにして、学習者は、より多くのデータを取得するにつれて、モデルに関連する小さな変更を加え続けます。 プロセスが一定の回数繰り返されると、予測はかなり良い信頼スコアを達成し、これは ML システムが成功したことを意味します。 その予測の精度は、受信するデータの量に大きく影響されます。 これは単純な例であり、実際の使用例はもっと複雑になる可能性があります。 機械学習の技術的側面については、機械学習フレームワークのトップ 10に関する最近のブログで詳しく知ることができます

主要産業における ML の適用

機械学習は、ほぼすべての業種に適用して、根本的な変化と成長をもたらすことができます。 主要なドメインの人気のあるアプリケーションをいくつか見てみましょう。

顧客中心の検索を作成する:電子商取引の検索エンジンが人間とまったく同じように考えることができたら素晴らしいと思いませんか? e コマース検索でよくある問題の 1 つは、特定の検索に対してサイトから返された製品結果が適切でなかったために、ユーザーが e コマース ポータルを放棄することです。 この問題は、自然言語処理を活用して検索クエリの意味を文脈化して絞り込み、e コマースの検索エクスペリエンスを向上させることで解決できます。

潜在顧客のリターゲティング:リターゲティングは、チェックアウトせずにカートを放棄したり、特定の製品ページに何度もアクセスしたりせずに移動せずにカートを放棄した顧客を呼び戻すための優れた方法です。 e コマースの買い物客の意図をインテリジェントに特定することで、拒否で​​きないオファーを送ることができます。 これは、手間をかけずにコンバージョン率を倍増させる優れた方法です。

優れた対象となる見込み客を特定する: 可能性の高い有望な見込み客を特定することは、より多くの収益を生み出すための鍵です。 機械学習を使用して顧客の購入パターンを分析することで、優れた見込み客を簡単に特定し、精度を高めてターゲットを絞ることができるため、リードジェネレーションが改善されます。

顧客へのレコメンデーションの改善:レコメンデーション エンジンは、顧客の購入パターンを記録して、次に必要になる可能性が高い製品をレコメンデーションするように構築されています。 簡単な例としては、新しいスマートフォンを購入したばかりの人への電話ケースの提案です。 顧客の購入パターンに関する履歴データの宝庫がすでに存在することを考えると、推奨事項の関連性は非常に高くなります。

偽のレビューに対処する:カスタマー レビューは、肯定的であれ否定的であれ、e コマースの買い物客の購入決定に影響を与えます。 ブランドは、競合他社を引き下げるために否定的なレビューを広めることに関与していることで知られています. 多くの e コマース小売業者は、人工知能を使用して、検証済みで役立つレビューを強調することで、偽のレビューと闘い始めています。

人材の獲得: AI の助けを借りて適切な人材を特定し、引き付けることは、近年増加傾向にあります。 たとえば、Linkedin は、機械学習を使用して、候補者のスキルや資格に合わせて仕事を推薦します。 Glassdoor、Seek、 Indeedなどの他の人気のある求人サイトも、同様の機械学習アルゴリズムを使用して、ユーザーの以前の検索、投稿、クリック、接続から対話マップを作成しています。 ジョブ マッチングとその仕組みについて詳しくは、こちらをご覧ください。

離職の検出:従業員を理解し、従業員が退職または会社に留まる理由を理解することは、人事分析における主要な質問の 1 つです。 減少のリスクを特定するには、高度なパターン認識と、問題の会社に合わせてカスタム設定する必要のある一連の変数が必要です。 機械学習の助けを借りて、遠く離れているように見える点を数秒で結び付けることができるため、人事担当者はリスクを特定するよりもリスクを最小限に抑えることに専念することができます。

応募者の追跡と評価:大量の応募者を受け取る企業では、追跡と評価は機械学習を使用することによってのみ最小限に抑えることができる重い作業負荷です。 最高の人材を求める傾向が強まる中、多くの人事担当者は、タスクをより迅速かつ大幅に効率化するために、アルゴリズムベースの評価を使用し始めています。

動的な価格設定と運賃予測:ホテルの価格と航空運賃は瞬く間に変化し、サービス プロバイダーによっても大きく異なる場合があります。 これらの変更を手動で追跡することはできません。 したがって、 Web スクレイピング サービスを利用して価格の変化を監視し、このデータを使用して将来の運賃を予測し、価格戦略を微調整します。 過去の価格データを自由に使用して、将来の価格変動を予測できる機械学習アルゴリズムを作成できます。 入力パラメーターには、季節的な傾向、特別オファー、需要の伸び、活発な競合他社などを含めることができます。

DataStock から旅行データ セットをダウンロードする

インテリジェントな旅行アシスタント:急速に変化する今日の世界では利便性が最優先であるため、AI を活用したスマート サービスは多くの業界で人気を集めています。 旅行の予約は、アルゴリズムを活用した自動化が大いに役立つ分野の 1 つです。 インテリジェント ボットは、旅行計画を聞いて予約を行うようにトレーニングできます。 AI を活用した仮想アシスタントは、Facebook Messenger、Telegram、Skype、Slack などの一般的な IM アプリにも統合されています。 これにより、ユーザーは最安値の検索、ホテルの予約、フライトの予約など、さまざまなことができます。 このようなインテリジェント アシスタントは、人気のある目的地、食事場所、観光スポットなどについてユーザーに貴重な提案をすることもできます。

機械学習用のトレーニング データ

機械学習の概念がより明確になったので、それをビジネスに適用して、無数の利益を得る時が来ました。 AI のすべての革新的なアプリケーションで共通しているのは、トレーニング データです。 機械学習システムの最も重要なコンポーネントであるため、機械学習システムをトレーニングするには、常にデータを提供する必要があります。

トレーニング データ セットは、機械学習システムが有用であることが判明するために、新鮮で関連性があり、高品質である必要があります。 トレーニング データ セット探している間、e コマース、採用、旅行、ヘルスケア、分類などの幅広い業界から、包括的でクリーンですぐに使用できるデータセットをダウンロードできる DataStock を確認できます