Как приручить дракона: начало работы с машинным обучением – PromptCloud

Опубликовано: 2017-09-19

Оглавление показать

Компоненты системы машинного обучения

Построение модели

Учимся на конфликте

Процесс обучения

Применение ML в основных отраслях

Учебные данные для машинного обучения

Искусственный интеллект нашел свое применение в повседневных технологиях, которые мы используем уже довольно давно. Если вы когда-нибудь задавались вопросом, почему рекомендации Amazon по продуктам исключительно важны для вас, ответ — искусственный интеллект. Системы искусственного интеллекта работают как по волшебству, но для создания хорошей системы ИИ в вашем распоряжении должны быть актуальные и огромные наборы данных. Алгоритм машинного обучения должен получать данные, и чем больше данных вы ему предоставляете, тем лучше он справляется со своей работой. Давайте кратко рассмотрим, как работает машинное обучение.

как обучить алгоритм машинного обучения

Компоненты системы машинного обучения

Каждая система машинного обучения состоит из трех основных компонентов:

Модель: компонент, который занимается идентификацией и прогнозированием.

Параметры: Факторы или сигналы, которые используются для принятия решений.

Ученик: система, которая вносит изменения в параметры, что, в свою очередь, приводит к модификации модели, учитывая различия в прогнозах и результатах.

Давайте возьмем реальный пример, чтобы лучше понять концепцию. Учтите, что вы учитель, пытающийся определить оптимальное количество времени, которое учащиеся должны потратить на учебу, чтобы получить высшую оценку на экзамене. Давайте посмотрим, как это можно решить, воспользовавшись машинным обучением.

Построение модели

Как мы уже говорили, все начинается с модели. Первоначально человек, создающий систему машинного обучения, должен дать ей модель для начала. В нашем случае учитель может предположить, что обучение в течение пяти часов должно дать лучший результат теста.

Далее модель будет зависеть от предоставленных параметров для выполнения расчетов и самонастройки. Здесь параметрами будут полученные результаты тестов и часы, потраченные на обучение. Что-то вроде этого:

0 часов = 50% баллов
1 час = 60% баллов
2 часа = 70% баллов
3 часа = 80% баллов
4 часа = 90% баллов
5 часов = 100% баллов

Система ML выразит вышеуказанное в математическом уравнении, чтобы построить линию тренда ожидаемого результата.

Учимся на конфликте

Теперь, когда у нас есть начальная модель, пришло время ввести параметры. Вы должны ввести в модель данные, которые будут представлять собой «баллы за тесты и часы обучения» для разных студентов. Как и ожидалось, входные оценки не будут точно соответствовать модели, запрограммированной вручную. Фактические результаты будут выше или ниже прогнозируемой линии тренда.

Эта конфликтная ситуация запускает учебную деятельность в системе машинного обучения.

Процесс обучения

Данные, которые были отправлены в систему машинного обучения, — это то, что мы называем «набором обучающих данных», и они используются обучающим компонентом в системе машинного обучения для обучения и оптимизации модели, чтобы сделать ее лучше.
В нашем случае учащийся сравнит входные оценки и проверит, насколько они отличаются от исходной модели. Затем учащийся использует сложную математику, чтобы изменить модель, чтобы привести ее в большее соответствие с фактическими данными. Модель может быть изменена примерно так:

0 часов = 45% баллов
1 час = 55% баллов
2 часа = 65% баллов
3 часа = 75% баллов
4 часа = 85% баллов
5 часов = 95% баллов
6 часов = 100% баллов

Прогноз был изменен, и он показывает, что для достижения наилучшего результата в этом тесте требуется 6 часов обучения. Таким образом, учащийся продолжает вносить небольшие и важные изменения в модель по мере того, как он получает больше данных. Поскольку процесс повторяется определенное количество раз, прогноз достигает довольно высокой степени достоверности, и это означает, что система машинного обучения была успешной. На точность его предсказания во многом влияет количество получаемых данных. Это был простой пример, а реальные варианты использования могут быть намного сложнее. Вы можете узнать больше о технических аспектах машинного обучения из нашего недавнего блога о десяти лучших фреймворках машинного обучения .

Применение ML в основных отраслях

Машинное обучение можно применять практически ко всем отраслевым вертикалям, чтобы добиться радикальных изменений и роста. Давайте рассмотрим некоторые популярные приложения из основных доменов.

Создайте поиск, ориентированный на клиента. Разве не было бы здорово, если бы поисковые системы электронной коммерции могли думать точно так же, как люди? Одной из распространенных проблем с поиском в электронной коммерции является отказ пользователей от портала электронной коммерции, потому что результаты продукта, возвращенные сайтом для определенного поиска, не были релевантными. Эту проблему можно решить, используя обработку естественного языка для контекстуализации и сужения значения поискового запроса, тем самым улучшая поиск в электронной коммерции.

Ретаргетинг потенциальных клиентов. Ретаргетинг — отличный способ вернуть клиентов, которые отказались от корзины, не проверив товар, или несколько раз посетили определенную страницу продукта, не сделав ни одного шага. Разумно определяя намерения покупателя электронной коммерции, вы можете отправить ему предложение, от которого он просто не сможет отказаться. Это отличный способ увеличить коэффициент конверсии без особых усилий.

Определите исключительные целевые перспективы: выявление ваших перспективных клиентов с высоким потенциалом является ключом к получению большего дохода. Используя машинное обучение для анализа моделей покупок ваших клиентов, вы можете легко определить исключительных потенциальных клиентов и нацелиться на них с большей точностью, тем самым улучшив лидогенерацию.

Улучшите рекомендации для клиентов. Механизмы рекомендаций созданы для записи моделей покупок клиентов, чтобы рекомендовать продукты, которые им, вероятно, понадобятся в следующий раз. Простым примером может быть предложение чехла для телефона тому, кто только что купил новый смартфон. Актуальность рекомендаций будет чрезвычайно высокой, учитывая, что уже имеется кладезь исторических данных о покупательских моделях клиентов.

Боритесь с поддельными отзывами: отзывы клиентов, как положительные, так и отрицательные, повлияют на решения покупателей электронной коммерции о покупке. Известно, что бренды занимаются распространением негативных отзывов, чтобы победить своих конкурентов. Многие ритейлеры электронной коммерции начали использовать искусственный интеллект для борьбы с поддельными отзывами, подчеркивая проверенные и полезные отзывы.

Привлечение талантов. Выявление и привлечение соответствующих талантов с помощью ИИ в последние годы переживает подъем. Linkedin, например, использует машинное обучение, чтобы рекомендовать вакансии, сопоставляя их с навыками и квалификацией кандидата. Другие популярные сайты вакансий, такие как Glassdoor, Seek и Indeed , также используют аналогичные алгоритмы машинного обучения для создания карт взаимодействия на основе предыдущих поисковых запросов, сообщений, кликов и подключений пользователей. Вы можете узнать больше о подборе вакансий и о том, как это работает , здесь.

Обнаружение убыли: понимание сотрудников и того, почему они решают уйти или остаться в компании, является одним из основных вопросов в HR-аналитике. Выявление риска истощения требует расширенного распознавания образов и набора переменных, которые должны быть настроены индивидуально для рассматриваемой компании. С помощью машинного обучения кажущиеся далекими точки могут быть соединены за секунды, освобождая время представителей отдела кадров, чтобы они могли сосредоточиться на минимизации риска, а не на его выявлении.

Отслеживание и оценка кандидатов. В компаниях, которые получают большое количество кандидатов, отслеживание и оценка — это большая нагрузка, которую можно минимизировать только с помощью машинного обучения. В то время как поиск лучших талантов набирает обороты, многие представители отдела кадров начали использовать алгоритмическую оценку, чтобы сделать задачу быстрее и значительно эффективнее.

Динамическое ценообразование и прогнозирование тарифов: цены на отели и авиабилеты меняются в мгновение ока, а также могут сильно различаться в зависимости от поставщика услуг. Эти изменения нельзя отследить вручную. Следовательно, веб-сервисы используются для отслеживания изменений цен, и эти данные используются для прогнозирования будущих тарифов и для точной настройки стратегии ценообразования. Имея в своем распоряжении исторические данные о ценах, вы можете создать алгоритм машинного обучения, способный прогнозировать будущие изменения цен. Входными параметрами могут быть сезонные тенденции, специальные предложения, рост спроса и активные конкуренты.

Загрузите наборы данных о поездках из DataStock

Интеллектуальные помощники в путешествиях. Поскольку в современном быстро меняющемся мире главное удобство, интеллектуальные услуги на основе ИИ набирают популярность во многих отраслях. Бронирование путешествий — одна из таких областей, где автоматизация на основе алгоритмов может очень помочь. Интеллектуальные боты могут быть обучены прослушивать ваш план поездок и бронировать билеты за вас. Виртуальные помощники на базе ИИ даже интегрированы в популярные приложения для обмена мгновенными сообщениями, такие как Facebook Messenger, Telegram, Skype и Slack. Благодаря этому пользователи могут делать множество вещей, таких как поиск самых дешевых предложений, бронирование отелей и бронирование авиабилетов. Такие интеллектуальные помощники также могут давать пользователям ценные советы о популярных направлениях, ресторанах, туристических достопримечательностях и многом другом.

Учебные данные для машинного обучения

Теперь, когда концепция машинного обучения стала для вас более понятной, пришло время применить ее в своем бизнесе и получить бесчисленные преимущества. Во всех инновационных приложениях ИИ есть одна общая черта — обучающие данные. Вам потребуется постоянный источник данных для обучения вашей системы машинного обучения, так как это, безусловно, самый важный компонент системы машинного обучения.

Наборы обучающих данных должны быть свежими, актуальными и хорошего качества, чтобы ваша система машинного обучения оказалась полезной. Пока вы ищете наборы данных для обучения , вы можете проверить DataStock , который позволяет вам загружать полные, чистые и готовые к использованию наборы данных из широкого спектра отраслей, таких как электронная торговля, набор персонала, путешествия, здравоохранение и классификация.