드래곤 훈련 방법: 기계 학습 시작하기 – PromptCloud

게시 됨: 2017-09-19

목차 쇼

기계 학습 시스템의 구성 요소

모델 구축

갈등에서 배우기

학습 과정

주요 산업에서의 ML 적용

머신 러닝을 위한 학습 데이터

인공 지능은 이제 꽤 오랫동안 우리가 사용하는 일상 기술에 침투해 왔습니다. Amazon의 제품 추천이 귀하와 어떻게 이례적으로 관련이 있는지 궁금해 한 적이 있다면 그 답은 AI입니다. 인공 지능 시스템은 마법처럼 작동하지만 좋은 AI 시스템을 만들려면 관련성이 있고 방대한 데이터 세트를 마음대로 사용할 수 있어야 합니다. 머신 러닝 알고리즘에는 데이터가 제공되어야 하며 더 많은 데이터를 제공할수록 더 잘 작동합니다. 머신 러닝이 어떻게 작동하는지 한 눈에 살펴보겠습니다.

기계 학습 알고리즘을 훈련하는 방법

기계 학습 시스템의 구성 요소

모든 기계 학습 시스템에는 세 가지 주요 구성 요소가 있습니다.

모델: 식별 및 예측을 처리하는 구성 요소입니다.

매개변수: 결정을 형성하는 데 사용되는 요인 또는 신호.

학습자( Learner): 예측과 결과의 차이에서 신호를 받아 모델을 수정하는 매개변수를 변경하는 시스템입니다.

개념을 더 잘 이해하기 위해 실제 예를 들어 보겠습니다. 여러분이 학생들이 시험에서 최고 점수를 받기 위해 공부해야 하는 최적의 시간을 파악하려고 하는 교사라고 가정해 보겠습니다. 기계 학습의 도움을 받아 이 문제를 어떻게 해결할 수 있는지 살펴보겠습니다.

모델 구축

논의한 바와 같이 모든 것은 모델에서 시작됩니다. 처음에 ML 시스템을 구축하는 사람은 시작할 모델을 제공해야 합니다. 우리의 경우, 교사는 5시간 동안 공부하는 것이 최고의 시험 점수를 줄 것이라고 가정할 수 있습니다.

모델은 제공된 매개변수에 따라 계산을 수행하고 자체적으로 조정합니다. 여기에서 매개변수는 받은 시험 점수와 공부한 시간입니다. 이 같은:

0시간 = 50% 점수
1시간 = 60% 점수
2시간 = 70% 점수
3시간 = 80% 점수
4시간 = 90% 점수
5시간 = 100% 점수

ML 시스템은 위의 내용을 수학 방정식으로 표현하여 예상 결과의 추세선을 개발합니다.

갈등에서 배우기

이제 초기 모델이 있으므로 매개변수를 입력할 차례입니다. 다른 학생들의 '시험 점수와 공부 시간'이 될 데이터를 모델에 제공해야 합니다. 예상대로 입력 점수는 수동으로 프로그래밍된 모델과 정확히 일치하지 않습니다. 실제 결과는 예측된 추세선보다 높거나 낮습니다.

이러한 충돌 상황은 기계 학습 시스템에서 학습 활동을 촉발하는 것입니다.

학습 과정

머신 러닝 시스템에 제공된 데이터는 '훈련 데이터 세트'라고 하며 머신 러닝 시스템의 학습자 구성 요소에서 모델을 훈련하고 최적화하여 더 나은 성능을 제공하는 데 사용됩니다.
우리의 경우 학습자는 입력 점수를 비교하고 초기 모델에서 얼마나 떨어져 있는지 확인합니다. 그런 다음 학습자는 복잡한 수학을 사용하여 실제 데이터와 더 일치하도록 모델을 수정합니다. 모델은 다음과 같이 변경될 수 있습니다.

0시간 = 45% 점수
1시간 = 55% 점수
2시간 = 65% 점수
3시간 = 75% 점수
4시간 = 85% 점수
5시간 = 95% 점수
6시간 = 100% 점수

예측이 변경되었으며 이 테스트에서 최고 점수를 얻으려면 6시간의 학습이 필요하다는 것을 보여줍니다. 이런 식으로 학습자는 더 많은 데이터를 보유함에 따라 모델에 작고 관련성 있는 변경을 계속합니다. 프로세스가 특정 횟수만큼 반복됨에 따라 예측은 상당히 좋은 신뢰도 점수를 달성하며 이는 ML 시스템이 성공적임을 의미합니다. 예측의 정확성은 수신하는 데이터의 양에 크게 영향을 받습니다. 이것은 간단한 예였으며 실제 사용 사례는 훨씬 더 복잡할 수 있습니다. 상위 10개 기계 학습 프레임워크 에 대한 최신 블로그에서 기계 학습의 기술적 측면에 대해 자세히 알아볼 수 있습니다 .

주요 산업에서의 ML 적용

머신 러닝은 거의 모든 산업 분야에 적용하여 급격한 변화와 성장을 가져올 수 있습니다. 주요 도메인에서 인기 있는 몇 가지 애플리케이션을 살펴보겠습니다.

고객 중심 검색 만들기: 전자 상거래 검색 엔진이 사람과 똑같이 생각할 수 있다면 좋지 않을까요? 전자 상거래 검색의 일반적인 문제 중 하나는 특정 검색에 대해 사이트에서 반환된 제품 결과가 관련이 없기 때문에 사용자가 전자 상거래 포털을 포기하는 것입니다. 이 문제는 자연어 처리를 활용하여 검색 쿼리의 의미를 문맥화하고 범위를 좁혀 전자 상거래 검색 경험을 개선함으로써 해결할 수 있습니다.

잠재 고객 리타게팅: 리타겟팅은 체크아웃하지 않고 장바구니를 포기하거나 특정 제품 페이지를 여러 번 방문한 고객을 움직이지 않고 다시 되돌릴 수 있는 좋은 방법입니다. 전자 상거래 구매자의 의도를 지능적으로 식별하여 단순히 거부할 수 없는 제안을 보낼 수 있습니다. 이것은 많은 노력 없이 전환율을 높일 수 있는 좋은 방법입니다.

탁월한 타겟 잠재 고객 식별: 높은 잠재 잠재 고객을 식별하는 것은 더 많은 수익을 창출하는 열쇠입니다. 머신 러닝을 사용하여 고객의 구매 패턴을 분석하면 탁월한 잠재 고객을 쉽게 발견하고 개선된 정확도로 타겟팅할 수 있으므로 리드 생성을 개선할 수 있습니다.

고객을 위한 추천 개선: 추천 엔진은 고객의 구매 패턴을 기록하여 다음에 필요할 가능성이 있는 제품을 추천하도록 구축되었습니다. 간단한 예는 새 스마트폰을 구입한 사람에게 휴대폰 케이스를 제안하는 것입니다. 고객의 구매 패턴에 대한 과거 데이터의 금광이 이미 있다는 점을 고려하면 권장 사항의 관련성이 매우 높을 것입니다.

가짜 리뷰 대처: 긍정적이든 부정적이든 고객 리뷰는 전자 상거래 쇼핑객의 구매 결정에 영향을 미칩니다. 브랜드는 경쟁자를 낮추기 위해 부정적인 리뷰를 전파하는 데 관여하는 것으로 알려져 있습니다. 많은 전자 상거래 소매업체는 검증되고 유용한 리뷰를 강조하여 가짜 리뷰와 싸우기 위해 인공 지능을 사용하기 시작했습니다.

인재 유치: AI의 도움으로 관련 인재를 식별하고 유치하는 것이 최근 몇 년 동안 증가세를 보였습니다. 예를 들어 Linkedin은 기계 학습을 사용하여 후보자의 기술 및 자격과 일치시켜 일자리를 추천합니다. Glassdoor , Seek 및 인디드와 같은 다른 인기 있는 구인 사이트 도 유사한 기계 학습 알고리즘을 사용하여 사용자의 이전 검색, 게시물, 클릭 및 연결에서 상호 작용 맵을 만듭니다. 여기에서 작업 매칭 및 작동 방식 에 대해 자세히 알아볼 수 있습니다 .

손실 감지: 직원을 이해하고 직원이 회사를 떠나거나 남아 있기로 결정한 이유는 HR 분석의 주요 질문 중 하나입니다. 손실 위험을 식별하려면 고급 패턴 인식과 해당 회사에 맞게 설정해야 하는 다양한 변수가 필요합니다. 머신 러닝을 사용하면 멀리 떨어져 있는 점을 몇 초 만에 연결할 수 있으므로 HR 담당자가 위험을 식별하는 것보다 최소화하는 데 집중할 시간을 확보할 수 있습니다.

지원자 추적 및 평가: 지원자 가 많은 회사에서 추적 및 평가는 기계 학습을 사용해야만 최소화할 수 있는 무거운 작업량입니다. 최고의 인재에 대한 탐구가 증가하는 동안 많은 HR 담당자는 작업을 더 빠르고 상당히 효율적으로 만들기 위해 알고리즘 기반 평가를 사용하기 시작했습니다.

다이내믹한 가격 책정 및 운임 예측: 호텔 가격과 항공권 운임은 눈 깜짝할 사이에 변하고 있으며, 통신사에 따라서도 크게 달라질 수 있습니다. 이러한 변경 사항은 수동으로 추적할 수 없습니다. 따라서 웹 스크래핑 서비스 를 활용하여 가격 변동을 모니터링하고 이 데이터를 사용하여 미래 요금을 예측하고 가격 전략을 미세 조정합니다. 과거 가격 데이터를 자유롭게 사용하여 향후 가격 변동을 예측할 수 있는 기계 학습 알고리즘을 생성할 수 있습니다. 입력 매개변수에는 계절적 추세, 특별 제안, 수요 증가 및 활성 경쟁자가 포함될 수 있습니다.

DataStock에서 여행 데이터 세트 다운로드

지능형 여행 도우미: 오늘날과 같이 빠르게 변화하는 세상에서 편의성이 왕이기 때문에 AI로 구동되는 스마트 서비스는 많은 산업 분야에서 인기를 얻고 있습니다. 여행 예약은 알고리즘으로 구동되는 자동화가 큰 도움이 될 수 있는 영역 중 하나입니다. 지능형 봇은 여행 계획을 듣고 예약하도록 훈련될 수 있습니다. AI 기반 가상 비서는 Facebook Messenger, Telegram, Skype 및 Slack과 같은 인기 있는 IM 앱에도 통합됩니다. 이를 통해 사용자는 가장 저렴한 거래 찾기, 호텔 예약 및 항공편 예약과 같은 다양한 작업을 수행할 수 있습니다. 이러한 지능형 비서는 또한 사용자에게 인기 있는 목적지, 식당, 관광 명소 등에 대한 유용한 제안을 제공할 수 있습니다.

머신 러닝을 위한 학습 데이터

이제 기계 학습의 개념이 더 명확해졌으므로 이를 비즈니스에 적용하고 수많은 이점을 얻을 때입니다. AI의 모든 혁신적인 응용 프로그램에서 공통적으로 유지되는 한 가지는 훈련 데이터입니다. 머신 러닝 시스템은 반드시 머신 러닝 시스템의 가장 중요한 구성 요소이기 때문에 머신 러닝 시스템을 훈련시키려면 데이터를 지속적으로 공급해야 합니다.

학습 데이터 세트는 기계 학습 시스템이 유용할 수 있도록 신선하고 관련성이 높고 품질이 좋아야 합니다. 교육 데이터 세트 를 찾는 동안 전자 상거래, 채용, 여행, 의료 및 분류와 같은 광범위한 산업에서 포괄적이고 깨끗하며 즉시 사용할 수 있는 데이터 세트를 다운로드할 수 있는 DataStock 을 확인할 수 있습니다.