[인공지능개론] What is machine learning?

 

제목: 인공지능과 머신러닝 - rule based approach와 real world

서론

인공지능(AI)은 인간의 지능을 모방하여 기계가 문제를 해결하고 학습할 수 있도록 하는 컴퓨터 과학 분야다. AI의 궁극적인 목표는 인간 수준의 성능을 달성하는 것이지만, 이는 결코 쉬운 일이 아니다. 인간 전문가의 지식을 추출하고 이를 기계에 전달하는 것은 매우 복잡하고 어려운 과정이다.

규칙 기반 접근과 예측 데이터 분석

초기 AI 연구는 주로 인간 전문가의 지식을 규칙(rule) 형태로 표현하고, 이를 기반으로 문제를 해결하는 규칙 기반 접근 방식을 채택했다. 하지만 이러한 접근 방식은 모든 가능한 경우를 고려해야 하므로, 복잡한 문제에 적용하기 어려웠다.

rule based approach

이러한 한계를 극복하기 위해 등장한 것이 머신러닝(Machine Learning)이다. 머신러닝은 데이터를 통해 학습하고 스스로 성능을 향상시키는 알고리즘과 모델을 개발하는 분야다. 특히 예측 데이터 분석(Predictive Data Analytics)은 머신러닝의 대표적인 응용 분야로, 과거 데이터를 기반으로 미래를 예측하는 데 사용된다. 예를 들어, 주식 가격 예측, 질병 진단, 맞춤형 상품 추천 등 다양한 분야에서 활용된다.

데이터의 특징과 규칙 기반 접근의 한계

데이터는 일반적으로 설명 변수(descriptive feature)목표 변수(target feature)로 구분된다. 설명 변수는 예측에 사용되는 입력 데이터이며, 목표 변수는 예측하고자 하는 값이다. 예를 들어, 주식 가격 예측 문제에서 과거 주가, 거래량, 경제 지표 등은 설명 변수가 되고, 미래 주가는 목표 변수가 된다.

데이터의 양이 증가하고 복잡해질수록, 모든 가능한 경우를 고려하는 규칙 기반 접근 방식은 한계에 부딪힌다. 이를 '불량 조건 문제(ill-posed problem)'라고 한다. 현실 세계에서는 모든 경우를 미리 알 수 없기 때문에, 규칙 기반 시스템은 새로운 상황에 유연하게 대처하기 어렵다.

ill-posed problem

머신러닝의 목표와 귀납적 편향

머신러닝의 목표는 주어진 데이터를 가장 잘 설명하고 일반화할 수 있는 예측 모델을 찾는 것이다. 이를 위해 다양한 머신러닝 알고리즘이 개발되었으며, 각 알고리즘은 '귀납적 편향(inductive bias)'이라는 고유한 기준을 가지고 있다. 귀납적 편향은 알고리즘이 데이터를 해석하고 모델을 학습하는 방식을 결정하는 중요한 요소다.

  • 제한 편향(Restriction Bias): 모델의 복잡성을 제한하여 과적합(overfitting)을 방지하는 데 사용된다. 예를 들어, 의사결정 트리 알고리즘은 트리의 깊이를 제한하여 모델의 복잡성을 제어한다.
    Restriction Bias

  • 선호 편향(Preference Bias): 특정 종류의 가설을 선호하여 모델을 학습하는 데 사용된다. 예를 들어, 선형 회귀 알고리즘은 데이터 간의 선형 관계를 가정하고 모델을 학습한다.

Preference Bias

적절한 귀납적 편향을 선택하는 것은 머신러닝 모델의 성능을 좌우하는 중요한 요소다.

과적합과 과소적합: 최적의 모델을 찾아서

머신러닝 모델 학습 시 주의해야 할 두 가지 문제는 과적합(overfitting)과 과소적합(underfitting)이다.

  • 과적합: 학습 데이터에 지나치게 맞춰져 새로운 데이터에 대한 예측 성능이 떨어지는 현상이다.
  • 과소적합: 학습 데이터의 특징을 충분히 학습하지 못하여 예측 성능이 낮은 현상이다.

Underfitting vs Overfitting

최적의 모델은 과적합과 과소적합 사이의 균형을 이루는 '골디락스 모델(Goldilocks model)'이다. 이를 위해 교차 검증(cross-validation), 정규화(regularization) 등 다양한 기법을 활용할 수 있다.

Goldilocks model

결론

머신러닝은 데이터를 통해 학습하고 스스로 성능을 향상시키도록 알고리즘과 모델을 개발하는 인공지능 분야다. 규칙 기반 접근 방식의 한계를 극복하고, 복잡한 문제에 대한 예측 능력을 향상시키는 데 기여한다. 다양한 머신러닝 알고리즘은 각자의 귀납적 편향을 가지고 있으며, 이를 통해 데이터를 해석하고 모델을 학습한다. 과적합과 과소적합 문제를 해결하고 최적의 모델을 찾는 것은 머신러닝의 중요한 과제다. 앞으로 다양한 알고리즘을 배우며 어떤 상황에서 어떤 모델을 사용하는 것이 좋을지 감을 잡아보자.

추천글 : 
[인공지능개론] Artificial Intelligence Basics
(https://hyeonb.blogspot.com/2024/09/artificial-intelligence-basics.html)

[데이터사이언스기초] Introduction to Machine learning
hyeon_B

안녕하세요! AI 기술을 이용해 더 나은 세상을 만들어 나가고 싶은 과기원생 Hyeon이라고 합니다. 저는 앞으로 인공지능 시대에는 지식을 '활용'하는 능력이 중요해질 것이라고 생각합니다. 대부분의 일들은 인공지능이 뛰어난 모습을 보이지만, 인공지능은 데이터로 부터 연관관계를 학습하기 때문에 지식들을 새로 통합해서 활용하는 능력이 부족합니다. 인공지능이 뉴턴 전에 만들어졌다면 사과가 떨어지는 이유에 대답하지 못했을 것이고, 아인슈타인 전에 만들어졌다면 중력이 어떻게 생기는지 설명하지 못했을 것입니다. 따라서 앞으로 우리는 '본질'을 탐구하고 그 본질로부터 다른 곳에 적용하며 인공지능을 현명하게 활용해야 할 것입니다. 함께 인공지능 시대를 준비합시다!

댓글 쓰기

다음 이전

POST ADS1

POST ADS 2