AI - 인공지능 개념 이해


최근 몇 년간 인공지능(AI, Artificial Intelligence) 은 기술 업계의 가장 뜨거운 화두이다.
이제는 우리 일상 깊숙이 자리 잡아, 누구나 한 번쯤을 그 이름을 들어보고 관련 서비스를 이용해 본 경험이 있을 것이다.
하지만 ‘인공지능이 정확히 무엇인가?’ 라는 질문에는 선뜻 답하기 어령ㄹ 수 있다.

이 포스트에서는 인공지능(AI)의 큰 그림을 이해하고, AI 를 구현하는 핵심 기술인 머신러닝(ML, Machine Learning)이 무엇인지 살펴본다.

이어서 머신러닝이 데이터를 학습하는 대표적인 3가지 방법인 지도 학습, 비지도학습, 강화 학습에 대해 알아본다.

마지막으로 구글에서 제공하는 티처블 머신(Teachable Machine), 퀵 드로우(Quick, Draw!), 오토드로우(AutoDraw) 도구를 통해 AI 를 직접 체험하며 그 원리를 직관적으로 이해해본다.


목차


1. 인공지능

1.1. 인공지능(AI, Artificial Intelligence)

인공지능은 단어 그대로 ‘인공적으로 만든 지능’을 의미한다.
여기서 말하는 ‘지능’이란, 단순히 계산을 넘어 무언가를 보고 그것이 무엇인지 인식하고(시각 지능), 말을 듣고 의미를 이해하여(언어 지능), 나아가 스스로 생각하는(추론 능력) 모든 과정을 포함한다.
이처럼 인간 고유의 영역이라 여겨졌던 지능적인 행동을 기계가 수행할 수 있도록 만드는 모든 기술과 연구 분야를 인공지능이라고 한다.


1.2. 머신러닝(ML, Machine Learning)

그렇다면 인공지능은 어떻게 구현할까?
다양한 방법이 있지만, 현대 AI의 대부분은 머신러닝 기술을 기반으로 한다.
머신 러닝은 ‘기계 학습’이라는 이름처럼, 기계가 데이터를 통해 스스로 학습하도록 만드는 방법론이다.

과거에는 개발자가 특정 상황에 대한 모든 규칙과 로직을 직접 프로그래밍해야 했다. 하지만 머신러닝은 다르다. 기계에 방대한 양의 데이터와 그에 따른 결과(정답)을 함께 제공하면, 기계가 데이터와 결과 사이의 패턴과 관계를 스스로 발견하여 학습 모델을 만들어낸다. 이렇게 학습된 모델은 새로운 데이터 입력을 받았을 때, 학습한 패턴을 기반으로 미래의 결과를 예측하거나 분류할 수 있다.
즉, 기계가 스스로 프로그램을 만들어 나가는 셈이다.

여기서 많은 사람들이 딥러닝(Deep Learning) 과의 관계를 궁금해한다. 간단히 정리하면 아래와 같다.

  • 인공지능(AI)
    • 가장 포괄적인 개념, ‘지능을 가진 기계’를 만들려는 모든 노력
  • 머신러닝(ML)
    • AI 를 구현하는 핵심 방법론, 데이터로부터 기계가 스스로 학습
  • 딥러닝
    • 머신러닝의 한 분야
    • 인간의 뇌 신경망(뉴런)을 모방한 ‘인공 신경망’ 기술을 활용하여 더 복잡하고 정교한 학습을 수행

따라서 ‘딥러닝은 머신러닝에 포함’되지만, ‘모든 머신러닝이 딥러닝인 것은 아니다.’
이 관계를 이해하는 것이 AI 기술의 구조를 파악하는 첫걸음이다.


1.3. 생성형 인공지능(Generative AI)

AI 기술은 데이터를 분석하고 분류하는 수준을 넘어, 이제는 세상에 없던 새로운 콘텐츠를 직접 창조하는 단계에 이르렀다.
이를 생성형 인공지능이라고 한다.
생성형 AI 는 학습한 방대한 데이터를 기반으로 사용자의 요구에 따라 글쓰기, 그림 그리기, 음악 작곡, 영상 제작 등 창의적인 결과물을 만들어낸다.

현재 우리 주변에서 쉽게 접할 수 있는 대표적인 생성형 AI 서비스는 아래와 같다.

  • ChatGPT(Open AI)
    • 사람처럼 자연스러운 대화를 이어가는 대규모 언어 모델 기반 챗봇
  • Gemini(Google)
    • 생성형 인공지능 알고리즘인 트랜스포머 기술을 개발한 구글에서 만든 생성형 AI, 지속적인 모델 성능 향상이 특징
  • ClaudeI(Anthropic)
    • OpenAI 초기 멤버들이 설립한 Anthropic 에서 개발한 AI 챗봇, 안전성과 대화 품질에 초점
  • DeepSeek
    • 중국 AI 스타트업에서 개발한 오픈소스 기반 대형 언어 모델, GPT 계열과 유사한 성능을 보이나 개인정보 활용 관련 사회적 이슈 발생
  • Stable Diffusion
    • 오프소스로 공개된 이미지 생성 AI, 텍스트 입력만으로 고품질 이미지 생성 가능

2. 머신러닝 학습 방법

머신러닝은 데이터로부터 스스로 학습힌다. 그렇다면 기계는 어떤 방식으로 학습을 진행할까?

학습 데이터의 형태와 학습 목표에 따라 크게 지도 학습, 비지도 학습, 강화 학습 세 가지로 구분할 수 있다.


2.1. 지도 학습(Supervised Learning): 정답을 알려주며 가르치기

지도 학습은 이름처럼 ‘감독’ 또는 ‘지도’를 받으며 학습하는 방식이다. 여기서 감독 역할을 하는 것은 바로 ‘정답(Label)’이 있는 데이터이다. 마치 학생이 정답이 표시된 문제집을 풀며 공부하는 것과 같다.

모델에 이미지 데이터를 주면서 ‘이건 고양이’, ‘이건 강아지’ 라고 명확한 정답(레이블)을 함께 알려주면, 모델은 수많은 데이터를 통해 고양이의 특징과 강아지의 특징을 스스로 학습한다. 이렇게 학습이 완료된 모델은, 처음 보는 강아지나 고양이 사진을 보고도 높은 정확도로 구분해낼 수 있다.

지도 학습은 예측하려는 결과의 형태에 따라 주로 분류회귀 두 가지로 문제로 나뉜다.


1)분류(Classification)

분류는 데이터를 정해진 카테고리 중 하나로 구분하는 작업이다. 결과값이 ‘A인가, B인가?’처럼 명확하게 떨어지는 분제이다.

  • 이진 분류
    • 주어진 데이터를 ‘예/아니오’, ‘성공/실패’처럼 단 두 가지 범주로 나누는 경우
    • 예) 메일이 스팸인지 정상인지 판단
  • 다중 분류
    • 3개 이상의 여러 범주 중 하나로 데이터를 분류하는 경우
    • 예) 손으로 쓴 숫자 이미지(0~9) 식별

2)회귀(Regression)

회귀는 카테고리를 나누는 대신, 연속적인 값을 예측하는 작업이다. 결과값이 특정 범위 안의 수치로 나타나는 문제이다.

방의 개수, 범죄율, 역세권 여부 등의 데이터를 기반으로 주택 가격 예측, 과거 데이터와 시장 상황을 깁간으로 주식 가격 예측 등이 있다.

분류가 ‘무엇인가’를 맞추는 문제라면, 회귀는 ‘얼만인가’를 예측하는 문제라고 생각하면 이해하기 쉽다.


 분류회귀
목표데이털가 어떤 카테고리에 속하는지 구분데이터 간의 관계를 파악하여 연속적인 수치 예측
결과값이산적인 값(예: 스팸/정상)연속적인 값(예: 25.5도, 300원)
주요 사례이미지 분류, 스팸 메일 필터링주택 가격 예측, 택시 수요량 예측

2.2. 비지도 학습(Unsupervised Learning): 정답 없이 패턴 찾기

지도 학습이 ‘정답’이 있는 데이터로 학습하는 것과 달리, 비지도 학습은 정답(레이블)이 없는 데이터를 사용한다.
정답이 없는데 AI 는 어떻게 학습하는 걸까?

비지도 학습은 데이터 자체에 내재된 숨겨진 구조, 관계, 패턴을 스스로 찾아내는 방식이다.

예를 들어 ‘사과’와 ‘배’ 사진이 뒤섞여 있는 데이터셋이 있다고 가정해보자.
비지도 학습에서는 어떤 사진이 사과이고 배인지 알려주지 않는다. 대신 AI 에서 “이 시진들을 특징에 따라 2개의 그룹으로 나눠봐” 라고 지시한다.
그러면 AI 는 각 사진의 색상, 모양, 질감 등 시각적 특징을 스스로 비교 분석하여 두 그룹으로 분류한다.

결과적으로 높은 확률로 한 그룹에는 사과 사진들이, 다른 그룹에는 배 사진들이 모이게 된다.
여기서 중요한 점은 AI 는 이 그룹이 ‘사과’인지 ‘배’인지는 모른다는 것이다.
단지 데이터의 특징을 기반으로 ‘A 그룹’과 ‘B 그룹’으로 나누었을 뿐이다.
이처럼 정답 없이 데이터의 본질적인 특성을 파악하여 지식을 얻는 것이 비지도 학습의 핵심이다.

현실 세계의 수많은 데이터에는 레이블이 없는 경우가 훨씬 많기 때문에, 비지도 학습은 매우 유용하게 활용된다.
대표적인 비지도 학습 기법으로는 군집화차원 축소가 있다.


1)군집화(Clustering)

군집화는 데이터들을 유사한 특징을 가진 것끼리 묶어 여러 개의 그룹(Cluster)으로 나누는 작업이다.

활용 사례: 고객 세분화를 통한 상품 추천 시스템

  • 수많은 고객의 구매 내역 데이터를 비지도 학습 모델에 입력함
  • 모델은 구매 패턴(예: 자주 구매하는 상품 카테고리, 구매 주기, 평균 결제 금액 등)을 분석하여 고객들을 몇 개의 그룹(예: 알뜰한 학생 그룹, 최신 IT 기기 매니아 그룹 등)으로 자동 분류함
  • 새로운 고객이 가입하면, 그 고객의 초기 구매 패턴을 분헉하여 어떤 그룹과 가장 유사한지 판단함
  • 해당 그룹의 다른 고객들이 많이 구매했던 상품을 새로운 고객에서 추천함으로써 개인화된 마케팅 수행

2)차원 축소(Dimensionality Reduction)

데이터를 설명하는 각각의 특징을 피처(feature) 또는 차원(dimension)이라고 한다. 예를 들어 집값을 예측할 때 ‘방 개수’, ‘범죄율’, ‘접근성’ 등이 모두 피처이다.

차원 축소는 수많은 피처(고차원) 중에서 데이터의 핵심적인 특징을 가장 잘 나타내는 소수의 피처(저차원)만 남기거나, 여러 피처를 압축하여 새로운 대표 피처를 만드는 과정이다.

  • 필요성
    • 데이터에 피처가 너무 많으면 의미 없는 정보까지 포함되어 모델의 성능이 저하되거나 학습 시간이 지나치게 길어질 수 있음
  • 작동 방식
    • 비지도 학습을 통해 여러 피처 간의 관계를 분석하고, 중복되거나 중요도가 낮은 피처를 제거/결합하여 데이터를 효율적으로 압축함
  • 효과
    • 모델의 학습 속도를 높이고, 더 적은 데이터로도 좋은 성능을 내게 하며, 데이터를 시각화하는데 유용함


 군집화차원 축소
목표데이터 내의 숨겨진 그룹(군집) 발견데이터의 핵심 특징만 남기고 압축
결과데이터가 속한 그룹 정보(예: 고객 A는 1번 그룹)더 적은 수의 효율적인 피처로 구성된 데이터셋
주요 사례고객 세분화, 이상 거래 탐지데이터 시각화, 모델 학습 속도 향상

2.3. 강화 학습(Reinforcement Learning): 보상을 통해 최적의 행동 찾기

지도 학습과 비지도 학습이 주어진 데이터를 분석하는 ‘정적인 학습’에 가깝다면, 강화 학습은 에이전트가 환경과 직접 상호작용하여 ‘동적으로 학습’하는 방식이다.

핵심은 사용자가 제공한 ‘시행착오’라는 키워드에 있다. 강화 학습은 명확한 정답도, 데이터 속 패턴 분석도 아닌, 수많은 시행착오를 통해 보상(Reward)을 최대화하는 행동 방식(Policy)을 스스로 터득해 나간다.

가장 직관적인 예시는 반려동물을 훈련시키는 과정이다.

  • 강아지(에이전트)가 거실(환경)에 있다.
  • 주인이 “앉아!”라고 말한 상황(상태, State)에서 강아지는 여러 행동(Action)을 취할 수 있다. (앉기, 눕기, 짖기 등)
  • 만일 ‘앉는’ 행동을 하면, 주인은 간식이라는 긍정적 보상을 준다. 다른 행동에는 아무런 보상을 주지 않거나 “안돼!”라는 부정적 피드백을 준다.
  • 이 과정이 반복되면 강아지는 “앉아!” 라는 상태에서는 ‘앉는’ 행동을 해야 가장 큰 보상을 얻을 수 있다는 최적의 전략을 학습하게 된다.

이처럼 강화 학습은 에이전트, 환경, 상태, 행동, 보상이라는 5가지 핵심 요소로 구성되며, 에이전트는 누적 보상을 최대로 만드는 방향으로 자신의 행동을 계속해서 수정하고 개선해 낙나다.

강화 학습의 대표적인 사례: 알파고(AlphaGo)

강화 학습의 강력함을 전 세계에 알린 가장 유명한 사례는 단연 구글 딥마인드의 알파고이다.

  • 알파고(에이전트)는 바둑의 규칙(환경) 안에서 스스로와 수백만 번의 대국을 펼쳤다.
  • 바둑돌을 놓는 하나하나의 수가 행동이었고, 대국에서 승리하면 긍정적 보상을, 패배하면 부정적 보상을 받았다.
  • 이 무수한 시행착오를 통해 알파고는 인간의 기보(데이터)에만 의존하지 않고, 인간이 한 번도 시도하지 않았던 창의적인 수를 발견하며 최적의 승리 전략을 스스로 터득했다.

이 외에도 강화 학습은 로봇이 걷는 법을 배우거나, 공장 라인을 최적화하고, 자율주행차가 안전하게 운전하는 방법을 학습하는 등 복잡한 의사결정이 필요한 문제 해결에 널리 사용되고 있다.


3. 인공지능 체험


참고 사이트 & 함께 보면 좋은 사이트

본 포스트는 이영호 저자의 모두의 인공지능 with 파이썬을 기반으로 스터디하며 정리한 내용들입니다.






© 2020.08. by assu10

Powered by assu10