Consultants Blogger

생성형 AI 개념 정리 2 본문

Useful Knowledge for Life

생성형 AI 개념 정리 2

Jeffrey.C 2023. 9. 7. 11:00

아래는 인문학도들의 쉬운 이해를 위해 개념적으로 생성형 AI를 정리한 내용으로, 참조용으로 공유합니다.

 

1. AI 모델의 유형: 판별 모델과 생성 모델

 

AI모델이란 AI프로그램을 의미하며, AI모델은 어떻게 학습할 지 모델을 정하는 방법에 따라 크게 판별 모델과 생성 모델로 구분할 수 있음.

 

1.1. 판별 모델 (Discriminative Model) 

 

1.1.1. 특징

서로 다른 종류의 데이터를 구분
일반적으로 규칙과 논리에 기반
특정 패턴이나 특징을 찾아내어(학습하여) 물체를 식별 (패턴 인식 특화)
데이터를 학습하고, 를 기반으로 결정 또는 예측을 수행
주로 데이터를 분석하고 예측하는 데 사용
Class 차이에 주목하여 어떤 Class에 들어가야 할지 결정해 주는 모델

 

1.1.2. 모델 작동 예시

몇 가지 특징적인 pattern을 찾아 차이를 학습
모든 sample들 간의 거리를 기반으로 가운데 선을 찾는 과정
가장 가까이 있는 sample 2개를 집어서 그 두 개의 가운데를 가로지르는 decision boundary를 도출
 
1.2. 생성 모델 (Generative Model)
1.2.1. 특징
하는 일에 따라 새로운 데이터를 생성
원본 데이터의 확률분포를 추정하여 특정 데이터가 있을 확률을 알려
기존 데이터를 학습하여 새로운 데이터(Output)생성’ (패턴 생성 특화)
, 제공된 정보를 활용해 스스로 새로운 것을 만듦
훈련 데이터(Text, Image, Audio)와 유사한 새로운 데이터를 생성
Class 의 분포에 주목하여 어떤 분포에 들어갈 가능성이 가장 많은 지 결정해 주는 모델
 

1.2.2. 모델 작동 예시

주어진 training data를 학습하여 학습 데이터의 분포를 따르는 유사한 데이터를 생성하는 모델
문제점은 기존에 사용된 sample들과의 거리 값을 기준으로 분류하므로 새로운 feature가 입력되면 결과값이 나오지 않는 않음
따라서, 01처럼 명확한 결론을 도출하기에 적합하지 않은 모델 (Hallucination이 발생하는 이유)
 

1.3. 각 모델의 입력과 출력 예시

 

판별모델
손글씨가 0인지 1인지 차이를 말하려고 함
line을 통해 데이터가 어디에 배치되는지 모델링 할 필요없이 01을 구별 가능
, x 값이 0 이라고 class를 구분하면, y값은 0이라고 출력
Decision boundary(판별할 수 있는 경계)를 학습하고, 학습을 지속함에 따라 더욱 정확하게 판별
 
생성모델
 
데이터 공간에서 실제와 가까운 숫자를 생성해서 10을 생성하려고 함
, 0입력값으로 들어오면, 기존의 0을 만드는 분포를 통해 y값은 0을 출력
따라서 데이터 공간 전체의 분포를 모델링하는 과정이 필요
데이터 범주의 분포를 학습하며, 학습을 지속함에 따라 Latent Space (지형도)에는 분포가 지속 생성됨
 
 

2. 생성형 AI의 정의

 

다양한 선도 기관 및 기업들이 정의한 생성형 AI의 개념에는 몇 가지 공통적으로 포함되는 개념이 존재함

기관 Definition
IBM 원시 데이터를 가져와 '학습'을 통해 통계적으로 가능성이 높은 결과를 생성할 수 있는 딥러닝 모델을 말합니다. 높은 수준에서 제너레이티브 모델은 학습 데이터의 단순화된 표현을 인코딩하고 이를 바탕으로 원본 데이터와 유사하지만 동일하지는 않은 새로운 결과물을 생성합니다
NVIDIA 제너레이티브 AI를 사용하면 다양한 입력을 기반으로 새로운 콘텐츠를 빠르게 생성할 수 있습니다. 이러한 모델에 대한 입력 및 출력에는 텍스트, 이미지, 사운드, 애니메이션, 3D 모델 또는 기타 유형의 데이터가 포함될 수 있습니다.
Google 생성 모델은 표시된 예제에서 학습한 내용을 바탕으로 완전히 새로운 것을 생성하는 AI.
) 대규모 언어 모델(LLM)은 자연스러운 언어의 형태로 새로운 텍스트 조합을 생성하기 때문에 제너레이티브 AI의 한 유형입니다. 또한 Imagen, AudioLM, 페나키처럼 새로운 이미지, 오디오, 심지어 비디오같은 다른 유형의 결과물을 생성하는 언어 모델을 구축할 수도 있습니다. (Text to Image)
Amazon 생성형 AI는 대화, 이야기, 이미지, 동영상, 음악 등 새로운 컨텐츠와 아이디어를 만들 수 있는 인공 지능의 일종입니다. 모든 인공 지능과 마찬가지로 생성형 AI는 기계 학습 모델, 방대한 양의 데이터로 사전 훈련되며 일반적으로 파운데이션 모델(FM)이라고 불리는 대규모 모델을 기반으로 구됩니다. 생성형 AI는 컨텐츠 제작 외에 디지털 이미지의 품질을 개선하고, 동영상을 편집하며, 제조용 프로토타입을 빠르게 제작하고, 가상 데이터 세트로 데이터를 보강하는 등의 작업에도 사용됩니다.
Gartner 생성형 AI는 데이터에서 아티팩트(인공물, 가공물)의 표현을 학습하고, 이를 사용하여 원본 데이터와 유사하지만 반복되지 않는 새롭고 고유한 아티팩트를 생성하는 AI 기술을 말합니다.
제너레이티브 AI는 완전히 새로운 콘텐츠(텍스트, 이미지, 비디오, 오디오, 구조물 포함), 컴퓨터 코드, 합성 데이터, 워크플로 및 물리적 객체 모델을 생성할 수 있습니다.
DELL 생성형 AI는 사람이 명시적으로 프로그래밍하지 않고 기존 예제(학습 데이터)와 스타일과 구조가 유사한 콘텐츠(: 이미지, 텍스트 또는 오디오)를 생성할 수 있는 모델을 구축하는 인공 지능의 한 분야입니다. 생성형 AI 기술은 딥러닝 알고리즘을 사용하여 대규모 예제 데이터 세트에서 학습하고 패턴을 학습하여 원본 데이터와 유사한 새로운 콘텐츠를 생성합니다.
BCG 생성 AI학습 데이터에서 텍스트, 이미지 또는 오디오와 같은 새롭고 사실적인 콘텐츠를 생성할 수 있는 일련의 알고리즘입니다. 가장 강력한 제너레이티브 AI 알고리즘은 광범위한 작업에 대한 기본 패턴을 식별하기 위해 자체 감독 방식(비지도 학습)으로 레이블이 지정되지 않은 방대한 양의 데이터에 대해 학습된 파운데이션 모델을 기반으로 구축됩니다.
우리금융경영연구소 최근 등장한 AI방대한 양의 데이터 학습을 통해 다양한 사고와 소통이 가능할뿐 아니라 새로운 컨텐츠까지 만들수있는 '생성형'이라는 점이 주요 특징
-기존 AI특정 분야에 국한된 정보를 습득하고 사전에 입력된 질문에 정답을 제시하는 '분석형'으로, 활용 범위가 제한적(금융상담, 고객불편 사항 접수 등)
-
생성AI의 특징은 1.우수한 자연어 처리, 2. 새로운 컨텐츠(이미지, 글 등) 생산 능력, 3. 높은 범용성 등이며, 특정 분야의 업무처리를 위해 만들어진 분석형 AI와 달리 개인과 기업의 경제활동 대부분에서 활용가능
삼성 SDS 생성형 AI는 기계가 콘텐츠, 예술, 음악 등을 만들고 생성할 수 있도록 하는 인공지능의 하위집합으로 여러 산업을 변화시킬 수 있는 잠재력을 지닌 빠르게 진화하는 기술입니다. 생성형 AI는 독특하고 독창적인 결과를 생성하기 위해 인간의 행동, 사고 과정 및 창의성을 시뮬레이션할 수 있는 알고리즘을 사용하며, 기계가 입력 매개변수와 이전에 학습한 패턴을 기반으로 새로운 콘텐츠나 데이터를 생성할 수 있습니다. , 기존 데이터를 단순히 가공하거나 분석하는 것이 아니라, 새롭고 독창적인 콘텐츠를 생성하는 AI 접근 방식입니다. 생성형 AI 모델은 패턴을 학습하고 훈련 데이터와 유사한 새로운 출력을 생성하기 위해 대규모 데이터 세트에서 훈련됩니다.

(출처: 각 사)

다양한 기관이 정의하는 생성형 AI에는 몇 가지 공통적인 키워드가 존재함

1) (원본과 유사한) 새로운 것을 생성

2) 방대한 양의 데이터 (대규모 모델)

3) 범용성, 파운데이션 모델

4) 텍스트, 오디오, 이미지

 

3. 생성 모델의 형태와 Latent Space

 

현재 생성 모델에서 가장 보편적으로 사용되는 모델 형태가 트랜스포머이며, 인코더와 Latent Space, 디코더의 개념으로 구성되어 있음

 

3.1. 생성 모델의 형태

 

생성 모델의 형태 중 가장 보편적인 것이 트랜스포머(Transformer) 형태임
불과 5년 전까지도 가장 인기 있는 딥 러닝 모델로 손꼽혔던 합성곱과 순환 신경망(CNNRNN)을 이제는 트랜스포머가 대체하였음
트랜스포머는 모델은 Attention만으로 이루어진 encoder-decoder 구조의 sequence to sequence 모델임
입력값을 벡터 값으로 변환해 주는 것이 인코더, 생성된 값을 입력값과 동일한 출력 형태로 재변환 해주는 것이 디코더가 있으며 그사이에 일명 블랙 박스라고 불리우는 Latent Space(잠재 공간; 지형도)가 있음
스탠퍼드대학교 연구진은 2021년 8월에 발표한 논문에서 트랜스포머를 “파운데이션 모델(foundation model)”로 일컬은 바 있음
 
3.2. Latent Space/지형도의 개념

 

 
앞서, 생성모델은 데이터 공간 전체의 분포를 모델링하는 과정이 필요하다고 했는데,
모델링된 데이터 공간의 분포를 Latent Space (잠재 공간; 지형도)라고 정의함
  -잠재 공간(latent space) 또는 임베딩 공간(embedding space)이라고도 함
  -Latent란 데이터가 가지고 있는 잠재적인 변수
Latent Space 는 모델이 뱉어낸 벡터 값들의 집합체로, 모델을 통해서 이미지가 가지고 있는 Latent의 분포를 학습함
, Latent Vector는 한 이미지가 가지고 있는 잠재적인 벡터 형태의 변수이며, Latent Vector들이 모여서 latent space가 형성됨
위 그림에서는 Encoder 부분에서는 우리가 이미지에서 feature 벡터로 가는 과정을, Decoder에서는 이 featurelatent 형태에서 다시 이미지로 재구축 되는 과정을 보여줌

 

Latent Space는 판별 모델과 생성 모델 모두 지니고 있으나, 이미지 분류 모델과 같은 모델들은 이미지를 벡터로 만들어내고, 생성 모델은 벡터를 이미지로 만든다고 생각하면 됨

 

3.2.1. 판별 모델의 Latent Space

 

이미지에서 CNN과 같은 모델을 통해 이미지가 가지고 있는 feature들을 벡터화하여 Latent Space를 만들어 냄
학습과정에서 하나의 이미지에 대해 이를 표현하는 feature가 달라짐
이미지에서 벡터로 가는 과정이 기존의 classificationdetection에서 하는 작업
 

3.2.2. 생성 모델의 Latent Space

 

생성모델은 데이터의 분포를 학습하는 것인데, 데이터는 Latent Space를 가지고 있으며 학습 할 때 이 Latent Space를 학습하는 것
생성 모델은 Latent Space를 학습하여 이미지를 생성
생성모델은 반대로 벡터에서 이미지로 가는 학습과정을 거침

 

3.2.3. 데이터의 양과 학습, Latent Space 와의 상관관계

 

생성 모델은 학습 데이터를 통해 학습을 함으로써 데이터의 분포도(지형도)를 그리게 되며,
학습 데이터의 양이 방대하거나, 지속적으로 학습을 시킬 수록 Latent Space 의 해상도가 고도화됨
이 의미는 Latent Space의 해상도가 고도화됨에 따라, 해당 모델이 생성할 수 있는 출력값도 더욱 더 선명해지고 다양화해 진다는 의미
여기서 중요한 것은 특정 목적이나 용도를 위해서는 그 목적에 맞는 주제의 데이터로 학습하면 되고, 왼쪽의 Latent Space의 해상도로 충분
하지만, ‘범용 목적으로 다양하게 활용될 목적으로 상식 등의 데이터를 활용하여 학습시키면 광범위(범용)하게 활용될 수 있는 오른쪽 모형이 생성
, 생성 모델을 활용하여 범용의 목적으로 방대한 양의 general 데이터를 학습시켜 놓은 모델을 범용 모델, 파운데이션 모델이라 하며
이렇게 범용 모델 목적으로 미리 학습을 시켜 놓는 행위를 사전학습, Pre-trained라고 정의할 수 있음
 

4. 생성형 AI의 개념적 정리

 

 

생성 모델을 대용량 데이터로 학습을 시켜 범용 수준까지 Latent Space의 해상도를 높여 놓은 것을 생성형 AI라고 하며, 해당 생성형 AI를 특정 용도에 맞게 활용하기 위해 특정 도메인 지식 데이터를 추가 학습(Fine-tuning )하여 응용 가능함

 

 
4.1. 생성 모델
생성 모델을 활용하여 특정 목적 용도로만 사용 가능하게 사용함
, 특정 범위의 데이터, 예를 들어 고양이 데이터만으로 학습시킬 경우, 고양이 이미지만 생성 가능함
학습 데이터가 충분치 않은 경우 (모델 사이즈 기준), 생성되는 아웃풋의 퀄리티가 낮음
, 학습되지 않은 Feature는 알 수가 없으며, 생성할 수도 없음
 
4.2.생성형 AI

Generic 모델의 수준까지 대용량 데이터로 학습된 생성 모델을 생성형 AI라고 정의함

적은 양의 학습 데이터로 결과물 생성이 가능하며, 범용 목적으로 활용 가능함
  -ChatGPTDALL.E 등은 모두 생성형 AI로 분류 가능함
생성형 AI는 특정 분야의 응용을 위해 파운데이션 모델 개념으로 활용될 수 있음
 
 
4.3. 생성형 AI 활용
 
생성형 AI를 활용하여 특정 목적에 맞게 사용하기 위해서는 그 특정 목적에 맞는 데이터로 학습을 해야 함
특정 목적에 맞는 데이터를 Specific Domain Knowledge라고 할 수 있으며, 예를 들어 EPC 의 특정 섹터의 데이터일 수 있음
생성형 AI를 파운데이션 모델로 삼아 Latent SpaceSpecific Domain Knowledge 데이터를 학습시켜서 활용할 수 있음
 
 

가장 대중적으로 쓰이는 GPT의 경우, 3 가지 개념이 모두 포함되어 있음. 생성형모델을 활용하여(또는 생성을 목적으로) 사전 학습시켜 놓은 범용형 트랜스포머모델