Video thumbnail

Ep 68 GPT 3 – 하나의 모델, 무한한 언어


GPT-3 (2020) – 초거대 언어 모델


1. 개요

  • 발표: 2020년 6월, OpenAI
  • 정의: 1,750억 개의 파라미터를 가진 초대형 언어 생성 모델
  • 의미: 인간 수준의 텍스트 생성 능력으로 언어 AI의 새로운 기준을 제시함

2. 핵심 기술

  • 기반 구조: GPT-2의 Transformer 아키텍처를 100배 이상 확장
  • 학습 데이터: 인터넷 전체에서 수집된 대규모 텍스트(약 45TB 이상)
  • 학습 방식: Autoregressive Language Modeling (다음 단어 예측)
  • Few-shot / One-shot / Zero-shot 학습 지원: 예시 몇 개만으로 새로운 작업 수행 가능

3. 주요 능력

  • 자연어 처리 전반: 문서 요약, 질문응답, 번역, 에세이 작성, 창작
  • 코드 생성, 수학 문제 풀이, 철학적 대화 등 다양한 지식 도메인 대응
  • 일관성 있는 장문의 텍스트 생성 가능

4. 혁신적 특징

  • 범용성: 한 모델이 다양한 작업에 무파인튜닝 상태로 대응
  • Few-shot 학습: 학습 없이도 몇 개의 예시만으로 새로운 태스크 수행
  • 다양한 문체, 인격, 지식 배경으로 응답 가능

5. 한계와 논란

  • 사실 오류, 환각(hallucination), 편향된 발화 등
  • 높은 연산 비용과 에너지 소비
  • 가짜 뉴스, 악용 우려로 윤리적 논쟁

6. 의의

  • GPT-3는 단순한 언어모델을 넘어,
  • 하나의 모델이 수많은 인간 작업을 수행할 수 있다는
  • 범용 인공지능(AGI)의 가능성을 처음으로 눈앞에 보여준 존재였다.

Ep 68 GPT 3 – 하나의 모델, 무한한 언어 #chatgpt #deeplearning #nlp - AI Odyssey NLP