본문 바로가기

Biusiness Insight/AI · Data Science

프롬프트 엔지니어링 (Prompt Entineering)

반응형

 

1. 프롬프트 엔지니어링(Prompt Engineering)의 중요성

  • 거대 언어 모델(Large Language Model)과의 커뮤니케이션 역량: 프롬프트 엔지니어링(Prompt Engineering)은 인간과 인공지능(AI) 사이의 소통을 원활하게 하는 핵심 역량임.
  • 전략적 상호작용: 단순한 기술적 스킬을 넘어 인공지능(AI)과의 전략적 상호작용을 가능하게 하며, 인공지능(AI) 시대를 살아가는 필수적인 역량임.
  • 정확도 향상: 효과적인 프롬프트를 작성함으로써 인공지능(AI)이 보다 정확하고 관련성 높은 결과를 생성하도록 유도함.
  • 핵심 역할: 사실상 모든 "거대 언어 모델(Large Language Model) 관여" 요소마다 프롬프트의 역할이 매우 중요함.
  • 차별화된 역량: 좋은 프롬프트 작성 역량은 남들과 차별화된 개인의 중요 역량이 됨.
  • 시장 성장: 글로벌 프롬프트 엔지니어링(Prompt Engineering) 시장은 2022년 7,550만 달러 규모에서 2030년까지 소프트웨어 및 서비스 분야 모두 급격한 성장이 예상됨.

 

2. 프롬프트(Prompt)의 기본 구성요소 및 고려사항

  • 기본 구성요소:
    • 지시사항(Instruction): 인공지능(AI) 모델이 수행할 작업을 명확히 설명함.
    • 맥락(Context): 명령 이해를 돕는 배경 정보를 제공함.
    • 입력 데이터(Query): 질문이나 입력 내용으로, 다양한 형태가 가능함.
    • 출력 명세(Format): 원하는 출력 유형 및 형식을 명시함.
  • 작성 시 고려사항:
    • 모든 요소가 필수는 아니며, 작업 특성에 맞게 선택함.
    • 모델별(지피티(GPT), 클로드(Claude), 라마(Llama) 등)로 프롬프트 입력 방식에 차이가 존재함.
    • 거대 언어 모델(Large Language Model)이 더 잘 이해할 수 있는 프롬프트 엔지니어링(Prompt Engineering) 능력이 중요함.

 

3. Chain of Thought (CoT) 프롬프팅

  • 개념: 모델이 답을 내리기 전, 중간 추론 과정(Step-by-step reasoning)을 글로 표현하도록 유도하는 기법임. https://arxiv.org/abs/2201.11903
  • 필요성: 단순 정답 출력 시 발생할 수 있는 오류 가능성을 줄이고, 복잡한 문제 해결에서 추론 과정을 확인할 수 있음 .
  • 활용 분야: 수학 문제 풀이, 논리적 사고, 계획 수립, 코드 작성 등.
  • 예시 (상태별 차이):
    • 표준 프롬프팅(Standard Prompting): 질문 후 바로 정답(The answer is 11)을 도출함 .
    • Chain of Thought 프롬프팅: "로저는 5개의 공으로 시작했고, 3개입 깡통 2개는 6개의 공입니다. $5+6=11$입니다."와 같이 사고 과정을 거침 .

 

4. Few-Shot 프롬프팅

  • 개념: 모델에게 답을 요구하기 전에 몇 가지 예시(입력 → 출력 쌍)를 제공하여, 모델이 패턴을 학습한 뒤 새로운 문제를 해결하게 하는 기법임.
  • 특징:
    • 제로샷(Zero-Shot)보다 정확도가 높음.
    • 모델에게 원하는 스타일이나 형식을 학습시킬 수 있음.
  • 유형:
    • 제로샷(Zero-Shot): 예제 없이 지시사항만 전달하고 모델이 직접 추론함.
    • 원샷(One-Shot): 단 하나의 예제만 제공함.
    • 퓨샷(Few-Shot): 여러 개의 예제를 제공함.
  • 활용 분야: 텍스트 분류(감정 분석), 변환 태스크(요약, 번역, 포맷 변환), 질의응답 등 .

 

5. Few-Shot CoT 프롬프팅

  • 개념: 예시(퓨샷, Few-Shot)에 추론 과정(생각의 사슬, Chain of Thought)을 포함시켜, 모델이 새로운 문제에서도 단계적 사고를 모사하도록 유도하는 기법임.
  • 특징 및 효과:
    • 단순한 패턴이 아닌 사고 과정 자체를 학습함.
    • 여러 단계를 거쳐야 하는 멀티홉(Multi-hop) 질문에서 강력함.
    • 정답뿐 아니라 추론 근거를 제시하여 신뢰도와 설득력을 높임.
  • 예시: 아인슈타인의 국적 예시를 통해 "출생지와 국적의 상관관계"라는 사고 과정을 학습시킨 후, 빌 게이츠의 본사 위치 질문에 대해 "창업자 → 회사 → 본사 위치"라는 논리 흐름을 따르게 함 .

 

6. Zero-Shot CoT 프롬프팅

  • 개념: 추론 과정의 예시 없이 **"단계별로 생각해보자(Let's think step by step)"**와 같은 간단한 프롬프트를 추가하여 모델 스스로 단계별 추론을 수행하게 함.
  • 특징: 기존 제로샷(Zero-Shot) 대비 큰 성능 향상을 제공하며, 특히 다단계 추론이 필요한 문제에서 효과적임.
  • 성능 확인: 매개변수 규모가 큰 모델(1750억 개(175B), 5400억 개(540B) 등)일수록 표준 프롬프팅 대비 생각의 사슬(Chain of Thought) 사용 시 정답률이 비약적으로 상승함 .

 

 

반응형