Open AI - ChatGPT - API 모델별 간략한 설명과 예시

반응형

 

해당 포스팅은 ChatGPT를 제공하는

openai.com 사이트에서 제공하는 api 모델에 대한 설명입니다.


OpenAI API란?

  • 자연어 처리를 비롯한 다양한 인공지능 기술을 활용하여 다양한 애플리케이션을 개발할 수 있는 API
  • 각기 다른 기능을 수행하는 다양한 모델 제공

DALL-E

  • 텍스트 입력에 대해 이미지를 생성하는 모델
  • 새로운 디자인 아이디어를 생성하거나 이미지 검색 등에 활용
  • 예) "호기심이 많고 역광을 받고 있는 흰색 샴 고양이의 스튜디오 클로즈업 사진"

<DALL-E 예시, 출처 OPENAI>


GTP-Neo

  • 흔히 우리가 아는 챗GPT 모델
  • chat.openai.com 사이트에서 사용하는 오픈 소스로 공개되어 있는 모델
  • GPT-3와 유사한 모델로 대규모 자연어 처리 데이터를 사용하여 학습
  • 자연어 처리 관련 다양한 작업 수행
  • 예) 이미지 렌더링의 개념이 뭐야?
이미지 렌더링(Image Rendering)은 이미지 파일을 브라우저에 표시하는 과정입니다.
브라우저는 HTML 문서에 포함된 이미지 파일을 읽어들이고,
해당 이미지를 화면에 렌더링하는 작업을 수행합니다.
이 과정에서 이미지를 화면에 출력하기 위해 여러 단계의 처리를 거치게 됩니다.
예를 들어, 이미지 파일을 디코딩하고 크기를 조정하는 등의 작업이 수행됩니다.
이러한 처리과정에서 브라우저마다 성능 차이가 발생할 수 있습니다.

GPT-3

  • 대화형 자연어 생성, 번역, 요약, 질문 응답 등 다양한 자연어 처리 작업에 사용
  • 인공지능 비서를 개발하거나 자동 번역, 문서 요약 등의 작업 수행
  • GPT-Neo와의 차이점
    • 다양한 사전학습 데이터와 발전된 모델 아키텍처
    • 이전 GPT모델들과 비교해서 더 높은 성능
    • 대규모 클라우드 컴퓨팅 자원을 사용한 학습 방법

Codex

  • 텍스트 입력에 대해 코드를 생성하는 모델
  • 자동으로 코드를 작성하는 기능 구현
  • 개발 생산성을 높이고 개발 시간 단축
  • 예) 자바스크립트, 이미지를 둥글게 보여주는 코드
var testImg = document.createElement('img');
testImg.src = 'URL'
document.body.appendChildtestImg);

/* 이미지 둥글게 자르기 */
testImg.style.borderRadius = '50%';

CLIP

  • 오픈 소스로 공개되어 있는 모델
  • 이미지와 텍스트를 결합한 다양한 멀티미디어 태스크를 수행할 수 있는 모델
    • 이미지와 텍스트 데이터를 이용한 다양한 자연어 처리 작업에 활용할 수 있음
    • 이미지 분류, 이미지 검색 등의 작업 수행
  • 모델의 학습 및 사용을 위한 코드와 튜토리얼 등의 자료는 GitHub에서 확인
  • 예시) '텔레비전 스튜디오 사진' 이미지 판독

<CLIP 예시, 출처 OPENAI>


참고

OpenAI

반응형