본문 바로가기

IT/AI , 로봇

chatgpt o1-mini vs 4o

최근 o1 (chatgpt's project strawberry) 이 나왔죠~ (2024 년 9월 12일) 

 

느리긴 하지만 구조적으로 길게~ 생각해주고 답변해서 너무 만족스러운 답변을 해줘서 좋습니다~!

 

유료 플랜을 쓰고 있고요..

그런데 자꾸..o1-preview 의 할당량이 다했는지 자꾸 4o로 전환이 되고 있는데요 ㅡㅡ;

chatgpt

그러면

GPT-4o 대신 o1 Mini 를 선택해서 쓰면 안될까?

 

Mini 는 기존 모델 대비 더욱 컴팩트하고 효율적인 버전인 만큼 일부 성능을 희생했습니다.

 

왜 있는걸까?

 

대규모 모델은 상당한 계산 리소스가 필요합니다. 높은 정밀도와 광범위한 데이터 처리를 요구하는 작업에 적합합니다.


반면 Mini 버전은 더 작고 리소스 효율성이 더 높습니다.

 

"그래도 새로나온 o1버전이니까 최신 정보기반 아닐까?"

 

그러나 o1 버전에 대해서도 물어봐도 스스로 잘 모르고 있습니다.

 

 

o1 버전에 대한 질문의 o1 mini 답변 :

현재 언급하신 "chat gpt o1", "4o", "o1-mini"는 일반적으로 알려진 OpenAI의 GPT 모델 이름과 일치하지 않습니다. 아마도 타이포(오타) 또는 혼동으로 인해 발생한 것으로 보입니다. 대신, 일반적으로 사용되는 GPT 모델들을 기준으로 비교해 드리겠습니다.

일반적으로 알려진 GPT 모델들

  1. GPT-3
  2. GPT-3.5
  3. GPT-4
각 모델의 특징과 차이점을 아래에 정리해 보았습니다.

 

 
저는 다른 질문들을 더 해봤는데 체감적으로도 o1-preview 수준으로는 나오는것 같진 않더라고요
 
 
 
But...
 
아래 링크 글을 보시면 수학문제를 푼다거나 하는 퍼포먼스 비교에서는 압도적임을 알 수 있습니다.
 

 

 

채팅모드로 쓰는 일반적인 용도로 mini 버전을 쓸 가치는 크지 않지만,

(chatgpt 설명 그대로 GPT 4o 만으로도 그럭저럭 "대부분의 업무에 탁월"합니다)

 

o1 만 할 수 있는 문제 해결 능력을 사용하려면 o1-mini 라도 쓰면 됩니다.

STEM(과학, 기술, 공학, 수학) 특히 수학과 코딩 분야에서 탁월하며, AIME (수학 시험) 및 Codeforces (코딩 시험 플랫폼) 와 같은 평가 벤치마크에서 OpenAI o1 의 성능에 근접하다는 근거를 제시하고 있네요