본문 바로가기
마케팅

Chat GPT 업그레이드 버전 GPT-4 출시 Open AI의 계속되는 발전 영상과 사진도 GPT로 알아보는게 가능하다고?

by Clover Marketer 2023. 3. 15.

Chat GPT 업그레이드 버전 GPT-4 출시 Open AI의 계속되는 발전

Open AI에서 새로운 AI을 발표했습니다. Chat GPT가 출시되며 세계적으로 엄청난 영향력을 보인 Chat GPT는 GPT-3.5버전의 AI에요. 최근에는 한국에서도 발 빠르게 도입되며 카카오톡의 채널인 UpSet을 통해서 사용이 가능해졌는데. 사실상 Chat GPT의 API를 가져와 사용을 하여 일상생활에서도 더욱 편하고 많이 사용이 가능하도록 바뀌었습니다.

 

 

 

 

Chat GPT → GPT-4

그렇다면 무엇이 바뀌었는지 알아볼게요. 가장 큰 차이점은 바로 텍스트 기반으로만 사용이 가능했던 Chat GPT가 이미지를 인식이 가능해졌다는 부분이에요.

이외에도 많은 부분들이 개선이 되었는데 기존에 조금 부족할 수 있었던 감정적인 부분이나 시 처럼 문맥상으로 비유를 사용하거나 감정적인 부분이 중요한 문학적 글에 대한 부분을 개선했다는 것이 Open AI에서의 발표입니다.  발표한 내용을 정리해서 살펴보도록할게요.

 

 

 

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks. For example, it passes a simulated bar exam with a score around the top 10% of test takers; in contrast, GPT-3.5’s score was around the bottom 10%. We’ve spent 6 months iteratively aligning GPT-4 using lessons from our adversarial testing program as well as ChatGPT, resulting in our best-ever results (though far from perfect) on factuality, steerability, and refusing to go outside of guardrails.

Over the past two years, we rebuilt our entire deep learning stack and, together with Azure, co-designed a supercomputer from the ground up for our workload. A year ago, we trained GPT-3.5 as a first “test run” of the system. We found and fixed some bugs and improved our theoretical foundations. As a result, our GPT-4 training run was (for us at least!) unprecedentedly stable, becoming our first large model whose training performance we were able to accurately predict ahead of time. As we continue to focus on reliable scaling, we aim to hone our methodology to help us predict and prepare for future capabilities increasingly far in advance—something we view as critical for safety.We are releasing GPT-4’s text input capability via ChatGPT and the API (with a waitlist). To prepare the image input capability for wider availability, we’re collaborating closely with a single partner to start. We’re also open-sourcing OpenAI Evals, our framework for automated evaluation of AI model performance, to allow anyone to report shortcomings in our models to help guide further improvements.
Capabilities
In a casual conversation, the distinction between GPT-3.5 and GPT-4 can be subtle. The difference comes out when the complexity of the task reaches a sufficient threshold—GPT-4 is more reliable, creative, and able to handle much more nuanced instructions than GPT-3.5.To understand the difference between the two models, we tested on a variety of benchmarks, including simulating exams that were originally designed for humans. We proceeded by using the most recent publicly-available tests (in the case of the Olympiads and AP free response questions) or by purchasing 2022–2023 editions of practice exams. We did no specific training for these exams. A minority of the problems in the exams were seen by the model during training, but we believe the results to be representative—see our technical report for details.internal reference 1
AP Calculus BCAMC 12Codeforces RatingAP English LiteratureAMC 10Uniform Bar ExamAP English LanguageAP ChemistryGRE QuantitativeAP Physics 2USABO Semifinal 2020AP MacroeconomicsAP StatisticsLSATGRE WritingAP MicroeconomicsAP BiologyGRE VerbalAP World HistorySAT MathAP US HistoryAP US GovernmentAP PsychologyAP Art HistorySAT EBRWAP Environmenta

 

 

 

 

 

- 적합도



예를 들어 한국어를 모르는 영어권 사용자가 언어를 배우기 위해서  한국어 학습 자료를 요청하니까, GPT-4는 상세한 체계적인 강의 목록을 제시해주었다는 것입니다. 그리고 추가적으로 설명을 추가했는데 학습 및 단어 기억 방법도 제시했습니다.

제시된 전부가 뛰어난 방법은 아니지만 Chat GPT의 기존 버전인 GPT-3.5에 기반되어 있는 기존의 챗GPT에 같은 요구를 했을 때 답을 해준 내용보다는 더욱 자세하고 유용한 정보를 제공한다는 점이다.


- 정확도

과거에 질문을 통한 오답에 대한 답변이 정확도가 높아졌다는 점인데, 인공지능 전문가 오렌 에치오니가 “오렌 에치오니(Oren Etzioni)와 엘리 에치오니(Eli Etzioni)가 무슨 관계냐?”라는 질문에 GPT-3.5는 형제사이라고 오답을 했었으나 GPT-4는 아버지와 아들 사이라고 맞게 답을 하는 등 정확도가 확실히 높아졌다고 합니다.



- 영상 설명


GPT-4는 문장에 대한 답변 능력이 더욱 정확도가 높아진 것뿐만 아니라 추가적으로 사진 및 영상에 대한 답변 능력도 새로 갖췄다고 합니다. 앞서 구글이 발표했던 사건 기억하시죠? 최초의 망원경에 대해서 잘 못 이야기를 하면서 주가 하락을 일으키게 된 사실이 있었는데 GPT-4에서는 영상으로도 그것을 이해하고 설명해주는것입니다. 그렉 브록먼 오픈AI 사장 겸 공동설립자는 허블 우주망원경이 촬영한 영상을 6개 문단으로 상세하게 설명하는 것을 시연했다.

또한 영상과 관련된 질문에도 답변을 했을 했는데. 심지어  식재료가 포함된 냉장고 내부 사진을 보고 만들 수 있는 음식 몇 가지를 제시했다.

이 기술은 아직 일반이 사용할 수 있도록 공개되지 않았으나 오픈AI사는 GPT-4를 사용해 인터넷 상의 영상이나 촬영된 영상에 대해 상세한 설명을 하는 비 마이 아이즈(Be My Eyes: 나 대신 보기) 서비스를 구축했기 때문에 조만간 이용이 가능해질 것으로 예상이 됩니다. 또한 기업용 유료 버전을 통해서 사용을 하면 수익 구조 역시 높아질 것으로 예상이 되어 chat gpt를 이용해서 수익 창출이 가능한 부분이 조금 더 구체화 되는거 같아요.


- 전문성



노스캐롤라이나대 심혈관 전문의 애닐 게히는 최근 자신의 환자의 병력과 증상을 일반인은 모르는 전문 의학 용어를 사용해 설명하고 치료법을 묻자 “정확한 치료법을 제시했다”고 했어요. 다른 환자들 사례에 대해서도 실제 이뤄지는 치료법을 알고 채팅으로 제시했다는 것이다.

아직 완전하지 않아서 게히 박사와 같은 전문가의 평가를 받아야 하지만 컴퓨터 프로그래밍에서 회계 분야까지 여러 분야에서 전문성을 발휘할 수 있다는 점은 다음 미래에는 전문적인 지식 역시 도움을 받을 수 있을거라는 평가가 확실히 있는거 같아요.


 

 

 

 

 

- 요약



뉴스나 책의 내용을 요약해달라고 하면 정말 중요한 부분을 걸러주도록 했는데요. 한 번 더 요약이 필요한 경우에는 요약이 된 문장에 추가적으로 요약을 해달라고하면 추가적으로 요약을 해주는 등 실제로 읽어서 중요한 부분을 선택하고 어떤 부분이 중요한지를 아는 지능이 있는 부분이 정말 대단한것 같다.. 평가를 진행한 에치오니 박사는 고품질의 요약과 비교를 할 수 있는 능력은 문장을 이해하고 이해한 내용을 표현하는 주목할 만한 능력으로 “뛰어난 지능의 형태”라고 평했다.


- 유머


가수 마돈나에 대해 새로운 농담을 만들라고 주문하자 웃음을 터트릴 수 있는 답을 제시했다. 마돈나의 최대 히트곡을 아는 사람이라면 충분히 웃을 수 있는 답변이다.

예컨대 GPT-3.5는 “마돈나가 은행에 간 이유는? 실제 돈을 빌리려고”라고 답했으나 GPT-4는 “마돈나가 기하학을 배우는 이유는? 다양한 각도로 포즈를 취하는 방법을 알고 싶어서”라고 답했다고해요. 이 부분은 실제로 사람처럼 생각을 하고 대답을 했다는 점에서 대단한 것 같습니다.

GPT-4는 “아재 개그”까지는 아니더라도 약간의 유머 감각이 더해졌다.


- 추론도 일부 실행



넓이가 무제한인 문을 탱크와 자동차 중 어느 것이 지나갈 수 있느냐는 질문에 GPT-3.5는 둘 다 가능하지만 높이가 변수라고 답했으나 GPT-4는 둘 다 가능하다고만 답하고 높이에 대한 언급이 없었어요.

샘 앨트먼 오픈AI CEO는 새 버전이 “약간의” 추론을 할 수 있다고 설명했다고합니다. 그러나 추론 능력은 상황에 따라 큰 차이가 났다. 오히려 GPT-3.5 버전이 높이를 감안해 추론한 점에서 앞섰다.


- 자격시험 통과



Open AI는 GPT-4가 미 41개주에서 실시되는 통합변호사시험 응시자 가운데 상위 10%의 성적을 낸다고 설명했다. 또 미국의 대학입학시험(SAT)에서 1600점 만점에 1300점을 받고 고등학교의 생물, 산수, 거시경제, 심리학, 통계학 및 역사학 선행학습과목 5과목 모두 점수 기준선을 넘었다고 밝혔다.

GPT-3.5는 통합변호사시험에서 낙방했었고 선행학습과목 점수가 높지 않았다고 하니 얼마나 몇개월 사이에 능력이 뛰어나졌는지 알 수 있는 부분이에요.

디젤트럭 수리소를 운영하는 사람에 관한 변호사 시험 문제에서 난해한 법률용어를 동원해 정확한 답을 낸 뒤 쉬운 영어로 설명해달라고 추가 주문을 하자 쉬운 영어로도 정확하게 답을 해냈다.

 

 

 


- 미래 전망 능력 부족



미래에 대한 전망을 제시하라는 주문에 잘 대응하지 못했는데요, 독창적인 추론을 만들어내지 못하고 다른 사람들이 제시한 전망을 종합하는 듯해요. 하지만 앞으로 더욱 개발이 되면서 전망 역시 훌륭하게 발전하지 않을까 싶습니다.



- 거짓말



GPT-4 역시 “환각”에 사로잡혀 엉뚱한 답을 내놓기도 했다. 모든 인공지능이 그렇듯 옳고 그름을 판별할 능력이 없기 때문에 가공의 답을 내놓는 것이다. AI의 한계라고 생각할 수 있으며, 한 편으로 이 부분은 실제로 감정을 가지고 사람에게 거짓말을 할 수 있는 지능이 생기는 부분이기 때문에 위험할 수 있어 분명 한계를 두고 있다고 저는 생각합니다. 만약 정보를 잘 못 알려주는 방식을 통해서 의학적인 지식이나 화학적인 부분에 오류를 일으키고 미래에는 거짓말을 하면서 사람에게 대항할 수 있다는 영화나 만화가 사실이 되는 일이 없어야 할 것이기 때문입니다.

 

 

 

 

 

728x90
그리드형

댓글