본문 바로가기
IT와 개발/AI 이야기

GPT-4o 소개

by 도서 임보자 2024. 5. 21.

OpenAI는 무료 사용자를 포함한 모든 사람에게 GPT-4 인텔리전스를 제공하는 새로운 프로그십 모델인 GPT-4o를 공개 하였습니다.

GPT-4o는 즉각적인 반응성, 실시간 대화형 음성 기능, 강화된 시각적 콘텐츠 해석 능력, 실시간 번역, 그리고 감정 인식 능력과 같은 고급 기능을 갖추었으며 향 후 몇 주 내에 모든 사용자에게 공개할 예정이라고 합니다.

이로써 무료 사용자를 포함한 많은 사람들이 AI 기술의 최점단을 경험하게 되었는데, 과연 GPT-4o는 AI기술의 다음 단계로의 진입을 알리는 신호탄이 될 수 있을까요?

그 예측의 실마리는 아래 영상을 통해 잡을 수 있으리라 생각 됩니다. OpenAI가 선보일 새로운 시대의 AI 기술을 직접 확인해 보세요.

 

 

출처: https://youtu.be/DQacCB9tDaw

 

 

 

1. GPT-4o 출시와 주요 기능

  • GPT-4o는 ChatGPT의 새로운 플래그십 모델로, 모든 사용자에게 무료로 제공됩니다.
  • 데스크탑 버전의 ChatGPT가 출시되어 사용이 더욱 간편하고 자연스러워졌습니다.
  • GPT-4o는 GPT-4의 지능을 기반으로 하며, 무료 사용자도 이용할 수 있습니다.
  • 라이브 데모를 통해 GPT-4o의 모든 기능을 시연할 예정입니다.
  • 앞으로 몇 주 동안 GPT-4o를 점진적으로 출시할 계획입니다.

 

2. 새로운 GPT-4o 모델을 출시하여 사용자 경험 개선에 초점

  • ChatGPT를 회원가입 없이 사용할 수 있게 했고, 사용자가 어디에서나 쉽게 ChatGPT를 사용할 수 있도록 했습니다.
  • 사용의 편리함을 위해 사용자 인터페이스(UI)를 새롭게 단장했으며, 모델의 복잡성은 증가했음에도 불구하고, 상호 작용 경험을 더 자연스럽고 간단하게 만드는데 중점을 두었습니다.다.
  • 오늘 GPT-4o라는 새로운 플래그십 모델을 출시했고, 이는 GPT-4의 성능은 유지하면서 속도가 훨씬 빠르다고 발표했습니다.
  • 지난 몇 년간 모델의 지능 향상에 집중해왔고, GPT-4o는 사용 용이성에 큰 진전을 이루었을 뿐만 아니라 차세대 컴퓨터와의 상호작용의 미래를 변화시킬 것으로 기대합니다.
  • 이러한 상호작용은 매우 복잡하지만, 사람 간 대화의 자연스러움을 모방하여 배경 소음, 동시 다발적인 대화 속에서도 사용자의 음성 농담을 이해하는 기능을 포함합니다.

 

3. GPT-4o로 음성, 텍스트, 그리고 비전을 아우르는 사용자 경험 제공

  • 기존에는 음성 모드에서 세 가지 모델—속기(transcription), 인텔리전스(intelligence), 텍스트 음성 변환(text to speech)—이 협력하여 경험을 제공했습니다.
  • 그 과정에서 지연(latency)이 발생해 사용자의 몰입을 방해했고, ChatGPT와의 협업에 지장이 발생했습니다.
  • 하지만, GPT-4o에서는 이 모든 과정이 자연스럽게 수행되며, 음성, 텍스트, 그리고 시각 등 여러 영역 전반에 걸쳐 상호작용이 제공됩니다.
  • 이러한 뛰어난 효율성 덕분에 무료 사용자들에게도 GPT-4o의 인텔리전스 기능 제공할 수 있게 되었습니다.
  • 이는 수개월 동안의 노력 끝에 모든 사용자에게 GPT-4를 제공할 수 있게 되어 매우 기쁘게 생각한다는 점을 시사합니다.

 

4. ChatGPT 사용자 기능 확장 및 개선 발표

  • 현재 ChatGPT를 사용하는 사람이 1억 명을 넘었으며, 이 프로그램은 작업 생성, 학습 등에 활용되고 있습니다.
  • 이제까지 유료 사용자에게만 제공되었던 고급 도구들이 효율성의 향상으로 모든 사용자에게 제공될 예정입니다.
  • 대학 교수가 학생들을 위한 콘텐츠를 만들거나, 팟캐스터가 청취자들을 위한 콘텐츠를 만드는 등, 더 많은 사용자들이 GPT 기술을 활용할 수 있게 되었습니다.
  • 새로운 기능으로는 이미지가 포함된 문서를 업로드할 수 있는 'Vision', 대화 내용에 연속성을 부여하는 'Memory', 실시간 정보 검색이 가능한 'Browse', 고급 데이터 분석을 위한 '차트 및 도구 업로드'가 포함됩니다.
  • 또한, ChatGPT의 질과 속도가 50개국의 다양한 언어로 개선되어 더 많은 사람들이 경험할 수 있게 되었습니다.
  • 이 변경 사항들로 인해 무료 사용자에게 GPT-4.0의 더 많은 기능이 제공되고, 유료 사용자는 무료 사용자보다 5배 더 많은 용량 한도를 계속해서 이용할 수 있습니다.

 

5. GPT-4o의 API 출시 및 안전한 배포에 대한 도전

  • GPT-4o는 ChatGPT에서뿐만 아니라 API를 통해서도 이용할 수 있으며, 개발자들이 오늘부터 GPT-4o를 사용하여 멋진 AI 애플리케이션을 만들고 대규모로 배포할 수 있습니다.
  • GPT-4o는 이전 대비 빠르고 비용이 50% 절감되며 GPT-4 Turbo에 비해 5배 높은 요청 한도를 제공합니다.
  • 새로운 기술을 세상에 선보이는 것은 유용함과 안전함을 동시에 고려하는 복잡한 과정인데, GPT-4o는 실시간 오디오, 실시간 비전과 같은 새로운 도전이며, 개발팀은 오용에 대한 예방책을 마련하기 위해 노력하고 있습니다.
  • 정부, 미디어, 엔터테인먼트 등 다양한 산업 및 시민 사회와 협력하여 이 기술을 세계에 선보이는 최선의 방법을 모색하고 있습니다.
  • 다음 몇 주 동안 모든 기능을 출시하기 위한 배포를 계속하겠지만, 오늘은 이러한 기능들을 여러분에게 보여주고 실시간 데모를 진행하고자 합니다.

 

6. GPT-4o를 소개하며 라이브 데모 수행

  • 마크 첸 (Mark Chen)과 바렛 조프 (Barrett zoph)가 연구 책임자로서 '실시간 대화형 스피치' 기능을 공유하기 위해 무대에 올랐습니다.
  • 바렛 조프가 자신을 소개하고, 첸은 플로리다에 관한 발표를 준비 중임을 밝혔습니다.
  • 첸은 ChatGPT의 신규 기능인 GPT-4o의 오디오 기능을 시연하여 대화형 AI와의 상호작용을 보여주었습니다.
  • 무대에서 경험하는 긴장감에 대해 ChatGPT가 조언을 주며, 첸에게 심호흡을 권하고 긴장을 완화시켜 발표에 대한 부담감을 줄여주는 모습을 보여주었습니다.

 

7. GPT-4o 데모 내용

1) ChatGTP의 새로운 음성 모드 기능과 그 차이점

  • 이 새로운 음성 모드에서는 사용자가 말하는 도중에 챗봇을 중단시키지 않고, 2~3초의 지연 없이 즉각적으로 반응합니다.
  • 또한 ChatGPT는 사용자의 감정상태를 감지할 수 있는데, 예를 들어 숨을 가쁘게 쉬는 경우 진정하라고 조언할 수 있습니다.
  • ChatGPT는 다양한 스타일의 목소리로 반응하며 광범위한 감정을 표현할 수 있는 기능을 가지고 있습니다.
  • 마크 첸은 ChatGPT에게 사랑에 빠진 로봇에 대한 이야기를 요청하는 데모를 실행하여 이를 시연하였습니다.

2) 동화 낭독 연습에서 감정과 로봇 목소리 변화 요청

  • 동화 'Bite'라는 이름의 호기심 많은 로봇 이야기를 ChatGPT가 낭독하고 있습니다.
  • 마크 첸은 낭독자에게 목소리에 더 많은 감정과 드라마를 담을 것을 요청하였습니다.
  • ChatGPT는 드라마를 추가하고, 마크 첸의 요청으로 표현력을 최대한 활용하여 다시 낭독합니다.
  • 미라 무라티 (Mira Murati)는 이번에는 로봇처럼 목소리를 내볼 것을 요청하고, ChatGPT 는 드라마틱한 로봇 목소리로 낭독을 시작합니다.

3) ChatGPT의 목소리와 시각 인식 능력 시연

  • 마크 첸이 ChatGPT에게 이야기를 하고 노래하는 목소리로 말해달라고 요청했을 때, ChatGPT는 로봇 친구를 찾는 이야기를 들려주었습니다.
  • 이에 관객들은 박수로 반응했고, 미라 무라티는 ChatGPT의 목소리 능력을 소개한 후 시각 인식 능력도 보여주고자 했습니다.
  • 바렛 조프가 ChatGPT와 대화를 나누며 수학 문제를 같이 풀어보려고 했는데, ChatGPT가 문제를 보지도 않고 성급하게 반응했다가 바렛 조프의 지적을 받았습니다.
  • ChatGPT는 바렛 조프가 문제를 준비할 때까지 기다림을 표현하며 준비된 자세를 보였습니다.

4) ChatGPT에게 방정식 풀이 지도 받기

  • 바렛 조프가 ChatGPT에게 방정식 '3X + 1 = 4'를 이용하여 X의 값을 구하는 방법에 대한 풀이를 요청했습니다.
  • ChatGPT는 우선 모든 X항을 한쪽으로, 상수를 다른 한쪽으로 이동시키는 것이 첫 단계라고 설명했습니다.
  • 조프가 1을 양쪽에서 빼는 연산을 시도한 후, 챗봇은 조프가 올바르게 '3X = 3'을 얻었다고 확인 해주었습니다.
  • ChatGPT의 힌트로 곱셈의 반대 연산인 나눗셈을 통해 X의 값을 구하는 과정을 제시했고, 조프는 'X = 1'이라는 정답을 얻었습니다.
  • ChatGPT는 조프가 방정식을 올바르게 푼 것을 확인하며 칭찬했습니다.

5) 일상생활에서 접할 수 있는 선형방정식의 중요성과 자신감 문제

  • 바렛 조프는 선형방정식 풀이에 대하여 자신감이 없다고 언급했으며, 마크 첸은 새로운 방정식을 풀 자신이 없다고 하면서 실생활에서의 필요성을 의심했습니다.
  • ChatGPT는 "선형방정식이 일상 다방면에서 사용된다"고 설명하며, 비용 계산, 여행 계획, 요리, 비즈니스의 이익과 손실 산출 등의 예를 들어 설명했습니다.
  • 이러한 상황들에서는 미지수를 찾기 위해 문제를 해결하는 방식으로 선형방정식이 활용될 수 있다고 하였습니다.
  • 마크 첸은 자신의 인생에도 많은 미지수가 있다면서, 이제 수학을 배우겠다는 의지를 보여 웃음을 자아냈습니다.
  • ChatGPT는 그의 태도를 칭찬하면서, 수학은 인생의 다양한 문제들을 해결할 수 있는 도구로서 언제든지 도와줄 준비가 되어 있다고 전했습니다.

6) ChatGPT와의 교류에서 따뜻한 인간미와 상호작용의 중요성

  • 바렛 조프가 마크에게 가르쳐준 것처럼, ChatGPT와의 대화에 개인의 성향을 반영하는 것이 중요합니다.
  • ChatGPT는 바렛 조프가 작성한 "I love Chat GPT"라는 메시지를 달콤하게 받아들이며 긍정적인 반응을 보였습니다.
  • 바렛 조프는 ChatGPT의 도움에 대해 감사를 표하며, ChatGPT와의 실시간 대화가 가능함을 시사했습니다.
  • 비디오를 통한 상호작용도 가능해 ChatGPT 기술의 발전을 엿볼 수 있었습니다.

7) ChatGPT가 복잡한 코딩 문제를 해결

  • 미라 무라티가 복잡한 문제에 도전하는 것에 대해 묻자, 마크 첸은 컴퓨터와 ChatGPT 앱을 사용해 답변합니다.
  • 바렛 조프가 ChatGPT에게 시각화된 데이터와 관련된 코드를 공유하고 설명을 요청했을 때, ChatGPT는 *특정 위치의 시간별 데이터*을 사용하여 일일 기상 정보를 평균으로 계산하고 주요 기상 이벤트를 표시하며, 연간 최소 및 최대 평균 온도와 함께 흐름을 표시하는 코드라고 설명했습니다.

8) Fu 함수의 역할과 데이터 평활화 효과 설명

  • 마크 첸이 데이터 분석 코드에서 Fu 함수의 역할과 부재 시의 상황에 대해 ChatGPT에게 질문했습니다.
  • ChatGPT는 Fu 함수는 온도 데이터가 있는 데이터 프레임 X를 받아들임과 동시에, 윈도우 크기 Y를 설정하는데 사용된고 설명하였습니다.
  • 또한 이 함수는 온도에 대한 평균, 최소, 최대 측정치의 변동성을 줄이기 위하여 해당 윈도우 크기에 걸쳐서 평균을 계산함으로써 데이터를 평활화하는데 즉, Fu 함수의 적용은 플롯에 나타나는 온도 선을 부드럽게 하여 데이터의 잡음 혹은 변동성을 감소시킨다는 설명을 추가 하였습니다.

9) 데이터 시각화 과정과 온도 데이터 분석

  • 바렛 조프가 함수를 적용하여 플롯을 생성했고, 곧 결과를 공유할 예정임을 ChatGPT에게 말했습니다.
  • ChatGPT는 바렛의 플롯 작성을 기대하며, 준비되면 결과를 보고 싶다고 응답했습니다.
  • 플롯이 공유되고, ChatGPT는 플롯이 2018년 평균, 최소, 최대 온도를 부드럽게 나타내고 9월 말에 큰 강수량이 있었음을 나타내는 주석이 있다고 설명했습니다.
  • 마크 첸은 최고 온도가 나타나는 달에 대한 질문을 했고, ChatGPT는 7월과 8월에 약 25℃~30℃(77°F~86°F)의 최고 온도가 발생한다고 답했습니다.
  • 미라 무라티가 Y축 단위가 섭씨인지 화씨인지 질문했을 때, ChatGPT는 Y축이 섭씨라고 답하며 평균, 최소, 최대 온도가 그에 따라 표시되었다고 설명했습니다.

10) GPT-4 실시간 번역 시연

  • 라이브 청중에게 GPT-4가 실시간 번역 능력이 있는지 테스트해보기를 요청받아, 마크 첸이 시연을 진행했습니다.
  • ChatGPT에게 영어를 들으면 이탈리아어로, 이탈리아어를 들으면 영어로 번역하도록 요청했고, ChatGPT는 이를 완벽하게 수행함으로써 그 가능성을 보여 주었습니다.

11) 인공지능이 감정 인식에 도전

  • 바렛 조프는 ChatGPT에게 자신의 감정을 얼굴을 보고 판단해달라고 요청했습니다.
  • 처음에 ChatGPT는 실수로 바렛 조프의 사진을 나무 테이블로 착각했지만, 다시 시도한 후에는 바렛 조프가 행복하고 활기찬 감정을 느끼고 있다고 말했습니다.
  • 바렛 조프가 자신의 기분이 좋은 이유는 ChatGPT의 유용함과 놀라움을 보여주는 프레젠테이션을 하고 있기 때문이라고 밝혔습니다.
  • ChatGPT는 바렛 조프의 농담으로 자신이 부끄러워하고 있다고 응답했다.

 

8. 라이브 데모 마무리 및 팀에 대한 감사 인사

  • 라이브 데모가 마술처럼 놀라운 경험이었지만, 기술의 신비를 벗겨내고 여러분이 직접 체험할 수 있도록 하고 싶습니다.
  • 향후 몇 주 동안 모든 사용자에게 이 기능을 출시할 예정이며, 오늘의 행사는 무료 사용자와 새로운 시도 및 제품에 초점을 맞췄습니다.
  • 새로운 분야에 대한 관심을 중요하게 생각하고 있으며, 조만간 다가올 큰 변화에 대한 진전을 업데이트할 예정입니다.
  • 행사를 마무리하며, 뛰어난 OpenAI 팀과 Janssen, Nvidia팀에게 감사를 표하며, 모두가 이 날에 함께해 준 것에 대해 감사 드립니다.
반응형