IT&Tech

인간을 뛰어넘는 AI등장, 구글 제미나이1.0

yamujinharim 2023. 12. 7. 17:00
반응형

구글이 드디어 오픈AI의 'GPT-4'에 대적할 

거대언어모델(LLM) '제미나이(Gemini 1.0)'를 공개했습니다.

 



LLM(Large Language Model)은 다양한 AI제품의 기반이 되는 것으로,

처음부터

'멀티모달(시각, 청각 등 다양한 감각을 통해 정보를 주고받는 것) AI'로 

제작된 제미나이는 

알파고를 만든 구글 딥마인드가 개발을 주도했다고 합니다. 

 


구글은 제미나이에 적용된 멀티모달 기술이 

기존의 접근방식과는 다르다고 설명했는데요, 

기존 방식은 서로 다른 모달리티에 대해 

별도의 구성 요소를 학습시킨 후 

이를 연결시키는 것이었는데 반해, 

제미나이는 개발 단계 초기부터 다양한 모달리티에 대한 

사전 학습을 통해 멀티모달이 되도록 설계했다고 합니다. 


이러한 설계로 제미나이는 처음부터 텍스트, 오디오, 

이미지, 영상 등 모든 종류의 입력값을 

원활하게 이해하고 추론할 수 있다는 것이 

 

구글의 설명입니다. 

영상이나 그림을 이해해 음성으로 생성하고, 

어렵고 복잡한 문제에 대해서도 

추론을 통해 답변할 수 있다는 것입니다. 

 


제미나이는 데이터센터부터 모바일 디바이스까지 

모든 환경에서 실행할 수 있도록 

'울트라(Ultra)', '프로(Pro)', '나노(Nano)' 이렇게 

세 가지 모델로 제공이 된다고 합니다. 

 

가장 무겁고 강력한 '제미나이 울트라'는

 'LLM 연구/개발에 널리 사용되는 

학술 벤치마크 32개중 30개에서 

최신 기술의 결과를 능가한다'고 구글측이 밝혔는데요, 

이는 지금까지 나온 LLM중 

가장 강력한 모델이라는 것을 말합니다.

 


구글이 공개한 각종 시험 결과를 보면 

제미나이의 압도적인 성능이 분명하게 확인이 되는데요. 

구글은 수학, 물리학, 미국 역사, 법률, 의학 등  

57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 

MMLU에서 제미나이 울트라가 90%의 정확도를 보였다고 밝혔습니다. 

MMLU는 AI의 전반적인 성능을 보여주는 대표적인 벤치마크인데요, 

지금까지 최고로 평가받았는오픈AI의 'GPT-4'가 86.4%였습니다. 

참고로, 인간 전문가의 점수는 89.8%이며, 

제미나이는 인간을 뛰어넘은 최초의 AI모델이 됩니다.  

구글 제미나이 1.0 MMLU 테스트 결과



순다르 피차이(Sundar Pichai) 구글 CEO는 

"이제, 우리는 수많은 주요 벤치마크에서 최고의 성능을 발휘하며, 

가장 유능하고 일반적인 모델인 Gemini를 통해 여

정의 다음 단계를 밟고 있습니다. 

올해 초 구글 딥마인드를 설립할 때 

우리가 가졌던 비전을 처음으로 실현한 모델입니다"라며, 

 

"이 새로운 시대의 모델은 우리가 수행해온 

가장 큰 과학 및 엔지니어링 노력 중 하나로 

저는 앞으로 있을 일이 무엇인지, 그리고 제미니가 

모든 곳의 사람들을 위해 

열어줄 기회에 대해 흥분됩니다"라고 

출시에 따른 소감을 밝혔습니다. 

순다르 피차이(Sundar Pichai) 구글 CEO



데미스 하사비스 구글 딥마인드 CEO는 

"오랫동안 우리는 사람들이 세상을 이해하고 

상호 작용하는 방식에서 영감을 받아 

차세대 AI 모델을 구축하고 싶었습니다"라며, 

 

"제미나이는 스마트한 소프트웨어라기보다는 

유용하고 직관적인 것, 

즉 전문가 도우미 또는 보조자처럼 

느껴지는 AI입니다"라고 말했습니다.

 

이어서 그는 "오늘 우리는 지금까지 우리가 만든 

가장 유능하고 일반적인 모델인 

제미나이를 발표하면서 

이 비전에 한 걸음 더 다가섰습니다"라며 

 

"제미나이는 구글 리서치를 비롯한 

구글 전체 팀의 대규모 공동 노력의 결과로 

처음부터 다중 모드로 구축되었습니다. 

즉, 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 

다양한 유형의 정보를 일반화하고 

원활하게 이해하고 작동하며 

결합할 수 있습니다"라고 밝혔습니다. 

구글이 공개한 시연 영상에서, 

제미나이는 물리학 문제를 단 몇초만에 풀어내는가 하면, 

경사로에 서 있는 고양이 그림을 보고 

속도를 계산하는 문제를 손글씨로 푼 다음 

이를 촬영해 제미나이에 입력시키자, 

제미나이는 우선 정답인지 아닌지에 대한 

답변을 내놨으며, 

 

오답인 경우에는 풀이 과정에서 

어떤 부분이 잘못되었은지 짚어가면서 

정답을 찾아가는 과정을 단계별로 설명했습니다.

제미나이 시연 영상중 일부 캡처



제미나이는 두 단계에 걸쳐 바드에 적용될 예정이라고 하는데요. 

우선, 오늘부터 바드 영어 버전은 

제미나이 프로의 파인튜닝된 버전을 사용하여 

보다 고도화된 추론, 계획, 이해 능력 등을 갖추게 되며, 

내년 초에는 최대 규모 모델인 제미나이 울트라를 적용한 

바드 어드밴스(Bard Advanced)를 선보일 예정이라고 합니다. 

반응형