본문 바로가기
돈 되는 이야기/이슈 삼키기

구글 AI '제미나이(Gemini)' 공개 #GPT-4 비교

by Jevestor 2023. 12. 8.
728x90

제미나이(Gemini): 구글의 AI 혁신

구글의 새로운 AI 모델, 제미나이는 멀티모달 AI 기술의 진화를 대표합니다. 이 AI 모델은 텍스트, 코드, 오디오, 이미지, 비디오 등 다양한 형태의 데이터를 처리할 수 있는 능력을 갖추고 있습니다. 구글 딥마인드 팀의 대규모 협력으로 탄생한 제미나이는, 인공지능이 단순한 소프트웨어를 넘어서 사용자에게 실질적이고 직관적인 도움을 줄 수 있도록 설계되었습니다. 이 모델은 일반 사용자와 전문가 모두에게 유용한 도구로 기능할 수 있도록 개발되었으며, AI의 새로운 지평을 열 것으로 기대됩니다

 

제미나이(Gemini)의 성능

제미나이 모델은 다양한 작업에서 뛰어난 성능을 보여주었습니다. 특히, 대규모 언어 모델 연구 및 개발에서 사용되는 32개의 학술 벤치마크 중 30개에서 현존하는 최고 수준의 결과를 초과하는 성과를 달성했습니다. 이 중 '대규모 다목적 언어 이해(MMLU)' 분야에서는 90.0%의 점수를 기록하며, 인간 전문가보다 높은 성능을 보여준 최초의 모델로 기록되었습니다. MMLU는 수학, 물리학, 역사, 법학, 의학, 윤리학 등 57개 분야를 아우르는 테스트로, 전문 지식과 문제 해결 능력을 동시에 평가합니다. 이러한 결과는 제미나이가 단순한 데이터 처리를 넘어 실제 세계 지식과 문제 해결에 있어서도 탁월함을 입증합니다

제미나이(Gemini) 모델 구조: 첨단 멀티모달 AI

제미나이는 새로운 방식으로 멀티모달 AI를 구현합니다. 전통적인 멀티모달 모델은 다양한 모달리티를 위한 별도의 컴포넌트를 훈련한 뒤 이를 결합하는 방식이었으나, 제미나이는 처음부터 다양한 모달리티에 대해 사전 훈련되었습니다. 이후 추가적인 멀티모달 데이터로 미세 조정하여, 이미지 설명과 같은 특정 작업뿐만 아니라 더 복잡하고 개념적인 추론에도 탁월한 능력을 발휘합니다​​.

제미나이는 구글의 AI 최적화 인프라스트럭처에서 대규모로 훈련되었습니다. 구글이 자체 설계한 텐서 처리 장치(Tensor Processing Units, TPUs) v4 및 v5e를 사용하여, 이전 모델보다 훨씬 빠른 속도로 실행됩니다. 이러한 고성능 AI 가속기는 구글의 다양한 AI 기반 제품에 중요한 역할을 하며, 전 세계의 기업들이 대규모 AI 모델을 비용 효율적으로 훈련할 수 있도록 지원합니다​​.

 

멀티모달(Multimodal)

여러 가지 형태(모달리티)의 정보를 동시에 처리하는 것을 의미합니다. 일반적으로 인공지능(AI)에서 멀티모달이라고 하면, 텍스트, 이미지, 오디오, 비디오 등과 같이 다양한 형태의 데이터를 이해하고, 분석하며, 상호 작용하는 AI의 능력을 가리킵니다. 이러한 멀티모달 AI는 복잡한 환경에서 더 효과적인 정보 처리와 의사 결정을 가능하게 하며, 인간의 감각과 유사한 방식으로 세상을 이해하는 데 도움을 줍니다.

 

제미나이(Gemini)의 신뢰성

제미나이는 구글의 AI 최적화 인프라스트럭처와 텐서 처리 장치(Tensor Processing Units, TPUs) v4 및 v5e를 사용한 훈련을 통해 신뢰성, 확장성 및 효율성을 강화하였습니다. 특히, 가장 강력한 TPU 시스템인 Cloud TPU v5p의 도입은 제미나이의 개발을 가속화하고, 개발자와 기업 고객이 대규모 AI 모델을 더 빠르고 효율적으로 훈련할 수 있도록 지원합니다​​.

구글은 제미나이 개발의 핵심으로 안전성과 책임감을 강조합니다. 제미나이는 구글 AI 모델 중 가장 포괄적인 안전 평가를 거쳤으며, 이는 바이어스와 독성을 포함한 잠재적 위험을 해결하기 위한 것입니다. 이를 위해 구글은 외부 전문가들과 협력하여 모델을 평가하고 다양한 관점을 제공했습니다​​.

이러한 정보를 바탕으로, 제미나이는 높은 성능과 함께 신뢰성과 확장성을 갖춘 효율적인 AI 모델로서, 다양한 분야에서 그 잠재력을 발휘할 수 있을 것으로 기대됩니다

구글 제품 통합 및 활용

구글은 제미나이를 널리 사용되는 자사 제품에 통합하여 수억 명의 사용자에게 제공할 계획입니다. 가장 먼저, 구글의 AI 챗봇인 바드(Bard)는 제미나이 프로(Gemini Pro)를 사용하여 추론, 계획, 이해 등의 기능을 향상시킬 예정입니다. 이는 바드에 있어 가장 큰 업그레이드로, 170개국 이상의 영어 사용 국가에서 사용할 수 있으며, 향후 다양한 모달리티 및 새로운 언어와 지역으로 확장될 예정입니다​​.

제미나이는 또한 픽셀 8 프로(Pixel 8 Pro) 스마트폰에도 적용됩니다. 이 스마트폰은 제미나이 나노(Gemini Nano)를 사용하여 새로운 기능을 제공하며, WhatsApp을 시작으로 여러 메시징 앱에 스마트 리플라이(Smart Reply) 기능을 도입할 계획입니다​​.

개발자와 기업 고객은 구글 AI 스튜디오(Google AI Studio) 또는 구글 클라우드 버텍스 AI(Google Cloud Vertex AI)를 통해 제미나이 프로에 접근할 수 있게 됩니다. 이를 통해 개발자는 앱 프로토타입을 빠르게 만들고 출시할 수 있으며, 안드로이드 14에서 제공되는 새로운 시스템 기능 AICore를 통해 제미나이 나노를 사용하여 기기 내 작업을 할 수 있게 됩니다​​.

구글은 또한 제미나이 울트라(Gemini Ultra)를 출시할 예정입니다. 제미나이 울트라는 신뢰와 안전 검증을 거친 후, 선택된 고객, 개발자, 파트너 및 안전 전문가들에게 초기 실험 및 피드백을 위해 제공될 예정입니다. 이후 개발자 및 기업 고객에게 널리 제공될 계획이며, 바드 어드밴스드(Bard Advanced)라는 새로운 AI 경험도 제공될 예정입니다.

제미나이(Gemini) vs chatGPT

항목 제미나이(Gemini) ChatGPT
개발사 구글(Google) OpenAI
모델 유형 멀티모달 AI(Multimodal AI) 대규모 언어 모델(Large Language Model)
특징 텍스트, 이미지, 오디오, 비디오 등 다양한 형식의 데이터 처리 가능 주로 텍스트 기반 데이터 처리
성능 32개의 학술 벤치마크 중 30개에서 최신 기술 초과 성능 달성 다양한 언어 이해 및 생성 작업에서 뛰어난 성능
사용처 구글 제품 및 서비스 통합 예정(예: 바드, 픽셀 8 프로) 대화형 AI, 콘텐츠 생성, 정보 검색 등에 사용
안전성 및 신뢰성 구글의 AI 원칙에 따른 포괄적인 안전 평가 지속적인 업데이트 및 사용자 피드백을 통한 안전성 개선
확장성 모바일에서 데이터 센터까지 다양한 환경에서 활용 가능 주로 클라우드 기반 환경에서 활용
개방성 개발자 및 기업 고객에게 API 제공 예정 다양한 API를 통해 개발자 및 연구자들에게 접근 가능

 

728x90

댓글