[6월의 AI 트렌드] GPT-4o 제친 최강 AI 모델 등장, 클로드 3.5 소네트!
글: SK브로드밴드 AIX R&D팀 전혜윤 매니저
안녕하세요.
6월달에도 새로운 AI 모델이 많이 출시되었고, 오픈소스로 다양한 기술들이 공개되었는데요.
그리고 AI로 인간의 언어가 아닌 동물의 소통도 해석할 수 있다는데요.
그럼 지금 함께 AI 소식을 알아볼까요?
<목차>
앤트로픽, '클로드 3.5 소네트' 출시... 'GPT-4o' 제치고 최강 모델 탈환
글로벌 GenAI 기업 채용 공고 통해 살펴보는 인재상
MIT, 동영상 시청만으로 언어 학습하는 AI모델 ‘DenseAV’ 공개
엔비디아, 합성 데이터 생성하는 ‘네모트론-4 340B’ 출시... "비용 문제 해결한 오픈 소스 최강 성능”
👉🏻 위의 목차 중 원하시는 주제명을 클릭하시면, 해당 본문으로 바로 이동할 수 있습니다.
앤트로픽, '클로드 3.5 소네트' 출시... 'GPT-4o' 제치고 최강 모델 탈환
1. Summary: 앤트로픽이 강력한 성능을 가진 새로운 AI 모델 ‘클로드 3.5 소네트(Claude 3.5 Sonnet)’를 공개했다.
벤치마크에서 오픈AI가 지난 5월 공개한 최신 모델 'GPT-4o'를 능가했다는 주장으로, 한달 만에 '현존 최고 성능' 모델 타이틀을 되찾은 셈이다.
소네트는 앤트로픽의 제품군 중 중간급 모델인데, 가장 강력한 모델인 클로드 3.5 '오퍼스(Opus)', 경량 모델 클로드 3.5 '하이쿠(Haiku)'도 순차적으로 출시할 예정이다.
소네트는 특히 코딩 능력이 뛰어나 정교한 추론 및 문제 해결 기능을 통해 독립적으로 코드를 작성, 편집 및 실행할 수 있다. '코딩 AI 에이전트' 수준으로 활용할 수 있다는 설명이다.
앤트로픽은 “불완전한 이미지에서 텍스트를 정확하게 전사(transcription)할 수 있다”라며 “텍스트보다 이미지, 그래픽, 일러스트레이션에서
더 많은 정보를 얻을 수 있는 소매, 물류, 금융 서비스의 핵심 기능”이라고 했다.
벤치마크 8개 중 7개, 비전 벤치마크 5개 중 4개 분야에서 'GPT-4o'나 '제미나이 1.5 프로', '라마 3 400B' 등 첨단 모델을 능가한 것으로 전해졌다.
2. Implication: LLM 성능 경쟁이 날이 갈수록 치열해 지는 가운데, 최근의 화두는 Multi-modal로 넘어간 듯하다.
특히 클로드 3.5 소네트는 중간 크기 모델임에도 불구하고 전 세대 최고 모델인 클로드 3 오퍼스의 성능을 모두 앞질렀다는 점에서 더욱 의미가 크다
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=160843
https://www.anthropic.com/news/claude-3-5-sonnet
글로벌 GenAI 기업 채용 공고 통해 살펴보는 인재상
1. Summary: GenAI 분야가 초창기인 만큼 변화무쌍하고 직무 정보 예측이 쉽지 않은데, Anthropic, OpenAI 별 전형프로세스/인재상을 통해 간단히 알아보자.
1) Anthropic : “성능과 안정, 두 마리 토끼를 잡는다” : Claude 3를 공개한 Anthropic은 뛰어난 성능뿐 아니라 안전한 AI 시스템 개발을 목표로 하는데
특히 해석과 제어가 가능하며 신뢰할 수 있는 AI 모델을 목표로 한다.
Anthropic의 전형 절차는 7단계로 1) Resume, 2) Exploratory chat, 3) Skills Assessment, 4) Team Screen, 5) Interview Panel, 6) Final Checks, 7) Offer 다.
모든 단계가 중요하지만 특히 5번째 단계인 Interview Panel 에서는 1시간 분량의 기술 인터뷰(technical interview)를 3~4번 가량 치러야 한다.
Anthropic은 지원자가 어떤 과정으로 문제를 해결하는지를 중요하게 봄으로써 웹 검색도 문제가 되지 않는다.
대신, 모델의 성능과 안정성 2가지를 Focus로 한 답변(Anthropic 인재상)을 내지 않으면 ‘치명적인 감점 요소’가 될 수 있다는 점은 주목할만하다.
2) OpenAI : “AGI 개발의 Frontier” : OpenAI는 ChatGPT, DALL-E, Whisper, Sora 등을 공개한 GenAI 업계의 리더다.
OpenAI 인재모집공고는 그들의 Core Values로 시작한다.
OpenAI의 5가지 Core Values는 1) AGI focus, 2) Intense and scrappy, 3) Scale, 4) Make something people love, 5) Team spirit다.
1) ‘AGI focus’는 OpenAI의 목표가 단순히 자동화를 위한 생성형 AI 서비스를 만드는 기업이 아닌 궁극적으로 인류에게 안전하고 유용한 AGI를 만드는 것이라는 점을 나타낸다.
2) ‘Intense and scrappy’는 OpenAI가 근면하고 성실한 인재를 원하며 필요한 일을 묵묵히 해내는 인재를 원하며,
3) ‘Scale‘은 규모’ 혹은 ‘확장’으로 해석되는 가치이며, 규모가 있는 모델과 시스템, 소수가 아닌 다수를 위한 프로세스 등에 대해 고민할 줄 알아야한다.
4) ‘Make something people love’, 5) ‘Team spirit’은 사용자들에게 사랑받는 서비스를 만들고, 팀원들과 협업하는 능력을 지원자들이 갖춰야 한다는 점이다.
2. Implication: Anthropic은 모델의 성능뿐 아니라 안정성, 투명성, 설명력을 높이기 위한 연구 인력을 적극적으로 찾고 있으며, OpenAI역시 비슷한 행보를 보이고 있다.
특히, OpenAI는 자신들의 인재 채용 철학 5가지를 밝히며 AGI 개발을 향한 OpenAI의 뚜렷한 의지, 성실하고 자발적 태도를 가진 인재상 등을 모집 공고에서 발견할 수 있다.
Anthropic과 OpenAI 외에도 국내외 다양한 AI 기업들이 인재를 적극 채용하고 있다.
3. 참고 기사: https://tech.co/news/ai-companies-jobs-listed
https://www.anthropic.com/careers
MIT, 동영상 시청만으로 언어 학습하는 AI모델 ‘DenseAV’ 공개
1. Summary: MIT 연구진이 동영상 시청만으로 언어를 학습할 수 있는 AI 모델을 공개했다.
이를 통해 인간의 언어뿐만 아니라 동물의 의사소통을 해석할 수 있는 방법이 될 수 있다는 평가가 나왔다.
이 모델은 사람이 말을 배울 때 주변 환경을 관찰하는 것처럼 영상에서 소리와 시각 사이의 연관성을 학습한다.
이 모델은 타 모델과는 다르게 사전 훈련된 모델(Pre-trained model)이나 지도학습으로 학습되는 것이 아닌, 완전 초기 단계부터 새롭게 학습한다.
단, 오디오와 시각 데이터에서 각각 Backbone 모델을 활용하여 특징을 추출하고, 이 특징을 연결하여 대조 학습을 수행한다.
예를 들어, 비디오 소스에서 강아지가 짖는 소리와 강아지의 픽셀 정보를 추출하여 이 둘간의 연관성을 학습하는 방식이다.
2. Implication: 위 연구의 방법론은 사람이 언어를 배울 때와 유사하게 단순 Text를 활용하는 것이 아닌, 시각 정보와 청각 정보를 혼합하여 언어체계를 학습하는 것이 특징이다.
이러한 방법은 단순히 Text 생성 등에 대해서의 효율은 떨어질 수 있으나 언어의 본질적인 의미와 주요 Multi-modal 정보와의 관계를 학습할 때 큰 강점이 있을 듯 하다.
위와 같은 방법론은 위에서도 언급한 바와 같이 체계가 존재하지 않는 새로운 언어(동물 등) 체계를 이해하는데 사용될 수 있다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=160675
엔비디아, 합성 데이터 생성하는 ‘네모트론-4 340B’ 출시... "비용 문제 해결한 오픈 소스 최강 성능”
1. Summary: 엔비디아는 대형언어모델(LLM) 학습용 합성 데이터를 생성할 수 있는 '네모트론-4 340B' 모델을 공개했다.
이 모델은 고품질 합성 데이터를 생성하며, 비용이 많이 드는 실제 데이터셋 없이도 도메인별 LLM을 구축할 수 있도록 돕는다.
네모트론-4 340B는 3,400억 매개변수를 가지고 있으며, 세 가지 버전으로 제공된다: 베이스(Base), 인스트럭트(Instruct), 리워드(Reward).
이 모델들은 챗봇, 데이터 품질 개선, 생성 데이터의 필터링 및 향상에 사용되며, 허깅페이스에서 상업적 용도로도 접근 가능하다.
엔비디아는 이 모델이 의료, 금융, 제조, 소매 산업 등 다양한 분야에서 혁신을 가져올 것으로 기대하고 있다.
2. Implication: 네모트론-4 340B는 고품질 합성 데이터 생성으로 LLM 개발 비용을 절감하고 실제 데이터셋에 대한 의존도를 줄인다.
다양한 산업 분야에서 혁신을 촉진하며, 의료, 금융, 제조, 소매 등에서 신약 발견, 사기 탐지, 예측 유지 관리 등의 응용 가능성을 높인다.
상업적 활용과 접근성이 증대되어 더 많은 기업과 개발자들이 맞춤형 AI 솔루션을 개발할 수 있게 한다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=160651
오늘은 6월의 AI 관련 주요 이슈들을 정리해봤는데요!
인간의 언어 외에도 동물의 언어까지 학습할 수 있다니, AI의 발전이 더욱 기대되네요.
다음달에도 더 유용한 AI 정보들로 찾아오겠습니다!