[4월의 AI 트렌드] 과학자가 10년 걸린 연구결과, 2일 만에 알아낸 AI가 있다?!

NEWS/AI 트렌드

by SK브로드밴드 2025. 5. 14. 19:12

글: SK브로드밴드 AIX R&D팀 전혜윤 매니저

안녕하세요

4월에도 놀랍도록 상상 그 이상으로 진화하고 있는 AI 소식을 가져왔습니다!

과학자가 10년 걸려 연구해 알아낸 결과를 구글AI가 단 2일만에 도출해냈다고 하는데요!

놀라운 속도로 발전하고 있는 AI에 관한 흥미진진한 소식들을 전해드리겠습니다.

<목차>

오픈AI, 'GPT-4' 은퇴 예고…"GPT-4o로 전면 교체"
엔비디아, '딥시크-R1' 절반 크기로 성능 앞서는 오픈 소스 추론 모델 출시
AI에 '마피아 게임' 시켰더니..."승률 1위는 클로드 3.7 소네트"
과학자가 10년 걸린 연구 결과, 구글 AI는 2일 만에 도출
중국서 최고 수준 '물리적 움직임' 구현하는 동영상 모델 출시

👉🏻 위의 목차 중 원하시는 주제명을 클릭하시면, 해당 본문으로 바로 이동할 수 있습니다

오픈AI, 'GPT-4' 은퇴 예고…"GPT-4o로 전면 교체"

1. Summary: 오픈AI는 오는 30일부터 대표 인공지능 모델 'GPT-4'를 '챗GPT'에서 제거하고, 'GPT-4o'로 전면 교체한다고 발표했다.

GPT-4는 2023년 3월 출시 이후 멀티모달 기능을 최초로 탑재한 모델로 주목받았으나, 약 2년 만에 공식 서비스에서 물러나게 된다.

오픈AI는 GPT-4o가 글쓰기, 코딩, STEM 분야 등에서 더 뛰어난 성능을 보이며, 지시 수행 능력과 문제 해결력, 대화 흐름 등이 개선됐다고 밝혔다.

GPT-4는 현재 저작권 분쟁에도 연루돼 있지만, 새로운 AI 모델의 등장 신호탄으로 여겨지고 있다.

앞으로는 'GPT-4.1' 시리즈와 추론 특화 모델 'o3', 신규 모델 'o4-미니' 등이 출시될 예정이며, GPT-4는 오픈AI API를 통해서만 계속 사용할 수 있다.

2. Implication: GPT-4o는 GPT-4보다 우수한 성능을 보이며, 글쓰기, 코딩, STEM 분야에서 더욱 향상된 능력을 제공한다.
오픈AI는 GPT-4를 GPT-4o로 교체하며, 추가적으로 GPT-4.1 시리즈와 새로운 AI 모델 출시를 예고하여 지속적인 기술 혁신을 예고하고 있다.

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=169569

엔비디아, '딥시크-R1' 절반 크기로 성능 앞서는 오픈 소스 추론 모델 출시

1. Summary: 엔비디아가 새로운 추론 모델 '라마-3.1-네모트론-울트라-253B-v1(Llama-3.1-Nemotron-Ultra-253B-v1)'을 오픈 소스로 공개했다.

이 모델은 메타의 '라마-3.1-405B-인스트럭트'를 기반으로 개발되었으며, 연구 및 상업적 용도로 자유롭게 사용 가능하다.

2530억개의 매개변수를 가진 '덴스(dense)' 모델로 고성능 추론 및 AI 에이전트 워크플로우를 지원하며, 간단한 작업 시 고비용 추론 기능을 비활성화하는 '추론 토글(Reasoning Toggle)' 기능을 탑재하고 있다.

또한, NAS(Neural Architecture Search)를 통해 설계된 커스터마이징 구조로 메모리 사용량과 연산 부담을 줄이면서도 출력 품질을 유지한다.

성능 테스트 결과, 추론 모드로 MATH500 벤치마크에서 97%, AIME25에서 72.5%, 라이브코드벤치에서 66.31%의 정확도를 기록했다.

2. Implication: 엔비디아는 새로운 모델의 공개로 AI연구자와 개발자들은 더욱 향상된 성능의 추론 모델을 자유롭게 사용할 수 있게 되었다.

“추론 토글” 기능을 통해 고비용 추론을 필요로 하지 않는 간단한 작업에서는 추론 기능을 비활성화 해 비용 절감에 도움을 줄 수 있을 것으로 보인다.

엔비디아는 이번 모델 공개를 통해 오픈소스 생태계를 확장하고, 추론 중심 AI시스템의 기반 모델로서의 입지를 더욱 강화할 것으로 예상된다.

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=169523

AI에 '마피아 게임' 시켰더니..."승률 1위는 클로드 3.7 소네트"

1. Summary: 구저스(Guzus) 라는 개발자가 최근 깃허브를 통해 LLM들이 참여한 ‘마피아 게임’ 시뮬레이션 결과를 발표했다.
이 실험에서는 여러 LLM에 시민, 마피아, 의사 등의 역할을 부여하고 실제 마피아 게임 규칙대로 경쟁시켰다.

여러 차례 시뮬레이션한 내용을 분석한 결과 클로드 3.7 소네트가 마피아 역할 시 100%, 시민 역할 시 45%의 승률로 1위를 차지했다.

딥시크-챗(V3)과 라마 3.3 70B가 그 뒤를 이었으며 제미나이 2.0 플래시는 미스트랄-스몰 24TB와 GPT-4o보다 낮은 7위에 그쳤다.

이번 테스트에는 ‘o1’이나 ‘딥시크 R-1’ 등 추론 모델은 제외됐다.

다만, 클로드 3.7 소네트는 추론-비추론 하이브리드 모델로 여기에서 큰 차이가 난 셈이다.

이 실험은 게임을 통해 AI 모델의 추론 능력을 평가하는 새로운 방식으로, 앞서 등장한 ‘포켓몬’이나 ‘슈퍼 마리오’ 게임보다는 유용하다는 지적이다.

2. Implication: 이 시뮬레이션은 LLM의 전략적 추론과 상호 작용, 사회적 이해 능력을 평가하는 신선한 실험이다.
모델들이 거짓말, 속임수 등 복잡한 사회적 상호작용을 처리하는 방식은 AI 활용에 새로운 통찰을 제공한다.

시뮬레이션 내용을 보면 모델들이 마피아 게임을 할 때 인간과 흡사한 전략을 사용한다는 점도 흥미롭게 볼 수 있는 지점이다.

한정된 영역에서 개인이 진행한 실험인 만큼 객관적인 모델 성능의 척도로 보기는 어렵지만, 이러한 실생활과 밀접한 관련이 있는 시뮬레이션이 기존의 벤치마크 테스트와 함께 모델의 성능을 평가하는데 있어 활용될 가능성을 보여준다.

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=168601

과학자가 10년 걸린 연구 결과, 구글 AI는 2일 만에 도출

1. Summary: 구글이 제미나이 2.0 기반의 과학 연구 특화 AI co-scientist를 발표했다.

과학 기술매체 Live Science는 과학자들이 10년에 걸쳐 도달한 세균의 약제내성에 관한 문제의 답을 co-scientist가 이틀만에 도달했다고 전했다.

임페리얼칼리지 런던의 호세 페나데스 교수의 연구팀은 세균의 약제 내성을 가져오는 ‘cf-PICIs’라는 유전요소가 다른 파지의 꼬리 부분과 상호작용하여 다양한 세균에 감염되는 메커니즘에 대해 오랜 기간 연구해왔다.

이런 가운데 페나데스 교수팀은 구글 연구팀으로부터 co-scientist의 성능 테스트를 의뢰 받았다.

교수팀은 조사 결과를 공개하기에 앞서 co-scientist에 대해 ‘cf-PICIs가 어떻게 다른 세균종에 감염되는가’라는 문제의 가설을 세우라고 지시했다.

그 결과, co-scientist는 불과 이틀 만에 5가지 주요 가설을 제안했고 가장 가능성이 높은 것으로 제시된 가설이 바로 페나데스 교수팀이 10년에 걸쳐 도달한 연구 결과였다.

이에 놀란 페나데스 교수는 AI가 미발표 연구 결과에 접근했는지 확인했으나, 구글은 그렇지 않다고 답변했다.

이 사례는 AI가 유망한 가설에 도달하는 시간을 가속화할 수 있음을 보여주지만, 가설을 검증하기 위한 실험은 여전히 필요하다.

2. Implication: 이번 사례는 도메인 특화 AI모델의 놀라운 잠재력을 보여준다.

방대한 관련 문헌을 통합적으로 분석하고 전문적인 수준의 가설을 단기간에 생성하는 능력은 R&D 영역에서 혁신을 가져올 수 있다.

co-scientist는 독창적인 과학적 가설을 생성하고 실험적으로 검증할 수 있는 형태로 발전시키는 데 목적이 있다.

여러 개의 특화된 에이전트 구조로 실제 연구자들이 수행하는 과정을 모방하여 분석하고 가설을 생성한다.

이러한 AI 도구들이 적절하게 활용된다면 연구 기간을 획기적으로 단축시키고 새로운 통찰을 도출할 수 있다.

이는 AI가 인간 전문가를 대체하기보다는 강력한 협업 도구로서 기능함을 보여주는 좋은 사례로 볼 수 있다.

3. 참고 기사: https://www.techtube.co.kr/news/articleView.html?idxno=5692

중국서 최고 수준 '물리적 움직임' 구현하는 동영상 모델 출시

1. Summary: 중국의 샌드 AI가 차세대 오픈소스 동영상 생성 모델 '매지-1(MAGI-1)'을 공개했다.

이 모델은 디퓨전 트랜스포머(DiT) 아키텍처를 기반으로 하여 텍스트와 이미지를 독립적으로 처리하면서 상호작용을 극대화한다.

트랜스포머 아키텍처의 자기회귀적 예측 능력을 활용해 이미지를 패치 단위로 분할하고 토큰으로 변환해 처리한다.

물리 행동 예측 정확도를 평가하는 물리학-IQ 벤치마크에서 기존 모든 모델을 압도하는 성능을 보였다.

전문가들로부터 높은 평가를 받았지만, 최소 4개에서 최대 8개의 엔비디아 H100 GPU가 필요해 일반 사용자의 접근이 제한적이다.

현재는 '매지-프로덕트' 플랫폼을 통한 체험만 가능하며, 소스 코드와 모델은 '매지-소스'와 '매지-어텐션'에서 사용할 수 있다.

2. Implication: 매지-1과 같은 고급 동영상 생성 모델의 등장으로 콘텐츠 제작 방식이 혁신될 것으로 보인다.

물리적 움직임을 정밀하게 구현할 수 있어 영화, 광고, 교육 등 다양한 분야에서 활용 가능성이 높다.

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=169877

오늘은 4월 AI 이슈들을 함께 알아보았는데요!

어떻게 글쓰기, 코딩, STEM 분야 등에서 두각을 나타낼지 기대가 되네요!

그럼 오늘은 여기서 마무리를 짓고 다음 달에 더 흥미로운 AI 이슈들로 찾아오겠습니다!

저작자표시 비영리 변경금지 (새창열림)

'NEWS > AI 트렌드' 카테고리의 다른 글

[4월의 AI 트렌드] 진화한 AI, GPT의 새로운 모델은 뭐가 다를까? (0)	2025.05.14
[2월의 AI 트렌드] 딥시크, V3 미세조정 버전 ‘R1’ 전격 공개! 오픈AI 대항마 될까?! (0)	2025.03.21
[2월의 AI 트렌드] 검색 시장 지각변동? 오픈AI, '챗GPT 검색' 전면 개방! (0)	2025.03.21
[12월의 AI 트렌드] AI가 3D 가상 세계도 만든다고?! (0)	2025.01.14
[12월의 AI 트렌드] AGI 시대가 5년밖에 남지 않았다?! (0)	2025.01.14

SK브로드밴드 공식블로그

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

'NEWS > AI 트렌드' 카테고리의 다른 글

관련글 더보기

댓글 영역

추가 정보

인기글

최신글

티스토리툴바