상세 컨텐츠

본문 제목

[4월의 AI 트렌드] 과학자가 10년 걸린 연구결과, 2일 만에 알아낸 AI가 있다?!

News/AI 트렌드

by SK브로드밴드 2025. 5. 14. 19:12

본문

글: SK브로드밴드 AIX R&D팀 전혜윤 매니저

 

안녕하세요

 

4월에도 놀랍도록 상상 그 이상으로 진화하고 있는 AI 소식을 가져왔습니다!

 

과학자가 10년 걸려 연구해 알아낸 결과를 구글AI가 단 2일만에 도출해냈다고 하는데요!

 

놀라운 속도로 발전하고 있는 AI에 관한 흥미진진한 소식들을 전해드리겠습니다.

 

 

<목차>

오픈AI, 'GPT-4' 은퇴 예고…"GPT-4o로 전면 교체"
엔비디아, '딥시크-R1' 절반 크기로 성능 앞서는 오픈 소스 추론 모델 출시
AI에 '마피아 게임' 시켰더니..."승률 1위는 클로드 3.7 소네트"
과학자가 10년 걸린 연구 결과, 구글 AI는 2일 만에 도출
중국서 최고 수준 '물리적 움직임' 구현하는 동영상 모델 출시

👉🏻 위의 목차 중 원하시는 주제명을 클릭하시면, 해당 본문으로 바로 이동할 수 있습니다

 

 

 

 

 

오픈AI, 'GPT-4' 은퇴 예고…"GPT-4o로 전면 교체"

 

1. Summary: 오픈AI는 오는 30일부터 대표 인공지능 모델 'GPT-4'를 '챗GPT'에서 제거하고, 'GPT-4o'로 전면 교체한다고 발표했다.


GPT-4
 2023 3월 출시 이후 멀티모달 기능을 최초로 탑재한 모델로 주목받았으나 2년 만에 공식 서비스에서 물러나게 된다.


오픈AI GPT-4o가 글쓰기, 코딩, STEM 분야 등에서 더 뛰어난 성능을 보이며, 지시 수행 능력과 문제 해결력대화 흐름 등이 개선됐다고 밝혔다.


GPT-4
는 현재 저작권 분쟁에도 연루돼 있지만새로운 AI 모델의 등장 신호탄으로 여겨지고 있다

 

앞으로는 'GPT-4.1' 시리즈와 추론 특화 모델 'o3', 신규 모델 'o4-미니' 등이 출시될 예정이며, GPT-4는 오픈AI API를 통해서만 계속 사용할 수 있다.

 

 

2. Implication: GPT-4o GPT-4보다 우수한 성능을 보이며글쓰기코딩, STEM 분야에서 더욱 향상된 능력을 제공한다.
오픈AI는 GPT-4를 GPT-4o로 교체하며, 추가적으로 GPT-4.1 시리즈와 새로운 AI 모델 출시를 예고하여 지속적인 기술 혁신을 예고하고 있다.

 

 

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=169569

 

 

 

 

 

 

 

엔비디아, '딥시크-R1' 절반 크기로 성능 앞서는 오픈 소스 추론 모델 출시

 

1. Summary: 엔비디아가 새로운 추론 모델 '라마-3.1-네모트론-울트라-253B-v1(Llama-3.1-Nemotron-Ultra-253B-v1)'을 오픈 소스로 공개했다.


이 모델은 메타의 '라마-3.1-405B-인스트럭트'를 기반으로 개발되었으며연구 및 상업적 용도로 자유롭게 사용 가능하다.


2530
억개의 매개변수를 가진 '덴스(dense)' 모델로 고성능 추론 및 AI 에이전트 워크플로우를 지원하며간단한 작업 시 고비용 추론 기능을 비활성화하는 '추론 토글(Reasoning Toggle)' 기능을 탑재하고 있다

 

또한, NAS(Neural Architecture Search)를 통해 설계된 커스터마이징 구조로 메모리 사용량과 연산 부담을 줄이면서도 출력 품질을 유지한다.


성능 테스트 결과추론 모드로 MATH500 벤치마크에서 97%, AIME25에서 72.5%, 라이브코드벤치에서 66.31%의 정확도를 기록했다.

 

 

2. Implication: 엔비디아는 새로운 모델의 공개로 AI연구자와 개발자들은 더욱 향상된 성능의 추론 모델을 자유롭게 사용할 수 있게 되었다.


“추론 토글” 기능을 통해 고비용 추론을 필요로 하지 않는 간단한 작업에서는 추론 기능을 비활성화 해 비용 절감에 도움을 줄 수 있을 것으로 보인다.


엔비디아는 이번 모델 공개를 통해 오픈소스 생태계를 확장하고추론 중심 AI시스템의 기반 모델로서의 입지를 더욱 강화할 것으로 예상된다.

 

 

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=169523

 

 

 

 

 

 

 

AI '마피아 게임' 시켰더니..."승률 1위는 클로드 3.7 소네트"

 

1. Summary: 구저스(Guzus) 라는 개발자가 최근 깃허브를 통해 LLM들이 참여한 ‘마피아 게임’ 시뮬레이션 결과를 발표했다.
이 실험에서는 여러 LLM에 시민마피아의사 등의 역할을 부여하고 실제 마피아 게임 규칙대로 경쟁시켰다.


여러 차례 시뮬레이션한 내용을 분석한 결과 클로드 3.7 소네트가 마피아 역할 시 100%, 시민 역할 시 45%의 승률로 1위를 차지했다.


딥시크-(V3)과 라마 3.3 70B가 그 뒤를 이었으며 제미나이 2.0 플래시는 미스트랄-스몰 24TB GPT-4o보다 낮은 7위에 그쳤다.


이번 테스트에는 ‘o1’이나 ‘딥시크 R-1’ 등 추론 모델은 제외됐다.


다만클로드 3.7 소네트는 추론-비추론 하이브리드 모델로 여기에서 큰 차이가 난 셈이다.


이 실험은 게임을 통해 AI 모델의 추론 능력을 평가하는 새로운 방식으로앞서 등장한 ‘포켓몬’이나 ‘슈퍼 마리오’ 게임보다는 유용하다는 지적이다.

 

 

2. Implication: 이 시뮬레이션은 LLM의 전략적 추론과 상호 작용, 사회적 이해 능력을 평가하는 신선한 실험이다.
모델들이 거짓말속임수 등 복잡한 사회적 상호작용을 처리하는 방식은 AI 활용에 새로운 통찰을 제공한다.


시뮬레이션 내용을 보면 모델들이 마피아 게임을 할 때 인간과 흡사한 전략을 사용한다는 점도 흥미롭게 볼 수 있는 지점이다


한정된 영역에서 개인이 진행한 실험인 만큼 객관적인 모델 성능의 척도로 보기는 어렵지만, 이러한 실생활과 밀접한 관련이 있는 시뮬레이션이 기존의 벤치마크 테스트와 함께 모델의 성능을 평가하는데 있어 활용될 가능성 보여준다.

 

 

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=168601 

 

 

 

 

 

 

 

과학자가 10년 걸린 연구 결과, 구글 AI 2일 만에 도출

 

1. Summary: 구글이 제미나이 2.0 기반의 과학 연구 특화 AI co-scientist를 발표했다.  


과학 기술매체 Live Science 과학자들이 10년에 걸쳐 도달한 세균의 약제내성에 관한 문제의 답을 co-scientist가 이틀만에 도달했다고 전했다.


임페리얼칼리지 런던의 호세 페나데스 교수의 연구팀은 세균의 약제 내성을 가져오는 ‘cf-PICIs’라는 유전요소가 다른 파지의 꼬리 부분과 상호작용하여 다양한 세균에 감염되는 메커니즘에 대해 오랜 기간 연구해왔다.


이런 가운데 페나데스 교수팀은 구글 연구팀으로부터 co-scientist의 성능 테스트를 의뢰 받았다.


교수팀은 조사 결과를 공개하기에 앞서 co-scientist에 대해 ‘cf-PICIs가 어떻게 다른 세균종에 감염되는가’라는 문제의 가설을 세우라고 지시했다.


그 결과, co-scientist 불과 이틀 만에 5가지 주요 가설을 제안했고 가장 가능성이 높은 것으로 제시된 가설이 바로 페나데스 교수팀이 10년에 걸쳐 도달한 연구 결과였다.


이에 놀란 페나데스 교수는 AI가 미발표 연구 결과에 접근했는지 확인했으나구글은 그렇지 않다고 답변했다.


이 사례는 AI가 유망한 가설에 도달하는 시간을 가속화할 수 있음을 보여주지만가설을 검증하기 위한 실험은 여전히 필요하다.

 

 

2. Implication: 이번 사례는 도메인 특화 AI모델의 놀라운 잠재력을 보여준다.


방대한 관련 문헌을 통합적으로 분석하고 전문적인 수준의 가설을 단기간에 생성하는 능력은 R&D 영역에서 혁신을 가져올 수 있다.


co-scientist
는 독창적인 과학적 가설을 생성하고 실험적으로 검증할 수 있는 형태로 발전시키는 데 목적이 있다.


여러 개의 특화된 에이전트 구조로 실제 연구자들이 수행하는 과정을 모방하여 분석하고 가설을 생성한다.


이러한 AI 도구들이 적절하게 활용된다면 연구 기간을 획기적으로 단축시키고 새로운 통찰을 도출할 수 있다.


이는 AI가 인간 전문가를 대체하기보다는 강력한 협업 도구로서 기능함을 보여주는 좋은 사례 볼 수 있다.

 

 

3. 참고 기사: https://www.techtube.co.kr/news/articleView.html?idxno=5692

 

 

 

 

 

 

 

중국서 최고 수준 '물리적 움직임' 구현하는 동영상 모델 출시

 

1. Summary: 중국의 샌드 AI가 차세대 오픈소스 동영상 생성 모델 '매지-1(MAGI-1)'을 공개했다.


이 모델은 디퓨전 트랜스포머(DiT) 아키텍처를 기반으로 하여 텍스트와 이미지를 독립적으로 처리하면서 상호작용을 극대화한다.


트랜스포머 아키텍처의 자기회귀적 예측 능력을 활용해 이미지를 패치 단위로 분할하고 토큰으로 변환해 처리한다.


물리 행동 예측 정확도를 평가하는 물리학-IQ 벤치마크에서 기존 모든 모델을 압도하는 성능을 보였다.


전문가들로부터 높은 평가를 받았지만최소 4개에서 최대 8개의 엔비디아 H100 GPU가 필요해 일반 사용자의 접근이 제한적이다.


현재는 '매지-프로덕트플랫폼을 통한 체험만 가능하며소스 코드와 모델은 '매지-소스' '매지-어텐션'에서 사용할 수 있다.

 

 

2. Implication: 매지-1과 같은 고급 동영상 생성 모델의 등장으로 콘텐츠 제작 방식이 혁신될 것으로 보인다.


물리적 움직임을 정밀하게 구현할 수 있어 영화, 광고, 교육 등 다양한 분야에서 활용 가능성이 높다.

 

 

3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=169877

 

 

 

 

오늘은 4 AI 이슈들을 함께 알아보았는데요!

 

'GPT-4o'로 전면 교체된 오픈 AI가 저작권 문제를 뚫고

 

어떻게 글쓰기, 코딩, STEM 분야 등에서 두각을 나타낼지 기대가 되네요!

 

그럼 오늘은 여기서 마무리를 짓고 다음 달에 더 흥미로운 AI 이슈들로 찾아오겠습니다!

 

관련글 더보기

댓글 영역