글: SK브로드밴드 AIX R&D팀 전혜윤 매니저
안녕하세요.
2월의 주요 AI 이슈로 돌아왔습니다!
AI 시장에 새로운 돌풍을 일으킨 딥시크가 V3 미세조정 버전 ‘R1’을 출시했다고 합니다!
‘딥시크 R1’은 ‘오픈 AI o1’ 동일 성능에 비해 90% 저렴하다고 하는데요.
그럼 '딥시크 R1'에 관한 내용과 다른 AI 소식도 자세히 알려드릴게요!
<목차>
딥시크, 'V3' 미세조정 버전 'R1' 오픈 소스 출시..."o1 동일 성능에 비용 90% 저렴"
앤트로픽, 최초의 추론-비추론 하이브리드 모델 '클로드 3.7 소네트' 출시
모든 AI 챗봇 능가한 ‘그록3’ 공개... “AI 검색엔진·음성대화 탑재”
👉🏻 위의 목차 중 원하시는 주제명을 클릭하시면, 해당 본문으로 바로 이동할 수 있습니다.
딥시크, 'V3' 미세조정 버전 'R1' 오픈 소스 출시..."o1 동일 성능에 비용 90% 저렴"
1. Summary: 딥시크가 오픈 소스 추론 모델 'R1' 시리즈를 공개했다.
이 시리즈에는 R1, R1-제로, R1-증류 모델이 포함되며, 특히 R1은 오픈AI의 o1 모델과 성능을 겨루고 있다.
R1과 R1-제로는 V3 모델을 미세조정한 것으로, '전문가 혼합(MoE)' 아키텍처를 채택해 높은 성능을 유지하면서도 비용과 메모리 사용량을 줄였다.
R1-제로는 SFT 없이도 복잡한 추론 기술을 구현했지만 출력 품질에서 한계가 있어, SFT를 포함한 R1 모델이 개선되었다.
R1은 여러 벤치마크에서 o1을 능가하며, 비용도 저렴하다. 또한 하드웨어 효율성이 높은 R1-증류 모델들도 공개되었다.
2. Implication: 딥시크의 R1 시리즈 공개는 오픈 소스 AI 모델 생태계를 강화하고 비용 효율적인 고성능 AI 솔루션을 제공함으로써, 연구와 산업적 응용 가능성을 확장시킨다.
또한, SFT 없이도 높은 성능을 구현한 사례는 AI 학습 방법론의 새로운 가능성을 열어주며, 더 많은 사용자들에게 고성능 AI 모델의 접근성을 확대할 것으로 기대된다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=167328
앤트로픽, 최초의 추론-비추론 하이브리드 모델 '클로드 3.7 소네트' 출시
1. Summary: 앤트로픽이 비추론 모델과 추론 모델을 혼합한 '클로드 3.7 소네트'를 출시했다.
이 모델은 일반 모드와 '확장 생각 모드'를 사용자가 선택할 수 있으며, 추론 모드는 유료 사용자만 이용 가능하다.
확장 생각 모드는 대답 전 '생각하는 시간'을 통해 수학, 물리, 코딩 등에서 성능이 향상된다.
클로드 3.7 소네트는 특히 코딩과 웹 개발에서 강력한 개선을 보여주며, 개발자를 위한 명령 줄 도구 '클로드 코드'도 소개했다.
SWE-벤치에서 62.3%의 정확도로 1위를 차지했으며, 실제 작업 유용성을 테스트하는 TAU-벤치에서도 높은 성공률을 기록했다.
앤트로픽은 모델 테스트를 위해 '포켓몬' 게임플레이를 도입했고, 추론 모드를 적용한 모델은 게임의 보스를 물리치는 데 성공했다.
API 사용료는 경쟁사보다 비싸지만, 개발자가 비용을 조절할 수 있는 옵션을 제공한다.
보안, 안전 및 신뢰성에 대한 광범위한 테스트를 거쳤으며, 이전 버전보다 유해한 요청으로 판단해서 수행한 불필요한 거부를 45% 줄였다.
2. Implication: AI 기술의 진화로 비추론과 추론 능력을 결합한 하이브리드 모델이 등장하고 있다.
클로드 3.7 소네트의 코딩 및 웹 개발 강화 기능은 기업에서 서비스 개발 및 유지보수 과정을 효율화하는 데 활용할 수 있으며, 이를 통해 개발 시간과 비용을 절감할 수 있다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=168259
모든 AI 챗봇 능가한 ‘그록3’ 공개... “AI 검색엔진·음성대화 탑재”
1. Summary: 일론 모스크가 설립한 AI 기업 xAI가 개발한 인공지능 챗봇 ‘그록3(Grok 3)’ 공개됐다.
그록3는 벤치마크 테스트에서 수학, 과학, 코딩 등 모든 영역에서 최고 성능을 기록하며 기존 모델들을 압도했다.
그록3는 20만 개의 NVIDIA H100급 GPU를 갖춘 콜로서스 슈퍼컴퓨터를 활용하여 개발되었으며, 개발진에 따르면 기존 모델보다 최소 10배 이상의 성능을 자랑한다.
LMSYS평가에서 1400점을 기록하며 Gemini-2 Pro, DeepSeek V-3, GPT-4o보다 더 나은 성능을 보였다.
또한 그록3와 함께 차세대 검색 시스템 딥서치를 공개 했다.
단순한 결과 제공이 아닌 다양한 데이터 소스를 분석하고 교차 검증하여 신뢰도 높은 정보를 제공하는 것이 특징이다.
그록3는 현재 텍스트 기반이지만, 음성 대화 기능이 추가될 예정이다.
또한 추론 능력을 강화한 고급 추론 모델과 미니 모델 베타 버전도 함께 공개되어 자가 검토 및 문제 해결 과정에서 다중 사고 체계를 활용해 심층적인 분석이 가능하다.
개발팀은 추론 모델 훈련은 아직 초기 단계이며 여전히 훈련 중이라고 강조했다.
그록3는 현재 X 플랫폼의 프리미엄 플러스 멤버십 사용자에게 우선 제공되며, 고급 추론 기능은 슈퍼 그록이라는 새 구독 서비스에 제공 에정이다.
2. Implication: 지구에서 제일 똑똑한 AI를 공개하겠다는 일론 머스크의 자신감 있는 예고는 공개된 벤치마크 테스트 결과로는 사실처럼 보인다.
개발진에서 발표한 자가 검토 및 다중 사고 체계를 통한 문제 해결 능력은 모델의 정확성에 새로운 지침을 제시한다.
이번 발표에서 주목할 만한 기능인 딥서치는 기존 검색 엔진보다 더 신뢰도 높은 정보를 빠르게 제공하여 비즈니스 환경에서 활용도가 높을 것으로 기대된다.
xAI가 20만여 개의 GPU를 안정적으로 운영하며 연산 성능을 극대화한 사례는 데이터 센터 관점에서도 중요한 참고 자료가 될 것이다.
한편 CNBC는 그록3가 독립적인 평가 없이 내부 지표를 근거로 최고 성능을 주장하고 있다는 점을 지적했다.
3. 참고 기사: https://www.newstheai.com/news/articleView.html?idxno=7199
'딥시크'와 '딥 리서치' 등장의 의미..."기업들은 더 이상 똑같은 모델 사용하지 않을 것
1. Summary: 최근 '딥시크-R1'과 오픈AI의 '딥 리서치'가 AI 개발에 큰 변화를 일으키고 있으며, 검색 증강 생성(RAG), 증류, 미세조정 등의 기술이 중요한 역할을 하고 있다.
이들의 기술로 인해 기업은 각자 도메인에 맞는 모델을 구축하기 쉬워져 기업 별로 같은 모델을 사용하지 않게 될 것이라는 해석이다.
아래는 딥시크의 발견이 어떤 의미를 갖고 있는지에 대한 해석이다.
1) 가벼운 모델을 도메인에 맞게 조정해서 사용하는 것이 효율적
2) 전문 도메인 및 자체 데이터 있는 경우에는 SFT(Supervised Fine-Tuning)
3) 톤 조정과 개성 부여하는 RL(Reinforcement Learning)
4) 대부분 회사는 RAG로 충분
5) 딥리서치는 RAG 장점을 극대화한 것
6) 추론 비용은 결국 0이 될 것
7) 데이터의 정확성이 결국엔 가장 중요한 포인트이다
8) 기업 AI의 미래는 개방적, 저렴, 데이터 중심
딥시크는 기업이 매우 저렴하고 유능하며 자체 데이터와 접근 방식을 기반으로 하는 도메인 별 모델을 앞으로 쏟아낼 것이라는 근본적인 변화의 신호로 해석할 수 있다.
2. Implication: 딥시크의 개발은 단순히 새로운 모델이 나왔다는 것에 그치는 것이 아니라, 앞으로 기업에서 어떤 모델을 어떻게 개발해야 하는지에 대한 인사이트를 제공하고 있다.
우선, 기업은 각자 도메인에 맞는 가벼운 모델을 개발하는 것이 효율적인 것으로 보인다.
다만 어떤 식으로 도메인 지식을 접목할지, 어떤 가벼운 모델이 제일 적합한지에 대해서는 깊은 연구가 필요할 것으로 보인다.
하지만 가장 중요한 것은 데이터의 퀄리티로 이해된다.
LLM이 잘 이해할 수 있도록 데이터가 구성되어 있고, 도메인의 내용을 정확하게 담고 있는 데이터가 있다면 모델 개발에 굉장히 유용하다.
사내에서도 효과적인 LLM 개발을 위해서는 우선적으로 데이터의 정합성부터 우선되어야 할 것으로 볼 수 있다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=167814
알트먼 "GPT-5에 'o3' 통합...무료 사용자도 무제한 채팅 가능"
1. Summary: 오픈AI의 CEO 샘 알트먼이 GPT-4.5와 GPT-5의 로드맵을 발표하면서, AI 모델 통합 계획을 밝혔다.
현재 여러 모델을 선택해야 하는 번거로움을 줄이기 위해 '오라이온'이라 불리는GPT-4.5를 마지막 비추론 모델로 출시하고, 이후 모든 모델에 추론 기능을 탑재할 예정이다.
GPT-5에 대해서는 ‘o3를 포함한 많은 기술을 통합하는 시스템으로, 챗GPT와 API를 통해 출시할 것이라고 밝혔다.
GPT-5는 무료 사용자도 무제한 채팅으로 모든 기능을 사용할 수 있지만, 표준 인텔리전스 설정이 적용된다.
딥 리서치 기능도 유료 및 무료 사용자가 사용할 수 있으나, 사용 횟수에는 제한이 있다.
외부 테스트 기간 등을 감안하면 모델을 출시하는데 있어서 최소 1~2개월이 걸릴 것으로 보이며 오픈AI 최고 제품책임자는 최근 인터뷰에서 출시 목표가 2~3월이라고 밝혔다.
2. Implication: 딥샘 올트먼의 CEO한테서 처음으로 오라이온과 GPT-5에 대한 계획이 나왔다는 점이 주목할만하며 이번 발표는 딥시크의 등장에 따라 확실한 성능 우위를 보이려는 의도에서 비롯된 것으로 보인다.
추론 기능뿐만이 아니라 멀티모달과 에이전트, 검색 기능을 통합하고 단순 추론 모델인 딥시크-R1과는 차원이 다른 모델을 만들겠다는 의도가 보인다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=167944
오늘은 2월에 핫했던 AI 관련 이슈들을 정리해봤습니다!
딥시크의 ‘R1’ 출시가 AI 시장에 과연 어떤 변화를 가져올 지 기대되는데요.
오늘 알려드린 AI 정보들은 어떠셨나요?
그럼 여기서 마무리하고, 다음 달에도 더 유용한 AI 정보들로 찾아오겠습니다!
[2월의 AI 트렌드] 검색 시장 지각변동? 오픈AI, '챗GPT 검색' 전면 개방! (0) | 2025.03.21 |
---|---|
[12월의 AI 트렌드] AI가 3D 가상 세계도 만든다고?! (0) | 2025.01.14 |
[12월의 AI 트렌드] AGI 시대가 5년밖에 남지 않았다?! (0) | 2025.01.14 |
[11월의 AI 트렌드] AI 추론 속도가 여기서 더 빨라진다고?! (1) | 2024.12.09 |
[11월의 AI 트렌드] AI의 취약점까지 알려주는 스캐너 도구가 등장했다?! (1) | 2024.12.09 |
댓글 영역