글: SK브로드밴드 AIX R&D팀 전혜윤 매니저
안녕하세요.
요즘 IT 업계에서 너도 나도 새로운 AI 기술을 발표하고 있어요.
AI 기술이 빠르게 발전하고 있다는 증거죠!
매일 새로운 소식이 들려오다 보니, 그 소식을 하나하나 찾아보기가 쉽지 않은데요.
그래서 준비했습니다, 5월 AI 트렌드 총정리!
지금 바로 5월의 새로운 AI 소식을 함께 확인해 볼까요?
<목차>
오픈AI, 음성비서 기능 대폭 강화한 'GPT-4o' 공개
구글, LLM 내부 살펴볼 수 있는 ‘모델 익스플로러’ 공개
허깅페이스, 오픈 소스 위한 무료 GPU 공유 프로젝트 추진
구글의 반격 “AI 검색 전격 도입”…AI 에이전트, 비디오 모델도 공개
👉🏻 위의 목차 중 원하시는 주제명을 클릭하시면, 해당 본문으로 바로 이동할 수 있습니다.
오픈AI, 음성비서 기능 대폭 강화한 'GPT-4o' 공개
1. Summary: 오픈AI가 음성 비서 기능을 강화한 새 멀티모달모델(LMM) 'GPT-4o'를 공개했다.
새 모델의 'o'는 모든 것이라는 '옴니(omni)'를 뜻하며, 정식 출시는 몇 주 안에 이뤄질 예정이다.
GPT-4o의 특징은 다음과 같다.
- 구두로 질문을 하면 최소 232밀리초, 평균 320밀리초 안에 오디오로 응답할 수 있는데, 이는 사람과 유사한 수준 (기존 'GPT-4'의 경우 5.4초).
- 대화 중 일부는 노래로 표현할 수 있으며, 심지어 GPT-4o를 탑재한 휴대폰 두개가 상호작용하는 것도 가능
- 50개에 달하는 다국어 능력을 갖추고 있어, 거의 즉각적으로 다른 언어 번역이 가능 (한국어 등 20개 언어를 토크나이저 압축으로 개선)
- 이미지 처리 기능에서도 뛰어난 성능을 보임 (종이에 적힌 수학 문제를 보여주고 답을 풀어내는 등)
오픈AI는 GPT-4o가 'GPT-4 터보'보다 두배 더 빠르고 비용은 2분의 1 수준이라고 설명했다.
오픈AI는 올여름 AI 검색 제품과 동영상 생성 AI '소라'의 정식 출시, 그리고 가장 중요한 'GPT-5'의 공개 등을 남겨 두고 있다.
2. Implication: LMM 모델이 인간 수준의 응답 시간과 표현력을 갖추게 된 것은 매우 큰 변화라고 할 수 있을 것이다.
택스트나 이미지 등 다른 양식을 처리하기 위해 복수의 모델을 하나로 결합하는 대신, 단일 모델에서 한꺼번에 처리하는 방식으로 속도의 혁신을 이뤄냈다.
이는 AI 비서뿐 아니라 향후 AI 에이전트, 더 나아가 인공일반지능(AGI)으로 연결되는 흐름으로 볼 수 있다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=159625
구글, LLM 내부 살펴볼 수 있는 ‘모델 익스플로러’ 공개
1. Summary: 구글이 LLM의 내부를 탐색할 수 있도록 신경망을 시각화 하는 도구를 공개했다.
이를 통해 “블랙 박스”라 하는 AI 모델들의 내부 동작을 이해, 디버깅, 최적화 할 수 있다.
구글은 모델의 내부를 탐색하기 위해 그래프 시각화 도구를 개발 했다.
시각화를 통해 모델 내부에서 데이터가 이동하는 방식, 구성요소들의 상호작용 등을 묘사하여 모델 아키텍처를 최적화 하는 방식이다.
이 도구는 Tensorflow, PyTorch, JAX 등의 프레임워크에서 일반적으로 사용되는 여러 그래프 형식을 지원하고 호환성을 보장한다.
또한 WebGL 및 three.js를 통해 GPU 가속 그래프 렌더링을 활용하여 대규모 구조를 갖는 모델도 60프레임의 렌더링을 지원한다.
이를 통해 사용자들은 복잡한 구조를 갖는 모델도 단계적으로 내부 구조를 파악 할 수 있고, 이를 통해 모델 개발에 인사이트를 얻을 수 있을 것이다.
2. Implication: Deep learning을 공부해본 사람이라면 한번쯤은 다루어 봤을 Keras에도 model.summary() 기능으로 모델의 구조를 시각화 할 수 있다.
그러나 이를 통해 모든 레이어들 간의 관계와 상호작용을 시각화 하긴 어렵다.
하지만 구글이 공개한 해당 솔루션은 대규모 모델에서도 시각적으로 모델 내부 구조에 대해 탐색하며
데이터 이동, 병목 등에 대한 정보를 얻을 수 있어 매우 유용할 것으로 생각된다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=159794
허깅페이스, 오픈 소스 위한 무료 GPU 공유 프로젝트 추진
1. Summary: 허깅페이스가 오픈소스 개발자 지원을 위해 누구나 사용할 수 있는 GPU 무료 공유 프로젝트에 1000만달러(약 136억원)를 투자한다.
허깅페이스의 GPU 무료 공유 프로젝트인 ‘제로GPU’는 소규모 개발자나 학계,
스타트업 등이 일부 기업에 집중된 AI 개발 집중화에 대응할 수 있도록 돕기 위한 것으로,
거대 기술 기업 뿐만 아니라, 모든 사람이 최첨단 AI기술에 접근할 수 있도록 하는 것이 목표라고 밝혔다.
공유 GPU는 여러 사용자 또는 애플리케이션이 동시에 액세스할 수 있기 때문에 사용자 또는 애플리케이션이 전용 GPU를 보유할 필요가 없다.
제로GPU는 앱 배포를 위한 호스팅 플랫폼 ‘허깅패이스 스페이스(Hugging Face’s Spaces)를 통해 제공될 예정이다.
제로GPU는 엔비디아의 ‘A100’ GPU를 사용하며 GPU 용량 중 일부가 남으면 누구나 접근할 수 있다고 한다.
허깅페이스의 클렘 디롱 CEO는 오픈AI나 구글 등 일부 기업 위주로 AI발전이 치우치는 것을 막고, 공개적으로 더 많은 AI기술을 구축하도록 돕는 것이 목표라며
“AI는 소수의 손에 쥐어져서는 안 된다. 우리는 이번 프로젝트로 모두가 협력과 투명성의 정신으로 어던 일을 해낼지 기대된다”라고 말했다.
2. Implication: AI 서비스 주도권을 위해 오픈AI, 구글, 메타 등이 한해 수십 조 원을 투자하는 등 세계 AI 시장이 ‘머니 게임’ 양상으로 전환하고 있다.
특히 많은 비용이 들어가는 클라우드 사용료 및 고가의 GPU 인프라는 AI 개발에 있어서 큰 허들로 여겨진다.
허깅페이스는 “주요 클라우드 제공업체와 직접 계약하며 충분한 GPU를 확보하는 것은 매우 어려운 일이다”라며
“미리 얼마나 많은 GPU가 필요하고 예산이 어느 정도 필요한지 예측하는 것 자체가 어렵다”고 설명했다.
이러한 선도 기업의 오픈소스 기술 공개나 자원 지원과 같은 자발적인 기여로 AI 접근성이 높아지고 AI민주화에 한 발 더 가까워 질것이라 기대된다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=159765
구글의 반격 “AI 검색 전격 도입”…AI 에이전트, 비디오 모델도 공개
1. Summary: 구글이 연례 개발자 회의(I/O)에서 생성 인공지능(AI)을 중심으로 한 여러 신제품과 기능을 발표했다. 주요 발표 내용은 다음과 같다.
- 생성 AI 검색 도입: 'AI 개요'라는 명칭으로 AI 기반 검색 기능을 전격 도입하고, '애스크 포토' 기능을 여름에 업데이트할 예정이다.
- 프로젝트 아스트라: AI 비서 기능을 강화한 프로젝트로, 휴대폰 카메라를 통해 주변 상황을 파악하고 음성으로 정보를 제공하는 AI 에이전트 출시 예정.
- 제미나이 모델: 새로운 '제미나이 1.5 플래시' 모델과 '나노' 및 '젬마 2' 모델 발표. 이들 모델은 향상된 다중 모드 추론 능력과 확장된 컨텍스트 창을 제공.
- 비오: 1분짜리 고화질 비디오를 생성하는 AI 모델로, 유튜브 쇼츠 등에 도입 예정.
- 6세대 TPU: 데이터 센터용 AI 칩 '트릴리움' 발표.
2. Implication: 구글은 AI 기술을 검색, 비서 기능, 비디오 생성 등 다양한 제품에 통합하여 사용자 경험을 혁신하고 있다.
이는 AI가 일상생활의 다양한 부분에 깊이 관여하게 될 것을 시사한다. 구글의 이번 발표는 마이크로소프트와 오픈AI에 대한 대응 전략으로,
AI 기술 경쟁에서의 주도권을 확고히 하려는 의도를 반영한다. 이는 향후 AI 산업에서의 치열한 경쟁을 예고한다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=159673
‘AI 검색’으로 광고 수익 유지될까… 구글, ‘광고 섹션’ 오픈
1. Summary: 구글이 생성 인공지능 검색 ‘AI 개요(AI Overview)’에 광고를 도입했다.
구글은 기존의 키워드 기반 검색에서 벗어나 대화 형태로 검색하며 검색 결과를 빠르게 요약하고 관련 링크를 제공받을 수 있는 ‘AI 개요’ 기능을 공개한 바 있으며,
여기에 검색어 관련성과 정보를 기반으로 AI 개요 내 ‘후원(Sponsored)’ 섹션에 광고가 게재된다.
예를 들면, AI 개요는 “옷에서 주름을 어떻게 없애나요”라는 질문에 대해서 AI가 생성한 검색 요약 아래에
월마트나 인스타카트와 같은 곳에서 주문할 수 있는 주름 제거 스프레이를 보여주는 새 광고 섹션을 추가한다.
생성 AI 검색은 연관된 광고를 함께 노출했던 과거와 달리 AI가 요약한 내용을 우선적으로 제공해 광고 매출이 줄어들 수 있다는 관측도 나왔다.
그러나 생성 AI 검색으로 사용자가 더 많은 검색을 하고 오랜 시간 웹페이지에 머물게 되면서 AI가 정리한 답변을 받는다면
기존에는 생각하지 못했던 아이디어도 탐색할 수 있어, 더 많은 광고 기회도 발견할 수 있다는 설명이다.
2. Implication: 고객이 더 효과적인 검색을 할 수 있도록 구글에서 검색 서비스에 대한 개선을 하는 것으로 보인다.
생성형 AI를 통해 수많은 검색 결과를 일목요연하게 요약해주어 검색 결과에 대한 포괄적인 이해를 도울 수 있다.
추가적으로 연관 광고를 추천해 수익으로 까지 연결 지은 것으로 보인다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=159881
오늘은 5월의 AI 트렌드 5가지를 정리해봤는데요!
AI 기술 발전이 정말 빠른 만큼 새로운 소식이 정말 많네요.
AI 기술의 지속적인 발전으로 다양한 분야에서 더욱 정교하게 활용될 것이 기대됩니다!
[6월의 AI 트렌드] AI칩 훈련 속도 6개월 사이에 2배, 점점 더 빨라지는 AI! (1) | 2024.07.22 |
---|---|
[6월의 AI 트렌드] GPT-4o 제친 최강 AI 모델 등장, 클로드 3.5 소네트! (0) | 2024.07.22 |
내 손 안의 AI 비서! GPT-4o, 알렉사, 프로젝트 아스트라 (0) | 2024.05.29 |
오픈 AI와 피규어의 합작, AI 휴머노이드 로봇 등장! (0) | 2024.04.29 |
유튜브, 가짜뉴스와 딥페이크 영상은 라벨링으로 거른다! 생성형 AI 사용 공개 의무화! (0) | 2024.04.01 |
댓글 영역