[10월의 AI 트렌드] GPT-4보다 12배 빠른 AI가 등장했다, 아치-함수 시리즈!
글: SK브로드밴드 AIX R&D팀 전혜윤 매니저
안녕하세요.
10월에도 AI 관련한 새로운 소식들이 많이 전해졌는데요.
GPT-4보다 12배 빠른 아치-함수 시리즈를 카타네모가 오픈 소스로 공개했다는 소식입니다.
기존 대형언어모델보다 속도도 빠르고, 비용까지 절감할 수 있다는데요.
그럼 아치-함수 시리즈에 관한 내용과 다른 AI 소식도 자세히 알려드릴게요!
<목차>
'딥 러닝 대부' 힌튼·홉필드, 노벨 물리학상 수상..."AI 기반 마련한 공로 인정"
앤트로픽의 AI 에이전트, AI 판도 뒤바꿀 대단한 기술
오픈AI, AI 에이전트 구축 프레임워크 공개..."공식 출시 아닌 실험용"
👉🏻 위의 목차 중 원하시는 주제명을 클릭하시면, 해당 본문으로 바로 이동할 수 있습니다.
'딥 러닝 대부' 힌튼·홉필드, 노벨 물리학상 수상..."AI 기반 마련한 공로 인정"
1. Summary: 2024년 노벨 물리학상은 제프리 힌튼과 존 홉필드에게 돌아가, 인공지능 관련 노벨상 수상자가 처음으로 탄생했다.
두 수상자는 인공 신경망을 기반으로 한 머신러닝(ML)의 기초적인 발견과 발명으로 높은 평가를 받았다.
힌튼 교수는 역전파(backpropagation) 알고리즘을 공동 개발하여 AI 훈련 방식을 혁신한 인물로, “딥러닝의 대부”로 불린다.
그는 2018년 튜링상을 수상하기도 했으며, AI의 잠재적 악영향을 우려하여 2023년 구글을 떠난 이후 AI 비관론자로 활동 중이다.
홉필드 교수는 '홉필드 네트워크'를 개발해 AI의 기억 저장 및 검색 방법을 제시한 인물로, 신경망 분야의 초기 개척자로 평가받는다.
두 수상자는 AI의 통제 불능 가능성에 대한 우려를 표명하며, 이 분야에 대한 신중한 접근을 강조했다.
2. Implication: 이번 수상은 AI 연구가 이제 물리학의 영역에서도 인정받고 있음을 시사하며, AI의 중요성이 과학 전반에 걸쳐 확대되고 있음을 보여준다.
AI 기술의 급격한 발전은 큰 사회적 변화를 예고하지만, 그에 따르는 윤리적·사회적 도전 과제도 점점 더 커지고 있다.
특히, AI의 통제 문제와 관련한 논의가 중요해지며, 향후 AI 개발에 있어 책임 있는 접근과 규제의 필요성이 부각될 전망이다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=164055
엔트로픽의 AI 에이전트, AI 판도 뒤바꿀 대단한 기술
1. Summary: 앤트로픽은 클로드 기반의 새로운 기능인 ‘컴퓨터 유즈’를 출시했다.
이는 공개 당시부터 매우 많은 관심을 받았는데, 컨셉은 AI가 키보드 입력, 버튼 클릭, 마우스 커서 이동 등 컴퓨터 조작에 필요한 작업을 스스로 수행한다는 점이다.
이는 클로드 3.5 소넷 기반으로 동작하는 에이전트의 일종이다.
이는 입력된 목표를 달성하기위해 LLM 스스로 단계별 작업 항목을 파악하고, 화면의 스크린 샷을 분석하여 각 단계의 실행 방법을 결정한다.
즉, 여러 응용 프로그램을 전환하며 사용자의 의도에 맞는 행동을 할 수 있는 것이다.
해당 기술의 예시로는 최근 동향 수집, 공개 데이터셋 기반 ML 모델 학습, 캡차 우회 등이 포함되었다.
해당 기능은 현재 베타 테스트 단계이며 데모는 도커 환경을 포함하여 깃허브에 공개되어 있다.
2. Implication: 컴퓨터 유즈’를 실제 사용해본 유저들의 리뷰는, “느리고, 결과물에 대해 신뢰할 수 없으며 컴퓨터를 장악 당하기 쉽지만, 매우 흥미로운 형태인 것은 사실”이라고 한다.
이 사례를 보면 ‘컴퓨터 유즈’가 완성된 형태는 아니지만, 모든 빅 테크들이 주목하고 있는 미래 기술의 방향성이 에이전트를 향하고 있음을 보여준다.
이러한 에이전트 형태의 도구들은 앤트로픽만 주목하는 것이 아닌, OpenAI, 구글도 주목하고 있으며 유사한 서비스들을 출시 중이다.
이 기술의 핵심은 이미지를 모델이 이해하고 판단한다는 것인데, 과거 공개된 모델들은 Vision 데이터에 대한 Fine-tuning을 지원하지 않았었다.
그러나 최근 OpenAI Dev-day에서 모델들의 vision fine-tuning 기능을 제공할 계획을 밝혔으며 이는 향후 서비스 개발/연구 방향성에 주목해야 할 분야라고 판단된다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=164660
https://github.com/anthropics/anthropic-quickstarts/tree/main/computer-use-demo
오픈AI, AI 에이전트 구축 프레임워크 공개..."공식 출시 아닌 실험용"
1. Summary: 오픈AI가 복수의 전문 인공지능(AI) 에이전트를 연계해 복잡한 작업을 자동화하는 '다중 에이전트' 시스템 구축 프레임워크인 '스웜(Swarm)'을 오픈 소스로 공개했다.
스웜은 각각 독립적인 기능을 수행하는 여러 에이전트를 이용해 복잡한 작업을 분담하고 협업을 통해 처리하는 시스템을 구축하도록 설계되었다.
이 프레임워크는 클라이언트 측에서의 경량화와 높은 제어 기능, 그리고 쉬운 테스트 운영을 지원한다.
스웜의 핵심 개념은 '루틴'과 '핸드오프'로, 각각 분할된 작업을 자동으로 처리하고, 작업 결과를 다른 에이전트에게 넘겨주는 기능을 제공한다.
그러나 다른 API와는 달리, 호출 사이에 상태를 저장하지 않아 과거 상호작용을 기반으로 하는 복잡한 의사 결정을 내리는 데 한계가 있어, 개발자들은 자체적인 메모리 솔루션을 구현해야 한다.
스웜은 가벼운 설계로 이해와 구현이 용이하며, 특히 다중 에이전트 시스템에 익숙하지 않은 사람들에게도 접근성이 높다.
관련 기술 커뮤니티에서는 큰 기대를 보이고 있으며, 일부 개발자들은 이미 초기 실험에 돌입했다.
그러나, 오픈AI는 스웜을 정식 제품이 아닌 실험적 코드로서 유지 보수를 하지 않을 것이라고 밝혔다.
2. Implication: 스웜의 공개는 AI 에이전트 간 협업을 통한 복잡한 작업 자동화의 가능성을 열며, 오픈 소스 접근으로 다양한 개발자들이 쉽게 실험하고 활용할 수 있게 한다.
다만, 상태 비저장 모델의 한계를 보완하기 위한 추가적인 메모리 솔루션이 필요하다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=164233
'GPT-4'보다 12배 더 빠른 AI 에이전트 모델 오픈 소스 등장
1. Summary: 인공지능 스타트업 카타네모가 AI 에이전트 구축을 위해 함수 호출 속도를 대폭 향상시킨 대형언어모델(LLM)인 아치-함수 시리즈(Arch-Function-1.5B, 3B, 7B)를 오픈 소스로 공개했다.
이 모델들은 함수 호출 작업을 특별히 가속화하도록 설계되었으며, 기존 LLM보다 최대 12배 빠른 처리 속도와 44배 낮은 비용을 제공한다고 주장한다.
아치-함수 모델은 자연어 프롬프트를 분석하고 매개변수를 식별해 정확한 함수 호출 출력을 생성할 수 있어, API 상호작용 및 자동화된 백엔드 워크플로를 지원한다.
기업은 이를 통해 더 빠르고 경제적인 방식으로 에이전트 애플리케이션을 개발할 수 있다.
최근 오픈AI와 라이터 등도 유사한 AI 에이전트 구축 기술을 공개하며 경쟁이 치열해지고 있다.
2. Implication: 아치-함수 시리즈는 빠르고 경제적인 함수 호출로 AI 에이전트 개발을 촉진하여 다양한 도메인에서 자율적 워크플로를 구축할 수 있다.
아치-함수 모델의 오픈 소스 공개는 개발자와 연구자들이 이를 활용하여 다양한 애플리케이션을 개발할 수 있는 기회를 제공, AI 커뮤니티 전체의 발전을 촉진하며, 높은 처리 속도와 낮은 비용으로 기업들이 효율적으로 AI 기반 솔루션을 도입, 운영 비용을 절감하고 생산성을 향상시킬 수 있다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=164291
노트북LM, 구글 대표 AI 히트작 되나...유튜브·오디오 파일 추가 업데이트
1. Summary: ‘공부 노트’로 유명한 구글의 AI 노트 작성 및 연구 보조 도구인 ‘노트북LM(NotebookLM)’이 큰 인기를 얻고 있다.
이에 최근 업데이트를 통해 유튜브 비디오와 오디오 파일 (mp3, wav)를 새로운 입력 소스로 추가했다.
이 기능으로 AI가 주요 주제를 요약하고, 사용자는 상세 정보를 얻거나 질문할 수 있게 되었다.
또한 ‘오디오 개요(Audio Overview)’기능을 통해 팟캐스트 스타일의 토론을 생성하고 웹 사이트나 소셜 미디어 등으로 공유할 수 있다.
노트북LM의 사용자 기반이 예상과 달리 학생에서 기업으로 확대되어, 현재 교육자와 학생이 50%, 비즈니스 전문가가 50%로 구성되었다고 한다.
‘프로젝트 테일윈드’라는 이름으로 첫 선을 보인 노트북LM은 미국뿐만 아니라 일본에서도 인기가 높으며 200개국 이상에서 서비스 중이다.
구글은 사용자 반응에 따라 새로운 기능을 계속 추가할 예정이며, 내년에는 모바일 앱으로도 출시할 계획이라고 전했다.
2. Implication: 노트북LM의 인기는 AI 기술의 실용적 응용과 사용자 중심 설계의 중요성을 보여주고 있다.
학업에 필요한 요약 및 주제 추출 기능은 LLM의 효과적인 적용을 보여주며, 멀티모달 입력 처리로 서비스의 범용성과 활용도를 향상시켰다.
이처럼 사용자의 니즈를 기반으로한 AI의 적용과 범용성이 당초 예상한 학생뿐만 아니라 기업이나 전문가들의 사용까지 이끌어냈다.
AI 서비스를 어떻게 사용하는지는 사용자의 몫이지만, 범용성과 활용도를 고려한 설계가 AI 기술의 접근성 향상과 일상생활에서의 통합을 나타낸 사례라고 볼 수 있다.
3. 참고 기사: https://www.aitimes.com/news/articleView.html?idxno=163754
오늘은 10월에 핫했던 AI 관련 이슈들을 정리해봤는데요!
인공지능 관련으로 노벨 물리학상이 처음 나왔다니, 그 의미가 정말 크죠.
노벨상을 받은 힌튼 교수는 현재 AI 비관론자로 활동중이라고 하는데요.
여러분들은 이에 대해서 어떻게 생각하시나요?
그럼 여기서 마무리하고, 다음달에도 더 유용한 AI 정보들로 찾아오겠습니다!