IBM의 오픈 소스 Granite 4.0 Nano AI 모델은 탐색에서 로컬로 직접 실행할 수 있을 만큼 작습니다

IBM의 오픈 소스 Granite 4.0 Nano AI 모델은 탐색에서 로컬로 직접 실행할 수 있을 만큼 작습니다

IT/기술 전문 정보

IBM의 오픈 소스 Granite 4.0 Nano AI 모델은 탐색에서 로컬로 직접 실행할 수 있을 만큼 작습니다

모델 크기가 지능의 대리자로 간주되는 업계에서 IBM은 거대함보다 효율성, 추상화보다 접근성을 중시하는 다른 방향을 제시하고 있습니다. 오늘 출시된 114년 역사의 기술 대기업이 오늘 출시한 4개의 새로운 Granite 4.0 Nano 모델은 3억 5천만에서 15억 개의 매개변수 범위에 이르며, 이는 OpenAI, Anthropic 및 Google과 같은 서버 기반 사촌의 크기에 비해 매우 작습니다. 이러한 모델은 접근성이 높도록 설계되었습니다. 350M 모델은 8~16GB RAM을 갖춘 최신 노트북 CPU에서 편안하게 실행될 수

핵심 특징

고품질

검증된 정보만 제공

빠른 업데이트

실시간 최신 정보

상세 분석

전문가 수준 리뷰

상세 정보

핵심 내용

모델 크기가 지능의 대리자로 간주되는 업계에서 IBM은 거대함보다 효율성, 추상화보다 접근성을 중시하는 다른 방향을 제시하고 있습니다. 오늘 출시된 114년 역사의 기술 대기업이 오늘 출시한 4개의 새로운 Granite 4.0 Nano 모델은 3억 5천만에서 15억 개의 매개변수 범위에 이르며, 이는 OpenAI, Anthropic 및 Google과 같은 서버 기반 사촌의 크기에 비해 매우 작습니다. 이러한 모델은 접근성이 높도록 설계되었습니다. 350M 모델은 8~16GB RAM을 갖춘 최신 노트북 CPU에서 편안하게 실행될 수 있는 반면, 1.5B 모델은 일반적으로 원활한 성능을 위해 최소 6~8GB VRAM을 갖춘 GPU 또는 CPU 전용 추론을 위한 충분한 시스템 RAM 및 스왑이 필요합니다. 따라서 클라우드 컴퓨팅에 의존하지 않고 소비자 하드웨어나 엣지에서 애플리케이션을 구축하는 개발자에게 적합합니다

상세 분석

. Transformer.js의 창시자이자 Hugging Face의 기계 학습 엔지니어인 Joshua Lochner(일명 Xenova)가 소셜 네트워크 X에 쓴 것처럼 실제로 가장 작은 애플리케이션도 자신의 웹 브라우저에서 로컬로 실행할 수 있습니다. 모든 Granite 4.0 Nano 모델은 Apache 2.0 라이선스로 출시됩니다. 이는 연구원, 기업 또는 인디 개발자가 상업적 용도로 사용하기에 적합합니다. 기본적으로 llama.cpp, vLLM 및 MLX와 호환되며 책임 있는 AI 개발에 대한 ISO 42001 인증을 받았습니다(IBM이 개척에 도움을 준 표준).

정리

그러나 이 경우 작다고 해서 성능이 떨어지는 것이 아니라 단지 더 스마트한 디자인을 의미할 수도 있습니다. 이러한 소형 모델은 데이터 센터용이 아니라 컴퓨팅이 부족하고 대기 시간이 문제가 되는 엣지 장치, 노트북 및 로컬 추론용으로 제작되었습니다. 그리고 나노 모델은 작은 크기에도 불구하고 같은 카테고리의 대형 모델과 맞먹거나 심지어 그 이상의 성능을 보여주는 벤치마크 결과를 보여주고 있습니다. 이번 릴리스는 새로운 AI 개척지가 급속히 형성되고 있다는 신호입니다. 이는 순전한 규모가 아니라 전략적 확장에 의해 지배됩니다.IBM이 정확히 무엇을 출시했습니까?Granite 4.0 Nano 제품군에는 현재 Hugging Face에서 사용할 수 있는 4가지 오픈 소스 모델이 포함되어 있습니다:Granite-4.0-H-1B(~1.5B 매개변수) – Hybrid-SSM 아키텍처Granite-4.0-H-350M(~350M 매개변수) – Hybrid-SSM ArchitectureGranite-4.0-1B – Transformer 기반 변형, 2BGranite-4.0-350M에 더 가까운 매개변수 수 – Transformer 기반 변형H 시리즈 모델(Granite-4.0-H-1B 및 H-350M)은 효율성과 강력한 성능을 결합한 하이브리드 SSM(상태 공간 아키텍처)을 사용하며 대기 시간이 짧은 에지 환경에 이상적입니다

자주 묻는 질문

Q. 어떤 정보를 제공하나요?

A. IT/기술 관련 최신 정보를 제공합니다.

Q. 신뢰할 수 있나요?

A. 검증된 출처만 선별합니다.

Q. 더 궁금한 점은?

A. 댓글로 문의하세요.

원문 출처

이 글은 원본 기사를 참고하여 작성되었습니다.

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다