AI의 용량 부족: 지연 시간 위험, 비용 증가, 가격 급등 중단점

AI의 용량 부족: 지연 시간 위험, 비용 증가, 가격 급등 중단점

IT/기술 전문 정보

AI의 용량 부족: 지연 시간 위험, 비용 증가, 가격 급등 중단점

AI의 최신 헤드라인은 모델 크기나 다중 양식이 아니라 용량 부족입니다. NYC에서 열린 VentureBeat의 최근 AI Impact 행사에서 WEKA의 최고 AI 책임자인 Val Bercovici는 VentureBeat CEO인 Matt Marshall과 합류하여 대기 시간 증가, 클라우드 잠금 및 비용 폭주 속에서 AI를 확장하는 데 실제로 필요한 것이 무엇인지 논의했습니다. Bercovici는 이러한 세력이 AI를 자체 버전의 급등 가격 책정으로 추진하고 있다고 주장했습니다. Uber는 최초로 차량 공유에 실시간 시장 요금을

핵심 특징

고품질

검증된 정보만 제공

빠른 업데이트

실시간 최신 정보

상세 분석

전문가 수준 리뷰

상세 정보

핵심 내용

AI의 최신 헤드라인은 모델 크기나 다중 양식이 아니라 용량 부족입니다. NYC에서 열린 VentureBeat의 최근 AI Impact 행사에서 WEKA의 최고 AI 책임자인 Val Bercovici는 VentureBeat CEO인 Matt Marshall과 합류하여 대기 시간 증가, 클라우드 잠금 및 비용 폭주 속에서 AI를 확장하는 데 실제로 필요한 것이 무엇인지 논의했습니다. Bercovici는 이러한 세력이 AI를 자체 버전의 급등 가격 책정으로 추진하고 있다고 주장했습니다. Uber는 최초로 차량 공유에 실시간 시장 요금을 도입하는 급증 가격 정책을 도입한 것으로 유명합니다. Bercovici는 AI가 수익성에 초점을 맞출 때 특히 추론을 위해 동일한 경제적 계산을 향해 나아가고 있다고 주장했습니다. “오늘날 실제 시장 금리는 없습니다. 우리는 보조금을 지급했습니다. 이는 현재 일어나고 있는 많은 혁신을 가능하게 하는 데 필요했지만 조만간 우리가 지금 이야기하고 있는 수조 달러의 자본 지출과 유한한 에너지 운영 비용을 고려하면 실제 시장 금리가 나타날 것입니다.

상세 분석

아마도 내년, 확실히 2027년”이라고 말했다. “그렇게 되면 이 산업은 근본적으로 변화하고 효율성에 더욱 깊고 예리한 초점을 맞추게 될 것입니다.”토큰 폭발의 경제학”첫 번째 규칙은 이 산업이 많을수록 더 많다는 것입니다. 더 많은 토큰은 기하급수적으로 더 많은 비즈니스 가치와 같습니다.”라고 Bercovici는 말했습니다. 그러나 지금까지 이를 지속 가능하게 만드는 방법을 알아낸 사람은 아무도 없습니다. 고전적인 비즈니스 3요소인 비용, 품질, 속도는 AI에서 대기 시간, 비용, 정확성(특히 출력 토큰의 경우)으로 변환됩니다. 그리고 정확성은 협상할 수 없습니다. 이는 ChatGPT와 같은 에이전트와의 소비자 상호 작용뿐만 아니라 금융 서비스 및 의료와 같이 규제가 심한 산업의 약물 발견 및 비즈니스 워크플로와 같은 고위험 사용 사례에도 적용됩니다. Bercovici는 “협상할 수 없는 사항입니다.”라고 말했습니다.

정리

“추론 정확도를 높이려면 특히 혼합, 가드레일 모델 및 품질 모델에 보안을 추가할 때 많은 양의 토큰이 있어야 합니다. 그런 다음 대기 시간과 비용을 상쇄하게 됩니다. 이것이 어느 정도 유연성이 있는 부분입니다. 높은 대기 시간을 견딜 수 있고 때로는 소비자 사용 사례의 경우 허용된다면 무료 계층과 저비용 플러스 계층을 통해 비용을 낮출 수 있습니다.” 그러나 대기 시간은 AI 에이전트의 중요한 병목 현상입니다. Bercovici는 “이제 에이전트는 단일한 의미로 작동하지 않습니다. 에이전트 떼가 있거나 에이전트 활동이 전혀 없습니다.”라고 Bercovici는 말했습니다. 떼에서 에이전트 그룹은 더 큰 목표를 완료하기 위해 병렬로 작업합니다. 가장 스마트한 모델인 오케스트레이터 에이전트가 중앙에 위치하여 아키텍처 선택, 클라우드 및 온프레미스 실행, 성능 제약, 보안 고려 사항 등 하위 작업과 주요 요구 사항을 결정합니다.

자주 묻는 질문

Q. 어떤 정보를 제공하나요?

A. IT/기술 관련 최신 정보를 제공합니다.

Q. 신뢰할 수 있나요?

A. 검증된 출처만 선별합니다.

Q. 더 궁금한 점은?

A. 댓글로 문의하세요.

원문 출처

이 글은 원본 기사를 참고하여 작성되었습니다.

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다