새로운 개방형 가중치 AI 코딩 모델이 독점 옵션에 가까워지고 있습니다
IT/기술 전문 정보
화요일, 프랑스 AI 스타트업 Mistral AI는 자율 소프트웨어 엔지니어링 에이전트의 일부로 작동하도록 설계된 1,230억 개의 매개변수 개방형 가중치 코딩 모델인 Devstral 2를 출시했습니다. 이 모델은 AI 시스템이 실제 GitHub 문제를 해결할 수 있는지 테스트하는 벤치마크인 SWE-bench Verified에서 72.2%의 점수를 달성하여 최고 성능의 개방형 가중치 모델 중 하나입니다. 아마도 더 주목할만한 점은 Mistral이 AI 모델만 출시한 것이 아니라 Mistral Vibe라는 새로운 개발 앱을 출시했다는
핵심 특징
고품질
검증된 정보만 제공
빠른 업데이트
실시간 최신 정보
상세 분석
전문가 수준 리뷰
상세 정보
핵심 내용
화요일, 프랑스 AI 스타트업 Mistral AI는 자율 소프트웨어 엔지니어링 에이전트의 일부로 작동하도록 설계된 1,230억 개의 매개변수 개방형 가중치 코딩 모델인 Devstral 2를 출시했습니다. 이 모델은 AI 시스템이 실제 GitHub 문제를 해결할 수 있는지 테스트하는 벤치마크인 SWE-bench Verified에서 72.2%의 점수를 달성하여 최고 성능의 개방형 가중치 모델 중 하나입니다. 아마도 더 주목할만한 점은 Mistral이 AI 모델만 출시한 것이 아니라 Mistral Vibe라는 새로운 개발 앱을 출시했다는 것입니다. 개발자가 터미널에서 직접 Devstral 모델과 상호 작용할 수 있게 해주는 Claude Code, OpenAI Codex 및 Gemini CLI와 유사한 명령줄 인터페이스(CLI)입니다
상세 분석
. 이 도구는 파일 구조와 Git 상태를 스캔하여 전체 프로젝트의 컨텍스트를 유지하고, 여러 파일을 변경하고, 셸 명령을 자율적으로 실행할 수 있습니다. Mistral은 Apache 2.0 라이센스에 따라 CLI를 출시했습니다. AI 벤치마크를 충분히 고려하는 것은 항상 현명한 일이지만, 대형 AI 회사의 직원들은 SWE-bench Verified에서 모델이 얼마나 잘 작동하는지 매우 세심한 주의를 기울이고 있다고 들었습니다.
정리
SWE-bench Verified는 인기 있는 Python 리포지토리의 GitHub 문제에서 가져온 500개의 실제 소프트웨어 엔지니어링 문제가 있는 AI 모델을 제공합니다. AI는 문제 설명을 읽고, 코드베이스를 탐색하고, 단위 테스트를 통과하는 작동 패치를 생성해야 합니다. 일부 AI 연구자들은 벤치마크 테스트 작업의 약 90%가 숙련된 엔지니어가 1시간 이내에 완료할 수 있는 상대적으로 간단한 버그 수정이라고 지적했지만 이는 코딩 모델을 비교하는 몇 안 되는 표준화된 방법 중 하나입니다. 전체 기사 읽기
자주 묻는 질문
Q. 어떤 정보를 제공하나요?
A. IT/기술 관련 최신 정보를 제공합니다.
Q. 신뢰할 수 있나요?
A. 검증된 출처만 선별합니다.
Q. 더 궁금한 점은?
A. 댓글로 문의하세요.
원문 출처
이 글은 원본 기사를 참고하여 작성되었습니다.
이 글과 함께 읽으면 좋은 글
-
→ Sequoia는 Roelof Botha가 물러나면서 Alfred Lin과 Pat Grady를 새로운 공동 관리인으로 지명
2025-11-04
-
→ FBI, ICE로 위장한 범죄자에 대해 경고하고 요원들에게 스스로 신원을 확인하도록 촉구
2025-11-04
-
→ MAGA가 할로윈 의상이 Charlie Kirk를 조롱했다고 주장한 후 교사들은 살해 위협을 받습니다
2025-11-04
-
→ 판매 중인 EU 최고 관료들의 전화 위치 데이터, 보고서 발견
2025-11-04
-
→ Studio Ghibli, Square Enix 등을 대표하는 일본 무역 협회 CODA는 Op
2025-11-03

댓글