새로운 개방형 가중치 AI 코딩 모델이 독점 옵션에 가까워지고 있습니다

새로운 개방형 가중치 AI 코딩 모델이 독점 옵션에 가까워지고 있습니다

IT/기술 전문 정보

새로운 개방형 가중치 AI 코딩 모델이 독점 옵션에 가까워지고 있습니다

화요일, 프랑스 AI 스타트업 Mistral AI는 자율 소프트웨어 엔지니어링 에이전트의 일부로 작동하도록 설계된 1,230억 개의 매개변수 개방형 가중치 코딩 모델인 Devstral 2를 출시했습니다. 이 모델은 AI 시스템이 실제 GitHub 문제를 해결할 수 있는지 테스트하는 벤치마크인 SWE-bench Verified에서 72.2%의 점수를 달성하여 최고 성능의 개방형 가중치 모델 중 하나입니다. 아마도 더 주목할만한 점은 Mistral이 AI 모델만 출시한 것이 아니라 Mistral Vibe라는 새로운 개발 앱을 출시했다는

핵심 특징

고품질

검증된 정보만 제공

빠른 업데이트

실시간 최신 정보

상세 분석

전문가 수준 리뷰

상세 정보

핵심 내용

화요일, 프랑스 AI 스타트업 Mistral AI는 자율 소프트웨어 엔지니어링 에이전트의 일부로 작동하도록 설계된 1,230억 개의 매개변수 개방형 가중치 코딩 모델인 Devstral 2를 출시했습니다. 이 모델은 AI 시스템이 실제 GitHub 문제를 해결할 수 있는지 테스트하는 벤치마크인 SWE-bench Verified에서 72.2%의 점수를 달성하여 최고 성능의 개방형 가중치 모델 중 하나입니다. 아마도 더 주목할만한 점은 Mistral이 AI 모델만 출시한 것이 아니라 Mistral Vibe라는 새로운 개발 앱을 출시했다는 것입니다. 개발자가 터미널에서 직접 Devstral 모델과 상호 작용할 수 있게 해주는 Claude Code, OpenAI Codex 및 Gemini CLI와 유사한 명령줄 인터페이스(CLI)입니다

상세 분석

. 이 도구는 파일 구조와 Git 상태를 스캔하여 전체 프로젝트의 컨텍스트를 유지하고, 여러 파일을 변경하고, 셸 명령을 자율적으로 실행할 수 있습니다. Mistral은 Apache 2.0 라이센스에 따라 CLI를 출시했습니다. AI 벤치마크를 충분히 고려하는 것은 항상 현명한 일이지만, 대형 AI 회사의 직원들은 SWE-bench Verified에서 모델이 얼마나 잘 작동하는지 매우 세심한 주의를 기울이고 있다고 들었습니다.

정리

SWE-bench Verified는 인기 있는 Python 리포지토리의 GitHub 문제에서 가져온 500개의 실제 소프트웨어 엔지니어링 문제가 있는 AI 모델을 제공합니다. AI는 문제 설명을 읽고, 코드베이스를 탐색하고, 단위 테스트를 통과하는 작동 패치를 생성해야 합니다. 일부 AI 연구자들은 벤치마크 테스트 작업의 약 90%가 숙련된 엔지니어가 1시간 이내에 완료할 수 있는 상대적으로 간단한 버그 수정이라고 지적했지만 이는 코딩 모델을 비교하는 몇 안 되는 표준화된 방법 중 하나입니다. 전체 기사 읽기

자주 묻는 질문

Q. 어떤 정보를 제공하나요?

A. IT/기술 관련 최신 정보를 제공합니다.

Q. 신뢰할 수 있나요?

A. 검증된 출처만 선별합니다.

Q. 더 궁금한 점은?

A. 댓글로 문의하세요.

원문 출처

이 글은 원본 기사를 참고하여 작성되었습니다.

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다