Ai2의 새로운 Olmo3.1은 더 강력한 추론 벤치마크를 위해 강화 학습 훈련을 확장합니다.

✨ Ai2의 새로운 Olmo3.1은 더 강력한 추론 벤치마크를 위해 강화 학습 훈련을 확장합니다.

★ 8 전문 정보 ★

Allen Institute for AI(Ai2)는 최근 가장 강력한 모델 제품군인 Olmo 3을 출시했습니다. 그러나 회사는 모델을 계속 반복하고 강화 학습(RL) 실행을 확장하여 Olmo 3.1을 만들었습니다. 새로운 Olmo 3.1 모델은 기업의 효율성, 투명성 및 제어에 중점을 둡니다. Ai2는 Olmo 2의 세 가지 버전 중 두 가지를 업데이트했습니다. 고급 연구에 최적화된 주력 모델인 Olmo 3.1 Think 32B와 지시 따르기, 다중 회전 대화 및 도구 사용을 위해 설계된 Olmo 3.1 Instruct 32B입니다

🎯 핵심 특징

✅ 고품질

검증된 정보만 제공

⚡ 빠른 업데이트

실시간 최신 정보

💎 상세 분석

전문가 수준 리뷰

📖 상세 정보

Allen Institute for AI(Ai2)는 최근 가장 강력한 모델 제품군인 Olmo 3을 출시했습니다. 그러나 회사는 모델을 계속 반복하고 강화 학습(RL) 실행을 확장하여 Olmo 3.1을 만들었습니다. 새로운 Olmo 3.1 모델은 기업의 효율성, 투명성 및 제어에 중점을 둡니다. Ai2는 Olmo 2의 세 가지 버전 중 두 가지를 업데이트했습니다. 고급 연구에 최적화된 주력 모델인 Olmo 3.1 Think 32B와 지시 따르기, 다중 회전 대화 및 도구 사용을 위해 설계된 Olmo 3.1 Instruct 32B입니다. Olmo 3에는 프로그래밍, 이해 및 수학을 위한 세 번째 버전인 Olmo 3-Base가 있습니다. 지속적인 미세 조정에도 효과적입니다. Ai2는 Olmo 3 Think 32B를 Olmo 3.1로 업그레이드하기 위해 연구원들이 더 긴 훈련 일정으로 최고의 RL 실행을 연장했다고 말했습니다. Ai2는 블로그 게시물에서 “원래 Olmo 3 출시 후 Olmo 3 32B Think에 대한 RL 훈련 실행을 재개하여 Dolci-Think-RL 데이터 세트에 대한 추가 신기원을 포함하여 224 GPU에서 추가로 21일 동안 훈련했습니다”라고 말했습니다.

📰 원문 출처

원본 기사 보기

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다