ai #딥러닝 #강화학습 #딥시크 #uc버클리 #ai연구 #머신러닝 #ai모델 #강화학습모델 #딥러닝기술 #데이터과학 #오픈소스 #인공지능기술 #딥러닝모델 #ai미래 #ai기술발전1 30달러로 딥시크 기술 재현 – 저비용 AI 개발의 가능성 연구 개요UC 버클리 연구진이 30달러(약 4만3750원)로 딥시크(DeepSeek)의 핵심 기술을 재현하는 실험을 진행했다고 발표했다. 이번 연구는 첨단 AI 모델을 낮은 비용으로 구현할 수 있는 가능성을 보여준 중요한 사례로 평가된다.딥시크-R1-제로 모델 개발모델 개요연구진은 '딥시크-R1-제로(DeepSeek-R1-Zero)'라는 30억 개의 매개변수를 가진 모델을 개발하여 깃허브에 공개했다.이 모델은 최근 주목받은 R1 모델의 기반이 되는 버전으로, 지도 미세조정(SFT)을 생략하는 방식으로 훈련 과정을 단순화했다.성능 평가AIME 2024 수학 추론 벤치마크에서 'o1'과 비슷한 성능을 기록했다.저비용으로도 AI 모델을 효과적으로 개발할 수 있는 가능성을 제시했다.카운트다운 게임과 강화학습강화.. 2025. 2. 5. 이전 1 다음