[블록미디어 정윤재 에디터] AI 연구 기업 젠신(Gensyn)이 11일 탈중앙화된 집단 강화학습(RL) 알고리즘 ‘사포(SAPO, Swarm sAmpling Policy Optimization)’를 발표했다. 개별적으로 훈련된 AI 모델들이 서로의 경험 데이터를 공유함으로써, 단독 훈련 방식 대비 누적 보상이 최대 94%까지 향상되는 결과를 보였다. SAPO: 탈중앙화된 집단 강화학습 알고리즘 SAPO는 기존의 중앙화된 GPU 클러스터에 의존하는 대신, 여러 기기(노드)가 연결된 ‘스웜(Swarm)’ 네트워크를 활용한다. […]
