google-developers
MaxText, 포스트 트레이닝 기능 확장: 단일 호스트 TPU에서 SFT 및 RL 도입
MaxText가 단일 호스트 TPU에서도 지도 파인튜닝(SFT)과 강화학습(RL)을 지원하게 되어, 개발자들이 LLM 모델을 더 쉽고 효율적으로 정교하게 만들 수 있게 되었어요.
google-developers
MaxText가 단일 호스트 TPU에서도 지도 파인튜닝(SFT)과 강화학습(RL)을 지원하게 되어, 개발자들이 LLM 모델을 더 쉽고 효율적으로 정교하게 만들 수 있게 되었어요.