google-research
머신 언러닝 감사를 위한 새로운 프레임워크
구글 리서치가 '정규화된 f-다이버전스 커널 테스트'라는 새로운 프레임워크를 선보였어요. 이 테스트는 모델의 '잊을 권리' 준수 여부를 훨씬 더 정확하고 효율적으로 검증해서 AI 시스템의 프라이버시와 안전성을 높여준답니다.
google-research
구글 리서치가 '정규화된 f-다이버전스 커널 테스트'라는 새로운 프레임워크를 선보였어요. 이 테스트는 모델의 '잊을 권리' 준수 여부를 훨씬 더 정확하고 효율적으로 검증해서 AI 시스템의 프라이버시와 안전성을 높여준답니다.
anthropic
앤트로픽이 클로드의 화학 능력을 향상시키기 위해 NMR 스펙트럼 분석에서 전문 소프트웨어와 비교 평가한 결과, 범용 모델인 Opus 4.7이 일상적인 데이터 예측에서 ChemDraw 및 MestReNova와 동등하거나 더 나은 성능을 보였고, 역구조 결정도 가능함을 확인했습니다.
google-developers
구글 튜닉스 해커톤에서 개발자들이 Tunix와 Kaggle TPU를 활용해 작은 Gemma 모델에 체인 오브 씽킹(Chain-of-Thought) 같은 복잡한 추론 능력을 성공적으로 학습시킨 방법을 소개하는 글이에요.
google-research
구글이 개발한 AI 연구 도구 ERA(Empirical Research Assistance)가 과학적 코딩 작업을 자동화하고 최적화하여 과학 연구 속도를 높이는 방법을 소개하며, 다양한 과학 분야에 적용된 성공 사례와 더 넓은 과학 커뮤니티를 위한 'Computational Discovery' 도구 출시를 알리는 글이에요.
google-developers
ADK(Agent Development Kit)를 활용하면 기업의 복잡하고 장기적인 워크플로우를 안정적으로 처리할 수 있는 AI 에이전트를 만들 수 있어요. 이는 상태 관리, 이벤트 기반 재개, 그리고 멀티 에이전트 협업을 통해 일반적인 챗봇의 한계를 뛰어넘는답니다.
openai-news
유럽 기업 리더들의 경험을 바탕으로, AI 확장 성공은 단순 기술 배포를 넘어 신뢰, 실험 문화, 그리고 인간의 감독이 있는 워크플로우 통합에 달려있다는 것을 보여줘요.
anthropic
앤트로픽은 스페이스X와의 대규모 컴퓨팅 계약 및 기존 파트너십 확대를 통해 클로드의 컴퓨팅 역량을 크게 늘렸고, 이에 따라 Claude Code와 API의 사용량 제한을 대폭 상향하여 사용자 경험을 개선했어요.
google-research
구글 리서치 과학자들이 AI 기반 '경험적 연구 지원(ERA)'을 활용해 전염병 예측, 우주론 난제 해결, 기후 데이터 분석, 신경 회로 규명 등 다양한 과학 분야에서 어떻게 혁신적인 발견을 가속화하고 있는지 네 가지 실제 적용 사례를 통해 친근하게 설명해 드릴게요.
google-research
구글 리서치가 구글 포토의 '자동 프레임' 기능에 도입한 신기술은 3D 장면 이해와 생성형 AI를 활용해 이미 찍은 사진도 새로운 각도로 재구성해 완벽하지 않은 사진을 보정해주는 기능이에요.
google-research
ReasoningBank는 에이전트가 성공과 실패 경험을 모두 활용해 일반화 가능한 추론 전략을 학습하고, 이를 통해 실제 문제 해결 능력을 효율적이고 효과적으로 높이는 혁신적인 메모리 프레임워크예요.
anthropic
에이전틱 코딩 벤치마크 점수가 모델의 실제 능력뿐 아니라 인프라 설정(리소스 할당, 시간 제한 등)에도 크게 좌우되며, 이런 '인프라 노이즈' 때문에 정확한 모델 비교가 어려울 수 있다는 것을 Anthropic 팀의 실험으로 보여주는 글이에요.
anthropic
앤트로픽은 자사 엔지니어와 연구원들을 대상으로 AI(클로드) 사용 실태를 조사한 결과, 생산성 향상, 역량 확장, 새로운 유형의 업무 가능성 등 긍정적인 변화와 함께 기술 역량 약화, 동료와의 교류 감소, 직업 미래에 대한 불확실성 등 도전 과제도 함께 발견했어요.