AI가 앤트로픽의 업무 방식을 어떻게 바꾸고 있을까요?

2025-11-26

요약

앤트로픽은 자사 엔지니어와 연구원들을 대상으로 AI(클로드) 사용 실태를 조사한 결과, 생산성 향상, 역량 확장, 새로운 유형의 업무 가능성 등 긍정적인 변화와 함께 기술 역량 약화, 동료와의 교류 감소, 직업 미래에 대한 불확실성 등 도전 과제도 함께 발견했어요.

인사이트

생산성 대폭 향상 및 역량 확장: 앤트로픽 엔지니어들은 클로드를 사용해 코드 디버깅, 이해, 새 기능 구현 등에서 생산성이 크게 늘었고, 기존 전문 분야를 넘어선 '풀스택' 역량을 갖추게 되었어요. 심지어 기존에는 시도하지 못했을 새로운 유형의 업무도 27%나 해냈죠.
기술 역량 약화와 감독의 역설: AI에 업무를 위임하면서 깊이 있는 코딩 연습 기회가 줄어들어 기술 역량이 약화될 수 있다는 우려가 있어요. AI의 결과물을 효과적으로 감독하려면 여전히 숙련된 코딩 능력이 필요한데, 이 능력이 줄어들 경우 '감독의 역설'에 직면할 수 있다는 점이 지적되었죠.
변화하는 직장 내 역학 및 미래 불확실성: 클로드가 동료에게 물어보던 질문의 첫 번째 창구가 되면서 동료 간 협업 및 멘토링 기회가 줄어들 수 있어요. 엔지니어들은 AI 에이전트를 관리하는 역할로 전환되고 있지만, 장기적으로는 자신의 직무가 어떻게 변할지에 대한 깊은 불확실성을 느끼고 있어요.

왜 중요한가

AI 개발을 선도하는 앤트로픽 내부의 경험은 AI가 다른 산업의 업무 환경에도 어떤 변화를 가져올지 미리 엿볼 수 있는 중요한 지표가 돼요. 엔지니어링 작업의 생산성 향상과 역할 변화는 물론, 기술 역량 유지, 협업 방식, 미래 직업 경로 같은 광범위한 질문에 대한 선제적 고민이 필요하다는 걸 보여주거든요. 다른 분야에서도 AI 도입 시 유사한 기회와 도전 과제에 직면할 가능성이 높기 때문에, 이 연구 결과는 AI 전환을 현명하게 헤쳐나가는 데 필요한 통찰을 제공해 줄 거예요.

#AI #인공지능 #머신러닝

AI가 앤트로픽의 업무 방식을 어떻게 바꾸고 있을까요?

AI는 우리가 일하는 방식을 어떻게 바꾸고 있을까요? 앤트로픽의 이전 연구는 AI의 경제적 영향에 대해 노동 시장 전체를 살펴봤고, 다양한 직업을 다뤘어요. 그런데 AI 기술을 가장 먼저 도입한 사람들, 그러니까 바로 앤트로픽 직원들을 좀 더 자세히 연구하면 어떨까요?

그래서 앤트로픽은 내부로 시선을 돌려, 2025년 8월에 132명의 앤트로픽 엔지니어와 연구원들을 대상으로 설문조사를 진행했고, 53번의 심층 질적 인터뷰를 했어요. 그리고 내부 클로드 코드 사용 데이터를 분석해서 AI 사용이 앤트로픽에서 어떤 변화를 가져오고 있는지 알아봤죠. 그 결과, AI 사용이 소프트웨어 개발자들의 업무 성격을 급진적으로 바꾸고 있으며, 희망과 우려를 동시에 낳고 있다는 걸 발견했어요.

앤트로픽의 연구는 업무 환경이 크게 변하고 있다는 걸 보여줘요. 엔지니어들은 훨씬 더 많은 일을 처리하고 있고, '풀스택'으로 변모하며 (자신이 평소 전문으로 하던 영역을 넘어선 일도 성공적으로 해낼 수 있게 되었죠), 학습과 반복 속도를 가속화하며, 이전에는 소홀했던 작업들까지 해결하고 있어요. 이렇게 업무 범위가 확장되면서 사람들은 장단점에 대해 고민하게 되었어요. 어떤 사람들은 이것이 더 깊은 기술 역량을 잃거나, 클로드의 결과물을 효과적으로 감독하는 능력이 떨어질 수 있다고 우려하는 반면, 다른 사람들은 더 폭넓고 높은 수준에서 생각할 기회로 받아들이고 있죠. AI 협업이 늘면서 동료들과의 협업이 줄었다고 느끼는 사람들도 있었고, 심지어 언젠가 자신의 직업이 AI로 인해 자동화될 수도 있지 않을까 궁금해하는 사람들도 있었어요.

AI를 만드는 회사에서 AI의 영향을 연구하는 것은 특권적인 위치를 대변한다는 점을 앤트로픽은 인지하고 있어요. 앤트로픽 엔지니어들은 최첨단 도구를 일찍부터 사용할 수 있고, 비교적 안정적인 분야에서 일하며, 스스로 다른 산업에 영향을 미치는 AI 전환에 기여하고 있죠. 그럼에도 불구하고, 앤트로픽 팀은 이 연구 결과를 발표하는 것이 전반적으로 유용하다고 생각했어요. 앤트로픽 엔지니어들에게 일어나는 일이 더 넓은 사회적 변화의 중요한 전조일 수 있기 때문이죠. 앤트로픽 팀의 연구 결과는 여러 분야에서 조기에 주의를 기울여야 할 몇 가지 도전 과제와 고려 사항을 시사하고 있어요 (단, 자세한 내용은 부록의 제한 사항 섹션을 참고하세요). 이 데이터가 수집될 당시, Claude Sonnet 4와 Claude Opus 4가 사용 가능한 가장 유능한 모델이었고, 그 이후로도 기능은 계속 발전하고 있어요.

더 유능한 AI는 생산성 이점을 가져오지만, 동시에 기술 전문성을 유지하고, 의미 있는 협업을 보존하며, AI가 증강된 직장에서 학습, 멘토십, 경력 개발에 새로운 접근 방식이 필요할 수 있는 불확실한 미래를 준비하는 것에 대한 질문을 제기해요. 앤트로픽 팀은 이러한 질문들을 내부적으로 탐구하기 위해 아래 '미래를 내다보며' 섹션에서 몇 가지 초기 단계를 논의했어요. 또한 AI 관련 경제 정책에 대한 아이디어에 대한 최근 블로그 게시물에서는 잠재적인 정책 대응 방안도 모색했죠.

주요 연구 결과

이 섹션에서는 설문조사, 인터뷰, 클로드 코드 데이터에서 얻은 연구 결과를 간략하게 요약해 드릴게요. 자세한 연구 결과, 방법, 주의사항은 아래 이어진 섹션에서 제공하고 있어요.

설문조사 데이터

앤트로픽 엔지니어와 연구원들은 클로드를 주로 코드 오류 수정과 코드베이스 학습에 사용하고 있어요. 디버깅과 코드 이해가 가장 흔한 사용 사례죠 (그림 1). 사람들은 클로드 사용이 늘고 생산성도 향상되었다고 보고하고 있어요. 직원들은 업무의 60%에서 클로드를 사용하고 있으며, 생산성이 50% 향상되었다고 자가 보고했는데, 이는 작년 이맘때보다 23배 증가한 수치예요. 이러한 생산성 증가는 작업 범주당 소요 시간은 약간 줄어들지만, 산출량은 상당히 늘어나는 형태로 나타나죠 (그림 2). 클로드 지원 작업의 27%는 원래는 하지 않았을 작업들로 구성돼요. 예를 들어, 프로젝트 확장, 유용한 도구 만들기 (예: 대화형 데이터 대시보드), 그리고 수동으로 했다면 비용 효율적이지 않았을 탐색 작업 등이 이에 해당하죠. **대부분의 직원은 클로드를 자주 사용하지만, 업무의 020%만 '완전히 위임'할 수 있다고 보고했어요.** 클로드는 끊임없는 협력자이지만, 특히 중요한 작업에서는 적극적인 감독과 검증이 필요하다고 생각해요. 전혀 검증이 필요 없는 작업을 넘겨주는 것과는 다르다는 거죠.

질적 인터뷰

직원들은 AI 위임에 대한 직관을 개발하고 있어요. 엔지니어들은 쉽게 검증할 수 있거나 ('정확성을 상대적으로 쉽게 냄새 맡아 확인할 수 있는'), 위험 부담이 적거나 (예: '일회성 디버깅 또는 연구 코드'), 지루한 작업 ('작업을 하고 싶다는 의욕이 클수록 클로드를 사용하지 않을 가능성이 높아요')을 위임하는 경향이 있어요. 많은 사람들이 간단한 작업부터 시작하여 점차 복잡한 작업을 위임하는 신뢰의 진전을 묘사하고 있죠. 현재 대부분의 설계 또는 '취향' 관련 작업은 사람이 하고 있지만, 모델이 개선됨에 따라 이 경계는 재협상되고 있어요. 기술 스택은 더 많은 영역으로 넓어지지만, 일부는 연습량이 줄어들고 있어요. 클로드는 사람들이 더 많은 소프트웨어 엔지니어링 영역으로 기술을 확장할 수 있게 해줘요 ('예전에는 손대기 두려웠던 프론트엔드나 트랜잭션 데이터베이스에서도 매우 유능하게 작업할 수 있어요'). 하지만 일부 직원들은 역설적으로 코드 작성과 비평 모두에 필요한 깊이 있는 기술 역량이 위축될 수 있다고 우려하고 있어요. '산출물을 만드는 것이 너무 쉽고 빨라지면서, 무언가를 배우는 데 시간을 할애하는 것이 점점 더 어려워지고 있어요.' 코딩 장인정신과의 관계 변화. 일부 엔지니어들은 AI 지원을 받아들이고 결과에 집중해요 ('저는 코드를 작성하는 것을 정말 즐긴다고 생각했는데, 대신 코드를 작성해서 얻는 것을 즐긴다는 것을 알게 되었어요'). 다른 이들은 '코드를 작성하는 과정 중 분명히 그리운 부분들이 있어요'라고 말하기도 하죠. 직장 내 사회적 역학이 변할 수도 있어요. 클로드는 이제 예전에는 동료들에게 가던 질문의 첫 번째 창구가 되었어요. 그 결과 멘토링과 협업 기회가 줄어들었다고 보고하는 사람들도 있죠. ('저는 사람들과 함께 일하는 걸 좋아하는데, 이제 그들이 덜 필요하다는 게 슬프네요… 주니어들이 저에게 질문하러 오는 횟수가 예전 같지 않아요.') 경력 발전과 불확실성. 엔지니어들은 AI 시스템을 관리하는 더 높은 수준의 업무로 전환하고 있으며, 상당한 생산성 향상을 보고하고 있어요. 하지만 이러한 변화는 소프트웨어 엔지니어링이라는 직업의 장기적인 궤적에 대한 의문도 제기하죠. 어떤 사람들은 미래에 대해 상충되는 감정을 표현해요. '단기적으로는 낙관적이지만, 장기적으로는 AI가 모든 것을 다 해내서 저와 많은 사람들을 쓸모없게 만들 것 같아요.' 다른 사람들은 진정한 불확실성을 강조하며, 몇 년 안에 자신의 역할이 어떻게 될지는 '말하기 어렵다'고 했어요.

클로드 코드 사용 트렌드

클로드는 점점 더 복잡한 작업을 더 자율적으로 처리하고 있어요. 6개월 전, 클로드 코드는 사람의 개입 없이 약 10가지 작업을 스스로 완료했어요. 지금은 일반적으로 약 20가지 작업을 처리하며, 더 복잡한 워크플로우를 완료하는 데 사람의 개입이 덜 필요하죠 (그림 3). 엔지니어들은 코드 설계/계획 (사용량의 1%에서 10%로 증가) 및 새 기능 구현 (14%에서 37%로 증가)과 같은 복잡한 작업에 클로드를 점점 더 많이 사용하고 있어요 (그림 4). 클로드는 많은 '사소한 불편함(papercuts)'을 해결해 줘요. 클로드 코드 작업의 8.6%는 유지보수성을 위해 코드를 리팩토링하는 것과 같이 삶의 질을 향상시키는 사소한 문제들을 해결하는 데 사용되는데, 사람들이 일반적으로 우선순위에서 밀렸을 '사소한 불편함'이라고 표현한 것들이죠. 이러한 작은 수정들이 더 큰 생산성과 효율성 증대로 이어질 수 있어요. 모든 사람이 '풀스택'이 되고 있어요. 다양한 팀이 클로드를 다른 방식으로 사용하고 있는데, 주로 핵심 전문성을 강화하기 위해서예요. 보안팀은 익숙하지 않은 코드를 분석하는 데 사용하고, 정렬(Alignment) 및 안전(Safety) 팀은 데이터 시각화를 위한 프론트엔드를 구축하는 데 사용하는 식이죠 (그림 5).

설문조사 데이터

앤트로픽은 조직 전반의 132명 엔지니어와 연구원들에게 클로드 사용에 대해 설문조사를 진행하여, 그들이 일상생활에서 클로드를 정확히 어떻게 사용하고 있는지 더 잘 이해하고자 했어요. 설문조사는 내부 통신 채널을 통해 배포되었고, 연구 및 제품 기능을 대표하는 다양한 팀의 직원들에게 직접 연락해서 진행했죠. 더 자세한 방법론적 내용은 부록의 제한 사항 섹션에 포함했어요. 또한 다른 사람들이 앤트로픽의 접근 방식을 평가하고 자신의 연구에 적용할 수 있도록 설문 질문을 공유하고 있어요.

사람들은 어떤 코딩 작업에 클로드를 사용하고 있을까요?

앤트로픽은 설문 응답을 한 엔지니어와 연구원들에게 다양한 종류의 코딩 작업에 클로드를 얼마나 자주 사용하는지 평가해달라고 요청했어요. 예를 들어, '디버깅' (코드 오류 수정에 클로드 사용), '코드 이해' (클로드가 기존 코드를 설명하여 사용자에게 코드베이스 이해를 돕도록 하는 것), '리팩토링' (기존 코드 구조를 재구성하는 데 클로드 사용), '데이터 과학' (예: 클로드가 데이터셋을 분석하고 막대 그래프를 만들도록 하는 것) 등이 있었죠.

가장 흔한 일상 업무는 다음과 같아요. 대부분의 직원(55%)은 매일 디버깅에 클로드를 사용했고, 42%는 매일 코드 이해에 클로드를 사용했으며, 37%는 매일 새로운 기능 구현에 클로드를 사용했어요. 덜 빈번한 작업은 높은 수준의 설계/계획 (아마도 사람들이 직접 하는 경향이 있는 작업이기 때문일 거예요)과 데이터 과학 및 프론트엔드 개발 (아마도 전체적으로 덜 흔한 작업이기 때문일 거예요)이었죠. 이는 '클로드 코드 사용 트렌드' 섹션에서 보고된 클로드 코드 사용 데이터 분포와 대체로 일치해요.

그림 1: 다양한 코딩 작업(y축)에 대한 일일 사용자 비율(x축)이에요. — Figure 1: Proportion of daily users (x-axis) for various coding tasks (y-axis).

사용량 및 생산성

직원들은 12개월 전에는 일상 업무의 28%에서 클로드를 사용했고, 그로부터 20%의 생산성 향상을 얻었다고 자가 보고했어요. 반면, 지금은 업무의 59%에서 클로드를 사용하고 평균 50%의 생산성 향상을 달성하고 있죠. (이는 앤트로픽이 엔지니어링 조직 전체에 클로드 코드를 도입했을 때 엔지니어 한 명당 병합된 풀 리퀘스트 수가 하루 67% 증가했다는 점과 거의 일치해요.) 전년 대비 비교는 상당히 극적인데요. 이는 1년 만에 두 지표 모두 2배 이상 증가했음을 시사하죠. 사용량과 생산성 또한 강하게 상관관계가 있는데, 분포의 극단에서는 응답자의 14%가 클로드를 사용하여 생산성을 100% 이상 높이고 있어요. 이들은 앤트로픽 내부의 '파워 유저'들이죠.

이 연구 결과 (및 아래의 다른 자가 보고된 생산성 연구 결과)에 대한 주의사항을 말씀드리면, 생산성은 정확하게 측정하기가 어려워요 (더 많은 제한 사항은 부록을 참조하세요). AI 연구 비영리 단체인 METR의 최근 연구에 따르면, AI를 사용하여 매우 익숙한 코드베이스에서 작업하는 숙련된 개발자들이 AI로 인한 생산성 향상을 과대평가했다고 해요. 하지만 METR이 예상보다 낮은 생산성에 기여한다고 밝힌 요인들 (예: AI가 크고 복잡한 환경에서 또는 많은 암묵적 지식/맥락이 필요한 곳에서 성능이 떨어지는 경우)은 앤트로픽 직원들이 클로드에 위임하지 않는다고 말한 작업 유형과 매우 유사해요 (아래 AI 위임 접근 방식을 참조하세요). 작업 전반에 걸쳐 자가 보고된 앤트로픽의 생산성 향상은 직원들이 전략적인 AI 위임 기술을 개발하고 있다는 것을 반영할 수 있는데, 이는 METR 연구에서는 고려되지 않은 부분이죠.

직원들에게 현재 클로드를 사용하는 작업 범주에서 클로드가 전반적인 소요 시간과 작업 산출량에 어떤 영향을 미치는지 물었을 때 흥미로운 생산성 패턴이 나타났어요. 거의 모든 작업 범주에서 소요 시간은 순감소하고, 산출량은 더 크게 순증가하는 것을 볼 수 있죠:

그림 2: 작업별 소요 시간(왼쪽 패널) 및 산출량(오른쪽 패널)에 미치는 영향(y축)을 보여줘요. 각 플롯의 x축은 클로드 지원 작업 범주에서 클로드를 사용하지 않았을 때와 비교하여 소요 시간 또는 산출량의 자가 보고된 감소(음수), 증가(양수) 또는 변화 없음(수직 점선)을 나타내요. 오차 막대는 95% 신뢰 구간을 보여줘요. 원 면적은 각 평가 지점의 응답 수에 비례하죠. 각 작업 범주에 클로드를 사용했다고 보고한 응답자만 포함되었어요. — Figure 2: Impact on time spent (left panel) and output volume (right panel) by task (y-axis). The x-axis on each plot corresponds to either a self-reported decrease (negative values), increase (positive values) or no change (vertical dashed line) in time spent or output volume for categories of Claude-assisted tasks, compared to not using Claude. Error bars show 95% confidence intervals. Circle area is proportional to the number of responses at each rating point. Only respondents who reported using Claude for each task category are included.

하지만 원시 데이터를 더 깊이 살펴보면, 시간 절약 응답이 양극단에 몰려 있다는 것을 알 수 있어요. 어떤 사람들은 클로드 지원 작업에 훨씬 더 많은 시간을 보내고 있죠.

왜 그럴까요? 사람들은 일반적으로 클로드의 코드를 디버깅하고 정리하는 데 (예: '코드를 직접 짜다가 막혔을 때'), 그리고 직접 작성하지 않았기 때문에 클로드의 코드를 이해하는 데 더 많은 인지적 오버헤드를 져야 한다고 설명했어요. 어떤 사람들은 '이전에는 바로 포기했을 작업을 계속하도록' 클로드가 도와준다고 말하거나, 새로운 코드베이스에서 더 철저한 테스트와 더 많은 학습 및 탐색을 할 수 있도록 돕는다는 의미에서 작업에 더 많은 시간을 보낸다고 언급하기도 했죠. 일반적으로 시간 절약을 경험하는 엔지니어들은 클로드에게 빠르게 검증 가능한 작업을 할당하는 반면, 더 많은 시간을 보내는 사람들은 AI가 생성한 코드를 디버깅하거나 클로드의 더 많은 지도가 필요한 도메인에서 작업하는 것 같아요.

또한 앤트로픽의 데이터만으로는 보고된 시간 절약이 어디에 재투자되는지 명확하지 않아요. 추가 엔지니어링 작업, 비엔지니어링 작업, 클로드와의 상호 작용 또는 그 결과물 검토, 혹은 업무 외 활동 등 다양한 가능성이 있죠. 앤트로픽의 작업 분류 프레임워크는 엔지니어들이 시간을 할애하는 모든 방식을 포착하지 못해요. 게다가 시간 절약은 자가 보고의 인식 편향을 반영할 수도 있고요. 이러한 효과를 명확히 하려면 추가 연구가 필요하죠.

산출량 증가는 더 직접적이고 상당한 수준이에요. 모든 작업 범주에서 더 큰 순증가가 나타나고 있죠. 사람들이 개별 작업보다는 '디버깅'과 같은 작업 범주 전체에 대해 보고한다는 점을 고려하면 이 패턴은 합리적이에요. 즉, 사람들은 디버깅이라는 범주에 약간 더 적은 시간을 보내면서도 전체적으로는 훨씬 더 많은 디버깅 결과물을 생산할 수 있는 거죠. 생산성은 직접 측정하기가 매우 어렵지만, 이 자가 보고 데이터는 AI가 앤트로픽에서 주로 더 많은 산출량 증대를 통해 생산성을 높인다는 것을 시사해요.

클로드가 새로운 업무를 가능하게 하다

앤트로픽 팀이 궁금했던 한 가지는, 클로드가 질적으로 새로운 종류의 작업을 가능하게 하는지, 아니면 클로드 지원 작업이 결국 직원들에 의해 (비록 더 느린 속도였겠지만) 수행되었을 것인지였어요.

직원들은 클로드 지원 작업의 27%가 클로드가 없었다면 수행되지 않았을 것이라고 추정했어요. 엔지니어들은 AI를 사용하여 프로젝트 확장, 있으면 좋은 기능 (예: 대화형 데이터 대시보드), 문서화 및 테스트와 같이 유용하지만 지루한 작업, 그리고 수동으로 했다면 비용 효율적이지 않았을 탐색 작업을 한다고 언급했어요. 한 사람은 클로드를 통해 '구조가 나쁜 코드를 리팩토링하거나 '다른 작업을 더 빨리 완료하는 데 도움이 되는 작은 도구'를 만드는 등, 이전에는 삶의 질을 떨어뜨렸던 더 많은 '사소한 불편함(papercuts)'을 해결할 수 있게 되었다고 설명했죠. 앤트로픽 팀은 사용 데이터 분석에서도 이를 찾아봤고, 클로드 코드 작업의 8.6%가 '사소한 불편함 해결'과 관련되어 있다는 것을 발견했어요.

다른 연구원은 여러 버전의 클로드를 동시에 실행하여 문제에 대한 다양한 접근 방식을 탐색했다고 설명했어요:

'사람들은 매우 유능한 모델을 한 대의 더 빠른 자동차를 얻는 것처럼 단일 인스턴스로 생각하는 경향이 있어요. 하지만 백만 마리의 말이 있다는 것은… 많은 다른 아이디어를 테스트할 수 있게 해주는 거죠… 탐색할 수 있는 폭이 더 넓어지면 흥미롭고 더 창의적이게 돼요.'

이어지는 섹션에서 보겠지만, 이러한 새로운 업무는 종종 엔지니어들이 자신의 핵심 전문 분야를 벗어나는 작업을 다루는 것을 포함해요.

얼마나 많은 작업을 클로드에 완전히 위임할 수 있을까요?

엔지니어들은 클로드를 자주 사용하지만, 절반 이상이 자신의 업무 중 0~20%만 클로드에 '완전히 위임'할 수 있다고 말했어요. (여기서 '완전히 위임'을 해석하는 방식에는 응답자마다 차이가 있을 수 있다는 점에 주목할 필요가 있어요. 전혀 검증이 필요 없는 작업부터 가벼운 감독만 필요한 정도로 신뢰할 수 있는 작업까지 다양하죠.) 이유를 설명할 때, 엔지니어들은 특히 복잡한 작업이나 코드 품질 기준이 중요한 고위험 영역에서 클로드와 적극적으로 반복하며 작업하고 그 결과물을 검증한다고 설명했어요. 이는 엔지니어들이 검증 없이 작업을 넘겨주기보다는 클로드와 긴밀히 협력하고 그 작업을 확인하는 경향이 있으며, '완전히 위임'으로 간주하는 기준이 높다는 것을 시사해요.

질적 인터뷰

이러한 설문조사 결과는 상당한 생산성 향상과 업무 패턴 변화를 보여주지만, 엔지니어들이 이러한 변화를 실제로 어떻게 일상에서 경험하고 있는지에 대한 질문을 제기해요. 이러한 측정 지표 이면에 있는 인간적인 측면을 이해하기 위해, 앤트로픽 팀은 설문조사에 응답한 앤트로픽 엔지니어와 연구원 53명과 심층 인터뷰를 진행하여 직장 내 변화에 대한 그들의 생각과 느낌에 대한 더 많은 통찰력을 얻었어요.

AI 위임 접근 방식

엔지니어와 연구원들은 워크플로우에서 클로드를 생산적으로 활용하기 위한 다양한 전략을 개발하고 있어요. 사람들은 일반적으로 다음 유형의 작업을 위임하죠:

사용자에게는 맥락이 없지만 복잡도가 낮은 작업: '맥락은 적지만 전체적인 복잡도도 낮다고 생각하는 일에 클로드를 사용해요.' '제가 겪는 인프라 문제는 대부분 어렵지 않고 클로드로 처리할 수 있어요… Git이나 리눅스를 잘 모르는데… 클로드가 제가 경험 부족한 부분을 잘 채워줘요.' 쉽게 검증 가능한 작업: '검증 노력이 생성 노력에 비해 크지 않은 모든 일에 절대적으로 놀라워요.' 잘 정의되거나 독립적인 작업: '프로젝트의 하위 구성 요소가 충분히 분리되어 있다면, 클로드에게 한번 맡겨볼 거예요.' 코드 품질이 중요하지 않은 작업: '일회성 디버깅이나 연구 코드라면 바로 클로드에게 맡기죠. 개념적으로 어렵거나 아주 구체적인 종류의 디버그 주입이 필요하거나, 설계 문제라면 제가 직접 해요.' 반복적이거나 지루한 작업: '그 작업을 하는 것이 더 신날수록 클로드를 사용하지 않을 가능성이 높아요. 반면에 많은 저항감을 느낄 때면… 클로드와 그 작업에 대해 대화를 시작하는 것이 더 쉽다고 생각하는 경우가 많아요.' 설문조사에서 사람들은 평균적으로 클로드 지원 작업의 44%가 스스로는 즐겨 하지 않았을 작업들로 구성되어 있다고 답했어요. 프롬프트가 실행보다 빠른 작업: '제가 예상하기에 10분도 안 걸릴 작업이라면… 굳이 클로드를 사용하지 않을 거예요.' '현재 가장 큰 걸림돌은 콜드 스타트 문제예요. 콜드 스타트란, 제 팀의 코드베이스가 어떻게 작동하는지에 대해 제가 가지고 있는 많은 내재적 정보가 클로드에게는 기본적으로 없을 것이라는 의미예요… 완벽한 프롬프트를 반복하는 데 시간을 쓸 수도 있지만, 그냥 제가 직접 가서 할 거예요.'

앤트로픽 직원들이 위임 결정에서 언급한 이러한 요인들은 METR의 외부 연구에서 AI 관련 생산성 저하 (예: 개발자의 코드베이스에 대한 높은 친숙도, 크고 복잡한 저장소)를 설명하는 데 발견된 요인들과 유사했어요. 앤트로픽의 인터뷰 전반에서 이러한 위임 기준이 일치한다는 것은 적절한 작업 선택이 AI 생산성 향상의 중요한 요인임을 시사하며 (이는 향후 생산성 연구에서 신중하게 통제되어야 해요).

신뢰하되 검증하라

많은 사용자들은 시간이 지남에 따라 점점 더 복잡한 작업을 위임하는 방식으로 클로드 사용이 진전되었다고 설명했어요. '처음에는 Rust 프로그래밍 언어에 대한 기본적인 질문으로 AI 도구를 사용했어요… 최근에는 모든 코딩에 클로드 코드를 사용하고 있죠.'

한 엔지니어는 신뢰의 진전을 구글 지도를 채택하는 것과 비유했어요:

'처음에는 제가 모르는 경로에만 [구글 지도]를 사용했어요… 이건 제가 모르는 SQL 코드를 작성하는 데 클로드를 사용하는 것과 같고, 제가 아는 파이썬 코드를 작성하라고 요청하지 않는 것과 같죠. 그러다 제가 대체로 아는 경로에도 구글 지도를 사용하기 시작했지만, 어쩌면 마지막 1마일은 모를 수도 있었어요… 오늘날 저는 매일 통근할 때도 항상 구글 지도를 사용해요. 다른 길로 가라고 하면 그렇게 하고, 모든 옵션을 고려했다고 그냥 믿죠… 오늘날 저는 클로드 코드를 비슷한 방식으로 사용하고 있어요.'

엔지니어들은 클로드를 자신의 전문 분야 내에서 사용할지, 아니면 벗어나서 사용할지에 대해 의견이 갈려요. 어떤 사람들은 구현 시간을 절약하기 위해 '주변' 도메인에 사용하고, 다른 사람들은 결과물을 검증할 수 있는 익숙한 영역을 선호하죠 ('클로드가 하는 일을 제가 완전히 이해하는 방식으로 사용해요'). 한 보안 엔지니어는 클로드가 '정말 똑똑하지만 위험한 방식으로, 아주 유능한 주니어 엔지니어가 제안할 법한 종류의' 해결책을 제시했을 때 경험의 중요성을 강조했어요. 즉, 이는 판단력과 경험이 있는 사용자만이 문제점을 인식할 수 있는 것이었죠.

다른 엔지니어들은 두 가지 유형의 작업을 모두 클로드에 사용하는데, 실험적인 방식 ('기본적으로 어떤 코딩 문제든 클로드에게 첫 시도를 맡겨요')으로 사용하거나, 작업에 대한 전문 지식 수준에 따라 접근 방식을 조절하기도 해요:

'저는 제 전문 지식의 핵심 분야(가속기로서, 무엇을 예상해야 할지 알고 에이전트를 효과적으로 안내할 수 있는 경우)와 제 전문 분야를 약간 벗어나는 분야(무엇을 예상해야 할지 대략 알지만, 클로드가 제 기억이나 특정 정의에 대한 익숙함의 공백을 채워줄 수 있는 경우) 모두에 이 도구들을 사용해요.'

'제가 특히 잘 아는 것이라면, 클로드에게 추적해야 할 것이 무엇인지 더 단호하게 말할 거예요. 제가 확신하지 못하는 것이라면, 클로드에게 전문가가 되어 제가 고려하고 연구해야 할 옵션과 통찰력을 달라고 요청하는 경우가 많아요.'

사람들은 어떤 작업을 직접 처리할까요?

사람들은 높은 수준의 전략적 사고나 조직적 맥락 또는 '취향'이 필요한 설계 결정이 포함된 작업에는 클로드를 사용하지 않는다고 일관되게 말했어요. 한 엔지니어는 '저는 보통 높은 수준의 사고와 설계를 담당해요. 새로운 기능 개발부터 디버깅까지 제가 할 수 있는 모든 것을 위임하죠.'라고 설명했어요. 이는 설계 및 계획 작업에서 가장 적은 생산성 향상을 보인 앤트로픽의 설문조사 데이터(그림 2)에도 반영되어 있죠. 하지만 많은 사람들은 위임 경계가 '움직이는 목표'라고 설명했는데, 모델이 개선됨에 따라 이 경계가 정기적으로 재협상되고 있다는 의미예요 (아래 클로드 코드 사용 데이터는 6개월 전보다 코딩 설계/계획 사용량이 상대적으로 많다는 것을 보여줘요).

기술 전환

새로운 역량…

클로드 지원 작업의 27%가 아니었다면 하지 않았을 것이라는 설문조사 결과는 더 넓은 패턴을 반영해요. 바로 엔지니어들이 AI를 사용하여 핵심 전문 분야를 벗어나 작업한다는 것이죠. 많은 직원들이 이전에 자신의 전문 지식 밖에 있던 작업을 완료하고 있다고 보고해요. 백엔드 엔지니어가 UI를 구축하고, 연구원이 시각화를 만드는 식이죠. 한 백엔드 엔지니어는 클로드와 반복 작업을 통해 복잡한 UI를 구축했다고 설명했어요. '제가 했을 때보다 훨씬 더 잘 해냈어요. 저는 절대 못했을 거고, 제시간에 맞춰 끝내지도 못했을 거예요… [디자이너들은] '잠깐, 네가 이걸 했어?'라고 말하더군요. 저는 '아니요, 클로드가 했어요. 저는 그냥 프롬프트만 줬죠.'라고 말했어요.'

엔지니어들은 '더 풀스택이 되고 있어요… 예전에는 감히 손댈 엄두도 못 냈던 프론트엔드나 트랜잭션 데이터베이스, 또는 API 코드에서도 매우 유능하게 작업할 수 있어요.'라고 보고하고 있죠. 이러한 역량 확장은 더 긴밀한 피드백 루프와 더 빠른 학습을 가능하게 해요. 한 엔지니어는 빌드하고 회의 일정을 잡고 반복하는 '몇 주가 걸리던 과정'이 동료들이 실시간 피드백을 제공하는 '몇 시간짜리 작업 세션'이 될 수 있다고 말했어요.

일반적으로 사람들은 빠르게 프로토타입을 만들고, 작업을 병렬화하며, 고된 작업을 줄이고, 전반적으로 야망의 수준을 높이는 새로운 능력에 열광했어요. 한 선임 엔지니어는 '이 도구들은 주니어 엔지니어들을 확실히 더 생산적이고, 더 과감하게 프로젝트를 맡도록 만들고 있어요'라고 말했죠. 일부는 클로드를 사용함으로써 '활성화 에너지'가 줄어들어 미루는 버릇을 더 쉽게 이겨낼 수 있었다고도 말했어요. '문제를 해결하기 시작하는 데 필요한 에너지가 극적으로 줄어들어서, 훨씬 더 많은 추가적인 일들을 해결할 의지가 생겼어요.'

…그리고 줄어드는 실제 연습

동시에 어떤 사람들은 '더 많이 위임하면서 기술이 위축될까' 걱정했고, 수동적인 문제 해결 과정에서 발생하는 부수적인 (또는 '우발적인') 학습을 잃어버리는 것에 대한 우려도 있었어요:

'만약 어려운 문제를 직접 디버깅하러 나간다면, 당신은 문제 해결에 직접적으로 유용하지 않은 문서와 코드를 읽는 데 시간을 보내게 될 거예요. 하지만 이 시간 내내 시스템이 어떻게 작동하는지에 대한 모델을 구축하게 되죠. 클로드가 문제에 바로 도달하게 해 주기 때문에 이런 과정이 훨씬 줄어들었어요.'

'저는 예전에는 도구가 무엇을 할 수 있는지 이해하기 위해 모든 설정을 탐색했지만, 이제는 AI에게 새로운 도구를 사용하는 방법을 물어봐서 전문 지식이 부족해졌어요. 다른 팀원들과 대화할 때 즉시 기억해낼 수 있었던 것들을 이제는 AI에게 물어봐야 해요.'

'클로드를 사용하는 것은 제가 쉬운 경우를 해결함으로써 작업을 수행하는 방법을 배우는 부분을 건너뛰게 할 수 있고, 나중에 더 복잡한 경우를 해결하는 데 어려움을 겪게 할 수 있어요.'

한 선임 엔지니어는 자신이 주니어였다면 자신의 기술에 대해 더 걱정했을 것이라고 말했어요:

'저는 주로 답이 무엇이거나 어떻게 보여야 하는지 아는 경우에 AI를 사용해요. 저는 SWE를 '어려운 방식'으로 하면서 그 능력을 개발했죠… 하지만 만약 제가 [경력 초반이었다면], 모델의 결과물을 맹목적으로 받아들이기보다는 제 자신의 능력을 계속 키우기 위해 많은 의도적인 노력을 해야 할 거라고 생각할 거예요.'

코딩 기술의 위축이 우려되는 한 가지 이유는 '감독의 역설' 때문이에요. 위에서 언급했듯이, 클로드를 효과적으로 사용하려면 감독이 필요하고, 클로드를 감독하려면 AI 과용으로 위축될 수 있는 바로 그 코딩 기술이 필요하기 때문이죠. 한 사람은 이렇게 말했어요:

'솔직히 저는 제 기술 세트 자체보다 감독 및 관리 문제에 대해 훨씬 더 걱정해요… 제 기술이 위축되거나 발전하지 못하는 것은 주로 제가 신경 쓰는 작업을 AI를 사용하여 안전하게 수행할 수 있는 능력과 관련하여 문제가 될 것이지, 그 작업을 독립적으로 수행할 수 있는 능력과는 관련이 없을 거예요.'

이를 해결하기 위해 일부 엔지니어들은 의도적으로 AI 없이 연습해요. '가끔은 클로드가 문제를 완벽하게 해결할 수 있다는 것을 알더라도, 요청하지 않을 때가 있어요. 그렇게 하면 제 실력을 날카롭게 유지하는 데 도움이 되죠.'

여전히 실제 코딩 기술이 필요할까요?

아마 소프트웨어 엔지니어링은 과거에도 그랬듯이 더 높은 수준의 추상화로 이동하고 있을 거예요. 초창기 프로그래머들은 훨씬 더 기계에 가까이서 작업했어요. 수동으로 메모리를 관리하고, 어셈블리 언어로 코드를 작성하거나, 심지어 물리적인 스위치를 토글해서 명령을 입력하기도 했죠. 시간이 지나면서 복잡한 저수준 작업을 자동으로 처리하는 더 높은 수준의, 더 인간이 읽기 쉬운 언어들이 등장했어요. 특히 '감성 코딩'의 부상과 함께, 우리는 이제 영어를 프로그래밍 언어로 사용하는 시대로 이동하고 있는지도 모르겠네요. 한 직원은 지망생 엔지니어들에게 'AI가 [코드를 작성하도록] 잘 활용하고, 더 높은 수준의 개념과 패턴을 배우는 데 집중하라'고 제안했어요.

몇몇 직원들은 이러한 변화가 자신들이 더 높은 수준에서 생각할 수 있도록 힘을 실어준다고 말했어요. 단순히 코드만이 아니라 '최종 제품과 최종 사용자'에 대해 생각할 수 있게 된다는 것이죠. 한 사람은 현재의 변화를 컴퓨터 과학에서 이전에 연결 리스트를 배워야 했던 것과 비교했어요. 이제는 고수준 프로그래밍 언어가 자동으로 처리하는 기본적인 구조들이죠. '그걸 어떻게 하는지 알아서 정말 기뻤지만… 그런 저수준 작업을 하는 것이 감정적으로 특별히 중요하지는 않아요. 저는 코드가 저에게 무엇을 가능하게 하는지에 더 신경 쓰고 싶어요.' 다른 엔지니어도 비슷한 비교를 했지만, 추상화에는 대가가 따른다고 언급했어요. 고수준 언어로 전환하면서 대부분의 엔지니어는 메모리 처리 방식에 대한 깊은 이해를 잃었죠.

어떤 분야에서 기술을 계속 개발하는 것은 클로드에 대한 더 나은 감독과 더 효율적인 작업으로 이어질 수 있어요 ('익숙한 것이라면 제가 직접 하는 것이 더 빠르다는 것을 알아요'). 하지만 엔지니어들은 이것이 중요한지에 대해 의견이 나뉘어요. 어떤 사람들은 여전히 낙관적이죠:

'저는 기술 침식에 대해 크게 걱정하지 않아요. AI는 여전히 문제를 신중하게 생각하게 하고 새로운 접근 방식을 배우는 데 도움을 줘요. 오히려 아이디어를 더 빠르게 탐색하고 테스트할 수 있게 되면서 일부 영역에서는 학습 속도가 빨라졌다고 할 수 있죠.'

다른 사람은 더 현실적이었어요. '저는 소프트웨어 엔지니어로서의 기술이 확실히 위축되고 있지만… 필요하다면 그 기술은 다시 돌아올 수 있고, 이제는 더 이상 필요하지 않아요!' 한 사람은 차트 만들기 같은 덜 중요한 기술만 잃었을 뿐, '중요한 종류의 코드는 여전히 아주 잘 작성할 수 있다'고 지적했어요.

아마도 가장 흥미로운 점은 한 엔지니어가 전제를 뒤집었다는 거예요. '능력이 녹스는' 프레임은 코딩이 언젠가 클로드 3.5 이전으로 돌아갈 것이라는 가정을 전제로 하는데, 저는 그렇게 생각하지 않아요.'

소프트웨어 엔지니어링의 장인정신과 의미

엔지니어들은 실제 코딩 작업을 그리워하는지에 대해 의견이 극명하게 갈려요. 어떤 사람들은 진정한 상실감을 느껴요. '저에게는 한 시대의 끝이에요. 저는 25년 동안 프로그래밍을 해왔고, 그 기술에 능숙하다는 것이 제 직업적 만족감의 핵심이었거든요.' 다른 사람들은 새로운 업무의 본질을 즐기지 못할까 봐 걱정하죠. '하루 종일 클로드에게 프롬프트를 주는 것은 그리 재미있거나 만족스럽지 않아요. 음악을 틀고 몰입해서 직접 무언가를 구현하는 것이 훨씬 더 재미있고 만족스러워요.'

어떤 사람들은 이러한 장단점을 직접 언급하며 받아들였어요. '코드를 리팩토링할 때 젠 상태에 몰입하는 등 [코드를 작성하는 과정 중] 분명 그리운 부분들이 있어요. 하지만 전반적으로 지금 훨씬 더 생산적이 되었으니 기꺼이 포기할 거예요.'

한 사람은 클로드와 반복하는 것이 더 재미있다고 말했는데, 사람과의 피드백보다 더 까다롭게 피드백할 수 있기 때문이라고 했어요. 다른 사람들은 결과에 더 관심이 많죠. 한 엔지니어는 이렇게 말했어요:

'지금쯤이면 겁을 먹거나 지루해할 줄 알았는데… 저는 둘 다 느끼지 않아요. 오히려 훨씬 더 많은 일을 할 수 있게 된 것에 꽤 흥분돼요. 저는 코드를 작성하는 것을 정말 즐긴다고 생각했는데, 대신 코드를 작성해서 얻는 것을 즐긴다는 것을 알게 되었어요.'

사람들이 AI 지원을 받아들이는지, 아니면 실제 코딩 작업의 상실을 애도하는지는 소프트웨어 엔지니어링의 어떤 측면에서 가장 의미를 찾는지에 따라 달라지는 것 같아요.

직장 내 사회적 역학 변화

가장 두드러진 주제 중 하나는 클로드가 한때 동료들에게 가던 질문의 첫 번째 창구가 되었다는 점이에요. 한 직원은 '저는 일반적으로 질문을 훨씬 더 많이 하지만, 그 중 80~90%는 클로드에게 가요'라고 언급했어요. 이는 클로드가 일상적인 질문을 처리하고, 동료들은 AI의 능력을 넘어서는 더 복잡하고 전략적이거나 맥락이 풍부한 문제들을 다루도록 하는 필터링 메커니즘을 만들고 있죠. ('[제 팀]에 대한 의존도를 80% 줄여줬지만, 나머지 20%는 매우 중요해서 가서 그들과 이야기해요.') 사람들은 또한 인간 협력자와의 상호 작용과 유사하게 클로드와 '아이디어를 주고받기도' 해요.

약 절반은 팀 협업 패턴이 변하지 않았다고 보고했어요. 한 엔지니어는 여전히 사람들과 만나고, 맥락을 공유하며, 방향을 정하고 있다고 말하며, 가까운 미래에도 협업은 많을 것이지만, '표준적인 집중 업무 대신 많은 클로드와 대화하게 될 것'이라고 생각한다고 했어요.

하지만 다른 사람들은 동료들과의 상호 작용이 줄어들었다고 설명했어요. ('저는 동료들보다 클로드와 훨씬 더 많이 일해요.') 어떤 사람들은 사회적 마찰이 줄어든 것을 좋게 생각해요. ('동료 시간을 뺏는 것에 대해 미안해하지 않아요.') 다른 사람들은 변화에 저항하거나 (''클로드에게 물어봤나요?'라는 일반적인 반응이 저는 정말 싫어요. 저는 사람들과 직접 일하는 것을 정말 즐기고 그것을 매우 소중히 여겨요.') 이전의 작업 방식을 그리워하기도 했죠. '저는 사람들과 함께 일하는 것을 좋아하는데, 이제 그들이 덜 필요하다는 것이 슬프네요.' 몇몇은 전통적인 멘토링 역학 관계에 미치는 영향을 지적했는데, '선임 엔지니어 대신 클로드가 주니어 직원들에게 많은 코칭을 제공할 수 있기' 때문이에요. 한 선임 엔지니어는 이렇게 말했어요:

'주니어들이 저에게 질문하러 오는 횟수가 예전 같지 않다는 것이 슬프지만, 그들은 확실히 질문에 더 효과적으로 답을 얻고 더 빨리 배우고 있어요.'

경력 불확실성 및 적응

많은 엔지니어들은 자신의 역할이 코드를 작성하는 것에서 AI를 관리하는 것으로 변화하고 있다고 설명해요. 엔지니어들은 자신을 'AI 에이전트의 관리자'로 점점 더 많이 보고 있으며, 일부는 이미 '항상 여러 [클로드] 인스턴스를 실행하고 있어요'. 한 사람은 자신의 업무가 '70% 이상이 새로운 코드를 작성하는 것보다 코드 검토자/수정자로' 바뀌었다고 추정했고, 다른 사람은 '1개, 5개, 또는 100개의 클로드 작업에 대한 책임'을 지는 것을 자신의 미래 역할의 일부로 봤어요.

장기적으로 경력 불확실성은 광범위하게 퍼져 있어요. 엔지니어들은 이러한 변화를 더 넓은 산업 변화의 전조로 봤고, 많은 사람들이 몇 년 뒤 자신의 경력이 어떻게 될지는 '말하기 어렵다'고 했어요. 어떤 사람들은 단기적인 낙관론과 장기적인 불확실성 사이의 갈등을 표현했어요. '단기적으로는 낙관적이지만, 장기적으로는 AI가 모든 것을 다 해내서 저와 많은 사람들을 쓸모없게 만들 것 같아요'라고 한 사람이 말했죠. 다른 사람들은 더 명확하게 말했어요. '매일 출근해서 제 직업을 없애는 일을 하는 것 같은 기분이에요.'

일부 엔지니어들은 더 낙관적이었어요. 한 사람은 '주니어 개발자들이 걱정되지만, 주니어 개발자들이 새로운 기술에 가장 목마르다는 점도 인정해요. 저는 이 직업의 궤적에 대해 전반적으로 매우 낙관적이에요.'라고 말했죠. 그는 경험 부족한 엔지니어들이 문제가 있는 코드를 배포할 잠재적 위험이 있지만, 더 나은 AI 보호 장치, 더 많은 내장 교육 자료, 그리고 실수로부터 자연스럽게 배우는 과정을 통해 시간이 지나면서 이 분야가 적응할 것이라고 주장했어요.

앤트로픽 팀은 사람들이 미래의 역할을 어떻게 구상하는지, 그리고 어떤 적응 전략을 가지고 있는지 물었어요. 어떤 사람들은 더 전문화할 계획이라고 언급했고 ('AI 작업의 의미 있는 검토 기술을 개발하는 데는 더 오랜 시간이 걸리고 더 많은 전문화가 필요할 거예요'), 어떤 사람들은 미래에는 더 대인적이고 전략적인 업무에 집중할 것이라고 예상했어요. ('우리는 합의를 찾는 데 더 많은 시간을 할애하고 AI에게 구현에 더 많은 시간을 할애하게 할 거예요.') 한 사람은 특히 경력 개발을 위해 클로드를 사용한다고 말했어요. 업무 및 리더십 기술에 대한 피드백을 클로드로부터 얻는 것이죠. ('제가 무언가를 배울 수 있는 속도나 심지어 완전히 배우지 않고도 효과적으로 일할 수 있는 능력이 완전히 바뀌었어요. 마치 제 한계가 깨진 것 같아요.')

전반적으로 많은 사람들이 깊은 불확실성을 인정하고 있어요. '미래에 어떤 특정 기술이 유용할지에 대한 확신이 매우 낮아요.' 한 팀장은 이렇게 말했어요. '아무도 무슨 일이 일어날지 몰라요… 중요한 것은 정말 적응력이 뛰어나야 한다는 거예요.'

클로드 코드 사용 트렌드

설문조사 및 인터뷰 데이터는 클로드 사용 증가가 사람들이 더 빠르게 작업하고 새로운 유형의 업무를 수행하는 데 도움이 된다는 것을 보여주지만, 이는 AI 위임 및 기술 개발과 관련된 긴장을 동반하기도 해요. 하지만 자가 보고된 데이터만으로는 전체 이야기를 알 수 없죠. 이를 보완하기 위해 앤트로픽 팀은 앤트로픽 팀 전반의 실제 클로드 사용 데이터도 분석했어요. 설문 응답자들이 클로드 코드가 사용량의 대부분을 차지한다고 보고했기 때문에, 앤트로픽 팀은 개인 정보 보호 분석 도구를 사용하여 2025년 2월과 8월의 20만 건에 달하는 클로드 코드 내부 스크립트를 분석했어요.

적은 감독으로 더 어려운 문제 해결

클로드 코드 사용은 지난 6개월 동안 더 어렵고 자율적인 코딩 작업으로 전환되었어요 (그림 3):

직원들은 클로드 코드로 점점 더 복잡한 작업을 다루고 있어요. 앤트로픽 팀은 각 스크립트의 작업 복잡도를 1~5 척도로 추정했는데, 1은 '기본적인 편집'에 해당하고 5는 '수주/수개월의 인간 전문가 작업이 필요한 전문가 수준의 작업'에 해당해요. 평균 작업 복잡도는 3.2에서 3.8로 증가했죠. 점수 차이를 설명하자면: 평균 3.2점의 작업에는 '파이썬 모듈 가져오기 오류 해결'이 포함되었고, 평균 3.8점의 작업에는 '캐싱 시스템 구현 및 최적화'가 포함되었어요. 클로드 코드가 스크립트당 연속적으로 호출하는 최대 도구 호출 횟수가 116% 증가했어요. 도구 호출은 파일 편집이나 명령 실행과 같은 외부 도구를 사용하여 클로드가 수행하는 동작을 의미해요. 클로드는 이제 사람의 개입 없이 21.2개의 독립적인 도구 호출을 연결하는 반면, 6개월 전에는 9.8개의 도구 호출을 연결했어요. 사람 개입 횟수가 33% 감소했어요. 스크립트당 평균 사람 개입 횟수는 6.2회에서 4.1회로 감소했는데, 이는 6개월 전보다 주어진 작업을 완료하는 데 사람의 입력이 덜 필요하다는 것을 보여줘요.

그림 3: 2025년 8월과 2025년 2월 사이 클로드 코드 사용 변화(x축)예요. 평균 작업 복잡도는 시간이 지남에 따라 증가했고(왼쪽 패널), 스크립트당 최대 연속 도구 호출 수는 시간이 지남에 따라 증가했으며(중간 패널), 사람 개입 횟수는 시간이 지남에 따라 감소했어요(오른쪽 패널). 오차 막대는 95% 신뢰 구간을 보여줘요. 이 데이터는 사람들이 시간이 지남에 따라 클로드에 더 많은 자율성을 위임하고 있음을 시사하죠. — Figure 3. Changes in Claude Code usage between August 2025 and February 2025 (x-axes). Average task complexity increased over time (left panel), average maximum consecutive tool calls per transcript increased over time (middle panel), and number of human turns decreased over time (right panel). Error bars show 95% confidence intervals. The data suggest people are increasingly delegating more autonomy to Claude over time.

이러한 사용 데이터는 설문조사 데이터를 뒷받침해요. 엔지니어들이 클로드에 점점 더 복잡한 작업을 위임하고 있고, 클로드는 감독을 덜 필요로 한다는 것이죠. 이는 관찰된 생산성 향상의 원동력일 것으로 보여요.

작업 분포

앤트로픽 팀은 클로드 코드 스크립트를 하나 이상의 코딩 작업 유형으로 분류하여, 지난 6개월 동안 다양한 작업에 대한 사용 방식이 어떻게 발전했는지 연구했어요:

그림 4: 다양한 코딩 작업(y축)의 분포를 전체 기록 수(x축)에 대한 백분율로 나타냈어요. 6개월 전(분홍색)과 현재(보라색)의 분포를 비교한 것이죠. y축은 2025년 2월의 빈도 순으로 정렬되어 있어요. — Figure 4. Distribution of various coding tasks (y-axis) as a percentage of the overall number of records (x-axis). We compare the distribution 6 months ago (pink) to present day (purple). The y-axis is ordered by frequency in Feb 2025.

사용 데이터에서 추정된 전체 작업 빈도 분포는 자가 보고된 작업 빈도 분포와 대체로 일치해요. 2025년 2월과 8월 사이에 가장 눈에 띄는 변화는 클로드를 사용하여 새로운 기능을 구현하는 스크립트(14.3% → 36.9%)와 코드 설계 또는 계획을 수행하는 스크립트(1.0% → 9.9%)의 비율이 훨씬 더 많아졌다는 점이에요. 클로드 코드 작업의 상대적 분포에서 이러한 변화는 클로드가 이러한 더 복잡한 작업에서 더 나아졌을 수 있음을 시사하지만, 이는 절대적인 작업량 증가보다는 팀들이 다양한 워크플로우에 클로드 코드를 채택하는 방식의 변화를 반영할 수도 있어요 (더 많은 제한 사항은 부록을 참조하세요).

사소한 불편함(papercuts) 해결

설문조사에서 엔지니어들이 이제 작은 삶의 질 개선에 더 많은 시간을 보낸다는 것을 발견했어요. 이에 맞춰 현재 클로드 코드 작업의 8.6%가 '사소한 불편함 해결'로 분류돼요. 여기에는 성능 시각화 도구 생성, 유지보수성을 위한 코드 리팩토링과 같은 더 큰 작업뿐만 아니라 터미널 단축키 생성과 같은 작은 작업도 포함되죠. 이는 엔지니어들의 보고된 생산성 향상에 기여할 수 있고 (이전에 무시되었던 삶의 질 개선을 해결하는 것이 시간이 지남에 따라 더 많은 효율성을 가져올 수 있어요), 잠재적으로 일상 업무의 마찰과 좌절을 줄일 수도 있고요.

팀별 작업 변화

현재 팀별로 작업이 어떻게 다른지 연구하기 위해, 앤트로픽 팀은 분류 방식을 개선하여 각 8월 스크립트에 단일 주 코딩 작업을 할당하고, 데이터를 내부 팀(y축)별로 분할했어요. 스택형 막대 차트는 각 팀의 코딩 작업 분류를 보여줘요:

그림 5: 각 가로 막대는 팀(y축)을 나타내며, 각 팀의 클로드 코드 사용 비율을 다른 코딩 작업(x축)에 따라 색상으로 구분하여(범례) 보여줘요. 맨 위 막대('모든 팀')는 전체 분포를 나타내죠. — Figure 5. Each horizontal bar represents a team (y-axis) with segments showing the proportion of that team’s Claude Code usage for different coding tasks (x-axis), color-coded by coding task (legend). Top bar (“All Teams”) represents the overall distribution.

'모든 팀' 막대는 전반적인 분포를 보여주며, 가장 일반적인 작업은 새 기능 구축, 디버깅, 코드 이해예요. 이는 팀별 비교를 위한 기준점을 제공하죠.

주목할 만한 팀별 패턴:

사전 훈련(Pre-training) 팀 (클로드 훈련을 돕는 팀)은 클로드 코드를 새 기능 구축(54.6%)에 자주 사용하는데, 이 중 상당수는 추가 실험 실행이에요.
정렬(Alignment) 및 안전(Safety) 팀과 사후 훈련(Post-training) 팀은 클로드 코드를 사용하여 가장 많은 프론트엔드 개발(각각 7.5% 및 7.4%)을 하는데, 주로 데이터 시각화를 만드는 데 사용하죠.
보안(Security) 팀은 클로드 코드를 코드 이해(48.9%)에 자주 사용하는데, 특히 코드베이스의 다양한 부분에 대한 보안 함의를 분석하고 이해하는 데 활용해요. 비기술(Non-technical) 직원들은 클로드 코드를 디버깅(51.5%)에 자주 사용하는데, 예를 들어 네트워크 문제나 Git 작업 해결에 사용하고, 데이터 과학(12.7%)에도 사용해요. 클로드가 기술 지식 격차를 해소하는 데 유용하다는 것을 알 수 있죠.

이러한 팀별 패턴 중 상당수는 앤트로픽 팀이 설문조사와 인터뷰에서 관찰했던 것과 동일한 역량 확장을 보여줘요. 즉, 팀원들이 시간이나 기술이 없었다면 할 수 없었을 새로운 종류의 업무를 가능하게 한다는 거죠. 예를 들어, 사전 훈련 팀은 많은 추가 실험을 실행했고, 비기술 직원들은 코드 오류를 해결할 수 있었어요. 또한 데이터는 팀이 핵심 작업을 위해 클로드를 사용한다는 것을 시사하지만 (예를 들어, 인프라 팀은 클로드 코드를 주로 인프라 및 DevOps 작업에 사용해요), 클로드는 종종 핵심 작업을 보강하기도 해요 (예를 들어, 연구원들은 데이터를 더 잘 시각화하기 위해 프론트엔드 개발에 클로드를 사용하죠). 이는 클로드가 모든 사람이 업무에서 더 풀스택이 될 수 있도록 돕는다는 것을 시사해요.

미래를 내다보며

앤트로픽 직원들은 지난 한 해 동안 클로드 사용을 크게 늘렸고, 이를 통해 기존 작업을 가속화했을 뿐만 아니라 새로운 코드베이스를 배우고, 고된 작업을 줄이며, 새로운 도메인으로 확장하고, 이전에는 소홀했던 개선 사항들을 해결했어요. 클로드가 더욱 자율적이고 유능해짐에 따라, 엔지니어들은 AI 위임을 활용하는 새로운 방법을 발견하는 동시에 미래에 어떤 기술이 필요할지 파악하고 있죠. 이러한 변화는 명확한 생산성 및 학습 이점과 함께 소프트웨어 엔지니어링 작업의 장기적인 궤적에 대한 진정한 불확실성을 가져와요. AI가 과거 소프트웨어 엔지니어링 전환과 유사할까요? 여러 엔지니어들이 제안했듯이 저수준에서 고수준 프로그래밍 언어로, 또는 개별 기여자에서 관리자로의 전환과 같을까요? 아니면 그 이상으로 나아갈까요?

아직 초기 단계예요. 앤트로픽은 내부적으로 많은 얼리 어답터를 보유하고 있고, 환경은 빠르게 변하고 있으며, 앤트로픽의 연구 결과는 현재 다른 조직이나 맥락에 일반화되지 않을 가능성이 높아요 (더 많은 제한 사항은 부록을 참조하세요). 이 연구는 그러한 불확실성을 반영해요. 연구 결과는 미묘하고, 단 하나의 합의나 명확한 지침이 나타나지 않죠. 하지만 이러한 변화를 신중하고 효과적으로 헤쳐나가는 방법에 대한 질문을 제기하고 있어요.

이 초기 연구를 보완하기 위해 앤트로픽 팀은 몇 가지 단계를 밟고 있어요. 앤트로픽은 엔지니어, 연구원, 리더십과 논의하여 제기된 기회와 도전 과제를 해결하고 있어요. 여기에는 팀을 어떻게 모으고 서로 협력하는지, 전문성 개발을 어떻게 지원하는지, 그리고 AI 증강 작업에 대한 모범 사례를 어떻게 확립하는지 (예: AI 유창성 프레임워크의 지침에 따라) 등이 포함돼요. 또한 이 연구를 엔지니어 외의 다른 역할로 확장하여 AI 전환이 조직 전체의 역할에 어떤 영향을 미치는지 이해하고, CodePath와 같은 외부 조직이 AI 지원 미래를 위한 컴퓨터 과학 교육과정을 조정하는 것을 지원하고 있어요. 앞으로는 AI 역량이 발전함에 따라 점점 더 관련성이 높아질 수 있는 구조적 접근 방식, 예를 들어 조직 내 역할 진화 또는 재교육을 위한 새로운 경로도 고려하고 있죠.

앤트로픽 팀의 생각이 성숙해짐에 따라 2026년에 더 구체적인 계획을 공유할 예정이에요. 앤트로픽은 책임감 있는 직장 전환을 위한 실험실이에요. AI가 업무를 어떻게 변화시키는지 연구하는 것뿐만 아니라, 먼저 앤트로픽 팀 내부에서부터 그 변화를 신중하게 헤쳐나가는 방법을 실험하고 싶어요.

Bibtex

이 게시물을 인용하고 싶다면 다음 Bibtex 키를 사용할 수 있어요:

@online{huang2025aiwork,
author = {Saffron Huang and Bryan Seethor and Esin Durmus and Kunal Handa and Miles McCain and Michael Stern and Deep Ganguli},
title = {How AI Is Transforming Work at Anthropic},
date = {2025-12-02},
year = {2025},
url = {https://anthropic.com/research/how-ai-is-transforming-work-at-anthropic/},
}

감사의 말씀

사프론 황(Saffron Huang)이 프로젝트를 이끌고, 설문조사, 인터뷰, 데이터 분석을 설계 및 실행했으며, 그래프를 작성하고 블로그 게시물을 작성했어요. 브라이언 시토르(Bryan Seethor)는 설문조사 및 인터뷰를 공동 설계하고, 설문조사 및 인터뷰 데이터 수집을 공동으로 이끌었으며, 인터뷰 주제를 분석하고 글쓰기에 기여했으며, 프로젝트 일정을 관리했어요. 에신 두르무스(Esin Durmus)는 실험 설계에 기여하고 전체 과정에서 자세한 지침과 피드백을 제공했어요. 쿠날 한다(Kunal Handa)는 인터뷰 프로세스를 위한 인프라를 제공했어요. 딥 강굴리(Deep Ganguli)는 중요한 지침과 조직적 지원을 제공했죠. 모든 저자는 전체 과정에서 자세한 지침과 피드백을 제공했어요.

또한 루스 애플(Ruth Appel), 샐리 알두스(Sally Aldous), 아비탈 발윗(Avital Balwit), 드루 벤트(Drew Bent), 조이 블루멘펠드(Zoe Blumenfeld), 미리암 차움(Miriam Chaum), 잭 클라크(Jack Clark), 제이크 이튼(Jake Eaton), 사라 헥(Sarah Heck), 캄야 자가디쉬(Kamya Jagadish), 젠 마르티네즈(Jen Martinez), 피터 맥크로리(Peter McCrory), 제러드 뮬러(Jared Mueller), 크리스토퍼 눌티(Christopher Nulty), 사샤 드 마리니(Sasha de Marigny), 사라 폴락(Sarah Pollack), 해나 프리쳇(Hannah Pritchett), 스튜어트 리치(Stuart Ritchie), 데이비드 손더스(David Saunders), 알렉스 탐킨(Alex Tamkin), 자넬 탐쿨(Janel Thamkul), 사 워너(Sar Warner), 헤더 휘트니(Heather Whitney)의 유용한 아이디어, 토론, 피드백 및 지원에 감사드려요. 그래프를 그려준 케이시 야마구마(Casey Yamaguma)에게도 감사드리고요. 안톤 코리넥(Anton Korinek), 이오아나 마리네스쿠(Ioana Marinescu), 실바나 텐레이로(Silvana Tenreyro), 닐 톰슨(Neil Thompson)의 건설적인 의견과 토론에도 감사드립니다.

부록

제한 사항

앤트로픽의 설문조사 결과는 몇 가지 방법론적 한계가 있어요. 앤트로픽 팀은 편의 표집과 의도적 표집(광범위한 조직 대표성을 확보하기 위해)을 통해 응답자를 선정했어요. 여러 내부 Slack 채널에 설문조사를 게시하여 68개의 응답을 얻었고, 조직도에서 연구 및 제품 기능에 걸쳐 20개의 다양한 팀을 선정하여 팀당 5~10명에게 직접 메시지를 보냈어요 (총 207명에게 연락), 그 결과 최종 64개의 응답에 대해 31%의 응답률을 얻었죠. 응답한 첫 53명과 인터뷰를 진행했어요. 이 과정에서 선택 편향이 있을 수 있어요. 클로드에 특히 적극적이거나 강한 의견(긍정적이든 부정적이든)을 가진 사람들이 응답할 가능성이 높았고, 중립적인 경험을 한 사람들은 과소 대표되었을 수 있죠.

또한, 응답은 사회적 바람직성 편향(응답이 익명이 아니었고 모든 참가자가 앤트로픽 직원이었기 때문에, 응답자들이 클로드의 영향에 대한 긍정적인 평가를 과장했을 수 있어요)과 최근성 편향(참가자들에게 12개월 전의 생산성 및 사용 패턴을 회상하도록 요청하는 것은 기억 왜곡의 영향을 받을 수 있어요)의 영향을 받을 수 있죠. 더욱이 위에서 논의했듯이, 생산성은 일반적으로 추정하기가 매우 어렵기 때문에, 이러한 자가 보고는 신중하게 받아들여야 해요. 이러한 자가 보고된 인식은 앤트로픽의 더 객관적인 클로드 코드 사용 데이터와 함께 해석되어야 하며, 향후 연구는 익명 데이터 수집 및 더 견고하게 검증된 측정 도구를 통해 이점을 얻을 수 있을 거예요.

앤트로픽의 클로드 코드 분석은 시간 경과에 따른 비례 표집을 사용하는데, 이는 작업 분포의 상대적 변화만 측정할 수 있을 뿐, 작업량의 절대적 변화는 측정할 수 없다는 의미예요. 예를 들어, 기능 구현이 클로드 코드 사용량의 14%에서 37%로 증가했다고 보고하더라도, 이것이 반드시 더 많은 총 기능 작업이 수행되고 있음을 나타내는 것은 아니죠.

마지막으로, 이 연구는 Claude Sonnet 4와 Claude Opus 4가 앤트로픽의 최첨단 모델이었던 2025년 8월에 수행되었어요. AI 개발 속도가 빠르다는 점을 고려할 때, 앤트로픽이 관찰한 패턴은 새로운 모델이 출시되면서 이미 바뀌었을 수도 있죠.

AI가 앤트로픽의 업무 방식을 어떻게 바꾸고 있을까요?

요약

인사이트

왜 중요한가

AI가 앤트로픽의 업무 방식을 어떻게 바꾸고 있을까요?

주요 연구 결과

설문조사 데이터

사람들은 어떤 코딩 작업에 클로드를 사용하고 있을까요?

얼마나 많은 작업을 클로드에 완전히 위임할 수 있을까요?

질적 인터뷰

AI 위임 접근 방식

신뢰하되 검증하라

사람들은 어떤 작업을 직접 처리할까요?

기술 전환

새로운 역량…

…그리고 줄어드는 실제 연습

소프트웨어 엔지니어링의 장인정신과 의미

직장 내 사회적 역학 변화

클로드 코드 사용 트렌드

작업 분포

사소한 불편함(papercuts) 해결

팀별 작업 변화

미래를 내다보며

Bibtex

부록

제한 사항

관련 콘텐츠

사회 과학 분야의 코딩 에이전트

프로젝트 글래스윙(Glasswing): 초기 업데이트

2028년: 글로벌 AI 리더십을 위한 두 가지 시나리오