사회과학에서의 코딩 에이전트
요약
1,260명의 사회과학자를 대상으로 한 설문조사 결과, 81%가 AI 챗봇을 연구에 사용해봤지만 코딩 에이전트를 정기적으로 사용하는 비율은 20%에 불과하며, 사용자 간 격차가 크고 생산성 향상은 초기 단계에 그쳤습니다.
인사이트
- 코딩 에이전트 채택률은 학문 분야, 성별, 대학 지위에 따라 큰 격차를 보이며, 남성 이름을 가진 연구자의 사용률이 여성 이름을 가진 연구자의 두 배에 달함.
- 코딩 에이전트 사용자는 미발표 논문과 연구 제안서 발행이 더 많지만 학술지 제출 증가는 아직 확인되지 않아 초기 파이프라인에만 효과가 있을 가능성이 있음.
- 연구자들은 AI가 논문 생산성을 높일 것이라고 낙관하지만, 사회과학 전반에 미치는 영향에 대해서는 더 회의적인 태도를 보임.
왜 중요한가
이 연구는 AI 코딩 에이전트가 사회과학 연구 현장에 어떻게 확산되고 있으며, 누가 혜택을 보고 있는지, 그리고 생산성과 불평등에 어떤 영향을 미칠 수 있는지에 대한 최초의 실증적 증거를 제공합니다. 이는 AI 도구의 채택이 단순히 기술적 문제가 아니라 사회적·제도적 격차를 반영하고 재생산할 수 있음을 시사합니다.
사회과학에서의 코딩 에이전트
요약
2026년 2월과 3월에 실시된 1,260명의 사회과학자를 대상으로 한 AI 및 코딩 에이전트 사용에 관한 설문조사 결과를 소개합니다. 응답자의 대다수(81%)가 연구에 AI 챗봇을 사용해 본 적이 있으며, 특히 코드 작성과 문장 편집에 주로 활용했습니다. 하지만 코딩 에이전트—Claude Code처럼 분석 코드를 자율적으로 작성하고 실행하는 도구—를 작업에 도입한 비율은 20%에 불과합니다. 코딩 에이전트 사용에는 뚜렷한 격차가 존재합니다. 일반적으로 남성적인 이름을 가진 연구자가 여성적인 이름을 가진 연구자보다 코딩 에이전트를 사용할 확률이 두 배 높습니다. 상위권 대학 연구자는 그렇지 않은 연구자보다 코딩 에이전트 사용 가능성이 40% 더 높습니다. 코딩 에이전트 사용자는 같은 분야와 경력 단계의 다른 연구자보다 더 많은 워킹 페이퍼와 연구 제안서를 발행하지만, 이는 얼리어답터 간의 사전 존재 차이를 반영할 수 있습니다. 연구자들은 AI가 게재 가능한 논문 작성에 미치는 영향에 대해 사회과학 전반에 미치는 영향보다 더 낙관적입니다.
AI 코딩 에이전트는 경제와 사회를 연구하는 방식을 어떻게 바꾸고 있을까요?
인간 과학은 변화하고 있어요. 처음으로 핵심 연구 작업을 기계에 넘길 수 있게 되었거든요. AI 챗봇은 점점 더 과학 연구에 기여하고 있으며, 특히 가장 권위 있는 학술지와 사회과학 분야에서 두드러집니다. 이는 AI가 연구 생산성을 높일 수 있다는 낙관론을 불러일으키는 한편, 동료 심사 과부하와 학술 AI 쓰레기의 홍수에 대한 우려도 키웠어요.
하지만 턴테이킹 방식의 AI 챗봇은 주로 글쓰기 보조에 사용된 반면, 코딩 에이전트는 사회과학 연구를 더 근본적으로 재구성할 수 있어요. Claude Code나 Codex 같은 에이전틱 코딩 플랫폼은 연구 아이디어와 데이터셋을 받아 분석 코드를 작성·실행하고, 결과를 해석하며 자율적으로 반복할 수 있어요. 실증 연구에서 그동안 필연적으로 인간의 손을 거쳐야 했던 단계들이 처음으로 자동화될 수 있게 된 거예요. 극단적으로는, 연구자들이 컴퓨터 과학 연구를 자동화하고 사회 과학 연구 아이디어를 자율적으로 실행하기 위해 멀티 에이전트 파이프라인을 구축하기도 했어요.
이러한 도구들은 과학을 가속화하고 더 대담하게 만들어 줄 수 있어요. 빠른 연구 실행은 저렴하고 풍부한 발견을 의미하니까요. 하지만 연구 자원의 격차를 확대하고 학술 기록의 혼잡을 악화시킬 수도 있어요. 더 깊게 들어가면, AI가 점점 더 넓은 범위의 연구 작업을 처리함에 따라, AI의 독특한 분석적 선택이 경제, 사회, 그리고 우리 자신에 대한 집단적 이해에 각인될 수 있어요.
이 글에서 우리는 2026년 초에 실시된 1,260명의 계량 사회과학자 대상 설문조사를 바탕으로 첫 번째 분석 결과를 제시합니다. 이 설문조사는 코딩 에이전트가 연구 생산성에 미치는 영향을 연구하는 더 큰 규모의 진행 중인 연구의 기준선 파동입니다. 이 연구에는 연구자들에게 Claude Code에 대한 접근 권한을 제공하는 무작위 실험도 포함되어 있어요. 이 실험의 결과는 추후 발표될 예정이에요. 지금은 기준선 설문조사가 누가 어떤 목적으로 이러한 도구를 사용하고 있는지, 사용자와 비사용자 간의 결과물 차이는 무엇인지, 그리고 채택 확대의 영향에 대해 연구자들이 무엇을 기대하는지 밝혀낸 내용을 보고합니다.
계량 사회과학자 대상 AI 코딩 에이전트 사용에 관한 새로운 설문조사
우리는 2026년 2월 말과 3월에 설문조사를 실시했으며, 활동 중인 계량 사회과학자를 대상으로 했어요. 이는 대표 표본이 아니었습니다. 응답자는 Claude Max 계정 접근 권한을 제공하는 연구를 위해 모집되었기 때문에, 표본에 포함된 사람들은 AI 도구에 관심이 많은 연구자 쪽으로 치우칠 수 있어요. 하지만 응답자들은 더 일반적인 초대장을 받은 이전 표본과 상당히 유사했어요(부록의 표 A2 참조: 링크).
응답자는 경제학, 정치학, 사회학에 고르게 분포되어 각각 표본의 약 5분의 1을 차지했고, 경영 과학과 심리학이 그 뒤를 이었어요(표 A1 참조). 공중 보건, 교육, 커뮤니케이션 연구자로부터도 소수의 응답을 받았어요. 약 40%는 정교수 또는 부교수, 25%는 조교수, 약 30%는 박사 과정 학생이었어요.
코딩 에이전트는 아직 대부분의 사회과학자에게 도달하지 못했어요
우리는 전반적인 AI 사용을 두 가지 방식으로 측정했어요. 첫째, "연구 과정을 지원하기 위해 생성형 AI 모델을 사용한 적이 있습니까?"라고 물었어요. 81%의 응답자가 '예'라고 답했어요.
하지만 점점 더 강력해지는 코딩 에이전트를 실제로 워크플로에 도입한 사람들은 얼마나 될까요? 여기서는 "명령줄에 통합된 AI 코딩 어시스턴트(예: Codex, Cursor, Claude Code)를 정기적으로(주 1회 이상) 사용합니까?"라고 물었어요. 후속 질문에서 그들이 해당 도구 중 하나(또는 Google Antigravity)를 사용하는지 확인했어요.1
응답자 중 단 20%만이 코딩 에이전트를 사용하고 있어요. 우리 설문조사는 2025년 12월 말에 시작된 Claude Code와 Opus 4.6에 대한 논의가 한창일 때로부터 약 2개월 후에 실시되었어요. 그럼에도 불구하고 우리 설문조사에 자발적으로 참여한 관심 있는 응답자 중에서도 5분의 1만이 에이전트를 워크플로에 도입했어요. Claude Code가 가장 흔한 코딩 에이전트 도구로, 사용자의 86%가 Claude Code를 사용한다고 보고했어요(31%는 Codex를 사용한다고 보고했으며, 이는 두 번째로 흔한 도구예요).

채택은 매우 불균등해요
그림 1은 전반적인 채택률에 큰 변동이 있음을 보여줘요. 경제학자 39%, 정치학자 25%에서 공중 보건(6%), 교육(4%), 커뮤니케이션(6%)의 한 자릿수까지 다양해요. 이러한 경향은 분야별 전반적인 AI 사용 차이를 대략적으로 반영하지만, 코딩 에이전트 채택의 차이는 평균적으로 더 급격해요.
박사 과정생과 박사후 연구원의 4분의 1 이상이 주 1회 이상 코딩 에이전트를 사용하는 반면, 정교수 중에서는 그 비율이 절반 이상 떨어져요. 코딩 에이전트를 채택하는 연구자들은 주로 주니어 연구자들인데, 기술에 더 능숙하고 코드와 데이터를 직접 다룰 가능성이 높으며, 연구를 생산해야 하는 직업적 압박이 더 크기 때문이에요.

채택 차이는 학문 분야와 경력 단계를 넘어서도 나타나요. 연구자 이름을 성별에 따라 분류한 결과, 일반적으로 남성적인 이름을 가진 응답자가 여성적인 이름을 가진 응답자보다 코딩 에이전트를 채택할 확률이 두 배 이상 높았어요. 높은 지위의 대학과 사립 대학에서도 현저히 높은 사용률을 보였어요. 이러한 모든 차이는 p<0.05 수준에서 유의미해요. 이러한 차이는 전반적인 AI 사용 차이보다 더 뚜렷하며, 적어도 코딩 에이전트 채택 초기 단계에서는 더 큰 불평등을 시사해요.
코딩 에이전트 사용의 성별 격차는 단순히 AI 사용 시도 비율의 차이를 반영하는 것은 아니에요. 연구에 AI를 사용해 본 응답자 중에서도 정기적인 코딩 에이전트 사용에 있어 전체 표본보다 성별 격차가 약간 더 크게 나타나요. 이러한 차이는 같은 분야와 경력 단계 내에서 성별을 비교할 때도 지속돼요.

연구자들은 주로 AI를 코딩과 편집에 사용하고, 글쓰기에는 덜 사용해요
AI(코딩 에이전트든 챗봇이든)를 사용하는 연구자들은 실제로 무엇에 사용하고 있을까요? 학술 연구에서 AI에 대한 논쟁은 글쓰기에 집중되어 왔어요. 환각에 빠진 문헌 검토, 정형화된 서론에 'X가 아니라 Y다'라는 표현이 널려 있는 점, 완전 자동화된 논문 작성 가능성 등이요.
하지만 그림 4는 가장 흔한 용도가 코딩 에이전트 사용자와 비사용자 모두에게 양적 데이터 분석을 위한 코드 작성임을 보여줘요. 코딩 에이전트 사용자의 97%, 다른 AI 사용자의 77%가 코드 생성을 위해 AI를 사용한다고 보고했어요. 그 다음으로 흔한 용도는 산문 편집, 그 다음은 방법 조언과 기존 연구에 대한 배경 지식 요청이에요. 코딩 에이전트 사용자와 다른 사용자를 합산하면, 전체 AI 사용자의 3분의 1만이 산문 작성을 위해 AI를 사용한 적이 있어요. 이러한 패턴은 대체로 모든 분야에서 유지되며, 경제학자와 경영 연구자만이 산문 작성을 위해 AI를 자주 사용해요.

코딩 에이전트 사용자는 더 많은 워킹 페이퍼를 발행하고 더 많은 연구 제안서를 제출하지만, 학술지 제출은 더 많지 않아요
코딩 에이전트가 연구자들의 생산성을 높이고 있을까요? 이것이 이 설문조사가 시작하는 더 큰 연구의 동기예요. 이 문제에 대해 우리가 진행 중인 실험은 아직 진행 중이에요. 하지만 기준선 설문조사를 통해 코딩 에이전트 사용자와 다른 연구자들을 연구 과정의 여러 체크포인트에서 비교할 수 있어요. 이 비교는 순수하게 기술적입니다. 우리는 코딩 에이전트 사용을 선택한 연구자와 그렇지 않은 연구자를 비교하며, 두 그룹이 우리가 조정할 수 없는 여러 방식에서 다를 것이라고 예상해요. 차이는 인과적으로 해석되어서는 안 되며, 코딩 에이전트를 사용하는 연구자와 사용하지 않는 연구자 간의 첫 번째 비교로 봐야 해요.

그림 5는 설문조사 전 6개월 동안 연구 과정의 여러 단계(시작된 프로젝트부터 제출된 논문까지)에서 자가 보고된 결과물을 보여줘요. 조정된 추정치는 코딩 에이전트 사용자와 다른 연구자를 비교하며, 경력 단계, 학문 분야, 설문조사 완료 주차를 통제했어요. 코딩 에이전트 사용자는 더 많은 프로젝트를 시작하고, 더 많은 워킹 페이퍼를 발행하며, 더 많은 연구비를 신청하고, 아마도 더 많은 학회 발표를 제출하고 있어요.
그렇다면 코딩 에이전트 사용자가 더 많은 논문을 쓰고 있을까요? 먼저, 초기 파이프라인 결과물에서 코딩 에이전트 사용자와 다른 연구자 간의 차이를 살펴보세요. 코딩 에이전트 사용자는 비사용자보다 약 4분의 1 편의 논문 더 많은 프로젝트를 시작하고, 약 절반 편의 워킹 페이퍼를 더 발행하고 있어요. 백분율로 보면, 코딩 에이전트 사용자는 같은 분야와 경력 단계의 다른 연구자보다 약 10%(시작된 실증 프로젝트)에서 75%(발행된 워킹 페이퍼) 더 생산적으로 보여요.
하지만 이러한 생산성 차이는 초기 파이프라인 측정에서만 나타나요. 우리는 코딩 에이전트 사용자가 학술지에 더 많은 새 논문을 제출하거나 재제출을 더 빨리 한다는 증거를 찾지 못했어요. 이는 논문이 제출되기까지의 시간을 반영할 수 있는데, 코딩 에이전트 사용은 최근 현상이기 때문이에요. 하지만 코딩 에이전트가 프로젝트를 시작하고 진행하는 데는 유용하지만, 학술지 제출을 위한 마지막 단계에서는 덜 유용하다는 것을 반영할 수도 있어요.
연구자들은 AI 도구가 생산성을 높일 것으로 기대하지만, 사회과학 전반을 개선할 것이라는 확신은 덜해요
우리는 또한 연구자들에게 AI 도구에 대해 무엇을 기대하는지 물었어요. AI가 게재 가능한 논문 작성 측면에서 사회과학자를 더 생산적으로 만드나요? 그리고 AI가 사회과학을 더 좋게 또는 더 나쁘게 만들 것이라고 생각하나요?
연구자들은 AI가 논문 작성 생산성을 높일 것이라는 데 낙관적이에요. 1에서 10까지 척도에서 응답자의 88%가 5점 이상이었고, 절반은 8점 이상이었어요. 그림 6은 이러한 평가가 AI 사용에 따라 크게 달라짐을 보여줘요. 그래프의 왼쪽은 더 다양한 유형의 작업에 AI를 사용하는 연구자일수록 더 낙관적임을 보여줘요. 오른쪽은 코딩 에이전트 사용자가 다른 연구자보다 더 낙관적임을 보여줘요.

이 설문조사는 이러한 도구를 시도해보는 데 관심이 있는 사람들을 대상으로 하기 때문에 생산성에 대한 약간의 낙관론이 나타나는 것은 놀랍지 않아요. 하지만 이러한 낙관론자들 사이에서도 AI가 게재 가능한 논문 작성에 좁게 도움이 되는 것에 대한 견해와 사회과학에 광범위하게 영향을 미치는 것에 대한 견해 사이에는 상당한 격차가 있어요. 응답자의 70%는 논문 생산성에 대해 더 낙관적이면서도 더 넓은 분야 영향에 대해서는 덜 낙관적이었어요. 분야 영향에 대해 논문 생산성보다 더 낙관적인 연구자는 거의 없었고, 많은 연구자가 더 비관적이었어요.
논의
코딩 에이전트를 사용하는 사회과학자들은 더 많은 워킹 페이퍼를 발행하고 더 많은 연구비를 신청하고 있어요. 같은 분야와 경력 단계의 다른 연구자에 비해 더 많은 프로젝트를 시작하고 있기도 해요. 하지만 2026년 3월 현재, 아직 학술지 제출 급증으로 이어지지는 않고 있어요. 프로젝트 시작 증가는 생산성 향상의 초기 증거일 수 있어요. 또한 얼리어답터가 원래부터 더 생산적인 연구자였음을 나타낼 수도 있어요.
전반적으로 코딩 에이전트의 초기 채택은 초기 경력 연구자, 남성, 그리고 더 높은 지위의 대학 연구자에게 치우쳐 있어요. 코딩 에이전트 사용은 현재 이러한 범주에서 LLM 사용보다 더 불균등하게 분포되어 있어요. 또한 연구자들은 논문 생산성 향상의 즉각적인 이점이 분야 수준의 비용을 동반할 수 있다고 우려한다는 암시적 증거를 발견했어요. 더 많은 논문이 혼잡과 주목 경쟁을 의미할 수 있고, 응답자들은 일부 연구자가 선택적 보고와 위험 회피적이고 점진적인 연구와 같은 사회과학의 기존 문제를 악화시키는 방식으로 AI 도구를 사용할 것을 두려워할 수도 있어요.
이 보고서의 결과에는 몇 가지 한계가 있어요. 여기에 제시된 데이터는 계량 사회과학자를 대상으로 한 이메일 설문조사에 기반하며, 워크플로와 AI 사용에 관한 연구에 참여하도록 명시적으로 모집되었어요. 우리는 응답자들이 비응답자보다 LLM을 더 많이 사용하고 더 낙관적일 것이라고 예상해요. 우리가 보는 초기 단계의 생산성 차이는 기술적으로 해석되어야 해요. 코딩 에이전트의 얼리어답터는 비채택자보다 더 생산적이고 다른 여러 측면에서 다를 수 있으며, 이는 설문조사에서 직접 측정할 수 없어요. 마지막으로, 우리는 여기서 연구자들이 보고한 프로젝트 수만 살펴보고 있으며, 그 품질에 대해서는 아무것도 보고하지 않아요. 이 연구의 향후 업데이트에서는 코딩 에이전트 사용자를 깨끗한 비교 그룹과 비교하고, 코딩 에이전트가 강화한 작업의 내용(양뿐만 아니라)이 어떻게 다른지 평가할 예정이에요.
이러한 한계에도 불구하고, 우리는 코딩 에이전트가 사회과학에 확산되고 있음을 보여줘요. 예를 들어, 우리가 경제와 정치를 연구하는 방식은 점점 더 AI 코딩 에이전트가 부분적으로 결정하는 분석 선택을 통해 이루어지고 있어요. 우리는 향후 보고서에서 이러한 종류의 자동화의 잠재력과 위험에 대한 더 많은 증거를 제시할 계획이에요.
저자
Thomas Lyttelton, Maxim Massenkoff, Nathan Wilmers
감사의 말
Tim Belonax, Keir Bradwell, Jake Eaton, Rebecca Hiscott, Peter McCrory, Kerry Persen, Sarah Pollack, Santi Ruiz, Heather Whitney, Jack Clark.
부록
여기에서 확인 가능합니다.
인용
@online{lyttelton2026agents,
author = {Thomas Lyttelton and Maxim Massenkoff and Nathan Wilmers},
title = {Coding Agents in the Social Sciences},
date = {2026-05-27},
year = {2026},
url = {https://www.anthropic.com/research/coding-agents-social-sciences},
}
참고문헌
Alvero, A. J., Stoltz, D. S., Stuhler, O., & Taylor, M. A. (2026). Generative AI in Sociological Research: State of the Discipline. Sociological Science, 13, 45-62.
Korinek, A. (2025). AI agents for economic research (No. w34202). National Bureau of Economic Research. NBER Working Paper Series.
Liang, W., Zhang, Y., Wu, Z., Lepp, H., Ji, W., Zhao, X., ... & Zou, J. (2025). Quantifying large language model usage in scientific papers. Nature Human Behaviour, 1-11.
Lu, C., Lu, C., Lange, R. T., Yamada, Y., Hu, S., Foerster, J., ... & Clune, J. (2026). Towards end-to-end automation of AI research. Nature, 651(8107), 914-919.
Wilmers, N., & Engzell, P. (2026). The Paper Factory. SocArXiv Preprints.
각주
- 설문조사는 Claude Cowork 출시와 OpenAI의 Codex 앱 출시 한 달 후에 실시되었기 때문에, 이 질문은 코딩 에이전트와 상호작용하기 위한 명령줄 인터페이스 도구에 초점을 맞추었습니다. 따라서 보다 범용적인 데스크톱 앱을 통해서만 AI 에이전트를 사용하는 연구자는 집계에서 제외됩니다.