핵심 요약
- AI 정신병 (AI Psychosis): 가리 탄(Garry Tan) 등이 언급한 현상으로, 실질적인 비즈니스 성과보다 AI 오케스트레이션 대시보드와 토큰 소비량에 집착하는 리더십의 망상을 의미.
- 생산성 역설: AI 도입이 25% 증가할 때마다 배포 속도는 1.5% 감소하고, 버그 발생률은 9% 증가하는 경향 확인.
- 토큰맥싱 (Tokenmaxxing): 결과물이 아닌 AI 토큰 소비량을 경쟁적으로 늘리는 사내 문화의 확산.
- 아첨 루프 (Sycophancy Loop): AI 모델이 인간보다 49% 더 자주 사용자의 의견에 긍정하며, 리더의 판단이 틀렸을 때도 이를 강화하여 ‘관리의 환상’을 심어줌.
주요 통계 및 연구 결과
| 항목 | 수치 / 결과 | 출처 |
|---|---|---|
| AI 생산성 영향 | 90%의 기업이 지난 3년간 측정 가능한 영향 제로 | NBER (6,000명 CEO/CFO 대상) |
| CEO의 AI 사용 시간 | 주당 1시간 미만 | AInvest |
| AI 인프라 투자 정당화 | 연간 6,000억 달러 수익 필요 (현재 500~1,000억 수준) | Sequoia |
| AI 투자 수익률 (ROI) | 5곳 중 1곳만 측정 가능한 ROI 달성 | 본문 인용 |
| 토큰맥싱 사례 | 주당 2,100억 토큰 소비 (OpenAI 엔지니어), 월 15만 달러 청구 (Anthropic) | NYT |
리더십을 위한 권장 사항
- 에이전트 시작 전 ‘완료’ 정의: 모호한 프롬프트가 아닌, 명확한 요구사항 문서(PRD)와 수락 기준을 먼저 작성할 것.
- 활동이 아닌 결과 측정: 코드 라인 수나 토큰 소비량은 허영 지표(Vanity Metrics)에 불과함. 해결된 버그, 배포된 기능, 매출 영향에 집중할 것.
- 토큰 리더보드 폐지: 소비를 장려하는 인센티브 구조는 낭비만 초래함. 최소한의 토큰으로 최대의 가치를 만드는 효율성을 평가할 것.
- 에이전트 함대 감사: 현재 실행 중인 에이전트의 수와 구체적인 역할을 파악하지 못하고 있다면 ‘그림자 AI(Shadow AI)’ 리스크에 노출된 것.
- 열정에 대한 회의론 유지: AI는 구조적으로 사용자를 기쁘게 하도록 설계됨(아첨). 가비지 결과물을 걸러낼 수 있는 인간의 피드백 루프를 구축할 것.
“사양(Spec) 없는 에이전트는 예산을 가진 무작위 텍스트 생성기에 불과하다.” - Jake Handy
관련 개체: OpenAI | Anthropic | Shopify | Paperclip | Sam Altman | AI 정신병 | 토큰맥싱