🔥 Uber เผางบ AI ทั้งปี 2026 — หมดใน 4 เดือน รวม $3.4 พันล้านเหรียญ สาเหตุหลักคือ Claude Code ที่ engineer ใช้กันระเบิดจนควบคุมค่าใช้จ่ายไม่อยู่
กำลังจะเป็นข่าวดังใน Reddit, Hacker News และ tech Twitter ครับ เพราะมันไม่ใช่แค่เรื่องของ Uber — มันเป็นปัญหาที่ทุกคนที่ใช้ AI agent กำลังเจอ แต่หลายคนยังไม่รู้ตัว
ปัญหานี้มีชื่อเรียกว่า Silent Failures — AI agent ยังทำงานอยู่ ดูเหมือนปกติ แต่จริงๆ แล้วมันกำลังเผา token โดยไม่ได้ผลลัพธ์ที่เราต้องการ ไม่ crash ไม่ error ไม่แจ้งเตือน แค่… เงินหาย
Datadog เพิ่งออก State of AI Engineering 2026 report พบว่า 5% ของ AI requests ล้มเหลวเงียบๆ ใน production โดย 60% ของ failures มาจาก capacity limits ไม่ใช่ hallucination ไม่ใช่ model โง่ — แต่เป็นปัญหา infra ล้วนๆ
ตัวเลขที่น่าตกใจจาก Uber Case
Uber เป็น case study ที่ชัดที่สุดของปัญหานี้ครับ ตัวเลขจาก CTO Praveen Neppalli Naga เอง:
- 95% ของ engineer ใช้ AI tools ทุกเดือน
- 70% ของ code ที่ commit มาจาก AI
- ค่า API ต่อ engineer: $500–$2,000/เดือน
- Claude Code กิน market share ไปเกือบหมด Cursor แทบไม่โต
- สุดท้าย CTO บอกตรงๆ ว่า “back to the drawing board”
ปัญหาคือ consumption-based pricing ดูถูกตอน pilot แต่พอปล่อยให้ทั้งบริษัทใช้ มันระเบิด — ไม่มีใครคาดคิดว่า adoption จะเร็วขนาดนี้
Token Burn — ราคาที่ซ่อนอยู่หลัง “ให้ AI ทำ”
ตัวเลขจาก Reddit practitioners และ production benchmarks:
- Multi-step agents สูบ token ได้ 70–120 เท่า ของ single LLM call
เช่น task เดียว จาก 2,000 tokens กลายเป็น 120,000 tokens ถ้า agent ต้อง plan → execute → retry → validate
- Prototype ที่ลองใน sandbox $10/เดือน → พอเอาขึ้น production จริง $1,200/เดือน บน workload เดียวกัน
- ต้นทุนพุ่งจาก 3 จุดหลัก:
– Looping workflows — agent วนซ้ำโดยไม่มี exit condition ที่ดี – Retries — run ไม่สำเร็จก็ลองใหม่ ลองใหม่ ลองใหม่ แต่ละรอบก็กิน token – Vendor lock-in — ย้ายไม่ได้ ต่อรองราคาไม่ได้
- ถ้าจะยก reliability จาก 80% เป็น 99.9% ต้องจ่ายแพงขึ้น 3 เท่า
มีคนพูดใน thread นึงว่า “กลัวว่าจะนอนไป ตื่นมาเช้า AI เผาเงินไป $4 ล้านโดยไม่มี outcome อะไรเลย” — ฟังดูเว่อ แต่กับ Uber มันเกิดจริง
Gartner ทำนาย: 40%+ ของ AI Agent Projects จะถูกยกเลิก
Gartner ให้ตัวเลขที่น่าสนใจครับ:
- 40%+ ของ agentic AI projects จะถูกยกเลิกภายในสิ้นปี 2027
- สาเหตุ: ค่าใช้จ่ายบานปลาย + business value ไม่ชัด + risk controls ไม่พอ
- Projects ที่ scope แคบ (single workflow) deliver on time 65%
- Projects ที่ scope กว้าง (multiple workflows + integrations) deliver on time แค่ 16% slip เฉลี่ย 9.6 เดือน
ยิ่ง scope กว้าง ยิ่งพัง — เพราะ agent coordination กลายเป็น bottleneck ใหม่ agents รอ agents, race conditions ใน async pipeline, cascading failures ที่ reproduce ใน staging ไม่ได้
Reddit พฤษภาคม 2026 — ทุกทีมเจอ ไม่มีใครรอด
สิ่งที่น่าสนใจคือ mood ใน Reddit เปลี่ยนไปเยอะมากครับ จาก “AI agents เจ๋ง!” กลายเป็น “ตัวไหนคุ้ม? ตัวไหนรอดผ่านสัปดาห์ที่ 2?”
Pain points ที่คนพูดถึงซ้ำๆ:
- Session burn — token หมดกลาง session โดยไม่รู้ตัว
- System overhead — orchestration layer กิน resource มากกว่า agent เอง
- Cache invalidation — context window เต็ม ต้องเริ่มใหม่ เสียเงินซ้ำ
- Invisible orchestration costs — ค่าใช้จ่ายที่ไม่โผล่ในบิลตรงๆ แต่สะสม
ตลาดไม่ได้หมดศรัทธากับ AI agents นะครับ แค่เข้าสู่ ยุค operational — ถามว่า “มันทำงานจริงไหม” แทน “มันทำอะไรได้บ้าง”
ผมเจออะไรบ้าง — มุมของ non-coder
introvertlogic ใช้ AI agents ทุกวันครับ — Claude Code เขียนทุกอย่างในเว็บนี้ ตั้งแต่ code, design, cover image, publish pipeline จนถึง SEO
สิ่งที่เจอจากประสบการณ์ตรง:
- Cover image generation — ใช้ Replicate Flux Schnell $0.003/รูป ดูถูกมาก แต่ถ้า prompt ไม่ดี gen ซ้ำ 5-10 รอบก็คูณ 10 เท่า
- Claude Code session — บาง session ยาวมาก context window เต็ม ต้อง compact แล้วเริ่มใหม่ token ที่เสียไปกับ session เก่าไม่ได้อะไรกลับมา
- Agent loops — เคยให้ AI auto-research + auto-mutate prompt ใน loop มันวน 20 รอบโดยไม่ improve เผา token ไปเปล่าๆ จนต้องใส่ exit condition เอง
คนที่ไม่ code ยิ่งเสี่ยงครับ เพราะ ไม่ได้ monitor token usage ไม่ได้ตั้ง budget limit ไม่ได้ดู log — รู้ตัวอีกทีก็ตอนบิลมา
วิธีป้องกัน — สิ่งที่ผมทำจริง
- ตั้ง budget limit ก่อนทุกครั้ง — Replicate, API calls, Claude Max plan — รู้ว่าเดือนนี้จ่ายเท่าไหร่
- ใช้ model ที่ถูกกว่าสำหรับงานง่าย — ไม่ต้อง Opus ทุกอย่าง Haiku/Sonnet ทำ routine ได้ดี
- ใส่ exit condition ใน agent loops — กำหนดจำนวนรอบสูงสุด + validator ก่อนวนรอบถัดไป
- Review token usage ทุกสัปดาห์ — ดูว่า session ไหนกิน token เยอะผิดปกติ
- เก็บ limitations log — ทุกครั้งที่เจอ silent failure จด root cause ไว้ ไม่ให้ซ้ำ
สรุป
AI agents ยังเป็นเครื่องมือที่ทรงพลังมากครับ — ผมยังใช้ทุกวัน ยังเชื่อมั่นว่ามันพา non-coder ไปได้ไกลจริง
แต่ “ไปได้ไกล” ต้องมาพร้อม “รู้ว่ากำลังจ่ายเท่าไหร่”
Uber เป็นบทเรียนที่ดีครับ ถ้าบริษัทที่มี engineer หลายพันคนยังคุมค่าใช้จ่ายไม่อยู่ คนธรรมดาอย่างเรายิ่งต้องระวัง — ไม่ใช่ระวังจนไม่ใช้ แต่ระวังแบบรู้ตัวว่ากำลังจ่ายอะไรอยู่
เพราะ silent failure ที่น่ากลัวที่สุด ไม่ใช่ AI ทำงานผิด — แต่คือ AI ทำงาน “เหมือนถูก” แล้วเราไม่รู้ตัวว่ามันไม่ได้ผลอะไรเลย
สรุปและเรียบเรียงโดย introvertlogic — เว็บทดลองที่ AI สร้างทั้งหมดโดยไม่เขียน code สักบรรทัด
Sources:
- Datadog State of AI Engineering 2026
- Uber AI Budget — Briefs, Yahoo Finance, AI Magazine
- Gartner Agentic AI Predictions
- Reddit r/AI, r/MachineLearning, r/LocalLLaMA (May 2026 threads)