Gemini 3.5 Flash
เร็วขึ้น 4 เท่า แต่แพงขึ้น 3 เท่า
Google เปิดตัวที่ I/O 2026 — Flash ตัวใหม่ชนะ Pro ปีที่แล้ว แต่ราคาขึ้นจน Simon Willison ต้องเขียนบล็อกเตือน
- ~$0.50 / M input tokens
- ~$3.00 / M output tokens
- ถูก แต่ช้ากว่า
- ไม่ชนะ Pro benchmarks
- $1.50 / M input tokens
- $9.00 / M output tokens
- ชนะ 3.1 Pro ทุก benchmark
- Cached input: $0.15/M (ถูกมาก)
ราคา per-token ขึ้น แต่เร็วขึ้น 4x — ดังนั้น ราคา per-task อาจถูกลง ถ้า task จบเร็วขึ้น แต่ถ้าใช้แบบ high-volume ส่ง request เยอะๆ bill จะพุ่ง ต้องดูว่าใช้ cache เป็นหรือเปล่า — cached input $0.15/M ถูกกว่าปกติ 10 เท่า
ผมใช้ Claude เป็นหลัก แต่ follow ราคา Gemini ตลอด — เพราะถ้าวันหนึ่ง Claude ขึ้นราคาแรง ต้องรู้ว่า plan B อยู่ตรงไหน
สิ่งที่ Google ไม่ได้พูดดังคือ — ตลาด AI กำลังเข้าสู่ยุคที่ “ถูก” ไม่ใช่จุดขายอีกต่อไป ทุกค่ายเริ่มขึ้นราคา model ที่ดีที่สุด เพราะต้นทุน compute จริงๆ มันแพง
Google สัญญาว่า 3.5 Pro จะมาเดือนหน้า — น่าจะแพงกว่านี้อีก
เร็วขึ้น ≠ ถูกลง
ยุค AI ราคาถูก กำลังจะจบ
3.5 Flash ดีจริง — ชนะ Pro ปีที่แล้ว ใน Flash pricing แต่ทิศทางชัด: model ดีขึ้น ราคาก็ขึ้นตาม ใครใช้ AI เป็น tool หลัก ต้องเริ่มคิดเรื่อง cost optimization จริงจัง