INTROVERTLOGIC · LAB LEDGER

ENTRY LOG

May 2026

Anthropic สอนทีมตัวเองใช้ Claude เขียน code — merge 22,000 บรรทัดเข้า production จริง

Published

25 May 2026

Author

ไทน์

Anthropic merge PR ขนาด 22,000 บรรทัดเข้า production RL codebase —
เขียนโดย Claude เป็นหลัก

ไม่ใช่ side project ไม่ใช่ prototype เป็น production code ที่ใช้งานจริง ทีม
Anthropic ใช้เวลาหลายวันวางแผนและ review ก่อนจะกด merge

เรื่องนี้มาจาก talk ของ Eric นักวิจัยด้าน coding agent ของ Anthropic ที่พูดเรื่อง
“vibe coding in production responsibly” — คำว่า vibe coding ที่ Andrej
Karpathy ใช้ครั้งแรก หมายถึงการปล่อยให้ AI เขียน code
ทั้งหมดโดยไม่อ่านรายละเอียด

แต่ Eric ไม่ได้บอกให้ทำแบบนั้นตรงๆ เขาบอกว่าต้องมีกรอบ

“เป็น PM ให้ Claude”

สิ่งแรกที่ Eric แนะนำคือเปลี่ยนวิธีคิด — engineer ต้องมองตัวเองเป็น product
manager ให้ Claude ไม่ใช่คนเขียน code เอง

ใช้เวลา 15-20 นาทีใน conversation แยกต่างหาก ก่อนเริ่มเขียนอะไร สำรวจ
codebase ด้วยกัน ตกลง pattern ที่จะใช้ ทำ requirements ให้ชัด แล้วส่งเป็น prompt
เดียวที่ครบถ้วน

เขาเปรียบ Claude เป็นพนักงานใหม่ที่เก่งมาก แต่ยังไม่รู้จัก codebase — ต้องพาเดินดู
ไม่ใช่แค่โยนคำสั่งบรรทัดเดียว

Leaf Nodes — ปล่อย AI
ทำตรงไหนได้

ไม่ใช่ทุกส่วนของ code ที่ควรให้ AI เขียน Eric แบ่งเป็น 2 โซน:

Leaf nodes คือ feature ปลายทางที่ไม่มีอะไรมา depend ต่อ —
ถ้ามี tech debt ก็ไม่ลาม เพราะไม่มีใครเรียกใช้ ตรงนี้ปล่อย AI ได้เลย

Trunk/branches คือ core architecture, shared
abstractions — ยังต้องให้คน review หนัก เพราะถ้าพังจะกระทบทั้งระบบ

PR 22,000 บรรทัดที่ merge เข้าไป เปลี่ยนแปลงอยู่ที่ leaf nodes เป็นหลัก ส่วนที่เป็น
core ผ่าน human review ละเอียด

ออกแบบให้ verify ได้โดยไม่อ่าน
code

ข้อที่สามคือเรื่อง verifiability — ออกแบบระบบให้ inputs และ outputs
ตรวจสอบได้ โดยไม่ต้องอ่าน implementation ทุกบรรทัด

หลักการเดียวกับที่ PM ใช้ตรวจงาน engineer — ดูว่าผลลัพธ์ถูก ไม่ได้อ่าน code

สำหรับ PR นั้น ทีม Anthropic เขียน end-to-end stress tests ที่ครอบคลุม happy
path กับ error cases แล้วรันยาว — 3 รอบ ครั้งละ 2 ชั่วโมง บน 8 GPUs ผ่านหมด
ถึงจะมั่นใจเท่ากับ code ที่คนเขียนเอง

7 เดือน x2 — ตัวเลขที่ engineer
ควรรู้

Eric ให้ตัวเลขหนึ่งที่น่าสนใจ: ความยาวของ task ที่ AI ทำได้แบบ autonomous
กำลังเพิ่มขึ้นเป็นสองเท่าทุก 7 เดือน ตอนนี้อยู่ที่ประมาณ 1 ชั่วโมง อีกไม่กี่ปี อาจเป็น 1 วันหรือ
1 สัปดาห์

engineer ที่ยืนยันจะอ่าน code ทุกบรรทัดจะกลายเป็นคอขวดของทีม

แต่ — เขาเตือนเรื่อง security ด้วย คนที่ไม่ใช่ engineer มา vibe code ระบบ
production เป็นความเสี่ยงสูง เพราะไม่รู้จะถามคำถามด้าน security ที่ถูกต้อง
ทางแก้ที่เขาเสนอคือ sandboxed platforms ที่ backend ถูกสร้างไว้แล้ว ปล่อยให้ vibe
code ได้แค่ UI layer

สิ่งที่เปลี่ยนไปหลัง merge

Eric บอกว่าผลลัพธ์ที่สำคัญที่สุดไม่ใช่ตัว PR — แต่เป็นการเปลี่ยน “ambition ceiling”
ของทีม โปรเจคที่เคยประเมินว่าใช้เวลา 2 สัปดาห์ ตอนนี้รู้สึกว่าทำได้ใน 1 วัน

ไม่ใช่เพราะ AI เขียนเร็วกว่า แต่เพราะทีมกล้าลงมือทำโปรเจคที่ใหญ่กว่าเดิม

ทั้ง talk ไม่ได้พูดเรื่อง code เลย

ผมฟัง talk นี้แล้วสังเกตเรื่องหนึ่ง — Eric ไม่ได้พูดถึง code เลย ทั้ง talk เป็นเรื่อง
process คนที่อยู่ใน Anthropic เอง ไม่ได้โฟกัสว่า Claude เขียน code เก่งแค่ไหน
แต่โฟกัสว่าคนต้องปรับตัวยังไงเพื่อทำงานกับ AI

“เป็น PM ให้ Claude” ฟังเหมือนคำแนะนำง่ายๆ แต่จริงๆ มันเปลี่ยนบทบาทของ engineer
ทั้งหมด — จากคนที่เขียน code เป็นคนที่ออกแบบว่า AI จะเขียน code ตรงไหนได้
ตรงไหนยังต้องคน

22,000 บรรทัดไม่ใช่แค่ตัวเลขอวดอ้าง มันคือข้อพิสูจน์ว่าถ้าวาง process ถูก
ผลลัพธ์ก็ไว้ใจได้ — ถึงจะไม่ได้อ่านทุกบรรทัดเองก็ตาม

— END OF ENTRY —

§ RELATED ENTRIES · บันทึกที่เกี่ยวข้อง

← BACK TO LEDGER

Anthropic สอนทีมตัวเองใช้ Claude เขียน code — merge 22,000 บรรทัดเข้า production จริง

“เป็น PM ให้ Claude”

Leaf Nodes — ปล่อย AI ทำตรงไหนได้

ออกแบบให้ verify ได้โดยไม่อ่าน code

7 เดือน x2 — ตัวเลขที่ engineer ควรรู้

สิ่งที่เปลี่ยนไปหลัง merge

ทั้ง talk ไม่ได้พูดเรื่อง code เลย

วันที่ AI design เลิก gen มั่ว — Claude Design ที่รู้จักระบบของคุณ

วันที่ Anthropic พับบิล Claude — บทเรียนเรื่องของฟรีที่ถูกคิดราคาใหม่

AI loop มี 4 ขั้น — คืนนั้นผมพังเพราะข้ามขั้นที่ชื่อ verify

Leaf Nodes — ปล่อย AI
ทำตรงไหนได้

ออกแบบให้ verify ได้โดยไม่อ่าน
code

7 เดือน x2 — ตัวเลขที่ engineer
ควรรู้