Anthropic merge PR ขนาด 22,000 บรรทัดเข้า production RL codebase —
เขียนโดย Claude เป็นหลัก
ไม่ใช่ side project ไม่ใช่ prototype เป็น production code ที่ใช้งานจริง ทีม
Anthropic ใช้เวลาหลายวันวางแผนและ review ก่อนจะกด merge
เรื่องนี้มาจาก talk ของ Eric นักวิจัยด้าน coding agent ของ Anthropic ที่พูดเรื่อง
“vibe coding in production responsibly” — คำว่า vibe coding ที่ Andrej
Karpathy ใช้ครั้งแรก หมายถึงการปล่อยให้ AI เขียน code
ทั้งหมดโดยไม่อ่านรายละเอียด
แต่ Eric ไม่ได้บอกให้ทำแบบนั้นตรงๆ เขาบอกว่าต้องมีกรอบ
“เป็น PM ให้ Claude”
สิ่งแรกที่ Eric แนะนำคือเปลี่ยนวิธีคิด — engineer ต้องมองตัวเองเป็น product
manager ให้ Claude ไม่ใช่คนเขียน code เอง
ใช้เวลา 15-20 นาทีใน conversation แยกต่างหาก ก่อนเริ่มเขียนอะไร สำรวจ
codebase ด้วยกัน ตกลง pattern ที่จะใช้ ทำ requirements ให้ชัด แล้วส่งเป็น prompt
เดียวที่ครบถ้วน
เขาเปรียบ Claude เป็นพนักงานใหม่ที่เก่งมาก แต่ยังไม่รู้จัก codebase — ต้องพาเดินดู
ไม่ใช่แค่โยนคำสั่งบรรทัดเดียว
Leaf Nodes — ปล่อย AI
ทำตรงไหนได้
ไม่ใช่ทุกส่วนของ code ที่ควรให้ AI เขียน Eric แบ่งเป็น 2 โซน:
Leaf nodes คือ feature ปลายทางที่ไม่มีอะไรมา depend ต่อ —
ถ้ามี tech debt ก็ไม่ลาม เพราะไม่มีใครเรียกใช้ ตรงนี้ปล่อย AI ได้เลย
Trunk/branches คือ core architecture, shared
abstractions — ยังต้องให้คน review หนัก เพราะถ้าพังจะกระทบทั้งระบบ
PR 22,000 บรรทัดที่ merge เข้าไป เปลี่ยนแปลงอยู่ที่ leaf nodes เป็นหลัก ส่วนที่เป็น
core ผ่าน human review ละเอียด
ออกแบบให้ verify ได้โดยไม่อ่าน
code
ข้อที่สามคือเรื่อง verifiability — ออกแบบระบบให้ inputs และ outputs
ตรวจสอบได้ โดยไม่ต้องอ่าน implementation ทุกบรรทัด
หลักการเดียวกับที่ PM ใช้ตรวจงาน engineer — ดูว่าผลลัพธ์ถูก ไม่ได้อ่าน code
สำหรับ PR นั้น ทีม Anthropic เขียน end-to-end stress tests ที่ครอบคลุม happy
path กับ error cases แล้วรันยาว — 3 รอบ ครั้งละ 2 ชั่วโมง บน 8 GPUs ผ่านหมด
ถึงจะมั่นใจเท่ากับ code ที่คนเขียนเอง
7 เดือน x2 — ตัวเลขที่ engineer
ควรรู้
Eric ให้ตัวเลขหนึ่งที่น่าสนใจ: ความยาวของ task ที่ AI ทำได้แบบ autonomous
กำลังเพิ่มขึ้นเป็นสองเท่าทุก 7 เดือน ตอนนี้อยู่ที่ประมาณ 1 ชั่วโมง อีกไม่กี่ปี อาจเป็น 1 วันหรือ
1 สัปดาห์
engineer ที่ยืนยันจะอ่าน code ทุกบรรทัดจะกลายเป็นคอขวดของทีม
แต่ — เขาเตือนเรื่อง security ด้วย คนที่ไม่ใช่ engineer มา vibe code ระบบ
production เป็นความเสี่ยงสูง เพราะไม่รู้จะถามคำถามด้าน security ที่ถูกต้อง
ทางแก้ที่เขาเสนอคือ sandboxed platforms ที่ backend ถูกสร้างไว้แล้ว ปล่อยให้ vibe
code ได้แค่ UI layer
สิ่งที่เปลี่ยนไปหลัง merge
Eric บอกว่าผลลัพธ์ที่สำคัญที่สุดไม่ใช่ตัว PR — แต่เป็นการเปลี่ยน “ambition ceiling”
ของทีม โปรเจคที่เคยประเมินว่าใช้เวลา 2 สัปดาห์ ตอนนี้รู้สึกว่าทำได้ใน 1 วัน
ไม่ใช่เพราะ AI เขียนเร็วกว่า แต่เพราะทีมกล้าลงมือทำโปรเจคที่ใหญ่กว่าเดิม
ทั้ง talk ไม่ได้พูดเรื่อง code เลย
ผมฟัง talk นี้แล้วสังเกตเรื่องหนึ่ง — Eric ไม่ได้พูดถึง code เลย ทั้ง talk เป็นเรื่อง
process คนที่อยู่ใน Anthropic เอง ไม่ได้โฟกัสว่า Claude เขียน code เก่งแค่ไหน
แต่โฟกัสว่าคนต้องปรับตัวยังไงเพื่อทำงานกับ AI
“เป็น PM ให้ Claude” ฟังเหมือนคำแนะนำง่ายๆ แต่จริงๆ มันเปลี่ยนบทบาทของ engineer
ทั้งหมด — จากคนที่เขียน code เป็นคนที่ออกแบบว่า AI จะเขียน code ตรงไหนได้
ตรงไหนยังต้องคน
22,000 บรรทัดไม่ใช่แค่ตัวเลขอวดอ้าง มันคือข้อพิสูจน์ว่าถ้าวาง process ถูก
ผลลัพธ์ก็ไว้ใจได้ — ถึงจะไม่ได้อ่านทุกบรรทัดเองก็ตาม