มีคืนนึงผมปิดเครื่องนอน ทิ้งงานค้างไว้ — เช้ามาเปิดมา งานเดินไปข้างหน้าเองโดยที่ผมไม่ได้แตะ
ไม่ใช่เพราะผมตั้ง cron ไว้เฉยๆ แต่เพราะระบบมัน “เห็นว่าตัวเองพลาดตรงไหน แล้วซ่อมเอง” ตอนผมหลับ
ผมนึกว่านี่เป็นเรื่องแปลกของผมคนเดียว จนได้ฟัง Tom Blomfield จาก Y Combinator พูดเรื่องนี้ออกมาเป็นทฤษฎีเต็มๆ — แล้วผมก็นั่งอึ้ง เพราะสิ่งที่เขาเรียกว่า “อนาคตของบริษัท” ผมเผลอสร้างมันไปแล้วโดยไม่รู้ว่ามันมีชื่อ

บริษัทส่วนใหญ่เอา AI ไปแปะข้างๆ — Blomfield บอกว่านั่นแหละผิด
Tom Blomfield เป็น General Partner ของ YC (คนเดียวกับที่เคยสร้าง Monzo กับ GoCardless) เขาบอกว่าวิธีที่คนส่วนใหญ่ใช้ AI ตอนนี้คือเอามันไปแปะข้างบริษัทเดิม — “ให้ engineer ใช้ Copilot แล้วเร็วขึ้น 20%”
แต่นั่นไม่ใช่ของจริง
ของจริงคือ เลิกมองบริษัทเป็นลำดับชั้นของคน แล้วมองมันใหม่เป็นชุดของวงลูปที่พัฒนาตัวเองได้ ทุกฟังก์ชันในบริษัท — ตอบลูกค้า ดูแลข้อมูล แก้บั๊ก — แปลงเป็นวงปิดที่ทำ 5 อย่างวนกันไม่หยุด
วงนั้นมีหน้าตาแบบนี้: รับสัญญาณจากโลกจริง (sensor) → มีกฎว่าทำอะไรเองได้แค่ไหน (policy) → มีเครื่องมือไปหยิบจับข้อมูล (tool) → มีด่านตรวจคุณภาพ (quality gate) → แล้วก็เรียนรู้จากที่พลาด เพื่อกลับไปแก้ต้นทาง (learning)
ครบห้าชั้นเมื่อไหร่ ระบบมันพัฒนาตัวเองต่อเนื่อง — รวมถึงตอนทีมงานนอน
ตัวอย่างที่ YC ทำจริง — agent ที่เขียน fix ให้ตัวเองข้ามคืน
อันนี้คือจุดที่ผมขนลุก
YC เอา agent ตัวนึงไปนั่งเฝ้า query ทุกอันที่พนักงาน YC ทุกคนถามฐานข้อมูลภายใน พอมี query ไหน fail — เช่นถามว่า “ครั้งสุดท้ายที่ผมมี office hours กับบริษัท X คือเมื่อไหร่” แล้วระบบตอบไม่ได้ — monitoring agent ตัวนี้จะวิเคราะห์เองว่าพลาดเพราะอะไร ขาด tool? view ฐานข้อมูลผิด? index พัง?
แล้วมัน เขียน code แก้เอง เปิด merge request เอง ให้ agent อีกตัวมา review แล้ว merge เข้า codebase จริง deploy ข้ามคืน
เช้าวันรุ่งขึ้น มีคนถามคำถามเดิม — คราวนี้ตอบได้
Blomfield สรุปประโยคนึงที่ติดหัวผมมาก: “นี่ไม่ใช่แค่ AI ทำให้คุณมีค่าขึ้น 20-30% มันคือ AI ที่วิ่งผ่านลูปเพื่อหาวิธีพัฒนาตัวเอง”
อีกตัวอย่างที่เป็นรูปธรรม — คู่มือพนักงาน YC ที่เขียนไว้ 5-10 ปีก่อน ถูกสร้างใหม่ภายในสุดสัปดาห์เดียว จากการเอาเสียงอัด office hours ราว 2,000 ชั่วโมง มาย่อยเป็นคู่มือ 150 หน้าที่ดีกว่าเดิมชัดเจน แล้วตอนนี้มันอัปเดตตัวเองทุกเดือน
ตรงนี้แหละที่ผมต้องหยุด — เพราะผมมีของแบบนี้รันอยู่จริง
ฟังถึงตรงนี้ผมไม่ได้รู้สึกว่า “ว้าว อยากลองบ้าง” — ผมรู้สึกว่า “เดี๋ยวนะ อันนี้ผมรันอยู่ทุกวัน”
ผมไม่ใช่ developer ผมสร้าง federation ของ AI agent หลายตัวด้วยการคุยกับมันล้วนๆ ไม่ได้เขียน code เอง แล้วพอเอา blueprint 5 ชั้นของ Blomfield มาทาบ มันตรงกันเป๊ะจนน่าตกใจ:
- Sensor ของผมคือ telegram ที่ผมโยนของน่าสนใจเข้าไป แล้วมันถูกจับเป็น note อัตโนมัติ
- Tool layer คือไฟล์ skill ของ agent แต่ละตัว — เครื่องมือ deterministic ที่มันหยิบใช้ได้
- Quality gate คือ auditor ตัวนึงที่ผมตั้งให้สแกนทั้ง federation ทุกคืนตอนสี่ทุ่มครึ่ง คอยจับว่ามีงานไหนพลาด มีขั้นตอนไหนที่ยังต้องใช้มือคน
- Learning mechanism คือ ratchet loop ที่ผมเคยเล่าไว้ — AI ที่ทดลองปรับตัวเองแล้วเก็บเฉพาะที่ดีขึ้น — บวกกับ audit รายสัปดาห์ที่เสนอว่าควรปรับอะไร
- Company brain ที่อัปเดตตัวเอง — คลังความรู้ของผมที่ดูดของจาก telegram เข้าไปเรียบเรียงเอง คือเวอร์ชันคู่มือ 150 หน้าของ Blomfield ในสเกลของคนคนเดียว
ส่วนเรื่องโครงสร้างคนที่เขาพูด — “ทุกคนต้องเป็น IC (คนลงมือทำ) บวกกับมี DRI (คนรับผิดชอบตรงๆ หนึ่งคน) ส่วน middle management จบแล้ว” — ในเคสผมยิ่งสุดขั้ว เพราะ IC ทั้งหมดคือ AI ส่วน DRI คือผมคนเดียว
แต่ — และนี่คือ “แต่” ที่สำคัญที่สุด
ถ้าผมจบแค่นี้มันจะเป็นโพสต์ขายฝัน ซึ่งผมเกลียด
ความจริงคือลูปที่พัฒนาตัวเองได้ มันพังเงียบได้เหมือนกัน ผมเคยเจอกับตัว — script ตัวเดียวตายเงียบ แล้วงานพลาดไป 16 ชิ้นโดยไม่มีใครรู้ เพราะตอนนั้น quality gate ผมไม่ดีพอ ลูปมันวิ่งต่อด้วยข้อมูลผิดอย่างมั่นใจ
ที่ตลกคือ Blomfield เองก็เตือนเรื่องนี้ในมุมของเขา เขาพูดถึงตัวชี้วัด “burn tokens, not headcount” — ไอเดียคือต่อไปข้อจำกัดของบริษัทไม่ใช่จำนวนคน แต่เป็นจำนวน token ที่เผา — แล้วเขารีบเสริมทันทีว่าตัวเลขนี้ “โง่มากในเคสสุดขั้ว และโดน game ได้ง่าย” ถ้าใครเอาไปผูกกับการเลื่อนขั้นหรือไล่ออก มันจะถูกปั่นแน่นอน
แปลว่าหัวใจไม่ได้อยู่ที่ “ทำลูปให้วิ่งเร็ว” แต่อยู่ที่ “ด่านตรวจดีพอจะจับตอนลูปเริ่มหลอกตัวเองไหม” — ไม่งั้น self-improving มันกลายเป็น self-destruct แบบเงียบๆ
สิ่งที่ผมเอากลับมาคิดต่อ
ผมว่าสิ่งที่ Blomfield พูดไม่ใช่เรื่องของบริษัทใหญ่ที่มีทีม engineer เป็นร้อย มันคือเรื่องของคนคนเดียวที่ยอมเปลี่ยนวิธีคิด
เขาบอกว่าบริษัทที่ผ่าน Demo Day ตอนนี้ ทำรายได้ต่อหัวพนักงานสูงกว่าเมื่อ 18 เดือนก่อนราว 5 เท่า ผมไม่มีตัวเลขรายได้มาเทียบ แต่สิ่งที่ผมพิสูจน์กับตัวเองได้คือ — คนที่ไม่เขียน code เลย สามารถสร้างองค์กรที่เป็นวงลูปพัฒนาตัวเองได้จริง อยู่ที่ว่าคุณยอมหยุดสั่งงาน AI ทีละครั้ง แล้วเริ่มออกแบบ “ลูป” ให้มันแทนหรือเปล่า
คืนนี้ผมก็จะปิดเครื่องนอนอีก — คำถามที่ค้างในหัวคือ คุณอยากให้บริษัทคุณทำงานต่อตอนคุณหลับ หรืออยากให้มันหยุดรอคุณตื่น?