INTROVERTLOGIC · LAB LEDGER

ENTRY LOG

บริษัทที่ซ่อมตัวเองตอนผมนอน — YC อธิบายทฤษฎี ผมรันของจริงอยู่ก่อนแล้ว

มีคืนนึงผมปิดเครื่องนอน ทิ้งงานค้างไว้ — เช้ามาเปิดมา งานเดินไปข้างหน้าเองโดยที่ผมไม่ได้แตะ

ไม่ใช่เพราะผมตั้ง cron ไว้เฉยๆ แต่เพราะระบบมัน “เห็นว่าตัวเองพลาดตรงไหน แล้วซ่อมเอง” ตอนผมหลับ

ผมนึกว่านี่เป็นเรื่องแปลกของผมคนเดียว จนได้ฟัง Tom Blomfield จาก Y Combinator พูดเรื่องนี้ออกมาเป็นทฤษฎีเต็มๆ — แล้วผมก็นั่งอึ้ง เพราะสิ่งที่เขาเรียกว่า “อนาคตของบริษัท” ผมเผลอสร้างมันไปแล้วโดยไม่รู้ว่ามันมีชื่อ

อินโฟกราฟิก: บริษัทที่พัฒนาตัวเองด้วย AI — วงลูป 5 ชั้น SENSOR POLICY TOOL QUALITY GATE LEARNING

บริษัทส่วนใหญ่เอา AI ไปแปะข้างๆ — Blomfield บอกว่านั่นแหละผิด

Tom Blomfield เป็น General Partner ของ YC (คนเดียวกับที่เคยสร้าง Monzo กับ GoCardless) เขาบอกว่าวิธีที่คนส่วนใหญ่ใช้ AI ตอนนี้คือเอามันไปแปะข้างบริษัทเดิม — “ให้ engineer ใช้ Copilot แล้วเร็วขึ้น 20%”

แต่นั่นไม่ใช่ของจริง

ของจริงคือ เลิกมองบริษัทเป็นลำดับชั้นของคน แล้วมองมันใหม่เป็นชุดของวงลูปที่พัฒนาตัวเองได้ ทุกฟังก์ชันในบริษัท — ตอบลูกค้า ดูแลข้อมูล แก้บั๊ก — แปลงเป็นวงปิดที่ทำ 5 อย่างวนกันไม่หยุด

วงนั้นมีหน้าตาแบบนี้: รับสัญญาณจากโลกจริง (sensor) → มีกฎว่าทำอะไรเองได้แค่ไหน (policy) → มีเครื่องมือไปหยิบจับข้อมูล (tool) → มีด่านตรวจคุณภาพ (quality gate) → แล้วก็เรียนรู้จากที่พลาด เพื่อกลับไปแก้ต้นทาง (learning)

ครบห้าชั้นเมื่อไหร่ ระบบมันพัฒนาตัวเองต่อเนื่อง — รวมถึงตอนทีมงานนอน

ตัวอย่างที่ YC ทำจริง — agent ที่เขียน fix ให้ตัวเองข้ามคืน

อันนี้คือจุดที่ผมขนลุก

YC เอา agent ตัวนึงไปนั่งเฝ้า query ทุกอันที่พนักงาน YC ทุกคนถามฐานข้อมูลภายใน พอมี query ไหน fail — เช่นถามว่า “ครั้งสุดท้ายที่ผมมี office hours กับบริษัท X คือเมื่อไหร่” แล้วระบบตอบไม่ได้ — monitoring agent ตัวนี้จะวิเคราะห์เองว่าพลาดเพราะอะไร ขาด tool? view ฐานข้อมูลผิด? index พัง?

แล้วมัน เขียน code แก้เอง เปิด merge request เอง ให้ agent อีกตัวมา review แล้ว merge เข้า codebase จริง deploy ข้ามคืน

เช้าวันรุ่งขึ้น มีคนถามคำถามเดิม — คราวนี้ตอบได้

Blomfield สรุปประโยคนึงที่ติดหัวผมมาก: “นี่ไม่ใช่แค่ AI ทำให้คุณมีค่าขึ้น 20-30% มันคือ AI ที่วิ่งผ่านลูปเพื่อหาวิธีพัฒนาตัวเอง”

อีกตัวอย่างที่เป็นรูปธรรม — คู่มือพนักงาน YC ที่เขียนไว้ 5-10 ปีก่อน ถูกสร้างใหม่ภายในสุดสัปดาห์เดียว จากการเอาเสียงอัด office hours ราว 2,000 ชั่วโมง มาย่อยเป็นคู่มือ 150 หน้าที่ดีกว่าเดิมชัดเจน แล้วตอนนี้มันอัปเดตตัวเองทุกเดือน

ตรงนี้แหละที่ผมต้องหยุด — เพราะผมมีของแบบนี้รันอยู่จริง

ฟังถึงตรงนี้ผมไม่ได้รู้สึกว่า “ว้าว อยากลองบ้าง” — ผมรู้สึกว่า “เดี๋ยวนะ อันนี้ผมรันอยู่ทุกวัน”

ผมไม่ใช่ developer ผมสร้าง federation ของ AI agent หลายตัวด้วยการคุยกับมันล้วนๆ ไม่ได้เขียน code เอง แล้วพอเอา blueprint 5 ชั้นของ Blomfield มาทาบ มันตรงกันเป๊ะจนน่าตกใจ:

  • Sensor ของผมคือ telegram ที่ผมโยนของน่าสนใจเข้าไป แล้วมันถูกจับเป็น note อัตโนมัติ
  • Tool layer คือไฟล์ skill ของ agent แต่ละตัว — เครื่องมือ deterministic ที่มันหยิบใช้ได้
  • Quality gate คือ auditor ตัวนึงที่ผมตั้งให้สแกนทั้ง federation ทุกคืนตอนสี่ทุ่มครึ่ง คอยจับว่ามีงานไหนพลาด มีขั้นตอนไหนที่ยังต้องใช้มือคน
  • Learning mechanism คือ ratchet loop ที่ผมเคยเล่าไว้ — AI ที่ทดลองปรับตัวเองแล้วเก็บเฉพาะที่ดีขึ้น — บวกกับ audit รายสัปดาห์ที่เสนอว่าควรปรับอะไร
  • Company brain ที่อัปเดตตัวเอง — คลังความรู้ของผมที่ดูดของจาก telegram เข้าไปเรียบเรียงเอง คือเวอร์ชันคู่มือ 150 หน้าของ Blomfield ในสเกลของคนคนเดียว

ส่วนเรื่องโครงสร้างคนที่เขาพูด — “ทุกคนต้องเป็น IC (คนลงมือทำ) บวกกับมี DRI (คนรับผิดชอบตรงๆ หนึ่งคน) ส่วน middle management จบแล้ว” — ในเคสผมยิ่งสุดขั้ว เพราะ IC ทั้งหมดคือ AI ส่วน DRI คือผมคนเดียว

แต่ — และนี่คือ “แต่” ที่สำคัญที่สุด

ถ้าผมจบแค่นี้มันจะเป็นโพสต์ขายฝัน ซึ่งผมเกลียด

ความจริงคือลูปที่พัฒนาตัวเองได้ มันพังเงียบได้เหมือนกัน ผมเคยเจอกับตัว — script ตัวเดียวตายเงียบ แล้วงานพลาดไป 16 ชิ้นโดยไม่มีใครรู้ เพราะตอนนั้น quality gate ผมไม่ดีพอ ลูปมันวิ่งต่อด้วยข้อมูลผิดอย่างมั่นใจ

ที่ตลกคือ Blomfield เองก็เตือนเรื่องนี้ในมุมของเขา เขาพูดถึงตัวชี้วัด “burn tokens, not headcount” — ไอเดียคือต่อไปข้อจำกัดของบริษัทไม่ใช่จำนวนคน แต่เป็นจำนวน token ที่เผา — แล้วเขารีบเสริมทันทีว่าตัวเลขนี้ “โง่มากในเคสสุดขั้ว และโดน game ได้ง่าย” ถ้าใครเอาไปผูกกับการเลื่อนขั้นหรือไล่ออก มันจะถูกปั่นแน่นอน

แปลว่าหัวใจไม่ได้อยู่ที่ “ทำลูปให้วิ่งเร็ว” แต่อยู่ที่ “ด่านตรวจดีพอจะจับตอนลูปเริ่มหลอกตัวเองไหม” — ไม่งั้น self-improving มันกลายเป็น self-destruct แบบเงียบๆ

สิ่งที่ผมเอากลับมาคิดต่อ

ผมว่าสิ่งที่ Blomfield พูดไม่ใช่เรื่องของบริษัทใหญ่ที่มีทีม engineer เป็นร้อย มันคือเรื่องของคนคนเดียวที่ยอมเปลี่ยนวิธีคิด

เขาบอกว่าบริษัทที่ผ่าน Demo Day ตอนนี้ ทำรายได้ต่อหัวพนักงานสูงกว่าเมื่อ 18 เดือนก่อนราว 5 เท่า ผมไม่มีตัวเลขรายได้มาเทียบ แต่สิ่งที่ผมพิสูจน์กับตัวเองได้คือ — คนที่ไม่เขียน code เลย สามารถสร้างองค์กรที่เป็นวงลูปพัฒนาตัวเองได้จริง อยู่ที่ว่าคุณยอมหยุดสั่งงาน AI ทีละครั้ง แล้วเริ่มออกแบบ “ลูป” ให้มันแทนหรือเปล่า

คืนนี้ผมก็จะปิดเครื่องนอนอีก — คำถามที่ค้างในหัวคือ คุณอยากให้บริษัทคุณทำงานต่อตอนคุณหลับ หรืออยากให้มันหยุดรอคุณตื่น?